29
f6XF
2936462bda8612e290f17231fddca9a658b472680cb661b537b1121d5b3d683b
f6XF
Replying to f6XF

梁博,有个问题,大模型行业经常听到一个术语SFT,而且我发现还挺乱的,能不能解释下。

答:SFT,这个就是指令微调,分为广义SFT和狭义SFT。广义SFT就是大模型通过预训练后,要提高其指令跟随,回答一些特定问题的能力,需要经过的阶段,这类数据都是各式各样的,不限定领域,长的样子大概是这样的:

P: “从这段文章中提取作者和出版年份。”

R: “作者是 [XXX],出版年份是 [YYY]。”

P: “什么是区块链?用五年级学生能听懂的方式解释。”

R: “想象一个公共账本...”

通常具备回答简洁,结果正确,因此这个阶段的数据质量要求较高,多样性也要高。一般都需要深度处理。不是知乎,Quora这种提问回答对数据直接拿来用。

第二个就是狭义SFT,这个是在一些特定领域的垂直大模型,为了具备回答垂直领域的问题,经过的一个“特训”,一般数据长的是这个样子的。

P: “患者,男,35岁,持续低烧三天,伴有干咳,白细胞计数 11.0×10⁹/L。请给出前三个鉴别诊断。”

R: “1. 支原体肺炎。 2. 流行性感冒。 3. 急性支气管炎。

P: “患者,女,35岁,持续胡言乱语,手脚抽搐。请给出前三个鉴别诊断。”

R: “1. 精神障碍。 2. 缺氧。 3. 惊恐。

SFT的过程,一般采用PEFT技术思路(例如:Low-Rank Adaptation),预训练的参数W 整体不动,只是学习一个小矩阵W*,最终微调结果是W+W*。这样可以针对比如法律学习一个 W*,医疗学习一个W*,最后想怎么组合都行,不会损坏预训练的结果。

以上是我的理解,仅供参考,我也不专业,最好还是请教专业人士,谢谢。

否极则顺Legion:梁博过谦了

梁博,有个问题,大模型行业经常听到一个术语SFT,而且我发现还挺乱的,能不能解释下。

答:SFT,这个就是指令微调,分为广义SFT和狭义SFT。广义SFT就是大模型通过预训练后,要提高其指令跟随,回答一些特定问题的能力,需要经过的阶段,这类数据都是各式各样的,不限定领域,长的样子大概是这样的:

P: “从这段文章中提取作者和出版年份。”

R: “作者是 [XXX],出版年份是 [YYY]。”

P: “什么是区块链?用五年级学生能听懂的方式解释。”

R: “想象一个公共账本...”

通常具备回答简洁,结果正确,因此这个阶段的数据质量要求较高,多样性也要高。一般都需要深度处理。不是知乎,Quora这种提问回答对数据直接拿来用。

第二个就是狭义SFT,这个是在一些特定领域的垂直大模型,为了具备回答垂直领域的问题,经过的一个“特训”,一般数据长的是这个样子的。

P: “患者,男,35岁,持续低烧三天,伴有干咳,白细胞计数 11.0×10⁹/L。请给出前三个鉴别诊断。”

R: “1. 支原体肺炎。 2. 流行性感冒。 3. 急性支气管炎。

P: “患者,女,35岁,持续胡言乱语,手脚抽搐。请给出前三个鉴别诊断。”

R: “1. 精神障碍。 2. 缺氧。 3. 惊恐。

SFT的过程,一般采用PEFT技术思路(例如:Low-Rank Adaptation),预训练的参数W 整体不动,只是学习一个小矩阵W*,最终微调结果是W+W*。这样可以针对比如法律学习一个 W*,医疗学习一个W*,最后想怎么组合都行,不会损坏预训练的结果。

以上是我的理解,仅供参考,我也不专业,最好还是请教专业人士,谢谢。

我们有个客户下月要在香港上市,邀请我参加观礼,我顺便去趟香港公司看望下同志们。。我们支持下,很多客户都上市了,但是邀请我厂观礼,目前仅此一家,我有一种能上台面的感觉,流泪。

现在数据工作者在“国21条”等国家和地方法规的支持下,逐渐走到了前台,今非昔比了,我们继续努力,年营收10亿美金的目标不变,加油吧,同志们。

E_lief:在虹桥站刚刚检票好像看到梁博了[doge]

UPIP关爱流浪博士组织:苦爷回国了,银行的同志们这下放心了[笑cry][笑cry]

越南被殖民的还是浅,要么是去殖民化很成功,吃个早餐,打个车都只会讲越语,会英语和法语都很少,日语,韩语当然也不会,可能局限于特殊行业?当然也没多少会中文的。从旅游体验来说,也是非常差的。

现在中国企业来的多的,才开始有很多大学生才开始学习中文,因为一个月可以多1000块。而且聪明的,跳槽勤快做主管的,有机会收入一万以上。#东哥笔记#

除了ds和千问,其他大模型都亏钱了。 我最近越来越感觉到维持2/3的资金空仓,是多么重要,特别是牛市。 ​​​

https://postimg.cc/RWKzYQGM

刚刚遇到一个流浪汉,问我。“Can you spare a dollar?” 我一时间没听懂,spare是什么意思忘记了,后来问大模型才知道是找我要一美元。这个流浪汉太谨慎了啊,直接来一句 20 dollars please,我马上就乖乖的掏钱了,英语要简洁啊[泪],照顾下我们这种老同志[泪] ​​​

今天启程回国了,中间东京转机,给单位的小伙伴再买点高档礼品。。这次出来差不多半个月,银行的同志老担心了,我懂。我这种身背巨债的,能有机会出来是非常非常不容易的,谢谢理解。

回国后我要继续努力,热情工作,回报领导和银行同志的信任,努力吧。 ​​​

#教授18个月卧底富豪全球巡游和派对#【#在VIP俱乐部美貌像一种货币#】2011至2013年的18个月里,阿姆斯特丹大学文化社会学教授阿什利·米尔斯装扮成“女孩”,卧底精英和富商云集的VIP派对,并加入了几场全球VIP夜店巡游——涉及美国的纽约、汉普顿和法国的里维埃拉等地。

“女孩”是VIP派对中特有的称呼。她们通常年龄不超过25岁,美丽、高挑且纤细,最好本身就是模特。“她们的身高和外貌经过时尚产业的‘合法化’。对男性而言,这是一种最直接的‘炫耀资本’。”米尔斯告诉《南方人物周刊》。

维持“女孩”与客户之间关系的是俱乐部经纪人,他们会用“免费的酒水和食物”吸引“女孩们”。一家俱乐部的“女孩”越多、“质量”越高,越有可能吸引更多的客户到访并购买酒水。俱乐部因此赚得盆满钵满,经纪人则从酒水等的提成中获利。但“女孩们”几乎从未因此获得金钱报酬。这正如米尔斯在采访中反复提到的——女性的美貌带给她们身旁男性的利益,远大于她们自身所能获得的。在“VIP俱乐部”,美貌像一种货币

这次ICCV大会还是收获蛮大的,特别是对我们数据服务行业,我回国后写个小作文,详细介绍机器视觉方向发展的动态,特别是我们这个行业的朋友们还是非常值得思考的。

现在大学的课题很多都是由大厂背后资金和数据支持的,出了很多不错的成果,下一步我厂也会拿出很多数据出来,分享给研究界的同志们,做一些长期维护的dataset,真是要搞一搞了,不搞知名度上不去,我走在会场上,一个打招呼的都没有,太尴尬了。 #iccv2025#

今天下午社交牛逼症时断时续,走到字节跳动展台前,一下就荡机了,完全不知道该怎么聊天,就只拿了资料。。脑子真是干冒烟了,太辛苦了,总算把既定任务都完成了,下面的时间就要好好旅游一下了,真是没怎么玩,一直都在忙,太辛苦了啊。 ​​​

经常看到很多专业做金融的,好几个屏幕,看盘。其实我感觉没用,让自己心态变得不好,持股体验变差。 一个手机就够了。。日常应该对研究行业发展,和gpt5,gemini等等这种大模型多交流,少操作,多思考,老看盘是不对的,对段位要求极高。 ​​​

https://postimg.cc/cKV1ff2w

阿里真的是个好公司,他现在什么概念都有。芯片,算力,云,外卖,总之是紧跟热点,整个公司的战略方向都很对,马云战略确实厉害。

而且估值才19倍,腾讯26倍,纳指43倍,显然阿里性价比凸显。

热点追踪 | 阿里巴巴发布AI战略升级:推出Qwen3-Max大模型与"造点"创作平台

在2025云栖大会上,阿里巴巴集团宣布多项AI领域重大突破。集团CEO吴泳铭表示,公司正在积极推进3800亿元人民币的AI基础设施建设,并计划追加更多投入。他指出,大模型将成为下一代操作系统,而全球最终可能仅存5-6个超级云计算平台。

技术突破方面,阿里云正式推出迄今规模最大的Qwen3-Max模型。该模型在LMArena文本排行榜测试版中位列第三,超越GPT-5-Chat。正式版本在编程和智能体能力方面进一步提升,在知识覆盖、推理、多语言理解等综合基准测试中达到行业领先水平。据悉,仍在研发中的Qwen3-Max-Thinking版本已在多项高难度推理测试中取得100%准确率。

同时,阿里巴巴旗下夸克应用发布全新AI创作平台"造点"。该平台整合了AI生图与AI生视频两大核心功能,成为国内首个支持音画同步视频生成的平台。"造点"集成了Midjourney V7图像生成模型和通义万相Wan2.5视频生成技术,可生成1080P高清视频,支持24帧/秒的流畅度,并实现音频视频同步输出。平台在亚洲人像生成、中文文字处理及国风元素创作方面表现突出。

吴泳铭在演讲中阐述了AI发展的四阶段演进路径:从智能涌现、自主行动到自我迭代,最终实现超级人工智能(ASI)。他表示,为迎接ASI时代,到2032年阿里云全球数据中心的能耗规模将提升10倍,意味着算力投入将呈指数级增长。

此外,阿里巴巴还推出了面向个人用户的终端AI智能体iFlow CLI,该工具支持通过自然语言指令完成从文件整理到复杂工作流程的自动化处理。

#a股#

https://postimg.cc/rKB93LsT

Replying to f6XF

二月份经济数据超出预期,初步显示出应有的活力。当然这里拆开看,基建等国家发力项目贡献最高,其次是服务业,再其次是制造业,从结构上来看属于短期企稳反弹,中长期还是要看民间经济力量,包括民企和消费者的活力。

我个人认为自下而上的看,经济复苏以及增长前景是很值得期待的,因为企业和消费者都有强烈的共同的愿望,那就是愿意为了更美好的未来而奋斗——别小看这个,这种共识在全球来看都是稀缺的。而且每年一千多万的高校毕业生规模,有足够的工程师红利,目前历史最高的居民储蓄水平也有足够的消费和投资潜力。

并且目前我国的消费需求很大程度上是被不合理的因素压制了,比如:中产阶级的个税门槛实在太低,如果调整到8000或者1万起付点,会释放多少消费潜力?再比如富裕群体想再买房子买车,但一线城市不让买,想在国内消费高档次的旅游服务或者游戏产品,有效供应也严重不足。类似问题应该解决了,没道理一边强调需求不足经济压力山大,另一边各种不合理的压制需求迟迟不做改善。

今年提到的“大力改善市场信心”,问题抓得极准,但关键还是行动。打消企业和民众显而易见的疑虑,在困难时期给企业和民众真的扶一把,鼓鼓劲,让繁荣再次回归,让未来再次变得可预期可期待,已经不仅仅是就业和经济层面的问题了,可能关乎全局胜负。

2023年是新开局之年,2033年则可能是两个世纪目标之一的尘埃落定之年。

美军的三军核心主战兵器全都被超越(海军被055,空军被歼20和六代机,陆军被四代坦克,还有无人机和高超音速武器),应该是二战后没有出现过的。从工业技术和规模角度来看,这个差距未来十几年还会扩大。

但有两个可能的追回机会,一个是人工智能做到明显领先,另一个是等中国老龄化持续几十年的加速和社会动能下降。

【#特朗普100万美元出售美国居留权#】#特朗普金卡100万美元出售#美国总统特朗普19日签署一项名为“黄金卡”的行政令,称其将为“具有非凡能力并愿意支持美国的外国人”开辟一条新的签证通道:个人向美国财政部缴纳100万美元,或者由企业赞助缴纳200万美元,就能通过这一“黄金卡”项目获得加速审批的签证待遇。

特朗普在社交媒体平台上说,美国的移民体系亟待改革,预计“特朗普金卡”很快将带来远超1000亿美元的收入。这笔资金将用于减税、推动经济增长的项目以及偿还国债。特朗普在另一条帖文中写道,“现在就购买特朗普金卡,”并链接了一个政府网站。

根据相关网站介绍,在通过审核并缴纳相关手续费后,申请者用100万美元可获得“特朗普金卡”,从而得到永久居留身份。

早在今年2月,特朗普就宣布将推出定价500万美元的移民“金卡”。如今“金卡”价码被降至100万美元,500万美元则可获得“白金卡”。

目前尚不清楚何时开始发放这类签证。网站上设有“立即申请”页面,要求申请人填写姓名、所在地区及电子邮箱。有专家表示,该项目可能需要获得国会批准。(新华社 视频来源:中国基金报)

http://t.cn/AXhTwXd6

甲骨文这个事情,我又琢磨了下,事情可能并不简单,大家想想有没有这种可能,美国zf或者bd,有搞大模型的需要,但是有一些保密需要,又不放心放在aws,微软云和普通民用需求混在一起,然后就指定承接项目的大厂,必须用甲骨文的云来提供服务。。

说明美国zf在加大投入啊,同志们?会是这个原因嘛? ​​​

【#11岁男孩喝增高汤睾丸体积超标一倍#, 医生提醒:盲目给孩子进补存在诸多风险!】近期在广东佛山,一位妈妈带着11岁儿子就诊,忧心忡忡地问医生,儿子还能长到175cm吗?男孩身高147cm,其实完全在正常范围;骨龄检测显示11岁半,和实际年龄一致,本该是好事!但男孩妈妈却说:“我总怕他长得慢,比不上同学…听说海马田七汤对增高有用,这半年我经常煲给他喝。”而医生一查才发现,这个男孩睾丸体积已达8ml——而超过4ml就已经标志青春期启动。

医生提醒,海马、田七这类补品,如同一只“无形的手”,强行按下了孩子发育的“加速键”。在短期内或许能促进孩子生长、增强免疫力,但同时也存在诸多风险,如促使孩子过早进入青春期,可能引发一系列生理和心理问题;刺激骨骺线提前闭合:一旦骨骺完全闭合,孩子的身高增长便会停止,身高也随之定型。

有些孩子原本骨龄落后,还有生长空间,但乱补之后骨龄反超,生长潜能反而被提前消耗!对于号称“促长高”的保健品和药物,在给孩子服用任何相关产品之前,一定要先咨询专业医生的意见。(广东医科大学顺德妇女儿童医院、佛山+)

Replying to f6XF

转发抽3000块。好久没喷人了。

曝光下赛诺龙@Candela激光 这个厂家太不靠谱了,机器出问题一个月了还没解决,让我们掏4万9换电脑。大部分医疗美容用的的机器,有治疗头、有手具等等耗材需要定期或每次换都是正常的。我头一次听说机器系统有积分用完需要换的,这离谱到家了。不管是销售时还是合同里从来没说过机器买了,机器的系统还有积分,积分清零就没办法更新,更新就要换电脑。就好像你买了个打印机除了纸、墨之外用机器还有积分,用一半了告诉你要花钱更新不然机器就罢工。

几万块不多,但这个事情很恶心,当初的销售消息电话不回失联。一度怀疑这公司是不是要凉了跑路了。如果你们靠这种套路赚钱,坑客户这公司早晚得出问题。工程师还说我们在机器手柄在外面换过,你们合同里原厂带的我们都还没用完呢,吃饱了撑的去外面换?找不到好的借口了?总部有没有人管?客户买了机器,用着用着还要花钱换电脑的逻辑,道理在哪?

医美同行得小心注意赛诺龙这个厂家,买完机器有你受的。 我们也找很多同行打听,确实这情况不止我们遇到,其他机构也会遇到也会不高兴。这不摆明就是坑钱,买的时候销售的时候根本没人告诉你这个东西。这不就是欺诈外加强买强卖么?我就不说这机器动不动就出个毛病了,看着我们工作群聊天记录里你们公司的产品老出问题我都有点后悔花了一百五十多万买两个机器了。

先转发抽个3000块吧,这钱就算抽奖也不能被这么套路。也不知道这种套路归不归市场监督管 @北京市场监管 @北京朝阳市场监管

https://postimg.cc/gallery/ZZYhtsb

星驰爷怒了:这不相当于年费么[doge]

Replying to f6XF

转发抽3000块。好久没喷人了。

曝光下赛诺龙@Candela激光 这个厂家太不靠谱了,机器出问题一个月了还没解决,让我们掏4万9换电脑。大部分医疗美容用的的机器,有治疗头、有手具等等耗材需要定期或每次换都是正常的。我头一次听说机器系统有积分用完需要换的,这离谱到家了。不管是销售时还是合同里从来没说过机器买了,机器的系统还有积分,积分清零就没办法更新,更新就要换电脑。就好像你买了个打印机除了纸、墨之外用机器还有积分,用一半了告诉你要花钱更新不然机器就罢工。

几万块不多,但这个事情很恶心,当初的销售消息电话不回失联。一度怀疑这公司是不是要凉了跑路了。如果你们靠这种套路赚钱,坑客户这公司早晚得出问题。工程师还说我们在机器手柄在外面换过,你们合同里原厂带的我们都还没用完呢,吃饱了撑的去外面换?找不到好的借口了?总部有没有人管?客户买了机器,用着用着还要花钱换电脑的逻辑,道理在哪?

医美同行得小心注意赛诺龙这个厂家,买完机器有你受的。 我们也找很多同行打听,确实这情况不止我们遇到,其他机构也会遇到也会不高兴。这不摆明就是坑钱,买的时候销售的时候根本没人告诉你这个东西。这不就是欺诈外加强买强卖么?我就不说这机器动不动就出个毛病了,看着我们工作群聊天记录里你们公司的产品老出问题我都有点后悔花了一百五十多万买两个机器了。

先转发抽个3000块吧,这钱就算抽奖也不能被这么套路。也不知道这种套路归不归市场监督管 @北京市场监管 @北京朝阳市场监管

https://postimg.cc/gallery/ZZYhtsb

切莫当针:让手底下兄弟把它破解了

Replying to f6XF

转发抽3000块。好久没喷人了。

曝光下赛诺龙@Candela激光 这个厂家太不靠谱了,机器出问题一个月了还没解决,让我们掏4万9换电脑。大部分医疗美容用的的机器,有治疗头、有手具等等耗材需要定期或每次换都是正常的。我头一次听说机器系统有积分用完需要换的,这离谱到家了。不管是销售时还是合同里从来没说过机器买了,机器的系统还有积分,积分清零就没办法更新,更新就要换电脑。就好像你买了个打印机除了纸、墨之外用机器还有积分,用一半了告诉你要花钱更新不然机器就罢工。

几万块不多,但这个事情很恶心,当初的销售消息电话不回失联。一度怀疑这公司是不是要凉了跑路了。如果你们靠这种套路赚钱,坑客户这公司早晚得出问题。工程师还说我们在机器手柄在外面换过,你们合同里原厂带的我们都还没用完呢,吃饱了撑的去外面换?找不到好的借口了?总部有没有人管?客户买了机器,用着用着还要花钱换电脑的逻辑,道理在哪?

医美同行得小心注意赛诺龙这个厂家,买完机器有你受的。 我们也找很多同行打听,确实这情况不止我们遇到,其他机构也会遇到也会不高兴。这不摆明就是坑钱,买的时候销售的时候根本没人告诉你这个东西。这不就是欺诈外加强买强卖么?我就不说这机器动不动就出个毛病了,看着我们工作群聊天记录里你们公司的产品老出问题我都有点后悔花了一百五十多万买两个机器了。

先转发抽个3000块吧,这钱就算抽奖也不能被这么套路。也不知道这种套路归不归市场监督管 @北京市场监管 @北京朝阳市场监管

https://postimg.cc/gallery/ZZYhtsb

投心湖的石子:医疗设备行业的钱是不是太好赚了,厂家才能这么牛气。

转发抽3000块。好久没喷人了。

曝光下赛诺龙@Candela激光 这个厂家太不靠谱了,机器出问题一个月了还没解决,让我们掏4万9换电脑。大部分医疗美容用的的机器,有治疗头、有手具等等耗材需要定期或每次换都是正常的。我头一次听说机器系统有积分用完需要换的,这离谱到家了。不管是销售时还是合同里从来没说过机器买了,机器的系统还有积分,积分清零就没办法更新,更新就要换电脑。就好像你买了个打印机除了纸、墨之外用机器还有积分,用一半了告诉你要花钱更新不然机器就罢工。

几万块不多,但这个事情很恶心,当初的销售消息电话不回失联。一度怀疑这公司是不是要凉了跑路了。如果你们靠这种套路赚钱,坑客户这公司早晚得出问题。工程师还说我们在机器手柄在外面换过,你们合同里原厂带的我们都还没用完呢,吃饱了撑的去外面换?找不到好的借口了?总部有没有人管?客户买了机器,用着用着还要花钱换电脑的逻辑,道理在哪?

医美同行得小心注意赛诺龙这个厂家,买完机器有你受的。 我们也找很多同行打听,确实这情况不止我们遇到,其他机构也会遇到也会不高兴。这不摆明就是坑钱,买的时候销售的时候根本没人告诉你这个东西。这不就是欺诈外加强买强卖么?我就不说这机器动不动就出个毛病了,看着我们工作群聊天记录里你们公司的产品老出问题我都有点后悔花了一百五十多万买两个机器了。

先转发抽个3000块吧,这钱就算抽奖也不能被这么套路。也不知道这种套路归不归市场监督管 @北京市场监管 @北京朝阳市场监管

https://postimg.cc/gallery/ZZYhtsb

梁斌penny

:就是给网友回答问题,然后就招这么多骂,太惨了,好在我心态好。。

今年上半年,重庆的社会消费品零售总额已经超过上海成为全国第一。

老年人决定了上海的消费会不断的萎缩。 ​​​

账不是这么算的。

贷款是下个月开始收,租金是第一个月开始收,一般还有押金,租金也有没租出去的时候。这些差异排除,按平均租金计算,都按下个月开始。

s首付资金,d贷款月供(为了简化计算,按统一的等额本息),z平均租金,n贷款年限,r市场期望资金平均年化收益率。

现在利率都比较低,大约3%左右,贷款的月利率一般也是按年利率/12算的,所以我们也按这个月利率计算。

按n年后资金的时间价值,n年后房子平衡价:

j=(s+12*(d-z)/r)*(1+r)^n-12/r。

算首付500万,月供3万,月租金2万,市场期望年利率算一般现在房贷贷款年利率3%,那么24年后的平衡房价:

j=(500+400)*1.03^24-400=1429.5万。

就是24年后房子要卖1428.5万才保本。如果你期望的资金收益率r高一点,还要更高的价格才保本。

转:

我让大模型给我算了个帐,假定500万首付,贷款24年(我这个年龄最多能贷这么多年),每个月还3万,大概只能买总价1147万的房产。那么24年时间归还的利息216万元。也就是实际总价是 1147 + 216 = 1363万。 如果24年后房子不值1363万,那就亏了。 如果计算租金价值,每年租金20万,24年480万。那么房子如果不值883万就亏了。另外如果计入租金价值,还不真不如租个豪宅算了。。真没必要担那么大风险,羁押这么多资金,24年480万,正好是首付了。

https://postimg.cc/1gp3Sv2g

我让大模型给我算了个帐,假定500万首付,贷款24年(我这个年龄最多能贷这么多年),每个月还3万,大概只能买总价1147万的房产。那么24年时间归还的利息216万元。也就是实际总价是 1147 + 216 = 1363万。 如果24年后房子不值1363万,那就亏了。 如果计算租金价值,每年租金20万,24年480万。那么房子如果不值883万就亏了。另外如果计入租金价值,还不真不如租个豪宅算了。。真没必要担那么大风险,羁押这么多资金,24年480万,正好是首付了。