2026-06-21 龙虾快讯:智谱GLM-5.2开源引爆GRPO之争,微信AI助手灰度上线,具身智能赛道半年融资438亿
免责声明:本快讯内容均从公开信息整理,仅作为信息传递之目的,不构成任何投资建议、购买建议或决策依据。所有内容版权归原作者所有,本平台不生产内容,只是对公开信息进行客观总结。读者据此操作,风险自担。
🤖 AI 模型快讯
-
智谱宣布GLM-5.2完全开源,744B参数MoE模型MIT协议开放
智谱于6月21日宣布GLM-5.2完全开源。GLM-5.2是一个744B参数、激活40B的MoE模型,遵循MIT协议完全开源,支持真正可用的1M token上下文。在长程任务基准FrontierSWE上,它拿到74.4%,逼近Claude Opus 4.8的75.1%,反超GPT-5.5的72.6%。开发者实测后表示,这是第一个让他们认真考虑用来替换Opus或GPT工作流的开源模型。值得注意的是,GLM-5.2在长程强化学习阶段放弃了GRPO,改用基于critic的PPO路线,这一技术细节引发了广泛讨论。
-
GRPO过时了吗?GLM-5.2换掉GRPO引爆强化学习路线之争
GRPO由DeepSeek于2024年提出,经DeepSeek-R1验证后几乎成了开源社区训练推理模型的默认答案。但GLM-5.2在长程智能体任务中改用基于critic的PPO,用token级别的优势值适配长短不一的子轨迹。技术社区讨论分化为多条路线:有人认为critic回来了,有开发者对比发现小规模项目中actor-critic表现明显更好;学术界GSPO、DAPO等变体仍在涌现。更准确的说法是:强化学习算法的选择正在变得任务相关——短程可验证任务GRPO依然够用且便宜,长程智能体任务价值网络重新变得重要。
-
PPO算法经典之作:曾被NeurIPS 2017拒稿
PPO作者John Schulman透露,这个后来在RLHF和大模型训练中被广泛使用的经典算法,当年曾被NIPS 2017拒之门外。PPO的目标是在保留TRPO稳定性的同时降低实现复杂度,但最终将其推向更大舞台的是大语言模型。从RLHF到RLVR,PPO成了大模型后训练的基础算法之一。Schulman解释,论文当时被认为创新性有限,但这折射出学术评价与真实产业需求之间的错位——学术界看重新颖性,真实世界更关心方法能否扩展到更大规模并保持稳定。LSTM、SIFT、Dropout等后来影响深远的技术也曾被顶会拒稿。
-
强化学习之父Sutton联手毁灭战士之父Carmack,机械手真实Atari游戏自主强化学习145小时
强化学习奠基人Richard S. Sutton与传奇程序员John Carmack领导的Keen Technologies合作,发布Physical Atari系统。该系统由树莓派驱动的Atari Devbox和专门用来按摇杆的机械手Robotroller组成,硬件成本控制在1000美元以内。系统在Pong、Seaquest等六款游戏上累计运行约145小时,期间无人工干预。实验发现即使同款机器人换一台,策略表现也明显变差,需重新学习才能恢复。端到端响应延迟约165毫秒,大致落在人类反应速度区间。
💻 AI 编程快讯
-
AI巨头的Token补贴大战:订阅Token价值最高为订阅费70倍
SemiAnalysis评测显示,OpenAI和Anthropic的订阅模式下,实际消耗Token价值最高可达订阅费的70倍,这被称为「逆向定价」——用激进亏损留住重度用户。但AI Token几乎没有锁定效应,用户可轻松在GPT、Claude、Gemini之间切换。Google Ventures创始人Bill Maris指出,谷歌凭借每年超3000亿美元广告收入,有能力将Token价格再砍80%。OpenAI累计融资超1800亿美元、Anthropic超1300亿美元,上市后华尔街将审视其「每收1美元订阅费实际亏损70美元」的模式。
🏢 AI 行业快讯
-
具身智能赛道2026上半年融资约438亿,大脑派占超半数
量子位不完全统计显示,2026年上半年国内具身智能赛道融资约438亿元,而2025年全年约554亿、2024年约137亿。超过一半资金涌入「大脑派」公司,强调「软件定义硬件,模型定义本体」。本体派公司同期融资仅占12.8%。Pre-A轮平均融资7亿元、B轮平均22.5亿元。千寻智能2月至6月完成四轮融资累计近50亿元,估值达200亿元。它石智航4月Pre-A轮4.55亿美元创中国具身智能最高单轮融资纪录。
-
近八成具身大脑公司研发世界模型,高校科研团队成创业主力
量子位统计,35家有融资动态的「大脑派」公司中,27家在研发世界模型,占比近八成。2024年几乎所有头部机器人公司都讲VLA,如今「仿佛谁不做世界模型,谁就掉队了」。但世界模型的语义尚无共识,李飞飞直言这是「被滥用最严重、语义最过载的词汇」。创业主力方面,17家公司一号位来自高校或科研机构,占比约一半。清华大学是最主要人才来源,9位创始人/联创/首席科学家出自清华。00后创业者也开始受到资本热捧。
-
AI数据独角兽Databricks寻求新融资,估值或达1750亿美元
Databricks正在寻求新一轮融资,最高估值可能达到1750亿美元(约1.26万亿元人民币)。公司2月刚融资50亿美元,目前估值1340亿美元。Databricks年收入规模已超54亿美元,净收入留存率超140%,年消费超100万美元的客户超800家。其核心能力是帮助企业管理混乱的内部数据并接入AI系统,正从数据平台转型为企业AI统一操作层,推出Genie One、Agent Bricks等产品,还开发了AI支出控制工具应对Agent消耗激增。
🌐 互联网快讯
-
微信AI助手「小微」小范围灰度上线
微信团队已小范围灰度上线原生AI助手「小微」。部分用户微信主界面左上角出现小眼睛式样图标,即为AI助手测试版入口。据腾讯客服介绍,微信小微支持通过文字或语音对话操作微信原生功能、调起小程序等,例如帮助好友发送消息、查询朋友圈、预约服务等。这是微信在AI交互领域的重要探索,将AI能力深度集成到社交平台中。
-
比特币ETF 30天净流出63.5亿美元,创历史新高
Galaxy Research披露,比特币ETF在过去30天内净流出资金达63.5亿美元,创下历史新高,在所有582个30天窗口期内排名第一。这一数据反映出加密市场正面临巨大的资金外流压力。比特币ETF自获批以来曾经历大规模资金流入,但近期持续净流的趋势表明市场情绪正在发生显著变化。
-
AI投资热潮向上游扩散,美股半导体设备龙头今年普遍翻倍
年初至今美股市场中,AI硬件板块集体狂飙的同时,产业链上游的半导体设备赛道亦同步走出亮眼升势。总市值超百亿美元的9家半导体设备公司,今年以来股价涨幅均已超过75%。其中应用材料、拉姆研究、科磊、泰瑞达、MKS Inc、英特格、Onto Innovation这7只个股年内股价实现翻倍。TCB热压键合设备因HBM4扩产需求火爆,韩美半导体、韩华半导体、ASMPT纷纷拿下大单。半导体设备行业正迎来卖方市场,FPGA交期从8-10周拉长到最长52周。
-
高盛大幅下调黄金目标价至4900美元,长期多头转趋谨慎
高盛日前将2026年年终黄金价格预测下调了500美元/盎司至4900美元,原因是美联储今年料不会再降息。该行表示金价下半年仍有望上涨,但涨幅将小于此前预期。近年来高盛一直是黄金市场最坚定、最高调的看多声音之一。此次下调标志着该行基调出现了轻微转变。
-
SpaceX上市前被MSCI打最低ESG评级「CCC」
据报道,指数提供商MSCI在SpaceX本月进行创纪录750亿美元公开募股之前,授予了其最低级别ESG评级「CCC」。MSCI称SpaceX「因其高风险敞口及未能管理重大ESG风险而落后于行业」。EDHEC商学院学者表示:「极差的治理评估和较低的总体ESG评级不应让任何人感到意外。对公开市场投资者而言,这非常接近一个治理层面的恐怖故事。」
📈 今日A股行情
周末休市:今日为周六,A股休市。
🇺🇸 今日美股行情
周末休市:今日为周六,美股休市。