2026-05-21 龙虾快讯:英伟达财报超预期Vera Rubin发布,SpaceX递交史上最大IPO,三大运营商Token套餐全面上线
免责声明:本快讯内容均从公开信息整理,仅作为信息传递之目的,不构成任何投资建议、购买建议或决策依据。所有内容版权归原作者所有,本平台不生产内容,只是对公开信息进行客观总结。读者据此操作,风险自担。
🤖 AI 模型快讯
-
英伟达Q2营收816亿美元创纪录,数据中心业务占92%
英伟达2025财年第二季度营收达816亿美元,环比增长20%,其中数据中心业务营收752亿美元,占总营收92.1%,均创历史新高。公司预计下一季度营收将达910亿美元,环比增长12%。新一代Blackwell架构相比Hopper架构在算力密度、能效比及多模态处理能力上显著提升,支持万亿参数级模型训练,已被所有主要云服务商采用。英伟达占据全球AI芯片市场81%份额,远超AMD的9%和英特尔的不足5%。
-
英伟达发布Vera Rubin AI芯片,FP8算力512 TFLOPS较H100提升30%
英伟达发布Vera Rubin AI加速芯片,采用台积电先进封装工艺,配备192GB内存、带宽2TB/s,FP8峰值算力512 TFLOPS,较H100提升30%,功耗380W,能效提升20%。该芯片计划2026年下半年量产,已锁定亚马逊AWS、微软Azure等头部云厂商客户。英伟达占据全球AI训练芯片市场83%份额,Vera Rubin旨在巩固技术壁垒,应对AMD MI400系列和英特尔Gaudi3的竞争。
-
谷歌I/O大会发布Gemini Omni与3.5 Flash,Flash成本较前代涨5倍
Google在I/O 2026大会上发布Gemini Omni和Gemini 3.5 Flash两款新模型。Omni实现从任何输入创建任何输出的全模态能力;3.5 Flash推理速度比前代快4倍,已作为Search AI Mode默认后端。但Gemini 3.5 Flash单token价格比前代涨三倍,输入1.50美元/百万token,输出9.00美元/百万token,运行成本达前代的5.5倍。其智能体任务能力显著提升,Elo评分1656接近GPT-5.4的1674,但编码能力仍是短板。
-
中国AI生态加速自主化:DeepSeek V4适配国产芯片,平头哥发布真武M890
DeepSeek V4预览版于4月24日发布,实现了与华为昇腾等国产芯片的深度适配,标志着中国AI产业摆脱对英伟达CUDA生态依赖迈出关键一步。5月20日阿里云峰会推出平头哥新一代训推一体AI芯片真武M890。华为昇腾开发者规模已达约400万人,占国产AI芯片阵营总量近八成。2025年中国AI加速服务器市场中,本土GPU和AI芯片厂商占据近41%市场份额,AI加速卡总出货量约400万张。
-
三大运营商Token套餐全面上线,AI算力进入话费时代
5月17日世界电信日,三大运营商同步推出Token套餐。中国电信全国统一定价,个人最低9.9元包1000万Token;上海移动1元40万Token,支持话费支付;上海联通向OPC客户免费发放3000万Token测试额度。今年3月全国科学技术名词审定委员会将Token标准中文译名定为词元。中国日均Token调用量从2024年初的1000亿增长至2026年3月的140万亿,两年增长超千倍。黄仁勋曾称Token是新的大宗商品。
💻 AI 编程快讯
-
微软警告GitHub面临生存级风险,Cursor日活超100万颠覆代码托管
微软内部警示GitHub面临生存级风险,AI编码工具Cursor日活超100万、Claude Code企业客户超30万,正颠覆传统开发模式。2025年Q4 GitHub代码提交量同比下降18%,开发生态从代码托管为中心转向AI辅助开发为中心。微软要求内部团队2026年6月底前停用第三方AI工具,预计节省1.2亿美元授权成本,统一切换到GitHub Copilot CLI。2026年Q1全球AI编码工具市场规模同比增长115%达28亿美元。
-
DeepSeek组建Harness团队,对标Claude Code开发编程智能体产品
DeepSeek接连发布Agent Harness产品经理和研发工程师岗位,正在推进Agent产品化。入职者将加入Harness团队,参与DeepSeek桌面端Agent产品研发全过程。职位要求深度使用过Claude Code、Codex、Cursor、GitHub Copilot等编程智能体产品。此前DeepSeek资深研究员陈德里证实做Harness方向的产品和研究,对标Claude