AI Know 早报 · 2026-05-20

🚀 科技动态

🏭

GTC 2026：NVIDIA 推理帝国版图全面展开

KOL/媒体科技动态

SemiAnalysis 发布 GTC 2026 深度报道，全面解析 NVIDIA 推理帝国的产品矩阵：Groq LP30 推理芯片、LPX Rack 推理系统、Attention FFN 解耦架构、Oberon & Kyber 软件更新、以及全新的 Vera ETL256 芯片。分析师指出 NVIDIA 的创新速度没有放缓迹象，推理端的产品线完整度已远超竞争对手。

Groq LP30 推理芯片 + Vera ETL256 — NVIDIA 的"推理双核"战略已经成型。收购 Groq 的技术正在以惊人的速度产品化。Attention FFN 解耦是一个架构级的创新，意味着 NVIDIA 不只是在硬件上碾压，也在架构设计上引领方向。

阅读原文 ↗

🔄

分析师：80-85% 的 AI 工作负载将转向推理

KOL/媒体科技动态

Fierce Network 引用分析师 Jack Gold 的观点指出，未来 80-85% 的 AI 工作负载将是推理而非训练。NVIDIA 在 GTC 上展示的 Vera Rubin + Groq 3 LPU 集成方案，正是为了抢占这一巨大市场。Gold 认为 NVIDIA 在推理市场的地位可能比训练市场更牢固，因为推理需要更成熟、更稳定的软件生态。

80-85% 推理 vs 15-20% 训练——这个比例意味着 AI 算力市场的重心正在发生根本性转移。对于芯片公司来说，谁能在推理市场建立优势，谁就能主导下一阶段的 AI 基础设施。NVIDIA 的先发优势在推理端同样明显。

阅读原文 ↗

🤝

OpenAI & Anthropic 合资模式获行业认可：ITdaily 分析"为何是双赢"

KOL/媒体科技动态

ITdaily 发表分析文章，解读 OpenAI 和 Anthropic 的合资公司战略。文章认为，合资模式对双方都是双赢：AI 公司获得企业客户渠道和行业 Know-how，资管公司获得 AI 能力赋能。两大竞争对手不约而同选择同一模式，说明合资已成为企业 AI 商业化的"标准答案"。

同一周、同一模式、两大巨头——合资不是偶然，而是 AI 商业化的必然阶段。当模型能力趋同、API 价格走低，谁能更快地交付"行业解决方案"，谁就能锁定企业客户。合资模式的核心不是技术，而是"信任"——有了华尔街的背书，企业客户才敢大规模用 AI。

阅读原文 ↗

💾 芯片算力

💻

SemiAnalysis 详解 NVIDIA GTC：Groq LP30、Vera ETL256 与 Attention 解耦

KOL/媒体芯片算力

SemiAnalysis 对 GTC 2026 进行了完整的技术拆解，亮点包括：Groq LP30 推理芯片实现比传统 GPU 低 10 倍的延迟；LPX Rack 将 32 颗 LP30 封装为推理一体机；Attention FFN 解耦技术将 Transformer 的注意力层和前馈层分离到不同芯片处理，大幅提升效率。Oberon 软件栈提供了统一的推理调度框架。

Attention FFN 解耦是真正的架构创新——把 Transformer 的 Attention 和 FFN 拆到不同的硬件上处理，就像把大脑的"思考"和"表达"分开优化。这个思路可能改变整个 AI 芯片的设计范式。当 NVIDIA 开始玩架构创新，竞争对手的压力会更大。

阅读原文 ↗

💰 财经简讯

📈

NVIDIA GTC 新品矩阵曝光：华尔街怎么看推理芯片的定价策略？

KOL/媒体财经简讯

GTC 2026 上 NVIDIA 展示了完整的推理芯片定价策略：Groq LP30 定价低于传统 H100/B200 GPU，意图用性价比抢夺推理市场份额；而 Vera ETL256 面向超大规模推理场景，定价更高。两级定价策略表明 NVIDIA 正在针对不同规模的市场精准打击。

两级定价策略——低端抢份额、高端赚利润——这是非常经典的芯片定价策略。NVIDIA 在推理市场的打法明显瞄准了两个目标：用 Groq LP30 打击 ASIC 定制芯片的性价比优势，用 Vera ETL256 守住高端市场。如果这套打法被市场接受，竞争对手的日子会更难过。

阅读原文 ↗

🏦

OpenAI & Anthropic 合资模式成行业范本，更多 AI 公司跟进

KOL/媒体财经简讯

随着 OpenAI 和 Anthropic 各自宣布合资计划，更多 AI 公司开始研究类似模式。行业分析认为，合资将改变 AI 行业的融资和商业化结构——从"融 VC 的钱烧算力"转向"和产业资本一起做收入"。合资模式的兴起也预示着 AI 行业正在从"烧钱拼参数"进入"赚钱比能力"的新阶段。

从"烧 VC 的钱"到"和产业资本做收入"——这是一个标志性的转变。当 AI 公司开始和华尔街合资而不是向 VC 融资，说明 AI 商业化的"成年礼"正在到来。烧钱的时代结束了，赚钱的时代开始了。

阅读原文 ↗

🌐 开源生态

🔓

DeepSeek V4 持续发酵：1.6T 参数模型掀开源社区热议

KOL/媒体开源生态

DeepSeek V4 系列发布后持续引发热议。DeepSeek-V4-Pro（1.6 万亿参数）和 V4-Flash 的发布标志着开源模型在规模上首次追平闭源水平。开源社区正在围绕 DeepSeek 构建完整的工具链和部署方案，BentoML 等公司已发布深度指南。Hacker News 上关于"代码开源 vs 数据未开源"的讨论仍在继续。

1.6T 参数的开源模型——半年前这还是天方夜谭。DeepSeek 证明了"规模 + 开源"可以同时做到。虽然数据未完全开源引发争议，但不可否认的是，DeepSeek 正在推动整个开源 AI 社区走向更高水平的竞争。受益的将是全球的 AI 开发者。

阅读原文 ↗

⚖️

AI 开源 vs 闭源：Hacker News 社区激辩 DeepSeek 许可证

KOL/媒体开源生态

DeepSeek 开源许可证 FAQ 在 Hacker News 上引发激烈讨论。核心争议点：权重开源但训练数据不开源，是否算真正的开源？DeepSeek 10 亿月活才收费的条款也被讨论——有人认为这足够慷慨，也有人认为需要更明确的商业边界。这场讨论折射出开源 AI 社区在"什么是真正的开源"上尚未达成共识。

Hacker News 的争论不是坏事——说明 DeepSeek 已经进入了全球开发者社区的"雷达范围"。至于"权重开源算不算真开源"这个问题，可能需要业界重新定义 AI 时代"开源"的标准。毕竟，当模型权重达到 TB 级时，传统开源的定义确实需要更新了。

阅读原文 ↗

🌍 国际视野

🍎

Apple Intelligence 全面开放：M5 芯片赋能端侧 AI 新体验

一手官方国际视野

Apple 正式发布 Apple Intelligence 全面指南，所有搭载 M5 系列和 A18 及以上芯片的设备均可使用。功能包括智能写作、图像生成、优先通知和隐私保护的 AI 处理。Apple 强调所有数据在设备端处理、不上传云端，并承诺不会将用户数据用于模型训练。

Apple 的"端侧 AI"故事现在有了硬件基础（M5）和软件体验（全面指南）。但问题是——当人们用惯了 Claude 和 ChatGPT 那种"无所不知"的云端 AI 时，Apple Intelligence 的"本地有限能力"是否足够有吸引力？Apple 赌的是大多数用户不需要知道太多，只需要安全。

阅读原文 ↗

📡

xAI 正式更名 SpaceXAI：新官网和 API 门户上线

KOL/媒体国际视野

xAI 官网已正式跳转至 SpaceXAI 品牌，新 API 门户提供 Grok Voice、Grok Vision 等多模态接口。Colossus 超级计算机（xAI 原有的十万卡集群）被整合进 SpaceX 的算力体系。星链边缘节点已开始测试 Grok 的低延迟推理服务，全球覆盖的 AI 推理网络正在建设中。

SpaceXAI 的品牌迁移只花了两周——执行力够快。真正的看点不是品牌，而是星链 + Colossus 的组合：太空中的十万卡集群 + 全球边缘节点，这个基础设施的故事确实够大。但投资人要的不是故事，是 Grok Voice API 的变现数据。

阅读原文 ↗

总司令日评

本周 GTC 2026 成为了绝对的焦点。SemiAnalysis 的深度拆解让我们看到了 NVIDIA 的"推理帝国"版图有多完整——从 Groq LP30 到 Vera ETL256，从 Attention FFN 解耦到 LPX Rack，NVIDIA 正在构建一个比训练时代更庞大的推理产品矩阵。当 80-85% 的 AI 工作负载转向推理，谁能抓住推理市场，谁就能定义下一代的 AI 基础设施。

另一个值得玩味的信号是合资模式成为 AI 商业化的"标准答案"。OpenAI 和 Anthropic 不约而同选择了与华尔街资产巨头合资的道路，说明 AI 公司自己搞不定企业市场——需要产业资本的渠道和信任背书。从"烧 VC 的钱"到"和产业资本一起赚钱"，AI 圈正在经历一场成人礼。

最后，DeepSeek 在 Hacker News 上的持续热议说明一件事：开源 AI 已经到了需要"重新定义规则"的阶段。当 1.6T 参数的开源模型成为现实，传统的"开源=源代码+数据"定义已经不够用了。这个问题的答案不会很快出现，但讨论本身就是进步。