人们常说,AI 一日,人间一年。
这个十一假期,OpenAI 再次证明了这句话。短短几天,它完成了多项重磅发布——Sora 2 火爆全球、ChatGPT 正式迈向应用平台化、与 AMD 签订历史级算力合作协议,公司估值也飙升至 5000 亿美元。假期前后的 OpenAI,几乎成了两家不同的公司。
Sora 2 是这场变革的引爆点。
果说 2024 年初的 Sora 只是 AI 视频生成的起点,那么 Sora 2 无疑标志着进入“GPT-3.5 时刻”的跨越。它不再是单纯的生成工具,而是具备社交属性的内容平台。用户不只是生成视频,而是在分享、互动和传播中创造新形式的AI内容。Sora 2 因此被许多人称作“AI版 TikTok”。
它的技术突破同样令人惊叹。Sora 2 是首个实现“文本到音视频”(Text-to-Audio-Video)的多模态模型,在生成画面的同时同步合成对白、音效和环境声,真正做到声画一体。以往类似 Veo 等产品,通常要依赖额外的音乐模型或声音生成工具后期合成音轨,而 Sora 2 直接在生成过程中完成完整的音视频融合。这一能力意味着模型已经开始具备理解物理世界、遵循时间与空间逻辑的“世界建模”能力,也让AI更进一步迈向具身智能。
视频生成的意义不仅是创作,更是模拟。Sora 2 能够基于物理规律和因果关系生成连续的世界画面,并通过视觉、听觉和语言的统一理解,构建出一个连贯的多模态世界观。它不只是“会拍视频”的AI,更像是在学习“理解现实”。
就在同一时间,OpenAI 又抛出另一颗重磅炸弹。10 月 6 日,公司宣布与 AMD 建立多年合作关系,计划在未来几年内部署总计 6GW 的 GPU 算力,用于下一代 AI 基础设施建设。首批部署将在 2026 年下半年启动,使用 AMD Instinct MI450 系列 GPU。更值得注意的是,这次合作跨越多代技术,涵盖 GPU、软件栈及优化框架的协同,双方将在硬件与推理层面深度融合。
为了建立长期绑定,AMD 向 OpenAI 授予了高达 1.6 亿份认股权证,随着项目部署里程碑和股价目标的实现而分批生效。若条件全部满足,OpenAI 最终可能持有 AMD 约 10% 的股份。业内普遍认为,这项合作既是算力层面的扩张,也是战略上的博弈布局。
就在一个月前,英伟达刚刚宣布对 OpenAI 投资最高 1000 亿美元,为其提供 10GW 的算力支持。如今 OpenAI 又选择与 AMD 合作,形成双供应体系,在保障算力安全的同时,也打破了英伟达在GPU生态的垄断地位。这既是合作,也是制衡。通过引入新的平衡力量,OpenAI 获得了更大的独立性与议价空间,也为未来的基础设施扩张埋下了伏笔。
与此同时,OpenAI 在旧金山举办了史上规模最大的开发者大会 DevDay 2025,吸引了超过 1500 名开发者参加。会上公布的一组数据引发了全场轰动——ChatGPT 的周活跃用户已经突破 8 亿。大会集中展示了 OpenAI 的产品演进:ChatGPT 已经支持在对话中直接运行第三方应用,开发者可通过 Apps SDK 构建和接入服务;AgentKit 工具集让开发和部署智能代理更简单;Sora 2 的视频生成能力首次通过 API 向开发者开放;新版语音与图像模型也进一步降低了使用成本。
这些动作共同勾勒出一个清晰的方向:ChatGPT 正在从一个聊天工具,成长为 AI 时代的操作系统。
所谓“操作系统”,并非传统意义上的文件与任务管理系统,而是以语言和意图为核心的全新计算范式。OpenAI 试图让 ChatGPT 成为人类与数字世界之间的统一界面——用户表达意图,AI 理解并执行。它的底层结构可以拆解为四个逻辑层:意图解析层负责理解用户需求;编排层通过应用生态协调外部服务;执行层整合模型、算力与API,实现任务完成;记忆层则让AI能跨对话、跨任务保持连续状态。这种“意图驱动计算”模式,本质上重新定义了操作系统:它不再以程序为中心,而以人类意图为中心。
假期结束前,外媒披露 OpenAI 最新估值已突破 5000 亿美元。一年前,这家公司还只是ChatGPT的开发者;如今,它正同时主导内容生成、算力布局、生态构建与交互范式的重塑。Sora 2 的出现让AI拥有了声音和视觉,AMD 合作让它掌握了能源与算力,而ChatGPT 的平台化则让它成为一个“通用接口”——连接一切数字活动的中枢。
可以说,这个十一假期,AI 世界走过了一年,而 OpenAI 已经提前抵达了下一个时代。
(撰写|潇飞)