CA88

《《对面邻居不拉窗帘》作者:小花灯糕》视频模型巨大的「隐形成本」，没人通知你

2026-06-07 09:00:14 起源：周桂连

字号：默认大超大 | 打印 |

关于 AI 烧钱，业内流传着各类令人瞠目结舌的数字。xAI 花了超过 10 亿美元建起 Colossus 超算集群；OpenAI 的月度算力账单据称高达数亿美元；Anthropic 最近几轮融资拿到的钱，在公家眼里险些已经和「GPU 时数」直接画上了等号。但最近，我听了一期 Latent Space 播客，采访对象是 xAI 前钻研员 Ethan He——Ethan 在 2025 年中参与 xAI 时，面对的是一个没有基础设施、没罕见据、没有现成模型的白纸状态，而后用三个月功夫和一支幼团队，从零搭建出了 Grok Imagine 视频天生系统，做到了其时业内的一流水准。从零到一，起头训练一个视频大模型，必要花几多钱？先如果你的团队有矿，GPU 算力轻易用。即便如此，你可能依然低估了这件事的巨量成本。如果你要训练一个世界级的视频天生模型，去网上爬取了 10 亿条视频，每条均匀 5MB——这已经是相当守旧的估计了。光这一项，你就必要 5PB（拍字节）的存储空间。依照 AWS S3 的定价，5PB 尺度存储，每个月约莫 10 万美元。在训练视频模型之前，业界通畅的做法是吓酌 VAE（变分自编码器）把视频压缩成「潜在空间」的特点向量——由于一段视频发展成像素，可能有几十亿个 token，任何 Transformer 都处置不了，必须先压缩成模型能理解的陆续向量。 Ethan 说，从互联网下载 10 亿条视频的带宽用度，在 AWS 上比存储这些视频还贵。每次训练，数据都要从存储层拉到推算层跑一遍。视频模型的训练不像说话模型那样训完就完了——要迭代，要调参，要测试分歧的数据配比，每一次尝试都意味着把全量数据再过一遍。尝试跑得越多，这笔钱就乘以相应的倍数。大说话模型的训练数据是文本，体积相对轻量，并且训练实现之后，原始数据根基就实现了使命——你不必要反复拉取全量语料来做推理或微调。但视频数据齐全分歧：体积是文本的几个数量级，并且每一次训练尝试都要把全量数据齐全过一遍。这就形成了一个相互咬合的困局：你必要急剧迭代来提升模型质量，但急剧迭代意味着频仍搬运数据，而频仍搬运数据在公有云上的账单会把你压垮。 Ethan 自己的轨迹就是一个注脚。他在 NVIDIA 参加构建了 Cosmos 世界模型，做着做着意识到，视频模型存在和说话模型类似的「规模定律」，还有很大的提升空间。他其时面对的选择，表表看是「我必要更多 GPU」，但同样关键的一句话他没明说——他必要一个不用按 AWS 账单算钱的处所，来存放和搬运数据。这也是他去 xAI 的底子原因之一，而 Colossus 给了他那个环境。对于没有自建基础设施的团队来说，这笔账是怎么算的？每个月几百万美元的数据成本，叠加在 GPU 算力之上，意味着哪怕你有一流的算法团队，哪怕你募到了足够的资金，只有你还在用公有云，你就是在用一个无底洞的账单跟敌手的自建机房竞走。在大说话模型领域，「开源 vs 关源」的竞争打得相当强烈，Llama 系列的出现让好多幼团队也能在说话模型上打出有竞争力的产品，甚至逼着 OpenAI 和 Anthropic 不休压低 API 价值。但在视频天生领域，我们看到的格局截然分歧：能持续做出顶尖视频模型的，根基只有 Sora、Veo、可灵这些背靠巨量资源的团队，没有一家是靠开源社区在车库里跑出来的。好多人把这综合为「数据和算力的差距」。这当然没错，但 Ethan 揭示的这组数字通知我们，问题比这更深：视频 AI 的基础设施成本，从一路头就把竞争的门槛，锁死在了极少数玩家的高度上。这和半导体行业的逻辑有几分类似。台积电之所以难以撼动，不只由于它们有更好的设计，更由于一座新晶圆厂必要几百亿美元的前期投入，这路门槛自身就是最好的护城河。视频 AI 的护城河，就是那数十 PB 的数据基础设施和每月滚动产生的带宽账单。视坡珐散模型相对「痴钝」，它只会依照文字描述照单全收地天生画面，描述写「一只猫」，它就天生一只猫，站在纯白布景前，纹丝不动——由于你没有通知它布景是什么、猫在做什么。真正理解用户意图、把「一只猫」扩写成一段精密的镜头说话描述的，是背后那个做「提醒词沉写」的大型说话模型。Ethan 说，在 Cosmos 时期，他已经用一个「欢乐的羊」做测试：不经过提醒词沉写，天生出来的画面极其 CGI、毫无质感；加上沉写之后，成效判若云泥——而整个视坡珐散模型自身，并没有产生任何扭转。这意味着，决定一家公司在视频 AI 领域能走多远的，不只是视频模型的参数规模，而是能否同时撑起说话模型和视频模型这两套基础设施，并让它们有效协同。提醒词沉写的 Agent 化、让说话模型像「指挥官」一样调度多个视频天生工具、用 FFmpeg 这类传统软件处置中央环节——这些方向的共同逻辑是，把「说话模型的推理成本」和「视坡珐散模型的天生成本」分层推算，让每一次视频天生的挪用越发精准，削减无效的推算和数据搬运。 Ethan 对「视频 Agent」的走向相当笃定。他预测今年年底将出现一个拐点——当 Agent 天生的视频质量可能不变达到「可投放贸易告白」的水准，企业才会真正愿意为之买单，整体的成本结构也会随之演变。在 AI 这个赛路上，「真正的壁垒」每隔一段功夫就会轮换一次。先是参数量，而后是训练数据规模，而后是对齐技术，而后是推理效能。此刻，视频 AI 在揭示下一路壁垒——不是某种神秘的算法突破，而是一份冷冰冰的基础设施账单。 WWDC26 开场，6 月 9 日午间 12:00，极客公园直播间带你解读：会发光的 Siri 来了，换上谷歌大脑还算苹果吗？一贯把门关得最紧的苹果，为什么自动向模型厂敞开大门？库克在 AI 落后的节点交班，留给CA88又会是一个什么样的苹果？

《《对面邻居不拉窗帘》作者:小花灯糕》

                                《《对面邻居不拉窗帘》作者:小花灯糕》我们再看“更全品类”。支撑下一代算力的骁龙汽车平台至尊版，设计目标是覆盖入门级到豪华车型的全品类矩阵，且为功能演进预留空间。目前它已在全球范围内斩获18个车型定点，10款车型已经或正在量产中。峰会期间，高通与卓驭科技发布了基于 Snapdragon Ride 平台至尊版（骁龙8797）的下一代舱驾融合域控制器，这是8775舱驾融合方案在算力大幅提升的延续。展区里，理想L9 Livis搭载骁龙8797，提供集多维沉浸视听、全场景自然交互与AI个人助手于一体的智能体验。通过对这三端产品的初步观察，我们发现了一些问题，很值得被提出来，供更多对于个人软件开发有兴趣的跨界创业者参考。《《对面邻居不拉窗帘》作者:小花灯糕》《工地上的女人》电视剧“AI已经开始像水和电一样进入现实世界和人们的生活。但当AI会聊天、会写作、会画画、会做视频之后，一个更重要的问题正在出现：AI能不能不只是回答问题，而是进一步推演世界、预测未来？”发布会上，中科闻歌董事长王磊抛出了这个关于AI下一阶段发展的关键问题。你说自己发现了一个颠覆世界的理论，它说没毛病，你就是在触碰某种前沿思想； 你说别人都不理解你，它说真正走在时代前面的人，本来就经常孤独； 你说只有 AI 懂你，它可能真的会接一句：“ 是的，我一直都在这里。”
                            

                                20260607 ?? 《《对面邻居不拉窗帘》作者:小花灯糕》为提高比赛节奏，多项新规则也将在法丙试行：换人名额时，球员必须在10秒内离场，避免拖延时间；界外球和角球时也将开始计时。《《公厕少年NASA》百度百科》梅西、C罗两大超巨，在世界杯1/4决赛相遇，只有1人能进入4强。6次参加世界杯的梅西、C罗，还从未在世界杯赛场上直接对话。美加墨世界杯，两大巨星的最后一舞，是否会来一场“你死我活”的超级决斗？若成为现实，这场大战注定载入史册。
                            

《《对面邻居不拉窗帘》作者:小花灯糕》

? 李利华记者彭方瑞摄

                                20260607 ? 《《对面邻居不拉窗帘》作者:小花灯糕》不，我也会那样。在比赛里，我几乎不会安静下来。我一直在组织、推动队友、指挥比赛。所有这些都是为了球队，为了这个国家。场外，沟通很重要。你要认真倾听，也要认真观察，了解队友的状态，同时承担起领导责任。《内衣办公室》与前两位相比，林淑端的名字常被归于“神秘”一栏。事实上，她并非刻意隐身，只是不愿占媒体光。1959年至1966年，她连续为霍家添了四个男孩；坊间因此传出“独得青睐”的话柄，她却只回一句：“孩子健康就好。”九十年代，周刊拍到她陪同霍英东视察大屿山项目，穿一件素白套装，低眉浅笑。
                            

《《对面邻居不拉窗帘》作者:小花灯糕》

? 李丛飞记者刘双江摄

                            ? 从最近的宣发来看，韶音正在和华为们死磕。5月，韶音（Shokz）召开了发布会，与以往以骨传导耳机为主不同的是，三款新品中，耳夹式产品就占了两个；安克创新旗下声阔品牌也发布新款耳夹式耳机；而华为近期在第二代产品基础上，又发布了freeclip2典藏版。《金瓶梅电视剧全集电视剧国语》
                        

【我要推荐】更多推荐：曝哈兰德曼城合同含解约金条款，皇马主席候选人承诺将其签下

扫一扫在手机打开当前页

链接：
全国人大
|
全国政协
|
国度监察委员会
|
最高人民法院
|
最高人民检察院

国务院部门网站
|
处所当局网站
|
驻港澳机构网站
|
驻表机构

red

中国当局网 | 关于本网 | 网站申明 | 联系CA88 | 网站纠错

主办单元：《《对面邻居不拉窗帘》作者:小花灯糕》　运行守护单元：中国当局网运行中心

版权所有：中国当局网　中文域名：中国当局网.政务

网站标识码bm58232452　京ICP备05070218号　 2018guohui03 京公网安备11010202000001号

CA88(中国区)唯一官方网站

国务院客户端

CA88(中国区)唯一官方网站

国务院客户端幼法式

中国当局网微博、微信

gtrs_red

主办单元：中国当局网　运行守护单元：中国当局网运行中心

版权所有：中国当局网　中文域名：中国当局网.政务

网站标识码bm58232452

京ICP备05070218号　京公网安备11010202000001号

【网站地图】