只管大型说话模型(LLMs)和大型视觉 - 说话模型(VLMs)在视频分析和长语境处置方面获得了显著进展,但它们在处置信息密集的数幼时长视频时仍显示出局限性。
本文提出了一种新鲜的智能体 Deep Video Discovery (DVD),通过将长视频宰割为更短的片段并将其视作环境,利用 LLM 先进的推理能力来思虑问题并自主规划,选择拥有适当参数的工具来从环境中逐步获守信息,最终回覆问题。在最新的推理模型OpenAI o3的援手下, DVD以这一简洁有效的 agentic 框架在极度拥有挑战性的LVBench上以74.2%的正确率大幅超过了之前的工作。这一工作将以MCP Server的大局开源。
分歧于之前的视频智能体框架依赖于手动设计的固定工作流程,DVD 强调其作为智能体的自主性,即通过自主规划,决策和行动来解决问题。
为了充分利用这一自主性,我们将原始的长视频转换为多粒度视频数据库,并提供了一套以搜索为中心的工具使得智能体在分歧阶段网络分歧粒度的信息。具体来说该系统重要由三个主题组件组成:多粒度视频数据库、以搜索为中心的工具集以及作为智能体协调器的 LLM。
在 “多粒度视频数据库构建” 阶段,系统将超长视频转换为一个结构化数据库,通过统一将视频宰割成短片段(例如 5 秒),并提取全局、片段和帧级此外多粒度信息,蕴含主题中心化提要、片段字幕及其嵌入向量,以及原始解码帧...。
(2)片段搜索(Clip Search)工具,实现通过片段描述 Embedding 对视频内容进行高效语义检索,并返回排名靠前的有关视频片段及其字幕和功夫领域。
LLM 作为主题认知驱动器,在迭代的 “观察 - 推理 - 行动” 循环中,凭据累积的知识和推理证据采取行动,从而赋予智能体自主、证据疏导和矫捷的行动机造,有效地将原始查问分化为逐步细化的子查问来解答问题。
该系统在多个长视频基准测试上进行了全面评估,展示了其卓越的效能和壮大的机能。在极具挑战性的 LVBench 数据集上,DVD 智能体获得了 74.2% 的最新正确率,大幅超过了所有现有工作,蕴含先前的最先进模型 MR. Video(13.4% 的提升)和 VCA(32.9% 的提升)。在辅助转录的援手下,正确率进一步提高到 76.0%。在 LongVideoBench、Video MME Long 子集和 EgoSchema 等其他长视频基准测试中,DVD 也持续超过了先前的最先进机能。
图 3:分歧基础模型在智能体中的行为分析。图中能够显著看出分歧基础模型阐发出显著的行为模式差距,不拥有推理能力 GPT-4o 阐发出极度单一的行为模型。
消融钻研证实了工具设计的有效性,并强调了推理模型在整个智能体系统中的关键作用:更换推理模型(如使用 OpenAI o4-mini 或 GPT-4o)会导致机能降落,这批注 LLM 推理能力的缺失会导致智能体行为崩溃。对智能体推理行为的分析也揭示了分歧模型在工具挪用模式、推理深度和正确性之间的关联,例如 GPT-4o 阐发出过度自负和行为崩溃,偏差于过早实现推理。这些行为模式的分析进一步为未来的智能体设计以及基础说话模型的发展提供了实际参考。
《深度开发》by我叫大海百度网盘谈判桌上的部分卡点也浮出水面。据称,伊方寻求解冻约240亿美元海外资金并放松制裁;美方则面临国内政治反弹和安全风险压力,不愿轻易接受大规模松绑制裁。恰好就赶上白鹿争议比较大的时期,嘉宾们都知道网上是怎么说节目组和白鹿的,所以他们是不是要在镜头前道歉或者回应一下?《深度开发》by我叫大海百度网盘《大地影视资源官网二页》捕捉情绪消费趋势并不难,真正令人意外的是,在全球IP市场上跑通这条路的,是一家完全“不讲故事”的中国公司。与迪士尼和漫威依靠电影、动画、漫画等叙事体系来赋予IP生命力不同,泡泡玛特的IP角色没有电影,没有动画,没有漫画作为内容基座。而王宁创办的泡泡玛特,其IP只提供抽象的形象和直给的情绪。这种选择在全球化扩张中展现出了意想不到的优势。美国经济学家泰勒·考恩在讨论文化产品的全球流动时曾指出,最容易跨越文化边界的创意产品,往往是那些信息密度低但情感密度高的产品——它们不需要翻译,不需要语境,甚至不需要语言。表情包如此,Emoji如此,LABUBU也如此。因为不承载叙事,消费者不需要了解角色背景就能产生情感连接,文化折扣因此被大幅降低。泡泡玛特等潮玩就是这样,踩中了文化全球化的一条捷径:绕过叙事,直达情绪。理论上确实有这种风险。但就像我刚才说的,我们现在是一支很特别的球队,队里有很多经历过多届大赛的球员。我们当然希望避免那种情况发生。最重要的是在球场上做好自己的事情,展现团队实力,然后尽可能走得更远。只要还能留在赛事里,就说明一切都在朝好的方向发展。
20260608 ? 《深度开发》by我叫大海百度网盘他批评4名投赞成票的共和党人是“爱出风头的人”,“他们应该为自己感到羞愧”。他还指责民主党人受“特朗普妄想综合征”驱使投票,“宁愿让美国失败”。《《对面邻居不拉窗帘》作者:幼花灯糕》除了罚跑,文东军的手机里还有很多带着水印的抄写照片,一开始文东清不明白哥哥怎么老是抄一样的东西,后来才发现这是公司的企业价值观。4月4日的工作群中显示,文东军因昨日业绩未达标被总监要求罚抄10遍公司的使命、愿景、价值观,要求他当天10点半发群里。还有人在群内为此调侃:“你俩连着写几天了,准备当书法协会会长了。”当天10点13分,文东军交出5张A4纸、约1500字的抄写证明。
20260608 ? 《深度开发》by我叫大海百度网盘欧塞尔官方宣布,俱乐部与主教练克里斯托夫-佩利西耶正式结束合作关系。同时离开的还有其教练团队中的三位成员:让-马里-斯特凡诺波利、奥利维耶-拉加德以及奥雷利安-德诺蒂。《枫与铃第一集在线旁观免费全集电视剧》就在吃瓜群众和经销商认为闹剧要结束的时候,又有消息说宗馥莉回到了娃哈哈上班。看到这儿,如果你以为宗馥莉这是要撒手娃哈哈从此当个乖巧的二股东,那你可就太天真了。