ÓɸñÁéÉîÍ«Áé¸Ð³¢ÊÔÊÒÖ÷µ¼Ñз¢µÄ LLaVA-OneVision-2.0£¬ÊÇÒ»¿îÃæÏòÏÂÒ»´ú¸ÐÖªÖÇÄܵÄÊÓ¾õ˵»°´óÄ£ÐÍ¡£ÍŶӳä·ÖÀûÓÃÊÓÆµ Codec Á÷ºÍ×ÔÑÐ OneVision-Encoder£¬ÊµÏÖ¿çÖ¡¡¢¿çÊÂÎñµÄÔöÁ¿¹Û²âºÍÂ½ÐøÖ¤¾ÝÁ÷½¨Ä£¡£±¾ÎĽ«¾ßÌå½éÉÜÄ£Ðͼܹ¹¡¢ÑµÁ·²½ÖèÓëÄÜÁ¦ÑéÖ¤£¬Õ¹Ê¾¸Ã¼¼ÊõÔÚÊÓÆÂ·í½â¡¢¿Õ¼äÍÆÀíºÍÖ¸±ê×·×ٵȹ¤×÷ÖеÄÀûÓÃDZÁ¦¡£
ÒÔ¡¸ÂëÁ÷£¨Codec-Stream£©¡¹ÎªÊÓ¾õµ¥ÔªµÄ¶àģ̬´óÄ£ÐÍ ¡ª¡ª ÈÃÊÓÆµ²»ÔÙ±»ÇгɹÂÁ¢Ö¡£¬¶ø³ÉΪһÌõÓɱÈÌØÂÊ¡¢»î¶¯Ê¸Á¿Óë²Ð²î¹²Í¬µãÁÁµÄÖ¤¾ÝÁ÷¡£
OV2-8B Ä£ÐÍÔÚ 18 ÏîÊÓÆµ¹¤×÷¡¢11 Ïî¿Õ¼äÍÆÀí¹¤×÷¡¢4 Ïî¸ú×Ù¹¤×÷ÖгöÏÖ²»±ä×ÛºÏÓÅÊÆ£»×ÔÑÐ JumpScore Ôò°ÑÖ÷ÌâÎÊÌâÍÆµ½Ì¨Ç°£ºµ±×÷Ϊ¸ß¶È³Á¸´¡¢¹Ø¼ü˲¼äÉÔ×ݼ´ÊÅ£¬Ä£ÐÍÊÇ·ñÕæµÄ¼ÇסÁË ¡°µÚ¼¸´Î²úÉú¡±£¿Ä£ÐÍ»ùÓÚ Qwen3-8B ˵»°Ä£ÐÍÓëÍŶÓ×ÔÑÐ OneVision-Encoder£¬ÑµÁ·Á÷³Ì¡¢Êý¾ÝºÍȨ³ÁÈ«Êý¿ªÔ´¡£
Codec ²»ÊÇÓÉÓÚ¿á²Å±»·¢ÏÖ£¬¶øÊDZ»Í¨Ñ¶Óë´æ´¢µÄÓ²Ô¼Êø±Æ³öÀ´µÄ£ºÈô°Ñÿһ֡¶¼µ±×÷¶ÀÁ¢Í¼Ïñ£¬ÂëÂÊ»áËæ·Ö±æÂʺÍÖ¡ÂÊһ·ʧ¿Ø¡£¿ÉÀ©´óµÄ¹¤³Ì·ÏßÖ»ÓÐÒ»Ìõ ¡ª¡ª ÀûÓù¦·òÈßÓࣺ°Ñ¿É¼Ì³ÐµÄ²¿ÃÅд³É״̬£¬°ÑÎÞ·¨ºöÂԵı䶯д³É²î·Ö¡£
ÕâÌõÏß´ÓÔçÆÚÔ¤²â±àÂëһ·×ßµ½ H.264/H.265/H.266£¬¼¼ÊõÃû´Ê»»ÁËÒ»´úÓÖÒ»´ú£¬Ö÷ÌâÎÊÌâÏÕЩû±ä£ºÔڲο¼Ö¡ÉÏ×öÔ¤²â£¬Ö»Îª»î¶¯ÏòÁ¿Óë²Ð²îÖ§¸¶¶î±í±ÈÌØ¡£
»»µ½½¨Ä£Ëµ»°£¬codec ²»Ö»ÊÇѹËõÆ÷£¬¸üÏñÒ»¸ö±íÖõÄÔ¤²âÄ£ÐÍ£ºËü°ÑÊÓÆµ²ð³É¡¸¸ßµÍÎÄ + ÔöÁ¿Ö¤¾Ý¡¹¡£¼¸ºÎÎ»ÒÆÍ¨ÖªÎÒÃÇÎïÌåÈôºÎÒÆ¶¯£¬²Ð²î֪ͨÎÒÃÇÔ¤²âÔÚÄÄÀïʧ°Ü ¡ª¡ª ¶øÊ§°Ü£¬ÍùÍùÕýÊÇÊÀ½çÕæÕý²úÉú±ä¶¯µÄ´¦Ëù¡£
Ö÷ÌâÐÅÏë£üÈÃÄ£ÐÍÎªÕæÊµ±ä¶¯¸¶·ÑCodec µÄÆÓËØÐÅÑö£ºÄܱ»¸ßµÍÎÄÍÆ³öµÄ£¬²»ÓÃÒ»±é±é³Á¿´£»ÕæÕýÖµµÃ¸¶·ÑµÄ£¬ÊÇÆÈʹģÐͽ¨¸ÄÅжϵÄÔöÁ¿¡£ÎÒÃǰÑÕâÌ×¹¤³ÌÓï·¨ÉÏÉýΪÊÓ¾õ½¨Ä£ÏÈÑé ¡ª¡ª Èà ViT ÒÔ¡¸×´Ì¬ + ÔöÁ¿¹Û²â¡¹µÄ·½Ê½¶ÁÈ¡ÊÀ½ç£¬Ò²ÌáÐѶÁÕߣºËùνÖÇÄÜ£¬ÍùÍù²»ÊÇ¿´µÃ¸ü¶à£¬¶øÊÇ֪·ÄÄÀïÖµµÃ¿´¡£
ÌìÈ»ÊÓÆµ²¢²»¾ùÔÈ¡£²¼¾°¡¢ÊÓ½ÇÓë¹âÕÕÎÞÊýʱ³½»ºÂýÆ¯ÒÆ£¬´«Í³ dense patch »ò¾ùÔȲÉÖ¡È´°ÑÒ»ÖÂÍÆËãÈöÏòÿ¸öµØÎ»¡¢Ã¿Ò»Ö¡£¬token Ô¤Ëã×îÏȱ»¿ÉÔ¤²âµÄ²¼¾°³Ôµô¡£
Codec µÄÉè¼Æ¸üÏñÒ»Ì×ÊÂÎñÀ״I-frame ³ÉÁ¢¸ßµÍÎÄ£¬P/B-frame Ö»¼Í¼»î¶¯ÏòÁ¿Óë²Ð²î¡£ËüÃDz»ÊÇѹËõ¸±²úÆ·£¬¶øÊÇÊÓÆµÔÚ¹¦·òÖáÉÏгöÏÖµÄÖ¤¾Ý¡£
OV-Encoder µÄÆúÈ¡ºÜÖ±½Ó£º²»°Ñ codec µ±×÷Ê¡´ø¿íµÄ¼¼ÇÉ£¬¶ø°ÑËüµ±×÷ÊÓÆµ½á¹¹µÄÏÔʽ±ê×¢¡£µ± tokenization ÓëÕâÌ׽ṹ¶ÔÆë£¬Ä£Ðͽø½¨µÄÖ¸±ê¾Í´Ó¡¸¾ùÔÈ¿´ÏñËØ¡¹Ôì³É¡¸ÔÚ״̬֮ÉÏÚ¹Êͱ䶯¡¹¡£
OV-Encoder ÔÚͳһ¶àģ̬ÆÀ²âÉèÖÃÏ£¬Ïà½Ï Qwen3-ViT Óë SigLIP2 ³öÏÖ²»±äÊÕÒæ£¨16 ÏîͼÏñ / ÊÓÆµ / Îĵµ»ù×¼£©£¬ÊÓÆÂ·í½â¾ùÔÈÌáÉýÔ¼ +4.1%£»¼à¶½Ô¤ËãΪ 100B caption tokens£¬¶ø¶Ô±È»ùÏßʹÓà 2.1T+¡£ËüµÄ¹Ø¼ü²»Ö»ÊÇ·ÖÊý±ä¶¯£¬¶øÊÇ»»ÁËÒ»ÖÖÅÔ¹Û·½Ê½£º°Ñ Codec µÄÔ¤²âʽ½á¹¹Ð´½ø ViT£¬Èà LLaVA-OneVision-2.0 Äܹ»Ö±½ÓÑØ×Å¡¸×´Ì¬ ¡ª ±ä¶¯ ¡ª Ö¤¾Ý¡¹ÕâÌõÁ´Â·Àí½âÊÓÆµ¡£
Ò»¶ÎÊÓÆÂ·ï£¬´óÁ¿»ÃæÖ»ÊÇǰһ¿ÌµÄÒ»Á¬£»ÕæÕýŤתÅжϵÄ˲¼ä£¬¿ÉÄÜÊǺöÈ»ÆðÌø¡¢Ò»´ÎתÉí¡¢Ò»¸öÕÚµ²»ò³¡¾°Çл»¡£¾ùÔȳéÖ¡»á°ÑÔ¤Ë㻨ÔÚ ¡°ÏÕЩû±ä¡± µÄ²¼¾°ÉÏ£¬Ò²¿ÉÄÜ´í¹ýÄÇÒ»Ö¡ÕæÕý¸ÄдÓïÒåµÄÖ¤¾Ý¡£
ÊÓÆµ±à½âÂ루H.264/H.265£©Ôç¾Í°ÑÕâ¸öÎÊÌâд½øÁËÂëÁ÷£ºI Ö¡¸ø³ö¸ßµÍÎÄ£¬P/B Ö¡ÓûÏòÁ¿ºÍ²Ð²î¼Í¼±ä¶¯£»µ±Ä³¶Î P/B Ö¡µÄ bit ¼ÛÖµºöȻ̧Éý£¬Í¨³£Òâζׯ¡¢ÕÚµ²»ò³¡¾°½á¹¹ÔÚ±äµÃ³ÁÒª¡£
²ÉÑùÊÓÆµ¡¢ÂëÁ÷ÊÓÆµ¡¢ÔÉú·Ö±æÂÊͼÏñ ¡ª¡ª ÈýÖÖÖ¤¾Ý״̬±»Í³Ò»¸ö OneVision-Encoder ½Óס£¬±àÂëΪ´ø 3D RoPE µÄÊÓ¾õ Token£¬ÔÙ¾ÇáÁ¿ MLP ͶÉäµ½ Qwen3-8B ×Իعé½âÂëÆ÷¡£½Ó¿Úͳһ£¬Ö¤¾Ý¶àÔ´£»ÕâÈÃÄ£ÐͼÈÄܶÁ¾²Ì¬Í¼£¬Ò²ÄÜÑØ×ÅÊÓÆµµÄ±ä¶¯ÏßË÷ÍÆÀí¡£
Ó봫ͳ¡¸¹Ì¶¨ GOP / µÈ¾à²ÉÖ¡¡¹·ÖÆç£¬LLaVA-OneVision-2.0 °Ñ P/B Ö¡×Ö½ÚÊýÊÓΪ¡¸ÓïÒåÔöÁ¿¡¹´úÀí£º±ÈÌØÂÊ·åÖµ×ÔÊÊÓ¦ÇзÖʱÐò×飬×éÄÚÔÙÓû²Ð²îÌô³öÕæÕý±ä¶¯µÄ 2¡Á2 Patch Çø¿é£¬´ò°ü½ø½ô´Õ I/P »²¼¡£ÊÂÎñÃܼ¯´¦ÃÜ Token£¬°²ÎÈ´¦Ï¡ Token¡ª¡ª °ÑËãÁ¦´Ó²¼¾°×ªÏòÊÂÎñ¡£
¢Ù GOP Partition£ºÓà P/B Ö¡ Packet Energy£¨×Ö½ÚÊý£©¶¨Î»ÊÂÎñ·åÖµ£¬ÊÂÎñÃܼ¯Çø¶Ì×é¡¢°²ÎÈÇø³¤×飻¢Ú Scoring£ºÈÚºÏ Motion Energy¡¢Residual Energy Óë Patch ¼¶±ÈÌØÂÊÏÈÑ飬µÃµ½Öð Patch µÄ Fused Score£»¢Û Block Selection£ºÒÔ 2¡Á2 Patch Çø¿éΪ×îÓ×µ¥Ôª£¬Ô¤·À¹é²¢²»ÓйØÇøÓò£»¢Ü Canvas Packing£ºÃ¿¸ö GOP Êä³öÒ»ÕÅ I-canvas ÓëÈô¸É P-canvas£¬Ðγɽô´Õ»²¼ÐòÁС£
Õâ×éÁ˾ÖÈ»ÕýÏë»Ø¸²µÄ£¬²»ÊÇÃû´Î£¬¶øÊÇÒ»¸ö¸üµ×²ãµÄÎÊÌ⣺µ±ÊÓÆµ±ä³¤¡¢×÷Ϊ±äÃÜ¡¢¿Õ¼ä¹ØÏµ±ä¸´ÔÓʱ£¬Ä£ÐÍ»¹Äܲ»Äܰѹؼü˲¼ä±£ÁôÏÂÀ´£¬²¢Ôڻظ²Ê±³ÁÐÂŲÓóöÀ´£¿
ÔÚÆÀ²âÖУ¬OV-2-8B µÄ¼¸¸ö×ø±ê±ðÀëÊÇ£º18 ÏîÊÓÆÂ·í½â¾ùÔÈ 62.5£¬11 Ïî¿Õ¼äÍÆÀí¾ùÔÈ 63.5£¬4 ÏîÖ¸±ê×·×Ù J&F ¾ùÔÈ 48.0¡£Êý×ÖÔÚÕâÀïµÄ¼ÛÖµ²»ÔÚÃû´Î£¬¶øÊÇΪÁË×¢Ã÷ Codec-Stream µÄÈ¡Ïò£º°Ñ token Ô¤ËãÌìÈ»ÍÆÏò»î¶¯¡¢ÕÚµ²¡¢ÊӽDZ䶯ºÍÊÂÎñתÕÛ£¬¶ø²»ÊǾùÔÈ¿÷ËðÔÚ³Á¸´²¼¾°ÉÏ¡£
¸üÖµµÃ¿´µÄ£¬ÊÇÄÇЩ¶Ô¹¦·òºÍ¼¸ºÎ³ö¸ñÃô¸ÐµÄѹÁ¦³¡¾°¡£CrossPoint¡¢TraceSpatial-3D Óë×·×ÙÀ๤×÷²¢²»Ö»¿¼ ¡°Èϳö»ÃæÀïÓÐʲô¡±£¬¶øÊÇÔÚ¿¼Ä£ÐÍÄÜ·ñ²»±äÀí½âµØÎ»¡¢°¤´Î¡¢·½ÏòÓëÂ½Ðø»î¶¯¡£ËüÃÇÌáÐÑÎÒÃÇ£ºÏÂÒ»´úÊÓ¾õ˵»°Ä£Ð͵ľºÕùµã£¬¿ÉÄܲ»ÔÙÊǵ¥Ö¡Àï¿´µ½Á˼¸¶àϸ½Ú£¬¶øÊÇÄÜ·ñ°Ñ¹¦·òÖеÄÖ¤¾Ý×éÖ¯³É¿ÉÑéÖ¤µÄÍÆÀíÁ´¡£
×·×ÙÁ˾ÖÒ²±ØÒªÉóÉ÷½â¶Á£ºLLaVA-OneVision-2.0 Êä³öµÄÊÇÿ֡ (x, y) ×·×ٵ㣬ÔÙ½»¸ø SAM2 ÌìÉú mask¡£Òò¶ø£¬Õâ×é²û·¢·´Ó³µÄÊÇ ¡°Ê±Ðòµã¶¨Î»ÄÜÁ¦ ¡Á Ô׸îÆ÷ÏìÓ¦ÖÊÁ¿¡± µÄÁª¶¯³ÉЧ£¬¶ø²»ÊÇÄ£ÐͶÀÁ¢ÊµÏÖËùÓÐÔ׸Öè¡£
ͼÏñÓëÎĵ·í½âÔòά³ÖÔÚͬ¼¶ 8B Ä£Ð͵ÄÏà½üˮƽ£»ÔÚ OCRBench¡¢InfoVQA ÕâÀàÎÄ×ÖÃܼ¯¹¤×÷ÉÏÈÔÓÐÌáÉý¿Õ¼ä¡£ÕâÌõÌìǵºÜ³ÁÒª£ºCodec-Stream Ç¿»¯µÄÊÇÂ½ÐøÊÀ½çÖеÄÊÂÎñ¸ÐÖª£¬¶ø²»ÊǰÑËùÓÐÊÓ¾õÄÜÁ¦¶¼Ò»´ÎÐÔ×°½øÍ³Ò»¸ö´ð°¸Àï¡£
ÕⲿÃÅÊý¾Ý¸²¸Ç 2D/3D ¿Õ¼ä¹ØÏµÎÊ´ð£¬ÆðÔ´Ô̺¬ÊÒÄÚ³¡¾°×¢½â¡¢·ÂÕÕÆ÷¹ì¼£ºÍÍøÂçÊÓÆµÖ¡£»Í¬Ê±½áºÏµãʽ׷×ÙÓëʱ¿ÕÖ¸ÏòÊý¾Ý£¬×¨ÃŰÑÄ£ÐÍÍÆÏò ¡°¿´¶®µØÎ»¡¢·½ÏòÓëÂ½Ðø×÷Ϊ¡± µÄÄÜÁ¦¡£
Stage 1£º»ìºÏÀ´×Ô LLaVA-OV-1.5 µÄ 85m ͼÎĶÔÊý¾Ý + 4.2M 30s ÊÓÆµ×ÖÄ»£¬×î´ó 30 Ö¡£¬³ß¶È¾ùÔȲÉÑùStage 2£º²ÎÓë 22M Ö¸ÁîÊý¾Ý + 24M FineVision + 2.7M 30¨C60s + 70 Íò 60¨C180s ÊÓÆµ×ÖÄ»£¬×î´ó 90 Ö¡£¬ÈÔÊǾùÔȲÉÑùStage 3£º²ÎÓë 350K 10¨C15 ·ÖÖÓ³¤ÊÓÆµ×ÖÄ»£¬×î´ó 384 Ö¡£¬ÈÔÊǾùÔȲÉÑùStage 4£º¶Ô 10¨C15 ·ÖÖÓÓïÁÏÆôÓà Codec Á÷ tokenization£¨384 Ö¡ + 768 Ö¡Á½¸öÃܶȣ©£¬Í¬Ê±²ÎÓë¿Õ¼äÍÆÀíÓïÁϺÍ×·×ÙÊý¾Ý
ÖµÍ×ÌùÐĵÄÊÇ£ºCodec Á÷²¢·Ç´Óһ·ͷ¾Í²ÎÓ룬¶øÊÇÔÚ Stage 4 ²ÅÓÃÓÚ 10¨C15 ·ÖÖÓ³¤ÊÓÆµÓïÁÏ£»ÆäÓàÊý¾ÝÈÔ±£Áô³ß¶ÈÌåʽ¡£ÕâÈÃÄ£ÐÍÔÚͳһ½Ó¿ÚÏÂͬʱ½ø½¨¾ùÔȲÉÑùÓëÂëÁ÷ÊäÈë¡£
×îÖÕÿ¸öѵÁ· step µÄ batch ԼΪ 50% codec ÊÓÆµ¡¢37.5% ¾ùÔȲÉÑùÊÓÆµ¡¢12.5% ͼÏñ¡£»»¾ä»°Ëµ£¬LLaVA-OneVision-2.0 ²»ÊÇÖ»»á¶ÁÒ»ÖÖÌåʽ£¬¶øÊÇÔÚ¶àÖÖÊÓ¾õÖ¤¾ÝÖ®¼äѧ»áÇл»¡£ÔÚѵÁ·¹ý³ÌÖУ¬ÍŶÓÒ²½èÖúÁËȫģ̬ѵÁ·¿ò¼Ü LoongForge£¬ÎªÓйØÑµÁ·Óëµü´úÌṩ֧³Ö¡£
ÄѵãÔÚÓÚ£¬Ã¿´ÎÌøÉþ¿´ÉÏÈ¥ÏÕЩһÑù¡£Ä£ÐͲ»ÄÜÖ»Èϳö¡¸ÓÐÈËÔÚÌøÉþ¡¹£¬»¹±ØÐëÔÚ³Á¸´×÷ΪÖÐά³Ö¼ÆÊý¡¢¶¨Î»ºÍ½ÚÅÄÓ°Ïó¡£¾ùÔȲÉÑùµÄ֡ʱʱÀàËÆµ½ÄÑÒԷֱ棬ÕâÕýÊÇÂëÁ÷Ö¤¾Ý¿ÉÄܲûÑï×÷ÓõĴ¦Ëù¡£
Êý¾Ý¼¯Ô̺¬ 189 ¶ÎÕæÊµÂ¼ÔìµÄÌøÉþÊÓÆµ£¬84% ÒÔÉÏ·Ö±æÂÊ´ïµ½ 1920¡Á1080£»¹¦·ò±ê×¢¾«È·µ½Ó×Êýµãºóһ룬»ù×¼µãÊÇÉþ×Ó¾¹ýÍȲ¿ºó²àµÄÄÇÒ»Ö¡¡£
JumpScore ÉÏ£¬LLaVA-OneVision-2.0 µÄ mAP Ϊ 74.9¡£Õâ¸öÊý×ÖÖ®ËùÒÔÖµµÃ±»·Å´ó£¬²»ÊÇÓÉÓÚËüË¢ÐÂÁËij¸ö¿Ì¶È£¬¶øÊÇÓÉÓÚËü°ÑÒ»¸ö¸üÄѵÄÎÊÌâ°Úµ½Ì¨Ç°£ºµ±Ã¿Ò»´ÎÌøÉþÔÚ»ÃæÉÏÏÕЩһÑù£¬Ä£ÐÍÊÇ·ñÕæµÄ¼ÇסÁ˵ڼ¸´Î¡¢ºÎʱ²úÉú¡¢½ÚÅÄÈôºÎ±ä¶¯£¿Ò²±ØÒªÄ¬Ä¬Àí½â£ºJumpScore Óë codec Á÷ÉÆÓÚµÄ¸ßÆµ³Á¸´»î¶¯ÌìÈ»Çнü£¬´æÔڿ϶¨ ¡°Ö÷³¡ÓÅÊÆ¡±¡£ËüµÄ¼ÛÖµ£¬ÊǰÑʱÐòÀí½â´Ó ¡°ÕÒµ½×÷ΪƬ¶Î¡± ÍÆ¶¯µ½ ¡°×·×Ù³Á¸´ÊÂÎñÖеݤ´Î¡¢½ÚÅÄÓëÒò¹ûÏßË÷¡±¡£
¹Ì¶¨ Token Ô¤ËãÏ£¬ÂëÁ÷Á÷ʽÊäÈëÏà¶Ô¾ùÔȲÉÖ¡ÔÚ¹¦·ò¶¨Î»ÉÏ»ñµÃ +9.7 ·ÖÔöÒæ£»ÔÚ³¤ÊÓÆµÉèÖÃÖУ¬¿É½« Patch ´Ó 128k ѹµ½ 16k£¨87.5% ѹËõ£©¶ø¾¡Á¿±£Áô¹Ø¼ü˲¼ä¡£Ê±Ðò¶¨Î»£¨Charades-STA¡¢ActivityNet¡¢QVHighlights£©£ºÔÚµÍÖ¡ÊýÔ¤ËãÏÂÓÈÆäÏÔÖø£¬4 Ö¡Ô¤Ëãʱ QVHighlights ÉÏ codec ³¬³ö¾ùÔȲÉÑù 15.4 ·Ö£¬ÌøÉþµÈ¸ßƵ³Á¸´»î¶¯µÄϸÁ£¶È¶¨Î»£¨JumpScore£©¡£
Codec µÄÐÅÏë¿´ËÆÆÓËØ£¬È´ÊÇÏÂÒ»´ú¸ÐÖªÖÇÄÜ£ºÄܱ»¸ßµÍÎÄÍÆ³öµÄ£¬²»Ó÷´¸´³Á¿´£»ÕæÕýÖµµÃ¸¶·ÑµÄ£¬ÊÇÆÈʹģÐͽ¨¸ÄÅжϵÄÕæÊµÔöÁ¿¡£
Õâ±³ºóÓÐÒ»¸ö¸ü´óµÄÎÊÌ⣺ÖÇÄÜÊÇ·ñ¿Ï¶¨À´×Ô¿´µÃ¸ü¶à£¿LLaVA-OneVision-2.0 ¸ø³öµÄ»Ø¸²ÊÇ ¡ª¡ª ²»¶¨¡£ÖÇÄÜÒ²¿ÉÄÜÀ´×Ô¸üºÃµÄÑ¡ÔñÐÔ°ÑÎÈ£ºÉÙ¸´Êö²¼¾°£¬¶à×·×ٱ䶯£»ÉÙ¾ùÔÈ·ÖÅäËãÁ¦£¬¶àÝÓÈÆÖ¤¾Ý×éÖ¯ÍÆÀí¡£
OneVision-Encoder °Ñ Codec µÄÔ¤²âʽ½á¹¹Ð´½ø ViT£¬LLaVA-OneVision-2.0 Ôò°ÑÕû¶ÎѹËõÁ÷Ôì³ÉÂ½ÐøÖ¤¾ÝÁ÷¡£ÏÂÒ»²½£¬Õâһ·Ïß½«³ÖÐø×ßÏòÁ÷ʽ¸ÐÖªÓëÓ×ʱ¼¶³¬³¤ÊÓÆµ½¨Ä£¡£ÕæÕýÖµµÃµÈ´ýµÄ£¬²»Ö»ÊǸü³¤¸ßµÍÎÄ£¬¶øÊÇÄ£ÐÍÄÜ·ñÔÚÂþ³¤ÊÓÆµÖÐά³ÖÒ»ÖÖ¸´ËÕ£ºÖªÂ·Ê²Ã´ÒѾ±»¼Ì³Ð£¬Ê²Ã´ÔÚŤת£¬Ê²Ã´±ØÒª±»³ÁÐÂÚ¹ÊÍ¡£
LLaVA-OneVision-2.0 չʾÁ˸ñÁéÉîÍ«Áé¸Ð³¢ÊÔÊÒÔÚÊÓ¾õ˵»°Ä£ÐÍÓë¶àģ̬ÊÓÆÂ·í½âÁìÓòµÄ×îм¼Êõ¶Ñ¼¯¡£Í¨¹ý Codec Á÷Óë OneVision-Encoder µÄ½áºÏ£¬Ä£ÐÍ¿ÉÄÜÔÚ¸ßÃܶȳÁ¸´×÷ΪÓ볤ʱÐòÊÓÆµÖÐ×½ÄùؼüÖ¤¾Ý£¬ÊµÏÖ¾«È·Àí½âÓëÍÆÀí¡£
δÀ´£¬ÍŶӽ«³ÖÐøÓÅ»¯È«Ö¡ÂÊÊÓÆÂ·í½âÄÜÁ¦£¬²¢Ë÷Çó¸ü¶à¿ç³¡¾°ÀûÓã¬ÎªÊÓ¾õ AI ¼¼ÊõµÄ¿ÉÀ©´óÂ䵨Ìṩ֧³Ö¡£ÓйشúÂ롢ģÐÍÓëÊý¾ÝÒÑÊ¢¿ª£¬µÈ´ýÓë¼¼ÊõÉçÇø¹²Í¬Ë÷ÇóÏÂÒ»´ú¶àģ̬¸ÐÖªÖÇÄܵĸü¶à¿ÉÄÜ¡£
公与媳妇可灵 AI 昨日宣布,产品发布两年后,全球用户数已突破 1 亿,企业客户接近 5 万。官方称,过去一年可灵完成 26 次迭代,应用场景覆盖影视、广告、音乐 MV、游戏、电商和智能硬件等领域。可灵还发布了两周年短片,全片由可灵 AI 生成。答:必须承认,西班牙人通常情绪起伏很大,会在短时间内从过度亢奋跌入深度低落。我不认为联赛第二、在欧战中体面出局是什么灾难。这不是一个好赛季,但也不是悲剧。公与媳妇ÈýÒ¶²Ýozweego3m此类围报行为并非个例。据红星新闻此前报道,2025年2月,在某省公务员考试报名期间,一名考生在填报信息时发现自己的身份信息遭他人盗用,导致其本人无法正常报名,遂向该省人事考试院举报反映,此事经警方侦办牵出一起侵犯公民个人信息的案件。决赛大半看台都是英格兰球迷,我一遍遍脑补落败回国后,日后去到任何球场都会被球迷拿这场失利调侃的画面。夺冠之后,我满心自豪。
20260607 ? 公与媳妇总决赛战局即将转战纽约,尼克斯手握大比分2-0领先。北京时间6月9日,双方将在麦迪逊广场花园展开第三场对决。若尼克斯再下一城,连胜纪录将刷新至14场,球队也将距离总冠军仅一步之遥。°éµÄÀÏÆÅ巴萨刚刚经历了一个出色的赛季,其年轻核心球员——亚马尔、佩德里、加维、费尔明、马克·贝尔纳尔、马丁、库巴西和琼·加西亚均在25岁或以下——实力位居欧洲顶级。这是积极的一面。
20260607 ? 公与媳妇在具体分类中,苹果把大量「数字商品和服务」的收入纳入统计,包括在 App Store 外订阅、但可在苹果设备或应用中使用的服务,例如 Hulu、Audible、Spotify 以及《纽约时报》等。这也引出一个问题:如果用户在网页端购买了例如 YouTube Premium 的订阅,却在 Apple TV 上观看,这笔交易是否也被算进 App Store 生态数据中?¡¶ÕÉ·ò²»ÔÚ¹«Ã´×·ÎÒÃâ·ÑÅÔ¹ÛµçÊÓ¾ç×î¡·需要说明的是,苹果并未单独披露App Store收入,而是将其归入服务业务部门。作为仅次于iPhone的第二大业务板块,服务业务在2025财年为苹果贡献了1091亿美元收入,约占公司总营收4161亿美元的四分之一;同期iPhone业务收入为2095亿美元。