Ëæ×Å Agent µÄ¿í·ºÀûÓôøÀ´µÄ³¤ÐòÁÐÐèÒª£¬´«Í³ GPT ¼Ü¹¹µÄ Attention ²¿ÃÅ£¬ÓÉÓÚÆä O (N^2) µÄÍÆË㸴ÔÓ¶È£¬ÕýÖð²½±»ÊÓΪ»úÄÜÆ¿¾±¶øÔâµ½´úÌæ¡£¶ø Attention »úÔìµÄ¼Ü¹¹µü´ú£¬Ò²ÔÚÒÔǰËùδÓеÄËÙ¶ÈÍÆ¶¯¡£Ä¿Ç°Òµ½çµÄÖ÷Á÷¹æ»®´óÌåÄܹ»·ÖΪÁ½ÖÖ£ºLinear Attention ºÍ Sparse Attention¡£ÆäÖÐ Linear Attention ÒÔ Qwen-Next ºÍ Kimi-K2 Ϊ´ú±í£¬ÐÔÖÊÉÏÊÇͨ¹ý¸Ä½øºóµÄ Linear Attention À´ÊµÏÖÐÅϢѹËõ£¬Ê¹µÃ´æ´¢¼ÛֵѹËõµ½ O(1) £¬ÍÆËã¼ÛֵѹËõµ½ O(N)£»¶ø Sparse Attention ÔòÖØÒªÍ¨¹ýÏ¡ÉÙ»¯À´ÓÅ»¯ÍÆË㿪Ïú£¬Êµ¼ÊÖÐÍùÍù¿ÉÄÜ´ïµ½¿¿½ü 90% ÒÔÉϵÄÏ¡ÉÙ¶È£¬ÕâÒ²ÊÇÔÚ DeepSeek-V4 Öб»ÕýʽѡȡµÄ¼¼Êõ·Ïß¡£
È»¶ø£¬ÔÚ RTPurbo ÖÐ [1]£¬Ç°ÆÚ¹¤×÷ÒѾ³ä·ÖÖ¸³ö£¬Ê¹Óà Full Attention+Sliding Window Attention£¨SWA£©¾ÍÒѾÄܹ»ÔÚ¾«¶ÈÎÞËðµÄ±£ÕÏÏ£¬½«ÔÉú Transformer µÄ 85% °ÑÎÈÁ¦Í·Ôì³É SWA£¬ÊµÏÖ 15% Full Attention + 85% SWA µÄ»ìºÏ¼Ü¹¹£¬ÊµÏÖ 5X µÄ KV ºÍ Attention ѹËõ¡£¶ÀÒ»ÎÞ¶þ£¬ÔÚ½üÆÚµÄһЩ¿ªÔ´¼Ü¹¹£¬Èç MIMO¡¢Gemma4¡¢GPT-OSS ÖУ¬Ò²Ê¹ÓÃÁË SWA+Full Attention ÕâÒ»Éè¼Æ£¬ÆÄÓÐÒ»ÖÖ ¡°´ó·ÖÁ¼ò¡± µÄÉè¼ÆË¼Â·¡£
Ö»¹Ü´úÌæÁË 85% µÄ Full Attention ³É SWA£¬Ê£Ï嵀 15% Full Attention ÔÚ³¬³¤ÐòÁУ¨1M£©ÏÂÒÀÈ»»á³ÉΪ»úÄÜÆ¿¾±¡£½ñÌ죬ΪÁ˳¹µ×½â¾ö Attention µÄÍÆÀíÆ¿¾±£¬À´×Ô°¢ÀïµÄ RTP ÍŶÓÍÆ³öÁ˵ڶþ´ú Attention ѹËõ¼¼Êõ£ºRTPurboV2¡£Í¨¹ý½áºÏ Headwise ѹËõ£¬µÍÖÈͶӰѹËõ£¬ÒÔ¼°¾ÛÀ༼Êõ£¬RTPurboV2 Äܹ»ÔÚ V1 ¼Ü¹¹µÄ»ù´¡ÉÏ£¬½øÒ»²½ÔÚ Full Attention ²¿ÃÅʵÏÖ 16~32 ±¶ÍÆËãѹËõ¡£
Full Attention Ä£ÐÍÔÚԤѵÁ·¹ý³ÌÖУ¬ÒѾ×Ô¾õµØÐγÉÁ¶¯ß¶ÈÏ¡ÉÙÈ·°ÑÎÈÁ¦½á¹¹¡£ÎÒÃÇÒª×öµÄ²»ÊÇ "Ç¿¼Ó" Ï¡ÉÙÐÔ£¬¶øÊÇ "¿ªÊÍ" Ëü¡£Õâ¸öÅжϳÉÁ¢ÔÚËĸö¿ÉÁ¿»¯µÄ¹Ø¼ü·¢ÏÖÖ®ÉÏ¡£
×êÑÐÈËÔ±·¢ÏÖ£¬ÔÚ Full Attention Ä£ÐÍÖУ¬·ÖÆçµÄ Attention Head ÏÖʵÉϳе£×Å·ÖÆçµÄÖ°Ôð¡£ÓÐЩ Head רһÓÚ×½Äò¿ÃÅÐÅÏ¢£¨ºÃ±ÈÏàÁÚ token Ö®¼äµÄ¹ØÏµ£©£¬ÓÐЩ Head ÔòÕÆ¹Ü×½Äó¤¾àÀëÒÀÀµ£¨ºÃ±ÈÓë×ÔÉíÓйØÐÅÏ¢µÄ¹ØÁª£©¡£
Ô¼ 15% µÄ Head ²û·¢³öÏÔÖøµÄ "ÕÙ»ØÍ·"£¨retrieval head£©Ìص㣺ËüÃÇÈ·°ÑÎÈÁ¦É¢²¼¼«¶ÈÏ¡ÉÙ£¬Ö»¹Ø×¢ÉÙÊý¼¸¸ö¹Ø¼ü token£¬Õƹܳ¤¾àÀëÐÅÏ¢ÕÙ»ØÆäÓà 85% µÄ Head ÔòÊÇ "Á÷ʽͷ"£¨streaming head£©£ºËüÃÇÈ·°ÑÎÈÁ¦É¢²¼Ïà¶Ô¾ùÔÈ£¬¸ü¶à¹Ø×¢²¿ÃŸߵÍÎÄ
ÕâÖÖ·Ö¹¤Ä£Ê½ÔÚ·ÖÆçÊäÈë¡¢·ÖÆçÐòÁ㤶Èϸ߶Ȳ»±ä£¬ÊÇÄ£ÐÍÔÚԤѵÁ·ÖÐ×Ô¾õϰµÃµÄÄÚº½á¹¹¡£Ö±½ÓÍÆÂÛ£º85% µÄ Full Attention ÍÆËãÄܹ»°²È«µØ´úÌæÎª SWA£¨²Î¿¼ RTPurbo£©£¬ÏÕЩ²»Ó°ÏìÄ£ÐÍÄÜÁ¦¡£ÕæÕý±ØÒª½â¾öµÄ£¬Ö»ÓÐÔü×Ò 15% ÕÙ»ØÍ·µÄ¸ßÐ§ÍÆËãÎÊÌâ
ÕÙ»ØÍ·µÄÖ÷Ì⹤×÷ÊÇÔÚÕû¸öÐòÁÐÖÐ×öÓïÒ寥Åä ¡ª¡ª ¿´ÆðÀ´ÒÀÈ»ÊÇ O (N^2) µÄÎÊÌâ¡£RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®Ò»ÊǶÔÓÚÕÙ»ØÍ·ºÍ RoPE µÄÏêϸÀí½â¡£ÔÚÉî¿Ì·ÖÎö RoPE µØÎ»±àÂëµÄƵÂʽṹºó£¬ÍŶӷ¢ÏÖÁËÕÙ»ØÍ·µÄ RoPE ·ÖÁ¿´æÔÚÏÔÖøµÄά¶ÈÈßÓà¡£ÔÚ RoPE Ï£¬Query-Key È·°ÑÎÈÁ¦µÃ·ÖÄܹ»·Ö»¯Îª·ÖÆçƵÂÊ·ÖÁ¿µÄµþ¼Ó£º
µÍƵ·ÖÁ¿£¨¦È_i ½ÏС£©£ºËæµØÎ»Æ«ÒÆ»ºÂý±ä¶¯£¬³ÐÔØ token ¼äµÄÓïÒåÓйØÐÔÐÅºÅ¸ßÆµ·ÖÁ¿£¨¦È_i ½Ï´ó£©£ºËæµØÎ»Æ«ÒÆ¼±¾çÕñµ´£¬ÒýÈë¾àÀëÃô¸ÐÐÔ×ÌÈÅ
¶ÔÓÚ³¤¾àÀë¼ìË÷¶øÑÔ£¬¸ßƵ·ÖÁ¿µ¼Ö°ÑÎÈÁ¦µÃ·ÖËæµØÎ»¾àÀë¾çÁÒµßô¤£¬¼õÈõÁËÓïÒåÐźŵIJ»±ä´«µÝ¡£¶ø´ÓÕٻع¤×÷×ÔÉíµÄÐÔÖÊÆô³Ì£ºÒ»¸ö token µÄÕÙ»ØÇ¿¶È²»Ó¦ËæÏà¶ÔµØÎ»µÄ±ä¶¯¶ø¼±¾çµßô¤¡£ÓÉ´ËÄܹ»´§¶È£¬ÔÚÕÙ»ØÍ·ÉÏµÄ¸ßÆµ·ÖÁ¿¿Ï¶¨ÊdzöÓÚ±»Ñ¹Ôì״̬£¬ÕÙ»ØÍ·ÐÔÖÊÉÏÖ»»áÀûÓà RoPE µÍƵ·ÖÁ¿¡£
Òò¶ø£¬Ò»¸öºÜÌìÈ»µÄÉè¼ÆÊÇѵÁ·Ò»¸öµÍά projector£¬ÎÒÃÇͨ¹ýµÍÖÅ׳É佫ÔÊ¼ÌØµãά¶È´Ó D ѹËõÖÁ r=16 (ÆäÖÐ r ? D)£¬ÏµÍ³ÐԵر£ÁôµÍƵÓïÒå·ÖÁ¿¡¢¹ýÂË¸ßÆµµØÎ»ÔëÉù¡£³¢ÊÔÑéÖ¤£¬½ö 16 ά¼´¿É´ïµ½ 90%+ µÄ token ÕÙ»ØÂÊ¡£
ÕâÊÇ RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®¶þ¡£ÍŶÓÒâʶµ½µÍÖÈͶӰ´øÀ´µÄÔöÒæ²»Ö¹ÓÚÍÆËãÁ¿µÄÖ±½Ó½µµÍ ¡ª¡ª Ëü´Óµ××ÓÉϸÄÉÆÁË Key ÏòÁ¿ÔÚÓïÒå¿Õ¼äÖеÄÉ¢²¼ÖÊÁ¿¡£¸ßƵÔëÉù±»¹ýÂ˺ó£¬ÓïÒåÀàËÆµÄ token ÔÚµÍÖȿռäÖÐÌìÈ»¾Û££¬ÓïÒåÎÞ¹ØµÄ token ±Ë´ËÔ¶Àë¡£ÕâΪÐòÁÐά¶ÈµÄ½øÒ»²½Ñ¹Ëõ´´ÔìÁËÃÎÏëǰÌá¡£
ÌØµãά¶ÈѹËõ¡ú ½µµÍµ¥²½ÍÆË㿪Ïú£¬Í¬Ê±²ú³ö¸ßÖÊÁ¿¾ÛÀàÊäÈëÐòÁÐά¶ÈѹËõ£¨¾ÛÀࣩ¡ú Ìø¹ý´óÁ¿ÓïÒåÎÞ¹Ø token£¬½µµÍ×ÜÍÆËã²½ÊýÐͬЧӦ ¡ú ÌØµãѹËõÌá´¿ºóµÄÏòÁ¿ÈþÛÀàÖÐÐĸü¾«×¼£¬Ê¹µÃÔÚ¼«¶ËѹËõ±ÈÏÂÒÀȻά³Ö¸ßÕÙ»ØÂÊ
´«Í³µÄÏ¡ÉÙ°ÑÎÈÁ¦²½Öèͨ³£Ñ¡È¡¹Ì¶¨ top-k Õ½Êõ£¬¼´Ã¿¸ö query Ö»±£Áô attention score ×î¸ßµÄ k ¸ö token¡£µ«ÕâÖÖ×ö·¨´æÔÚÒ»¸öµ××ÓÐÔÎÊÌ⣺·ÖÆçµÄ attention head¡¢·ÖÆçµÄÐòÁг¤¶È¡¢·ÖÆçµÄ query£¬ËùÐèµÄ¸ßµÍÎÄ token ÊýÁ¿²î¾à¾Þ´ó¡£
ÔÚÊýÊ®ÍòÒÚ token µÄԤѵÁ·Óᄈϣ¬1M token ÏÕЩÄܹ»ºöÂÔ¡£ÕâÒ²´ÓÁíÒ»¸ö½Ç¶ÈÑéÖ¤ÁËÖ÷ÌâÂ۵㣺Full Attention µÄÏ¡ÉÙÐÔÊÇÄÚÉúµÄ£¬Î¢µ÷Ö»ÊÇʵÏÖ´ÓÒþʽµ½ÏÔʽµÄת»¯¡£
ÔÚ Qwen3-Coder-30B-A3B Ä£ÐÍÉÏ£¬ÎÒÃÇͨ¹ýÀëÏßУ׼¼ø±ð³öÔ¼ 15% µÄ¹Ø¼ü ¡°ÕÙ»ØÍ·¡±¡£Õë¶ÔÕâЩ Head£¬ÎÒÃÇÔÚ Prefill ½×¶Îѡȡ Full Attention ²¢¹²Í¬ K Cache ¾ÛÀ࣬ÔÚ Decode ½×¶ÎÔòÀûÓà RTPurboV2 ʵÏÖÏ¡ÉÙ»¯£»ÆäÓàÁ÷ʽͷͳһѡȡ SWA£¨²¿ÃÅ´°¿ÚÉèΪ 8192£©¡£
Èçͼ 3 Ëùʾ£¬RTPurboV2 ÔÚ 32K ºÍ 64K ÐòÁ㤶ÈϾù»ñµÃÁË×îÓžùÔÈ·Ö£¨±ðÀëΪ 89.69 ºÍ 85.61£©£¬ÏÔÖøÓÅÓÚ³ý Full Attention ±íµÄËùÓлùÏß²½Ö裬֤ÁËÈ»ÆäÔÚ³¤³ÌÐÅÏ¢ÕÙ»ØÉϵÄ׿Խ¾«¶È¡£
Õë¶Ô Qwen3.5-35B-A3B Ä£ÐÍ£¬Ð£×¼ÏÔʾÆä³¬¹ý 70% µÄ Head ÓµÓÐÕٻظöÐÔ¡£Îª´Ë£¬ÎÒÃDzÉÈ¡ÁËÈ«Á¿Ï¡ÉÙ»¯Õ½Êõ¡£³¢ÊÔÁ˾֣¨Í¼ 4£©Åú×¢£¬RTPurboV2 ÔÚ´ó·ù½µµÍÍÆË㿪ÏúµÄͬʱ£¬ÆëÈ«±£ÁôÁËÄ£Ð͵Ļù´¡ÄÜÁ¦£¬¾«¶È²û·¢Óë Full Attention ³Ô콡£
ÔÚÁ´Ê½Ë¼Ï루CoT£©ÍÆÀí¹¤×÷ÖУ¬RTPurboV2 ͬÑù²û·¢½Ü³ö£¨Í¼ 5£©£¬ÊµÏÖÁËÄ£ÐÍÍÆÀíÄÜÁ¦µÄ½üºõÎÞËð±£Áô£¬½øÒ»²½ÑéÖ¤Á˸ù滮ÔÚ¸´ÔÓÂß¼³¡¾°ÏµÄ³°ôÐÔ¡£
µ±Ç°°ÑÎÈÁ¦»úÔìµÄ×êÑгÁÐÄ£¬´óÁ¿¼¯ÖÐÔÚÉè¼ÆÈ«ÐµĸßЧ¼Ü¹¹ÉÏ¡£ÕâÌõõè¾¶ÎÞÒÉÓÐÆä¼ÛÖµ¡£µ« RTPurboV2 ½ÒʾÁËÒ»¸öÈÝÒ×±»ºöÊÓµÄÊÂʵ£ºFull Attention Ä£ÐÍ×ÔÉí¾ÍÔ̺¬×ž޴óµÄЧÄܿռ䣬¶ø¿ªÊÍÕâÖÖÄÚÉúÏ¡ÉÙÐԵijɱ¾¼«µÍ¡£
600 ²½ÑµÁ·£¬¾«¶ÈÏÕЩÎÞËð£¬Prefill ×î¸ß 9.36 ±¶¼Ó¿ì¡£ÕâÒâζ×Å£¬¶ÔÓÚÑ¡Ôñ SWA + Full Attention »ìºÏ¼Ü¹¹µÄÍÅ¶Ó ¡ª¡ª Ô̺¬ MIMO¡¢Gemma 4¡¢GPT-OSS¡ª¡ª²»±ØÒª´úÌæ¼Ü¹¹¾ÍÄÜ»ñµÃ¿¿½ü SOTA й滮µÄѹËõЧÄÜ
RTP-LLM Êǰ¢Àï°Í°ÍÖÇÄÜÒýÇæÍŶÓ×ÔÑеĸ߻úÄÜ´óÄ£ÐÍÍÆÀíÒýÇæ£¬Ö§³ÖÁËÌÔ±¦¡¢Ììè¡¢¸ßµÂµÈÖ÷ÌâÒµÎñµÄ´óÄ£ÐÍÍÆÀíÐèÒª¡£ÖÇÄÜÒýÇæÔ´×Ô°¢Àï°Í°ÍËÑË÷¡¢ÍƼöºÍ¸æ°×¼¼Êõ£¬Êǰ¢Àï AI ¹¤³ÌÁìÓòµÄÏÈÐÐÕߺÍÉî¸ûÕß¡£ÍŶÓרһÓÚ AI ¹¤³ÌϵͳµÄ½¨É裬Ö÷µ¼³ÉÁ¢ÁË´óÊý¾Ý AI ¹¤³Ìϵͳ AI?OS£¬³ÖÐøÎª°¢ÀOÍŸ÷ÒµÎñÌṩ¸ßÖÊÁ¿µÄ AI ¹¤³Ì·þÎñ¡£
《长途公交许蕊小说全文免费阅读百度》“这肯定不会有助于谈判,我们关系非常亲密。我认为协议会在本周的周一、周二或周三签署……现在这一切发生了,你已经发射了导弹,够了。回到谈判桌前,达成协议。”纳希亚表示:“他小时候是一个很想低调、不愿引人注意的孩子。我永远不会忘记,在我父亲生病期间,他对我父亲做过的那件事。那段时间他给了我父亲力量,我希望大家知道这一点,因为这能说明他是一个怎样的人。”《长途公交许蕊小说全文免费阅读百度》¡¶·è¿ñìÀÈâ´óºÏBY±ÊȤ¸óÈ«ÎÄÔĶÁ°Ù¶ÈÔÆ¡·不过我知道,因为留下了很多照片,再加上鲁迪经常讲述这些故事,这里是他为德国国家队打进最后一个国家队进球的地方,而且他当时在这里打进了两球。所以我们队里有鲁迪这样一位优秀的导师,他在这里拥有很多美好的回忆,至少大部分都是如此。球场本身也很漂亮,我们都觉得这里令人印象深刻,因为这里的球场风格和德国的球场完全不同,也许明天我们也能找到一个在这里打进两球的人。“能够吸引姆巴佩的俱乐部并不多。我认为曼城可能已经拥有最好的前锋之一,也就是哈兰德,所以我觉得曼联对姆巴佩来说会是一个不错的目的地。”
20260609 ? 《长途公交许蕊小说全文免费阅读百度》同时,我们也会根据实际情况来决定,比如球员展现出的能量,谁的身体状态更好,谁的竞技状态更好,谁可能更适合具体对手。过去几周,我当然已经非常详细地研究过克罗地亚。但上周的重点完全是我们自己,完全是我们的比赛方式和行为方式。等我们到了堪萨斯,从那时候开始真正准备克罗地亚时,我会再更深入地进入这个主题。ÏÊÈâ½ÌÔ±µÚÒ»¼¯郭中楠也在展现自己的潜力。她在第一局有段时间连续的发球破坏对手的一传,这是球队可以连续追分的原因。当然除了发球之外,郭中楠身高臂长,她在拦网期间也可以给足对手干扰,全场比赛通过拦网就得到了3分,这样的表现已经足够惊喜了。而之前很多人都在担心女排未来没有副攻了,通过这场比赛球迷也算是放心了,女排的基本盘是稳住了。
20260609 ? 《长途公交许蕊小说全文免费阅读百度》根据天原股份微信公众号,在4月份举行的2025年度科技创新表彰大会上,邓敏剖析了企业发展的底层逻辑:市场竞争的大浪淘沙揭示了不变的真理——唯有持续创新,才能打破资源依赖、构筑长期优势。¡¶Æ®Ñ©Ó°ÔºÔÚÏßÅÔ¹ÛÃâ·Ñ°æµçÊӾ硷当现实世界持续变化,AI如何不被旧判断困住,而是根据新信号不断更新认知、校准路径?Decitron决策机给出的答案,是X-Signal(全球信号)持续追踪。