Ëæ×Å Agent µÄ¿í·ºÀûÓôøÀ´µÄ³¤ÐòÁÐÐèÒª£¬´«Í³ GPT ¼Ü¹¹µÄ Attention ²¿ÃÅ£¬ÓÉÓÚÆä O (N^2) µÄÍÆË㸴ÔÓ¶È£¬ÕýÖð²½±»ÊÓΪ»úÄÜÆ¿¾±¶øÔâµ½´úÌæ¡£¶ø Attention »úÔìµÄ¼Ü¹¹µü´ú£¬Ò²ÔÚÒÔǰËùδÓеÄËÙ¶ÈÍÆ¶¯¡£Ä¿Ç°Òµ½çµÄÖ÷Á÷¹æ»®´óÌåÄܹ»·ÖΪÁ½ÖÖ£ºLinear Attention ºÍ Sparse Attention¡£ÆäÖÐ Linear Attention ÒÔ Qwen-Next ºÍ Kimi-K2 Ϊ´ú±í£¬ÐÔÖÊÉÏÊÇͨ¹ý¸Ä½øºóµÄ Linear Attention À´ÊµÏÖÐÅϢѹËõ£¬Ê¹µÃ´æ´¢¼ÛֵѹËõµ½ O(1) £¬ÍÆËã¼ÛֵѹËõµ½ O(N)£»¶ø Sparse Attention ÔòÖØÒªÍ¨¹ýÏ¡ÉÙ»¯À´ÓÅ»¯ÍÆË㿪Ïú£¬Êµ¼ÊÖÐÍùÍù¿ÉÄÜ´ïµ½¿¿½ü 90% ÒÔÉϵÄÏ¡ÉÙ¶È£¬ÕâÒ²ÊÇÔÚ DeepSeek-V4 Öб»ÕýʽѡȡµÄ¼¼Êõ·Ïß¡£
È»¶ø£¬ÔÚ RTPurbo ÖÐ [1]£¬Ç°ÆÚ¹¤×÷ÒѾ³ä·ÖÖ¸³ö£¬Ê¹Óà Full Attention+Sliding Window Attention£¨SWA£©¾ÍÒѾÄܹ»ÔÚ¾«¶ÈÎÞËðµÄ±£ÕÏÏ£¬½«ÔÉú Transformer µÄ 85% °ÑÎÈÁ¦Í·Ôì³É SWA£¬ÊµÏÖ 15% Full Attention + 85% SWA µÄ»ìºÏ¼Ü¹¹£¬ÊµÏÖ 5X µÄ KV ºÍ Attention ѹËõ¡£¶ÀÒ»ÎÞ¶þ£¬ÔÚ½üÆÚµÄһЩ¿ªÔ´¼Ü¹¹£¬Èç MIMO¡¢Gemma4¡¢GPT-OSS ÖУ¬Ò²Ê¹ÓÃÁË SWA+Full Attention ÕâÒ»Éè¼Æ£¬ÆÄÓÐÒ»ÖÖ ¡°´ó·ÖÁ¼ò¡± µÄÉè¼ÆË¼Â·¡£
Ö»¹Ü´úÌæÁË 85% µÄ Full Attention ³É SWA£¬Ê£Ï嵀 15% Full Attention ÔÚ³¬³¤ÐòÁУ¨1M£©ÏÂÒÀÈ»»á³ÉΪ»úÄÜÆ¿¾±¡£½ñÌ죬ΪÁ˳¹µ×½â¾ö Attention µÄÍÆÀíÆ¿¾±£¬À´×Ô°¢ÀïµÄ RTP ÍŶÓÍÆ³öÁ˵ڶþ´ú Attention ѹËõ¼¼Êõ£ºRTPurboV2¡£Í¨¹ý½áºÏ Headwise ѹËõ£¬µÍÖÈͶӰѹËõ£¬ÒÔ¼°¾ÛÀ༼Êõ£¬RTPurboV2 Äܹ»ÔÚ V1 ¼Ü¹¹µÄ»ù´¡ÉÏ£¬½øÒ»²½ÔÚ Full Attention ²¿ÃÅʵÏÖ 16~32 ±¶ÍÆËãѹËõ¡£
Full Attention Ä£ÐÍÔÚԤѵÁ·¹ý³ÌÖУ¬ÒѾ×Ô¾õµØÐγÉÁ¶¯ß¶ÈÏ¡ÉÙÈ·°ÑÎÈÁ¦½á¹¹¡£ÎÒÃÇÒª×öµÄ²»ÊÇ "Ç¿¼Ó" Ï¡ÉÙÐÔ£¬¶øÊÇ "¿ªÊÍ" Ëü¡£Õâ¸öÅжϳÉÁ¢ÔÚËĸö¿ÉÁ¿»¯µÄ¹Ø¼ü·¢ÏÖÖ®ÉÏ¡£
×êÑÐÈËÔ±·¢ÏÖ£¬ÔÚ Full Attention Ä£ÐÍÖУ¬·ÖÆçµÄ Attention Head ÏÖʵÉϳе£×Å·ÖÆçµÄÖ°Ôð¡£ÓÐЩ Head רһÓÚ×½Äò¿ÃÅÐÅÏ¢£¨ºÃ±ÈÏàÁÚ token Ö®¼äµÄ¹ØÏµ£©£¬ÓÐЩ Head ÔòÕÆ¹Ü×½Äó¤¾àÀëÒÀÀµ£¨ºÃ±ÈÓë×ÔÉíÓйØÐÅÏ¢µÄ¹ØÁª£©¡£
Ô¼ 15% µÄ Head ²û·¢³öÏÔÖøµÄ "ÕÙ»ØÍ·"£¨retrieval head£©Ìص㣺ËüÃÇÈ·°ÑÎÈÁ¦É¢²¼¼«¶ÈÏ¡ÉÙ£¬Ö»¹Ø×¢ÉÙÊý¼¸¸ö¹Ø¼ü token£¬Õƹܳ¤¾àÀëÐÅÏ¢ÕÙ»ØÆäÓà 85% µÄ Head ÔòÊÇ "Á÷ʽͷ"£¨streaming head£©£ºËüÃÇÈ·°ÑÎÈÁ¦É¢²¼Ïà¶Ô¾ùÔÈ£¬¸ü¶à¹Ø×¢²¿ÃŸߵÍÎÄ
ÕâÖÖ·Ö¹¤Ä£Ê½ÔÚ·ÖÆçÊäÈë¡¢·ÖÆçÐòÁ㤶Èϸ߶Ȳ»±ä£¬ÊÇÄ£ÐÍÔÚԤѵÁ·ÖÐ×Ô¾õϰµÃµÄÄÚº½á¹¹¡£Ö±½ÓÍÆÂÛ£º85% µÄ Full Attention ÍÆËãÄܹ»°²È«µØ´úÌæÎª SWA£¨²Î¿¼ RTPurbo£©£¬ÏÕЩ²»Ó°ÏìÄ£ÐÍÄÜÁ¦¡£ÕæÕý±ØÒª½â¾öµÄ£¬Ö»ÓÐÔü×Ò 15% ÕÙ»ØÍ·µÄ¸ßÐ§ÍÆËãÎÊÌâ
ÕÙ»ØÍ·µÄÖ÷Ì⹤×÷ÊÇÔÚÕû¸öÐòÁÐÖÐ×öÓïÒ寥Åä ¡ª¡ª ¿´ÆðÀ´ÒÀÈ»ÊÇ O (N^2) µÄÎÊÌâ¡£RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®Ò»ÊǶÔÓÚÕÙ»ØÍ·ºÍ RoPE µÄÏêϸÀí½â¡£ÔÚÉî¿Ì·ÖÎö RoPE µØÎ»±àÂëµÄƵÂʽṹºó£¬ÍŶӷ¢ÏÖÁËÕÙ»ØÍ·µÄ RoPE ·ÖÁ¿´æÔÚÏÔÖøµÄά¶ÈÈßÓà¡£ÔÚ RoPE Ï£¬Query-Key È·°ÑÎÈÁ¦µÃ·ÖÄܹ»·Ö»¯Îª·ÖÆçƵÂÊ·ÖÁ¿µÄµþ¼Ó£º
µÍƵ·ÖÁ¿£¨¦È_i ½ÏС£©£ºËæµØÎ»Æ«ÒÆ»ºÂý±ä¶¯£¬³ÐÔØ token ¼äµÄÓïÒåÓйØÐÔÐÅºÅ¸ßÆµ·ÖÁ¿£¨¦È_i ½Ï´ó£©£ºËæµØÎ»Æ«ÒÆ¼±¾çÕñµ´£¬ÒýÈë¾àÀëÃô¸ÐÐÔ×ÌÈÅ
¶ÔÓÚ³¤¾àÀë¼ìË÷¶øÑÔ£¬¸ßƵ·ÖÁ¿µ¼Ö°ÑÎÈÁ¦µÃ·ÖËæµØÎ»¾àÀë¾çÁÒµßô¤£¬¼õÈõÁËÓïÒåÐźŵIJ»±ä´«µÝ¡£¶ø´ÓÕٻع¤×÷×ÔÉíµÄÐÔÖÊÆô³Ì£ºÒ»¸ö token µÄÕÙ»ØÇ¿¶È²»Ó¦ËæÏà¶ÔµØÎ»µÄ±ä¶¯¶ø¼±¾çµßô¤¡£ÓÉ´ËÄܹ»´§¶È£¬ÔÚÕÙ»ØÍ·ÉÏµÄ¸ßÆµ·ÖÁ¿¿Ï¶¨ÊdzöÓÚ±»Ñ¹Ôì״̬£¬ÕÙ»ØÍ·ÐÔÖÊÉÏÖ»»áÀûÓà RoPE µÍƵ·ÖÁ¿¡£
Òò¶ø£¬Ò»¸öºÜÌìÈ»µÄÉè¼ÆÊÇѵÁ·Ò»¸öµÍά projector£¬ÎÒÃÇͨ¹ýµÍÖÅ׳É佫ÔÊ¼ÌØµãά¶È´Ó D ѹËõÖÁ r=16 (ÆäÖÐ r ? D)£¬ÏµÍ³ÐԵر£ÁôµÍƵÓïÒå·ÖÁ¿¡¢¹ýÂË¸ßÆµµØÎ»ÔëÉù¡£³¢ÊÔÑéÖ¤£¬½ö 16 ά¼´¿É´ïµ½ 90%+ µÄ token ÕÙ»ØÂÊ¡£
ÕâÊÇ RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®¶þ¡£ÍŶÓÒâʶµ½µÍÖÈͶӰ´øÀ´µÄÔöÒæ²»Ö¹ÓÚÍÆËãÁ¿µÄÖ±½Ó½µµÍ ¡ª¡ª Ëü´Óµ××ÓÉϸÄÉÆÁË Key ÏòÁ¿ÔÚÓïÒå¿Õ¼äÖеÄÉ¢²¼ÖÊÁ¿¡£¸ßƵÔëÉù±»¹ýÂ˺ó£¬ÓïÒåÀàËÆµÄ token ÔÚµÍÖȿռäÖÐÌìÈ»¾Û££¬ÓïÒåÎÞ¹ØµÄ token ±Ë´ËÔ¶Àë¡£ÕâΪÐòÁÐά¶ÈµÄ½øÒ»²½Ñ¹Ëõ´´ÔìÁËÃÎÏëǰÌá¡£
ÌØµãά¶ÈѹËõ¡ú ½µµÍµ¥²½ÍÆË㿪Ïú£¬Í¬Ê±²ú³ö¸ßÖÊÁ¿¾ÛÀàÊäÈëÐòÁÐά¶ÈѹËõ£¨¾ÛÀࣩ¡ú Ìø¹ý´óÁ¿ÓïÒåÎÞ¹Ø token£¬½µµÍ×ÜÍÆËã²½ÊýÐͬЧӦ ¡ú ÌØµãѹËõÌá´¿ºóµÄÏòÁ¿ÈþÛÀàÖÐÐĸü¾«×¼£¬Ê¹µÃÔÚ¼«¶ËѹËõ±ÈÏÂÒÀȻά³Ö¸ßÕÙ»ØÂÊ
´«Í³µÄÏ¡ÉÙ°ÑÎÈÁ¦²½Öèͨ³£Ñ¡È¡¹Ì¶¨ top-k Õ½Êõ£¬¼´Ã¿¸ö query Ö»±£Áô attention score ×î¸ßµÄ k ¸ö token¡£µ«ÕâÖÖ×ö·¨´æÔÚÒ»¸öµ××ÓÐÔÎÊÌ⣺·ÖÆçµÄ attention head¡¢·ÖÆçµÄÐòÁг¤¶È¡¢·ÖÆçµÄ query£¬ËùÐèµÄ¸ßµÍÎÄ token ÊýÁ¿²î¾à¾Þ´ó¡£
ÔÚÊýÊ®ÍòÒÚ token µÄԤѵÁ·Óᄈϣ¬1M token ÏÕЩÄܹ»ºöÂÔ¡£ÕâÒ²´ÓÁíÒ»¸ö½Ç¶ÈÑéÖ¤ÁËÖ÷ÌâÂ۵㣺Full Attention µÄÏ¡ÉÙÐÔÊÇÄÚÉúµÄ£¬Î¢µ÷Ö»ÊÇʵÏÖ´ÓÒþʽµ½ÏÔʽµÄת»¯¡£
ÔÚ Qwen3-Coder-30B-A3B Ä£ÐÍÉÏ£¬ÎÒÃÇͨ¹ýÀëÏßУ׼¼ø±ð³öÔ¼ 15% µÄ¹Ø¼ü ¡°ÕÙ»ØÍ·¡±¡£Õë¶ÔÕâЩ Head£¬ÎÒÃÇÔÚ Prefill ½×¶Îѡȡ Full Attention ²¢¹²Í¬ K Cache ¾ÛÀ࣬ÔÚ Decode ½×¶ÎÔòÀûÓà RTPurboV2 ʵÏÖÏ¡ÉÙ»¯£»ÆäÓàÁ÷ʽͷͳһѡȡ SWA£¨²¿ÃÅ´°¿ÚÉèΪ 8192£©¡£
Èçͼ 3 Ëùʾ£¬RTPurboV2 ÔÚ 32K ºÍ 64K ÐòÁ㤶ÈϾù»ñµÃÁË×îÓžùÔÈ·Ö£¨±ðÀëΪ 89.69 ºÍ 85.61£©£¬ÏÔÖøÓÅÓÚ³ý Full Attention ±íµÄËùÓлùÏß²½Ö裬֤ÁËÈ»ÆäÔÚ³¤³ÌÐÅÏ¢ÕÙ»ØÉϵÄ׿Խ¾«¶È¡£
Õë¶Ô Qwen3.5-35B-A3B Ä£ÐÍ£¬Ð£×¼ÏÔʾÆä³¬¹ý 70% µÄ Head ÓµÓÐÕٻظöÐÔ¡£Îª´Ë£¬ÎÒÃDzÉÈ¡ÁËÈ«Á¿Ï¡ÉÙ»¯Õ½Êõ¡£³¢ÊÔÁ˾֣¨Í¼ 4£©Åú×¢£¬RTPurboV2 ÔÚ´ó·ù½µµÍÍÆË㿪ÏúµÄͬʱ£¬ÆëÈ«±£ÁôÁËÄ£Ð͵Ļù´¡ÄÜÁ¦£¬¾«¶È²û·¢Óë Full Attention ³Ô콡£
ÔÚÁ´Ê½Ë¼Ï루CoT£©ÍÆÀí¹¤×÷ÖУ¬RTPurboV2 ͬÑù²û·¢½Ü³ö£¨Í¼ 5£©£¬ÊµÏÖÁËÄ£ÐÍÍÆÀíÄÜÁ¦µÄ½üºõÎÞËð±£Áô£¬½øÒ»²½ÑéÖ¤Á˸ù滮ÔÚ¸´ÔÓÂß¼³¡¾°ÏµÄ³°ôÐÔ¡£
µ±Ç°°ÑÎÈÁ¦»úÔìµÄ×êÑгÁÐÄ£¬´óÁ¿¼¯ÖÐÔÚÉè¼ÆÈ«ÐµĸßЧ¼Ü¹¹ÉÏ¡£ÕâÌõõè¾¶ÎÞÒÉÓÐÆä¼ÛÖµ¡£µ« RTPurboV2 ½ÒʾÁËÒ»¸öÈÝÒ×±»ºöÊÓµÄÊÂʵ£ºFull Attention Ä£ÐÍ×ÔÉí¾ÍÔ̺¬×ž޴óµÄЧÄܿռ䣬¶ø¿ªÊÍÕâÖÖÄÚÉúÏ¡ÉÙÐԵijɱ¾¼«µÍ¡£
600 ²½ÑµÁ·£¬¾«¶ÈÏÕЩÎÞËð£¬Prefill ×î¸ß 9.36 ±¶¼Ó¿ì¡£ÕâÒâζ×Å£¬¶ÔÓÚÑ¡Ôñ SWA + Full Attention »ìºÏ¼Ü¹¹µÄÍÅ¶Ó ¡ª¡ª Ô̺¬ MIMO¡¢Gemma 4¡¢GPT-OSS¡ª¡ª²»±ØÒª´úÌæ¼Ü¹¹¾ÍÄÜ»ñµÃ¿¿½ü SOTA й滮µÄѹËõЧÄÜ
RTP-LLM Êǰ¢Àï°Í°ÍÖÇÄÜÒýÇæÍŶÓ×ÔÑеĸ߻úÄÜ´óÄ£ÐÍÍÆÀíÒýÇæ£¬Ö§³ÖÁËÌÔ±¦¡¢Ììè¡¢¸ßµÂµÈÖ÷ÌâÒµÎñµÄ´óÄ£ÐÍÍÆÀíÐèÒª¡£ÖÇÄÜÒýÇæÔ´×Ô°¢Àï°Í°ÍËÑË÷¡¢ÍƼöºÍ¸æ°×¼¼Êõ£¬Êǰ¢Àï AI ¹¤³ÌÁìÓòµÄÏÈÐÐÕߺÍÉî¸ûÕß¡£ÍŶÓרһÓÚ AI ¹¤³ÌϵͳµÄ½¨É裬Ö÷µ¼³ÉÁ¢ÁË´óÊý¾Ý AI ¹¤³Ìϵͳ AI?OS£¬³ÖÐøÎª°¢ÀOÍŸ÷ÒµÎñÌṩ¸ßÖÊÁ¿µÄ AI ¹¤³Ì·þÎñ¡£
《莲花梦迟[NP](一蓑烟雨著)》德天空称,德国队将补招莱比锡中场韦德拉奥果作为卡尔的替代者。韦德拉奥果将结束在西班牙的假期前往芝加哥,纳格尔斯曼已告知他这一决定,莱比锡俱乐部方面也已知悉。克而瑞好房点评网楼盘测评是深度融合克而瑞在房地产领域长达二十年的专业积淀与市场洞察,基于深度智联“专业力”与“工程力”构建起的评价体系。《莲花梦迟[NP](一蓑烟雨著)》¡¶Èվ硼ûÕÑùµÄ°®×Ó¡·¡·对舞蹈的热爱,也让他对学习舞蹈后来者有话要说:“坚持你所热爱的,相信自己,一步一个脚印。希望他们能从中找到乐趣,快乐是最好的导师。”由于上周参加了欧冠决赛,特罗萨德直到周四才与比利时国家队会合。他在周五的新闻发布会上表示:“我真的已经迫不及待想开始了。大家都带着很高的热情开启这次世界杯征程,这是非常积极的信号。到目前为止,我只参加了一堂训练课,所以还看不出太多特别明显的东西,但我能感觉到所有人都很专注,也都已经准备好迎接世界杯了。”
20260608 ? 《莲花梦迟[NP](一蓑烟雨著)》伊劳拉:“我曾经站在另一边,我仍然记得小基耶萨在赛季第一场比赛最后时刻打进的那个进球!当时我们2-2战平,觉得或许可以带走点什么。他进球了,整座球场瞬间沸腾。很疯狂,对吧?现在我想从另一边去感受这一切。刚到任何一家俱乐部时,我认为你都需要在某种程度上证明自己。你需要赢得归属感。我想尽快做到这一点,这样我也能和他们一起庆祝,真正成为那些庆祝的一部分。”¹ëÃÛÀϰÖ(ÖÕ¾Ö1V1)±ÊȤ¸ó政治上新西兰为英联邦成员国、议会制君主立宪制,国家元首为英国国王(由总督代行职权)且仅保留象征权力,实行一院制议会,民主制度成熟,社会稳定。1907年,新西兰成为英国自治领。1947年,新西兰接受英国威斯敏斯特法令,实行全面自治。
20260608 ? 《莲花梦迟[NP](一蓑烟雨著)》2026年1月14日,招标方发布公告称,“因本项目收到相关投诉,暂停本项目的招投标活动”,并表示投标有限期相应延长90天。然而,两个月后,项目招标进行的最终合同公示中,中标方仍为二次公示的中标者湖南省第四工程有限公司联合体。»Ø¸´ÊõÊ¿µÄ³ÁÀ´ÈËÉúÈ«¼¯Ãâ·ÑÅÔ¹ÛÆëÈ«°æ招商·臻园地处丰台科技园总部基地板块,是央企招商蛇口打造的改善型小高层住宅代表作。在项目价值测评中,其综合得分位居同类竞品前列,尤其在市场口碑与项目价值两大维度表现卓越。