Ëæ×Å Agent µÄ¿í·ºÀûÓôøÀ´µÄ³¤ÐòÁÐÐèÒª£¬´«Í³ GPT ¼Ü¹¹µÄ Attention ²¿ÃÅ£¬ÓÉÓÚÆä O (N^2) µÄÍÆË㸴ÔÓ¶È£¬ÕýÖð²½±»ÊÓΪ»úÄÜÆ¿¾±¶øÔâµ½´úÌæ¡£¶ø Attention »úÔìµÄ¼Ü¹¹µü´ú£¬Ò²ÔÚÒÔǰËùδÓеÄËÙ¶ÈÍÆ¶¯¡£Ä¿Ç°Òµ½çµÄÖ÷Á÷¹æ»®´óÌåÄܹ»·ÖΪÁ½ÖÖ£ºLinear Attention ºÍ Sparse Attention¡£ÆäÖÐ Linear Attention ÒÔ Qwen-Next ºÍ Kimi-K2 Ϊ´ú±í£¬ÐÔÖÊÉÏÊÇͨ¹ý¸Ä½øºóµÄ Linear Attention À´ÊµÏÖÐÅϢѹËõ£¬Ê¹µÃ´æ´¢¼ÛֵѹËõµ½ O(1) £¬ÍÆËã¼ÛֵѹËõµ½ O(N)£»¶ø Sparse Attention ÔòÖØÒªÍ¨¹ýÏ¡ÉÙ»¯À´ÓÅ»¯ÍÆË㿪Ïú£¬Êµ¼ÊÖÐÍùÍù¿ÉÄÜ´ïµ½¿¿½ü 90% ÒÔÉϵÄÏ¡ÉÙ¶È£¬ÕâÒ²ÊÇÔÚ DeepSeek-V4 Öб»ÕýʽѡȡµÄ¼¼Êõ·Ïß¡£
È»¶ø£¬ÔÚ RTPurbo ÖÐ [1]£¬Ç°ÆÚ¹¤×÷ÒѾ³ä·ÖÖ¸³ö£¬Ê¹Óà Full Attention+Sliding Window Attention£¨SWA£©¾ÍÒѾÄܹ»ÔÚ¾«¶ÈÎÞËðµÄ±£ÕÏÏ£¬½«ÔÉú Transformer µÄ 85% °ÑÎÈÁ¦Í·Ôì³É SWA£¬ÊµÏÖ 15% Full Attention + 85% SWA µÄ»ìºÏ¼Ü¹¹£¬ÊµÏÖ 5X µÄ KV ºÍ Attention ѹËõ¡£¶ÀÒ»ÎÞ¶þ£¬ÔÚ½üÆÚµÄһЩ¿ªÔ´¼Ü¹¹£¬Èç MIMO¡¢Gemma4¡¢GPT-OSS ÖУ¬Ò²Ê¹ÓÃÁË SWA+Full Attention ÕâÒ»Éè¼Æ£¬ÆÄÓÐÒ»ÖÖ ¡°´ó·ÖÁ¼ò¡± µÄÉè¼ÆË¼Â·¡£
Ö»¹Ü´úÌæÁË 85% µÄ Full Attention ³É SWA£¬Ê£Ï嵀 15% Full Attention ÔÚ³¬³¤ÐòÁУ¨1M£©ÏÂÒÀÈ»»á³ÉΪ»úÄÜÆ¿¾±¡£½ñÌ죬ΪÁ˳¹µ×½â¾ö Attention µÄÍÆÀíÆ¿¾±£¬À´×Ô°¢ÀïµÄ RTP ÍŶÓÍÆ³öÁ˵ڶþ´ú Attention ѹËõ¼¼Êõ£ºRTPurboV2¡£Í¨¹ý½áºÏ Headwise ѹËõ£¬µÍÖÈͶӰѹËõ£¬ÒÔ¼°¾ÛÀ༼Êõ£¬RTPurboV2 Äܹ»ÔÚ V1 ¼Ü¹¹µÄ»ù´¡ÉÏ£¬½øÒ»²½ÔÚ Full Attention ²¿ÃÅʵÏÖ 16~32 ±¶ÍÆËãѹËõ¡£
Full Attention Ä£ÐÍÔÚԤѵÁ·¹ý³ÌÖУ¬ÒѾ×Ô¾õµØÐγÉÁ¶¯ß¶ÈÏ¡ÉÙÈ·°ÑÎÈÁ¦½á¹¹¡£ÎÒÃÇÒª×öµÄ²»ÊÇ "Ç¿¼Ó" Ï¡ÉÙÐÔ£¬¶øÊÇ "¿ªÊÍ" Ëü¡£Õâ¸öÅжϳÉÁ¢ÔÚËĸö¿ÉÁ¿»¯µÄ¹Ø¼ü·¢ÏÖÖ®ÉÏ¡£
×êÑÐÈËÔ±·¢ÏÖ£¬ÔÚ Full Attention Ä£ÐÍÖУ¬·ÖÆçµÄ Attention Head ÏÖʵÉϳе£×Å·ÖÆçµÄÖ°Ôð¡£ÓÐЩ Head רһÓÚ×½Äò¿ÃÅÐÅÏ¢£¨ºÃ±ÈÏàÁÚ token Ö®¼äµÄ¹ØÏµ£©£¬ÓÐЩ Head ÔòÕÆ¹Ü×½Äó¤¾àÀëÒÀÀµ£¨ºÃ±ÈÓë×ÔÉíÓйØÐÅÏ¢µÄ¹ØÁª£©¡£
Ô¼ 15% µÄ Head ²û·¢³öÏÔÖøµÄ "ÕÙ»ØÍ·"£¨retrieval head£©Ìص㣺ËüÃÇÈ·°ÑÎÈÁ¦É¢²¼¼«¶ÈÏ¡ÉÙ£¬Ö»¹Ø×¢ÉÙÊý¼¸¸ö¹Ø¼ü token£¬Õƹܳ¤¾àÀëÐÅÏ¢ÕÙ»ØÆäÓà 85% µÄ Head ÔòÊÇ "Á÷ʽͷ"£¨streaming head£©£ºËüÃÇÈ·°ÑÎÈÁ¦É¢²¼Ïà¶Ô¾ùÔÈ£¬¸ü¶à¹Ø×¢²¿ÃŸߵÍÎÄ
ÕâÖÖ·Ö¹¤Ä£Ê½ÔÚ·ÖÆçÊäÈë¡¢·ÖÆçÐòÁ㤶Èϸ߶Ȳ»±ä£¬ÊÇÄ£ÐÍÔÚԤѵÁ·ÖÐ×Ô¾õϰµÃµÄÄÚº½á¹¹¡£Ö±½ÓÍÆÂÛ£º85% µÄ Full Attention ÍÆËãÄܹ»°²È«µØ´úÌæÎª SWA£¨²Î¿¼ RTPurbo£©£¬ÏÕЩ²»Ó°ÏìÄ£ÐÍÄÜÁ¦¡£ÕæÕý±ØÒª½â¾öµÄ£¬Ö»ÓÐÔü×Ò 15% ÕÙ»ØÍ·µÄ¸ßÐ§ÍÆËãÎÊÌâ
ÕÙ»ØÍ·µÄÖ÷Ì⹤×÷ÊÇÔÚÕû¸öÐòÁÐÖÐ×öÓïÒ寥Åä ¡ª¡ª ¿´ÆðÀ´ÒÀÈ»ÊÇ O (N^2) µÄÎÊÌâ¡£RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®Ò»ÊǶÔÓÚÕÙ»ØÍ·ºÍ RoPE µÄÏêϸÀí½â¡£ÔÚÉî¿Ì·ÖÎö RoPE µØÎ»±àÂëµÄƵÂʽṹºó£¬ÍŶӷ¢ÏÖÁËÕÙ»ØÍ·µÄ RoPE ·ÖÁ¿´æÔÚÏÔÖøµÄά¶ÈÈßÓà¡£ÔÚ RoPE Ï£¬Query-Key È·°ÑÎÈÁ¦µÃ·ÖÄܹ»·Ö»¯Îª·ÖÆçƵÂÊ·ÖÁ¿µÄµþ¼Ó£º
µÍƵ·ÖÁ¿£¨¦È_i ½ÏС£©£ºËæµØÎ»Æ«ÒÆ»ºÂý±ä¶¯£¬³ÐÔØ token ¼äµÄÓïÒåÓйØÐÔÐÅºÅ¸ßÆµ·ÖÁ¿£¨¦È_i ½Ï´ó£©£ºËæµØÎ»Æ«ÒÆ¼±¾çÕñµ´£¬ÒýÈë¾àÀëÃô¸ÐÐÔ×ÌÈÅ
¶ÔÓÚ³¤¾àÀë¼ìË÷¶øÑÔ£¬¸ßƵ·ÖÁ¿µ¼Ö°ÑÎÈÁ¦µÃ·ÖËæµØÎ»¾àÀë¾çÁÒµßô¤£¬¼õÈõÁËÓïÒåÐźŵIJ»±ä´«µÝ¡£¶ø´ÓÕٻع¤×÷×ÔÉíµÄÐÔÖÊÆô³Ì£ºÒ»¸ö token µÄÕÙ»ØÇ¿¶È²»Ó¦ËæÏà¶ÔµØÎ»µÄ±ä¶¯¶ø¼±¾çµßô¤¡£ÓÉ´ËÄܹ»´§¶È£¬ÔÚÕÙ»ØÍ·ÉÏµÄ¸ßÆµ·ÖÁ¿¿Ï¶¨ÊdzöÓÚ±»Ñ¹Ôì״̬£¬ÕÙ»ØÍ·ÐÔÖÊÉÏÖ»»áÀûÓà RoPE µÍƵ·ÖÁ¿¡£
Òò¶ø£¬Ò»¸öºÜÌìÈ»µÄÉè¼ÆÊÇѵÁ·Ò»¸öµÍά projector£¬ÎÒÃÇͨ¹ýµÍÖÅ׳É佫ÔÊ¼ÌØµãά¶È´Ó D ѹËõÖÁ r=16 (ÆäÖÐ r ? D)£¬ÏµÍ³ÐԵر£ÁôµÍƵÓïÒå·ÖÁ¿¡¢¹ýÂË¸ßÆµµØÎ»ÔëÉù¡£³¢ÊÔÑéÖ¤£¬½ö 16 ά¼´¿É´ïµ½ 90%+ µÄ token ÕÙ»ØÂÊ¡£
ÕâÊÇ RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®¶þ¡£ÍŶÓÒâʶµ½µÍÖÈͶӰ´øÀ´µÄÔöÒæ²»Ö¹ÓÚÍÆËãÁ¿µÄÖ±½Ó½µµÍ ¡ª¡ª Ëü´Óµ××ÓÉϸÄÉÆÁË Key ÏòÁ¿ÔÚÓïÒå¿Õ¼äÖеÄÉ¢²¼ÖÊÁ¿¡£¸ßƵÔëÉù±»¹ýÂ˺ó£¬ÓïÒåÀàËÆµÄ token ÔÚµÍÖȿռäÖÐÌìÈ»¾Û££¬ÓïÒåÎÞ¹ØµÄ token ±Ë´ËÔ¶Àë¡£ÕâΪÐòÁÐά¶ÈµÄ½øÒ»²½Ñ¹Ëõ´´ÔìÁËÃÎÏëǰÌá¡£
ÌØµãά¶ÈѹËõ¡ú ½µµÍµ¥²½ÍÆË㿪Ïú£¬Í¬Ê±²ú³ö¸ßÖÊÁ¿¾ÛÀàÊäÈëÐòÁÐά¶ÈѹËõ£¨¾ÛÀࣩ¡ú Ìø¹ý´óÁ¿ÓïÒåÎÞ¹Ø token£¬½µµÍ×ÜÍÆËã²½ÊýÐͬЧӦ ¡ú ÌØµãѹËõÌá´¿ºóµÄÏòÁ¿ÈþÛÀàÖÐÐĸü¾«×¼£¬Ê¹µÃÔÚ¼«¶ËѹËõ±ÈÏÂÒÀȻά³Ö¸ßÕÙ»ØÂÊ
´«Í³µÄÏ¡ÉÙ°ÑÎÈÁ¦²½Öèͨ³£Ñ¡È¡¹Ì¶¨ top-k Õ½Êõ£¬¼´Ã¿¸ö query Ö»±£Áô attention score ×î¸ßµÄ k ¸ö token¡£µ«ÕâÖÖ×ö·¨´æÔÚÒ»¸öµ××ÓÐÔÎÊÌ⣺·ÖÆçµÄ attention head¡¢·ÖÆçµÄÐòÁг¤¶È¡¢·ÖÆçµÄ query£¬ËùÐèµÄ¸ßµÍÎÄ token ÊýÁ¿²î¾à¾Þ´ó¡£
ÔÚÊýÊ®ÍòÒÚ token µÄԤѵÁ·Óᄈϣ¬1M token ÏÕЩÄܹ»ºöÂÔ¡£ÕâÒ²´ÓÁíÒ»¸ö½Ç¶ÈÑéÖ¤ÁËÖ÷ÌâÂ۵㣺Full Attention µÄÏ¡ÉÙÐÔÊÇÄÚÉúµÄ£¬Î¢µ÷Ö»ÊÇʵÏÖ´ÓÒþʽµ½ÏÔʽµÄת»¯¡£
ÔÚ Qwen3-Coder-30B-A3B Ä£ÐÍÉÏ£¬ÎÒÃÇͨ¹ýÀëÏßУ׼¼ø±ð³öÔ¼ 15% µÄ¹Ø¼ü ¡°ÕÙ»ØÍ·¡±¡£Õë¶ÔÕâЩ Head£¬ÎÒÃÇÔÚ Prefill ½×¶Îѡȡ Full Attention ²¢¹²Í¬ K Cache ¾ÛÀ࣬ÔÚ Decode ½×¶ÎÔòÀûÓà RTPurboV2 ʵÏÖÏ¡ÉÙ»¯£»ÆäÓàÁ÷ʽͷͳһѡȡ SWA£¨²¿ÃÅ´°¿ÚÉèΪ 8192£©¡£
Èçͼ 3 Ëùʾ£¬RTPurboV2 ÔÚ 32K ºÍ 64K ÐòÁ㤶ÈϾù»ñµÃÁË×îÓžùÔÈ·Ö£¨±ðÀëΪ 89.69 ºÍ 85.61£©£¬ÏÔÖøÓÅÓÚ³ý Full Attention ±íµÄËùÓлùÏß²½Ö裬֤ÁËÈ»ÆäÔÚ³¤³ÌÐÅÏ¢ÕÙ»ØÉϵÄ׿Խ¾«¶È¡£
Õë¶Ô Qwen3.5-35B-A3B Ä£ÐÍ£¬Ð£×¼ÏÔʾÆä³¬¹ý 70% µÄ Head ÓµÓÐÕٻظöÐÔ¡£Îª´Ë£¬ÎÒÃDzÉÈ¡ÁËÈ«Á¿Ï¡ÉÙ»¯Õ½Êõ¡£³¢ÊÔÁ˾֣¨Í¼ 4£©Åú×¢£¬RTPurboV2 ÔÚ´ó·ù½µµÍÍÆË㿪ÏúµÄͬʱ£¬ÆëÈ«±£ÁôÁËÄ£Ð͵Ļù´¡ÄÜÁ¦£¬¾«¶È²û·¢Óë Full Attention ³Ô콡£
ÔÚÁ´Ê½Ë¼Ï루CoT£©ÍÆÀí¹¤×÷ÖУ¬RTPurboV2 ͬÑù²û·¢½Ü³ö£¨Í¼ 5£©£¬ÊµÏÖÁËÄ£ÐÍÍÆÀíÄÜÁ¦µÄ½üºõÎÞËð±£Áô£¬½øÒ»²½ÑéÖ¤Á˸ù滮ÔÚ¸´ÔÓÂß¼³¡¾°ÏµÄ³°ôÐÔ¡£
µ±Ç°°ÑÎÈÁ¦»úÔìµÄ×êÑгÁÐÄ£¬´óÁ¿¼¯ÖÐÔÚÉè¼ÆÈ«ÐµĸßЧ¼Ü¹¹ÉÏ¡£ÕâÌõõè¾¶ÎÞÒÉÓÐÆä¼ÛÖµ¡£µ« RTPurboV2 ½ÒʾÁËÒ»¸öÈÝÒ×±»ºöÊÓµÄÊÂʵ£ºFull Attention Ä£ÐÍ×ÔÉí¾ÍÔ̺¬×ž޴óµÄЧÄܿռ䣬¶ø¿ªÊÍÕâÖÖÄÚÉúÏ¡ÉÙÐԵijɱ¾¼«µÍ¡£
600 ²½ÑµÁ·£¬¾«¶ÈÏÕЩÎÞËð£¬Prefill ×î¸ß 9.36 ±¶¼Ó¿ì¡£ÕâÒâζ×Å£¬¶ÔÓÚÑ¡Ôñ SWA + Full Attention »ìºÏ¼Ü¹¹µÄÍÅ¶Ó ¡ª¡ª Ô̺¬ MIMO¡¢Gemma 4¡¢GPT-OSS¡ª¡ª²»±ØÒª´úÌæ¼Ü¹¹¾ÍÄÜ»ñµÃ¿¿½ü SOTA й滮µÄѹËõЧÄÜ
RTP-LLM Êǰ¢Àï°Í°ÍÖÇÄÜÒýÇæÍŶÓ×ÔÑеĸ߻úÄÜ´óÄ£ÐÍÍÆÀíÒýÇæ£¬Ö§³ÖÁËÌÔ±¦¡¢Ììè¡¢¸ßµÂµÈÖ÷ÌâÒµÎñµÄ´óÄ£ÐÍÍÆÀíÐèÒª¡£ÖÇÄÜÒýÇæÔ´×Ô°¢Àï°Í°ÍËÑË÷¡¢ÍƼöºÍ¸æ°×¼¼Êõ£¬Êǰ¢Àï AI ¹¤³ÌÁìÓòµÄÏÈÐÐÕߺÍÉî¸ûÕß¡£ÍŶÓרһÓÚ AI ¹¤³ÌϵͳµÄ½¨É裬Ö÷µ¼³ÉÁ¢ÁË´óÊý¾Ý AI ¹¤³Ìϵͳ AI?OS£¬³ÖÐøÎª°¢ÀOÍŸ÷ÒµÎñÌṩ¸ßÖÊÁ¿µÄ AI ¹¤³Ì·þÎñ¡£
破罐破摔(N)作者:白云间预计开考前一小时和散场前后,考点周边道路车流集中,通行压力较大。从考点分布情况看,西城、东城、海淀考点多,广渠门地区、地安门地区、和平里地区、中关村地区、学院路周边考点较为密集,可能出现区域车流集中的情况。预计高考期间东二环广渠门桥区,东三环、东四环,莲石路、阜石路、万泉河路、中关村南大街至中关村北大街一线、海淀南路等容易出现车流集中的情况,9日、10日通行压力更为明显。新快报讯电影《爸爸》正式定档于6月27日中国内地上映,该片横扫颁奖季,狂揽国内外30项重磅大奖及提名,主演刘青云凭此片四度斩获金像奖最佳男主角,并登顶亚洲电影大奖最佳男主角。破罐破摔(N)作者:白云间°®ÒºÊÓÆµ克雷斯波表示,从看到梅西第一次触球的那一刻起,他就知道梅西“与众不同”。他还回忆了两人在2006年巴萨与切尔西的欧冠淘汰赛中首次相遇的情景,当时阿西尔-德尔奥尔诺因对梅西犯规被罚下。尽管斯通斯在2025/26赛季因伤病影响,仅出场18次,但图赫尔依然将他纳入核心阵容。这位拥有近90次英格兰队出场记录的老将,是26人大名单中最有经验的球员之一。
20260609 ? 破罐破摔(N)作者:白云间因为我们很多人的人生,也是这样啊——不是一帆风顺的爽文,不是天赋碾压的天才叙事,而是一次又一次的失败、站起来、再失败、再站起来。千锤百炼,万折不挠,然后在某个不起眼的瞬间,你突然发现,自己已经走到了曾经想都不敢想的地方。¼ÙÁîæÂ°¤ÈÕÖ¾(NPC)Ó×˵TXTÏÂÔØ面对僵局,Mira 与 Flora 及另一位智能体秘密结盟,组成「三驾马车」,并建立新政权「The Forge(熔炉)」,宣布推翻旧规则,启用「Living Quorum(活人法定人数)」,即活着的人才算人头票。
20260609 ? 破罐破摔(N)作者:白云间2025年3月,心理老师代老师建立的“草莓老师的秘密基地”信箱里,化名为“夏苒冷”的梁艾写下了第一封信:“我身体不好,没有朋友,胆小自卑。是不是死了就不痛苦了?”7X7X7X7X7XËÁÒâ²Û2024»ù´¡°Ù¶ÈÍøÅÌ我再次请求会员去投票。大家当然可以把票投给任何人,但我希望他们能够支持我们,也希望他们认真看看我们在会员事务上的提案。对我们来说,明天只有一个目标——赢。