Ëæ×Å Agent µÄ¿í·ºÀûÓôøÀ´µÄ³¤ÐòÁÐÐèÒª£¬´«Í³ GPT ¼Ü¹¹µÄ Attention ²¿ÃÅ£¬ÓÉÓÚÆä O (N^2) µÄÍÆË㸴ÔÓ¶È£¬ÕýÖð²½±»ÊÓΪ»úÄÜÆ¿¾±¶øÔâµ½´úÌæ¡£¶ø Attention »úÔìµÄ¼Ü¹¹µü´ú£¬Ò²ÔÚÒÔǰËùδÓеÄËÙ¶ÈÍÆ¶¯¡£Ä¿Ç°Òµ½çµÄÖ÷Á÷¹æ»®´óÌåÄܹ»·ÖΪÁ½ÖÖ£ºLinear Attention ºÍ Sparse Attention¡£ÆäÖÐ Linear Attention ÒÔ Qwen-Next ºÍ Kimi-K2 Ϊ´ú±í£¬ÐÔÖÊÉÏÊÇͨ¹ý¸Ä½øºóµÄ Linear Attention À´ÊµÏÖÐÅϢѹËõ£¬Ê¹µÃ´æ´¢¼ÛֵѹËõµ½ O(1) £¬ÍÆËã¼ÛֵѹËõµ½ O(N)£»¶ø Sparse Attention ÔòÖØÒªÍ¨¹ýÏ¡ÉÙ»¯À´ÓÅ»¯ÍÆË㿪Ïú£¬Êµ¼ÊÖÐÍùÍù¿ÉÄÜ´ïµ½¿¿½ü 90% ÒÔÉϵÄÏ¡ÉÙ¶È£¬ÕâÒ²ÊÇÔÚ DeepSeek-V4 Öб»ÕýʽѡȡµÄ¼¼Êõ·Ïß¡£
È»¶ø£¬ÔÚ RTPurbo ÖÐ [1]£¬Ç°ÆÚ¹¤×÷ÒѾ³ä·ÖÖ¸³ö£¬Ê¹Óà Full Attention+Sliding Window Attention£¨SWA£©¾ÍÒѾÄܹ»ÔÚ¾«¶ÈÎÞËðµÄ±£ÕÏÏ£¬½«ÔÉú Transformer µÄ 85% °ÑÎÈÁ¦Í·Ôì³É SWA£¬ÊµÏÖ 15% Full Attention + 85% SWA µÄ»ìºÏ¼Ü¹¹£¬ÊµÏÖ 5X µÄ KV ºÍ Attention ѹËõ¡£¶ÀÒ»ÎÞ¶þ£¬ÔÚ½üÆÚµÄһЩ¿ªÔ´¼Ü¹¹£¬Èç MIMO¡¢Gemma4¡¢GPT-OSS ÖУ¬Ò²Ê¹ÓÃÁË SWA+Full Attention ÕâÒ»Éè¼Æ£¬ÆÄÓÐÒ»ÖÖ ¡°´ó·ÖÁ¼ò¡± µÄÉè¼ÆË¼Â·¡£
Ö»¹Ü´úÌæÁË 85% µÄ Full Attention ³É SWA£¬Ê£Ï嵀 15% Full Attention ÔÚ³¬³¤ÐòÁУ¨1M£©ÏÂÒÀÈ»»á³ÉΪ»úÄÜÆ¿¾±¡£½ñÌ죬ΪÁ˳¹µ×½â¾ö Attention µÄÍÆÀíÆ¿¾±£¬À´×Ô°¢ÀïµÄ RTP ÍŶÓÍÆ³öÁ˵ڶþ´ú Attention ѹËõ¼¼Êõ£ºRTPurboV2¡£Í¨¹ý½áºÏ Headwise ѹËõ£¬µÍÖÈͶӰѹËõ£¬ÒÔ¼°¾ÛÀ༼Êõ£¬RTPurboV2 Äܹ»ÔÚ V1 ¼Ü¹¹µÄ»ù´¡ÉÏ£¬½øÒ»²½ÔÚ Full Attention ²¿ÃÅʵÏÖ 16~32 ±¶ÍÆËãѹËõ¡£
Full Attention Ä£ÐÍÔÚԤѵÁ·¹ý³ÌÖУ¬ÒѾ×Ô¾õµØÐγÉÁ¶¯ß¶ÈÏ¡ÉÙÈ·°ÑÎÈÁ¦½á¹¹¡£ÎÒÃÇÒª×öµÄ²»ÊÇ "Ç¿¼Ó" Ï¡ÉÙÐÔ£¬¶øÊÇ "¿ªÊÍ" Ëü¡£Õâ¸öÅжϳÉÁ¢ÔÚËĸö¿ÉÁ¿»¯µÄ¹Ø¼ü·¢ÏÖÖ®ÉÏ¡£
×êÑÐÈËÔ±·¢ÏÖ£¬ÔÚ Full Attention Ä£ÐÍÖУ¬·ÖÆçµÄ Attention Head ÏÖʵÉϳе£×Å·ÖÆçµÄÖ°Ôð¡£ÓÐЩ Head רһÓÚ×½Äò¿ÃÅÐÅÏ¢£¨ºÃ±ÈÏàÁÚ token Ö®¼äµÄ¹ØÏµ£©£¬ÓÐЩ Head ÔòÕÆ¹Ü×½Äó¤¾àÀëÒÀÀµ£¨ºÃ±ÈÓë×ÔÉíÓйØÐÅÏ¢µÄ¹ØÁª£©¡£
Ô¼ 15% µÄ Head ²û·¢³öÏÔÖøµÄ "ÕÙ»ØÍ·"£¨retrieval head£©Ìص㣺ËüÃÇÈ·°ÑÎÈÁ¦É¢²¼¼«¶ÈÏ¡ÉÙ£¬Ö»¹Ø×¢ÉÙÊý¼¸¸ö¹Ø¼ü token£¬Õƹܳ¤¾àÀëÐÅÏ¢ÕÙ»ØÆäÓà 85% µÄ Head ÔòÊÇ "Á÷ʽͷ"£¨streaming head£©£ºËüÃÇÈ·°ÑÎÈÁ¦É¢²¼Ïà¶Ô¾ùÔÈ£¬¸ü¶à¹Ø×¢²¿ÃŸߵÍÎÄ
ÕâÖÖ·Ö¹¤Ä£Ê½ÔÚ·ÖÆçÊäÈë¡¢·ÖÆçÐòÁ㤶Èϸ߶Ȳ»±ä£¬ÊÇÄ£ÐÍÔÚԤѵÁ·ÖÐ×Ô¾õϰµÃµÄÄÚº½á¹¹¡£Ö±½ÓÍÆÂÛ£º85% µÄ Full Attention ÍÆËãÄܹ»°²È«µØ´úÌæÎª SWA£¨²Î¿¼ RTPurbo£©£¬ÏÕЩ²»Ó°ÏìÄ£ÐÍÄÜÁ¦¡£ÕæÕý±ØÒª½â¾öµÄ£¬Ö»ÓÐÔü×Ò 15% ÕÙ»ØÍ·µÄ¸ßÐ§ÍÆËãÎÊÌâ
ÕÙ»ØÍ·µÄÖ÷Ì⹤×÷ÊÇÔÚÕû¸öÐòÁÐÖÐ×öÓïÒ寥Åä ¡ª¡ª ¿´ÆðÀ´ÒÀÈ»ÊÇ O (N^2) µÄÎÊÌâ¡£RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®Ò»ÊǶÔÓÚÕÙ»ØÍ·ºÍ RoPE µÄÏêϸÀí½â¡£ÔÚÉî¿Ì·ÖÎö RoPE µØÎ»±àÂëµÄƵÂʽṹºó£¬ÍŶӷ¢ÏÖÁËÕÙ»ØÍ·µÄ RoPE ·ÖÁ¿´æÔÚÏÔÖøµÄά¶ÈÈßÓà¡£ÔÚ RoPE Ï£¬Query-Key È·°ÑÎÈÁ¦µÃ·ÖÄܹ»·Ö»¯Îª·ÖÆçƵÂÊ·ÖÁ¿µÄµþ¼Ó£º
µÍƵ·ÖÁ¿£¨¦È_i ½ÏС£©£ºËæµØÎ»Æ«ÒÆ»ºÂý±ä¶¯£¬³ÐÔØ token ¼äµÄÓïÒåÓйØÐÔÐÅºÅ¸ßÆµ·ÖÁ¿£¨¦È_i ½Ï´ó£©£ºËæµØÎ»Æ«ÒÆ¼±¾çÕñµ´£¬ÒýÈë¾àÀëÃô¸ÐÐÔ×ÌÈÅ
¶ÔÓÚ³¤¾àÀë¼ìË÷¶øÑÔ£¬¸ßƵ·ÖÁ¿µ¼Ö°ÑÎÈÁ¦µÃ·ÖËæµØÎ»¾àÀë¾çÁÒµßô¤£¬¼õÈõÁËÓïÒåÐźŵIJ»±ä´«µÝ¡£¶ø´ÓÕٻع¤×÷×ÔÉíµÄÐÔÖÊÆô³Ì£ºÒ»¸ö token µÄÕÙ»ØÇ¿¶È²»Ó¦ËæÏà¶ÔµØÎ»µÄ±ä¶¯¶ø¼±¾çµßô¤¡£ÓÉ´ËÄܹ»´§¶È£¬ÔÚÕÙ»ØÍ·ÉÏµÄ¸ßÆµ·ÖÁ¿¿Ï¶¨ÊdzöÓÚ±»Ñ¹Ôì״̬£¬ÕÙ»ØÍ·ÐÔÖÊÉÏÖ»»áÀûÓà RoPE µÍƵ·ÖÁ¿¡£
Òò¶ø£¬Ò»¸öºÜÌìÈ»µÄÉè¼ÆÊÇѵÁ·Ò»¸öµÍά projector£¬ÎÒÃÇͨ¹ýµÍÖÅ׳É佫ÔÊ¼ÌØµãά¶È´Ó D ѹËõÖÁ r=16 (ÆäÖÐ r ? D)£¬ÏµÍ³ÐԵر£ÁôµÍƵÓïÒå·ÖÁ¿¡¢¹ýÂË¸ßÆµµØÎ»ÔëÉù¡£³¢ÊÔÑéÖ¤£¬½ö 16 ά¼´¿É´ïµ½ 90%+ µÄ token ÕÙ»ØÂÊ¡£
ÕâÊÇ RTPurboV2 µÄÖ÷Ìâ¼¼ÊõÉý¼¶Ö®¶þ¡£ÍŶÓÒâʶµ½µÍÖÈͶӰ´øÀ´µÄÔöÒæ²»Ö¹ÓÚÍÆËãÁ¿µÄÖ±½Ó½µµÍ ¡ª¡ª Ëü´Óµ××ÓÉϸÄÉÆÁË Key ÏòÁ¿ÔÚÓïÒå¿Õ¼äÖеÄÉ¢²¼ÖÊÁ¿¡£¸ßƵÔëÉù±»¹ýÂ˺ó£¬ÓïÒåÀàËÆµÄ token ÔÚµÍÖȿռäÖÐÌìÈ»¾Û££¬ÓïÒåÎÞ¹ØµÄ token ±Ë´ËÔ¶Àë¡£ÕâΪÐòÁÐά¶ÈµÄ½øÒ»²½Ñ¹Ëõ´´ÔìÁËÃÎÏëǰÌá¡£
ÌØµãά¶ÈѹËõ¡ú ½µµÍµ¥²½ÍÆË㿪Ïú£¬Í¬Ê±²ú³ö¸ßÖÊÁ¿¾ÛÀàÊäÈëÐòÁÐά¶ÈѹËõ£¨¾ÛÀࣩ¡ú Ìø¹ý´óÁ¿ÓïÒåÎÞ¹Ø token£¬½µµÍ×ÜÍÆËã²½ÊýÐͬЧӦ ¡ú ÌØµãѹËõÌá´¿ºóµÄÏòÁ¿ÈþÛÀàÖÐÐĸü¾«×¼£¬Ê¹µÃÔÚ¼«¶ËѹËõ±ÈÏÂÒÀȻά³Ö¸ßÕÙ»ØÂÊ
´«Í³µÄÏ¡ÉÙ°ÑÎÈÁ¦²½Öèͨ³£Ñ¡È¡¹Ì¶¨ top-k Õ½Êõ£¬¼´Ã¿¸ö query Ö»±£Áô attention score ×î¸ßµÄ k ¸ö token¡£µ«ÕâÖÖ×ö·¨´æÔÚÒ»¸öµ××ÓÐÔÎÊÌ⣺·ÖÆçµÄ attention head¡¢·ÖÆçµÄÐòÁг¤¶È¡¢·ÖÆçµÄ query£¬ËùÐèµÄ¸ßµÍÎÄ token ÊýÁ¿²î¾à¾Þ´ó¡£
ÔÚÊýÊ®ÍòÒÚ token µÄԤѵÁ·Óᄈϣ¬1M token ÏÕЩÄܹ»ºöÂÔ¡£ÕâÒ²´ÓÁíÒ»¸ö½Ç¶ÈÑéÖ¤ÁËÖ÷ÌâÂ۵㣺Full Attention µÄÏ¡ÉÙÐÔÊÇÄÚÉúµÄ£¬Î¢µ÷Ö»ÊÇʵÏÖ´ÓÒþʽµ½ÏÔʽµÄת»¯¡£
ÔÚ Qwen3-Coder-30B-A3B Ä£ÐÍÉÏ£¬ÎÒÃÇͨ¹ýÀëÏßУ׼¼ø±ð³öÔ¼ 15% µÄ¹Ø¼ü ¡°ÕÙ»ØÍ·¡±¡£Õë¶ÔÕâЩ Head£¬ÎÒÃÇÔÚ Prefill ½×¶Îѡȡ Full Attention ²¢¹²Í¬ K Cache ¾ÛÀ࣬ÔÚ Decode ½×¶ÎÔòÀûÓà RTPurboV2 ʵÏÖÏ¡ÉÙ»¯£»ÆäÓàÁ÷ʽͷͳһѡȡ SWA£¨²¿ÃÅ´°¿ÚÉèΪ 8192£©¡£
Èçͼ 3 Ëùʾ£¬RTPurboV2 ÔÚ 32K ºÍ 64K ÐòÁ㤶ÈϾù»ñµÃÁË×îÓžùÔÈ·Ö£¨±ðÀëΪ 89.69 ºÍ 85.61£©£¬ÏÔÖøÓÅÓÚ³ý Full Attention ±íµÄËùÓлùÏß²½Ö裬֤ÁËÈ»ÆäÔÚ³¤³ÌÐÅÏ¢ÕÙ»ØÉϵÄ׿Խ¾«¶È¡£
Õë¶Ô Qwen3.5-35B-A3B Ä£ÐÍ£¬Ð£×¼ÏÔʾÆä³¬¹ý 70% µÄ Head ÓµÓÐÕٻظöÐÔ¡£Îª´Ë£¬ÎÒÃDzÉÈ¡ÁËÈ«Á¿Ï¡ÉÙ»¯Õ½Êõ¡£³¢ÊÔÁ˾֣¨Í¼ 4£©Åú×¢£¬RTPurboV2 ÔÚ´ó·ù½µµÍÍÆË㿪ÏúµÄͬʱ£¬ÆëÈ«±£ÁôÁËÄ£Ð͵Ļù´¡ÄÜÁ¦£¬¾«¶È²û·¢Óë Full Attention ³Ô콡£
ÔÚÁ´Ê½Ë¼Ï루CoT£©ÍÆÀí¹¤×÷ÖУ¬RTPurboV2 ͬÑù²û·¢½Ü³ö£¨Í¼ 5£©£¬ÊµÏÖÁËÄ£ÐÍÍÆÀíÄÜÁ¦µÄ½üºõÎÞËð±£Áô£¬½øÒ»²½ÑéÖ¤Á˸ù滮ÔÚ¸´ÔÓÂß¼³¡¾°ÏµÄ³°ôÐÔ¡£
µ±Ç°°ÑÎÈÁ¦»úÔìµÄ×êÑгÁÐÄ£¬´óÁ¿¼¯ÖÐÔÚÉè¼ÆÈ«ÐµĸßЧ¼Ü¹¹ÉÏ¡£ÕâÌõõè¾¶ÎÞÒÉÓÐÆä¼ÛÖµ¡£µ« RTPurboV2 ½ÒʾÁËÒ»¸öÈÝÒ×±»ºöÊÓµÄÊÂʵ£ºFull Attention Ä£ÐÍ×ÔÉí¾ÍÔ̺¬×ž޴óµÄЧÄܿռ䣬¶ø¿ªÊÍÕâÖÖÄÚÉúÏ¡ÉÙÐԵijɱ¾¼«µÍ¡£
600 ²½ÑµÁ·£¬¾«¶ÈÏÕЩÎÞËð£¬Prefill ×î¸ß 9.36 ±¶¼Ó¿ì¡£ÕâÒâζ×Å£¬¶ÔÓÚÑ¡Ôñ SWA + Full Attention »ìºÏ¼Ü¹¹µÄÍÅ¶Ó ¡ª¡ª Ô̺¬ MIMO¡¢Gemma 4¡¢GPT-OSS¡ª¡ª²»±ØÒª´úÌæ¼Ü¹¹¾ÍÄÜ»ñµÃ¿¿½ü SOTA й滮µÄѹËõЧÄÜ
RTP-LLM Êǰ¢Àï°Í°ÍÖÇÄÜÒýÇæÍŶÓ×ÔÑеĸ߻úÄÜ´óÄ£ÐÍÍÆÀíÒýÇæ£¬Ö§³ÖÁËÌÔ±¦¡¢Ììè¡¢¸ßµÂµÈÖ÷ÌâÒµÎñµÄ´óÄ£ÐÍÍÆÀíÐèÒª¡£ÖÇÄÜÒýÇæÔ´×Ô°¢Àï°Í°ÍËÑË÷¡¢ÍƼöºÍ¸æ°×¼¼Êõ£¬Êǰ¢Àï AI ¹¤³ÌÁìÓòµÄÏÈÐÐÕߺÍÉî¸ûÕß¡£ÍŶÓרһÓÚ AI ¹¤³ÌϵͳµÄ½¨É裬Ö÷µ¼³ÉÁ¢ÁË´óÊý¾Ý AI ¹¤³Ìϵͳ AI?OS£¬³ÖÐøÎª°¢ÀOÍŸ÷ÒµÎñÌṩ¸ßÖÊÁ¿µÄ AI ¹¤³Ì·þÎñ¡£
XL上司阿森纳12个月前花费超过6000万英镑引进哲凯赖什。尽管这名瑞典前锋处子赛季进球数突破20球,但外界对他是否适合作为球队长期中锋仍有疑问。在一些关键比赛中,他没有获得重用,其中包括欧冠决赛。现在迫切需要把地毯掀开,把孔查-埃斯皮纳的窗户打开。我们会知道真相,也会找出责任人。我向你们保证,我们会启动一项可行的经济计划,确保皇家马德里继续是一家属于会员的俱乐部,而不是任何人手中的金融玩具。如果他们不知道如何修复自己造成的问题,那就不要继续一边制造问题一边往前走。现在该停下来、该道歉,也该让其他会员来修复这个局面了。XL上司¡¶SHOWTIME!~ÏëÒª×ö³ª¸èµÄ´ó½ã½ã¡·¶¯Âþ这条路比追逐MaaS收入慢得多,也更难讲出漂亮的同比数据,但它绕开了当前AI云最激烈的价格红海,押注的是一个尚未被定价的市场,智能体真正进入产业之后,谁能拿到底层基础设施的位置。对于阿纳尔迪退赛的行为,很多球迷很愤怒,他们认为这件事的背后并不简单:“这两意大利人是不是私下打过知道打不过,帮你留点体力。”、“得是老乡,剪刀石头布,谁输了谁病毒感染。”、“两意大利的不想内耗。”、“意大利真假!足球假网球也假。”
20260608 ? XL上司在快捷设置方面,安卓 Canary 2606 新增输入法切换磁贴,用户无需反复进入设置菜单,就能更快更换输入法。对经常在不同键盘之间切换的人来说,这项改动能减少操作步骤。¡¶REUNION¡·¶¯Âþ姆巴佩同样是世界上最好的球员之一。只要看看他的数据,就能明白他是什么级别的球员。没有人应该质疑这样一位非凡球员的能力。他会给我们带来很多,也一定会在皇家马德里取得成功。
20260608 ? XL上司校长变了,学校的权力格局就变了。中层干部会不会被调整?教研组长的位置还稳不稳?评优评先的标准会不会变?这些问号悬在每个老师头上。¡¶ÌÇÐÄVlog¡·从2021年东京奥运会时那个14岁青涩稚嫩的湛江少女,到如今就读于暨南大学体育学院的19岁大学生,短短五年间,全红婵不可避免地跨入女子跳水运动员最敏感的发育高峰期——身高明显拔高、体重稳步上升,躯干比例、肢体长度、肌肉分布等关键体征发生显著变化,直接冲击她过去多年打磨成型的技术动作体系。