ÕâÌõ²¼¸æÔÚ¹úÄÚ AI ȦˢÁËÒ»ÕûÖÜ¡£Òµ½çµÚÒ»·´Ó³·Ö³É¼¸ÅÉ¡£×î´óÄÇÅÉ˵ÕâÊÇ"ÓÖÒ»ÂÖ¼ÛÖµÕ½"¡ª¡ªÕâÁ½Äê´ÓÖÇÆ×¡¢DeepSeek¡¢×Ö½Ú¶¹°üµ½°¢ÀïͨÒ壬¹ú²ú´óÄ£ÐÍÂÖ׎µ¼Û£¬Ë²»ÔÚ¾í¡£
ÁíÒ»ÅÉÍùÏû¼«´¦¿´£ºÓ×Ã׸ղ¼¸æ½ñÄêÀûÈóÑüÕ¶£¬Õâʱ³½»¹Íù AI ÉÕ 600 ÒÚ¡¢API Ö±½Ó¿³¾Å³É¡ª¡ªµäÐ͵Ä"¿÷±¾ÇÀÊг¡"¡£»¹ÓÐÈ˸д¥ÕâÊÇ DeepSeek ЧӦ³ÖÐø¡ª¡ªºóÕß°ÑÕû¸öÐÐÒµµÄ¶¨¼Û»ù×¼×§µ½Á˵ذåÉÏ£¬Ë²»¸ú˳ö¾Ö¡£
Ëü²»ÊÇȫģÐͽµ¼Û¡£99% µÄÕÛ¿ÛרÃÅÕë¶ÔÒ»µµ½ÐInput (Cache Hit)µÄ¶¨¼Û¡ª¡ªÒ²¾ÍÊÇ"Óû§ÔÚ³¤¶Ô»°Àï³Á¸´¶Áº¹Çà¸ßµÍÎÄ"ÄDz¿ÃÅ¡£Í¨³£µÄÐÂÊäÈ루No Cache Hit£©½µ·ùÓ׺ö࣬ģÐÍÊä³ö£¨Output£©½µ·ù×îÓס£
ÄãµãÒ»±°ëÌÇÄÃÌú£¬¿§·ÈµêÓÐÁ½ÖÖ×ö·¨£ºÃ¿´ÎÖØÐÂÄ¥¶¹×ÓÁ¿Ìǽ¬µ¹ÄÌ£¬ÔÁÏÈËΪ¶¼¸¶Ò»´Î£»µ«ÊÇÄ£ÐÍ֪·ÕâÖÜÄãÿÌì¶¼ÒªºÈͬÑùµÄ°ëÌÇÄÃÌú£¬Ë÷ÐÔ×öÒ»´óºø´æ½ø±ù¹ñ£¬Ï´ΰ´Ò»±Ò¨Ò»·Ý¡£MiMo Õâ´Î×öµÄÊǺóÕß¡ª¡ª°ÑÓû§³Á¸´¶ÁµÄ²¿ÃÅ´Ó"ÏÖËã"¸Ä³ÉÁË"ÏÖÈ¡"£¬ËùÒÔÕⲿÃŵÄÕæÊµ³É±¾¿¿½ü 0£¬ÌìÈ»Äܸø 99% ÕÛ¿Û¡£
Ä£ÐÍÔÚºÍÄã¶Ô»°Ê±£¬Ã¿¸ö token ¶¼ÒªËãÒ»·Ý"ÖÐÑë״̬"£¬´æÆðÀ´¹©ÏÂÒ»²½Óá£Õâ¸öÆ÷²Ä½ÐKVCache¡ª¡ªÄܹ»Àí½â³ÉÄ£Ð͵Ä"¶ÌÆÚÓ°Ïó±Ê¼Ç±¾"¡£Ã¿ËµÒ»¾ä»°£¬Ä£ÐÍÔڱʼDZ¾ÉϼÇÏÂÕâ¾ä»°µÄÌáÒª£¬Ï´ÎÖ±½Ó·±Ê¼Ç£¬²»ÓÃÖØÐÂÌýÒ»±éÄã˵¹ýµÄËùÓÐÄÚÈÝ¡£
´«Í³Ä£ÐÍÿһ²ã¶¼×ö"Full Attention"¡ª¡ªÒ²¾ÍÊÇÿ¸ö token ¶¼Òª¿´ÆëÈ«¶Î¶Ô»°ËùÓÐ token£¬±Ê¼Ç±¾Ô½·Ô½ºñ¡£MiMo-V2.5-Pro ¸ÄÁ˼ܹ¹£º70 ²ãÀï 60 ²ãÖ»¿´×î½ü 128 ¸ö token£¨SWA£¬Sliding Window Attention£©£¬Ö»ÓÐ 10 ²ã"µµ°¸ÖÎÀíÔ±"¿´È«Êý¡£
ÕâÊǽµ±¾µÄµÚÒ»¿éµØ»ù¡£´ò¸öÆ©Ó÷£¬Õý±¾¹«Ë¾Ã¿¸öÔ±¹¤¶¼±»ÒªÇó¼ÇסËùÓеĻáÒé¼Í¼£¬Á˾ÖÿÓ×ÎÒµÄÄÔ×Ó¶¼²»¹»Óá¢Ð§ÄÜÒ²µÍ¡£Ð»®¶¨°Ñ 60 ¸öÔ±¹¤µÄÄÔÖ°ÊØ½µµ½ 1/7£¬Ö»Áô 10 ¸öµµ°¸ÖÎÀíÔ±¹ÜÈ«Êýº¹Çࡪ¡ª¹«Ë¾ÕûÌåÓ°ÏóÄÜÁ¦Ã»½µÂ䣬µ«Ð§ÄÜÌáÉý 7 ±¶¡£
´«Í³µÄ KVCache ϵͳÊǰ´"×î´ó¿ÉÄÜÓÃÁ¿"¸øËùÓвãͳһ·ÖÅäÏÔ´æµÄ¡£Òâ˼ÊÇ£ºÄÄÅ 60 ²ã SWA Ö»±ØÒªÓ×±¾×Ó£¬ÏµÍ³Ò²°´"µµ°¸ÖÎÀíÔ±µÄ´ó±¾×Ó"¸øËùÓв㶼·ÖÅ䡪¡ªSWA Ê¡ÏÂÀ´µÄ¿Õ¼ä±»°×°×Ô¤ÁôÁË£¬µÅ×Úûʡ¡£
´ò¸öÆ©Ó÷£¬Õý±¾¹«Ë¾¸øÃ¿¸öÔ±¹¤¶¼·¢ÁË"ÄÜ×° 100 ÄêÎļþµÄµµ°¸¹ñ"¡ª¡ªµ« 60 ¸öÔ±¹¤Æäʵֻ±ØÒª"×°Ò»ÖÜÎļþµÄÓ×¹ñ×Ó"£¬ÄÇЩ´ó¹ñ×ÓÀï 99% µÄ¿Õ¼äÊǿյġ£ÐÂ×ö·¨Êǰ´ÏÖʵ±ØÒª·Ö¹ñ×Ó¡£Á˾ÖÕû¸ö°ì¹«ÊÒÄܶà×° 5 ±¶ÒÔÉϵÄͬʽøÀ´¹¤×÷¡ª¡ªÍ¬Ñùһ̨ GPU ÄÜ·þÎñµÄ²¢·¢Óû§Êý·ÁË 5 ±¶¡£
ºÃ¶àÓû§µÄ¶Ô»°ÓÐÒ»Ñù¿ªÍ·¡ª¡ªÍ³Ò»¶Î system prompt¡¢Í³Ò»¶Î´úÂë¿â¡¢Í³Ò»·Ý³¤Îĵµ¡£ÏµÍ³»á°ÑÕâЩËã¹ýµÄÁ˾ִæÆðÀ´£¬ÏÂÒ»´ÎÆ¥ÅäÉϾÍÖ±½Ó¸´Óá£Õâ¸ö»úÔì½Ðǰ׺»º´æ¡£
µ« SWA ģʽϳöÏÖÒ»¸ö¿Ó£ºÁ½ÌõÒªÇó token Ò»Ñù£¬²»µÅ×Ú KV »¹ÔÚ¡£¿ÉÄÜǰ׺Ëã¹ý£¬µ« SWA ´°¿Ú±íµÄ²¿ÃÅÔç¾Í±»²Ã¼õÁË¡£ÈôÊÇϵͳ»¹°´"token Ò»Ñù¾ÍÉäÖÐ"µÄ¾É¹æ¶¨¸øÄ㸴Ó㬻á¶Áµ½ÎÞЧ»ò±»¸²¸ÇµÄÊý¾Ý£¬Ä£ÐͳÉЧ»áÖ±½Ó±À¡£
´ò¸öÆ©Ó÷£¬Í¼Êé¹ÝÓÐ 100 Íò±¾Ê飬ÄãÏë½èÈ«Ì×¹²¼ÆÈý±¾µÄ¡¶ÈýÌå¡·¡£ÔÀ´µÄ¼Ü¹¹»á֪ͨÄã"Õâ±¾ÊéÔÚ"£¬ÄãÅÜ´Óǰ·¢ÏÖÊé¼ÜÉÏֻʣ·âÃæºÍµÚÒ»²¿£¬ºóÃæÁ½²¿¶¼±»½è×ßÁË¡£ÕâÖÖ"αÉäÖÐ"ÈÃÄã°×ÅÜÒ»ÌË»¹Òª³Á½è¡£ÐÂϵͳµÄ¹æ¶¨¸Ä³ÉÖ»³ÐŵÄãÄÜÆëÈ«½èµ½µÄÄDz¿ÃÅ¡ª¡ªÏȸøÄãµÚÒ»±¾£¬¶øºó°ÑºóÃæÁ½±¾ÔÙ¸øÄãµ÷¹ýÀ´¡£
ÌýÆðÀ´Èçͬ¸üÑϸñ¡¢ÉäÖÐÂʻήÂä¡£µ«ÏÖʵÏà·´£ºÓÉÓÚ SWA Èà KVCache Ìå»ýѹµ½ 1/7£¬Í¬Ñù´æ´¢¿Õ¼äÄÜ×°µÄÄÚÈݶàÁ˺ü¸±¶£¬ÕæÊµÉäÖÐÂÊ·´¶ø´ó·ù¶ÈÌáÉý¡£
ÏԴ棨GPU É쵀 HBM Äڴ棩ºÜ¹óÒ²ºÜÓÐÏÞ¡ª¡ªÒ»Ì¨ H100 °Ë¿¨»ú²Å 640GB ÏԴ棬µ« MiMo Òª´æµÄ KVCache ¿ÉÄÜÊǼ¸Ê® TB Á¿¼¶¡£ËùÒÔ±ØÐë·Ö²ã£º×î½üÓõķÅÏԴ棨L1£©£¬ÉÔ΢¾ÉµÄ·Å CPU Äڴ棨L2£©£¬ÀäÊý¾Ý´æµ½É¢²¼Ê½»º´æ£¨L3£©¡£
¸úÄã¹ÜǮһ¸ö·Àí¡£Ç®°üÀïµÄÏÖ½ðÊÇÏԴ桪¡ªËæÓÃËæÈ¡µ«·Å²»Á˼¸¶à¡£ÒøÐп¨Óà¶îÊÇ CPU Äڴ桪¡ªÈ¡Ò»´ÎÒª 30 Ã뵫Äܷźöࡣ¶¨ÆÚ´æ¿îÊÇ L3 É¢²¼Ê½»º´æ¡ª¡ªÈ¡Ò»´ÎÒª 2 ·ÖÖÓµ«±ãÒ˺öࡣ
Ó×Ã×´æ´¢ÍŶӵÄ×ö·¨²»Ò»Ñù¡£ËûÃÇ×ÔÑÐÁËÒ»Ì×½ÐGCacheµÄÉ¢²¼Ê½»º´æ£¬Ö±½Ó²¿ÊðÔÚ GPU »úе×Ô´øµÄ SSD ÉÏ¡ª¡ª¸úѵÁ·¹¤×÷¡¢ÍÆÀí¹¤×÷»ì²¼ÔÚͳһ̨»úеÀï¡£
Õâ¼þʵÄɱÉËÁ¦±È¿´ÉÏÈ¥´ó¡£Í¨ÀýµÄ"AI ¹«Ë¾ËãÁ¦ÕË"À´æ´¢³É±¾ÊÇÒ»¸ö¹Ì¶¨Ö§³öÏ¡ªÄãµÄÄ£ÐÍÔ½´ó¡¢Óû§Ô½¶à£¬´æ´¢Õ˵¥Ô½³¤¡£GCache ÕâÌ××ö·¨°ÑÕâÒ»ÏîÖ±½Ó´òµô¡£½áºÏ SWA µÄÓ×Ìå»ý + ÉäÖÐÂÊ 93-95%£¬KVCache ÔÚ L3 µÄ´æ»î¹¦·ò£¨TTL£©´Ó¼¸·ÖÖÓµ¢¸éµ½¼¸Ó×ʱÉõÖÁ¼¸Ì졪¡ªTTL Ô½³¤£¬º¹Çà context µÄ¿ÉÉäÖд°¿ÚÔ½¿í£¬»º´æÉäÖÐÂÊÔ½¸ß£¬99% ÄǸöÕÛ¿Û¾ÍÔ½Õ¾µÃס¡£
ÈýÊÇTTFT ÓÅ»¯¡£ÔÚÁжӵÈÍÆÀíµÄ¶ÓÁÐÀÓÅÏȵ÷¶ÈÕæÊµÍÆËãÁ¿Ó×µÄÒªÇó£¨Ò²¾ÍÊÇ´óÁ¿ÉäÖлº´æµÄÒªÇ󣩡ª¡ªÔ¤·ÀËüÃDZ»"È«ÐÂÊäÈë"ÄÇÖÖ³ÁÍÆËãÒªÇó×èÈû¡£
ºÃ±È£¬ÔÚͨÀýµÄ»ú³¡µ÷¶ÈÖУ¬ËùÓзÉͳһ¸öÖ÷Õŵصij˿ͼ¯Öе½Í³Ò»¸öºò»úÌü£¬¹²ÏíÐÐÀîÌáÈ¡Á÷³Ì¡ª¡ªÕâÊÇÇ׺͵÷¶È¡£´øµÇ»úÏäµÄºÍ´ø 3 ´óÏäÍÐÔ˵ķÖÁ½Ìõ°²¼ìͨ·×ߣ¬¿ìµÄ²»±»ÂýµÄÍÏ¡ª¡ªÕâÊdz¤¶È·ÖͰ¡£µÇ»úʱÓÅÏÈ·ÅÖ»´øµÇ»úÏäµÄÈË£¬ËûÃǵǻú¿ì£¬È÷ɻúÄÜÔçÌÚ·É¡ª¡ªÕâÊÇ TTFT ÓÅ»¯¡£
Ç°ÃæÎå¼þʶ¼ÔÚÓÅ»¯"¶Á"ÄÇÒ»²à¡ª¡ªÈÃÓû§³Á¸´¶Áº¹Çà context µÄ³É±¾Ñ¹µ½¿¿½ü 0¡£µÚÁù¼þÊÂÊÇÓÅ»¯"д"ÄÇÒ»²à¡ª¡ªÒ²¾ÍÊÇÄ£ÐÍÌìÉúÏÂÒ»¸ö token µÄ¹ý³Ì¡£
´ò¸öÆ©Ó÷£¬´«Í³´ò×ÖÊÇÒ»¸ö×ÖÒ»¸ö×Ö´ò¡ª¡ªÄãÏë´ò"½ñÌìÆøÏó"£¬Òª°´ 4 ´Î¼ü¡£MTP ÏñÓиö×Ô¶¯²¹È«ÔÚ²ÂÄãÏÂÒ»¸ö 1-2 ¸ö×ÖÊÇʲô¡ª¡ªÈôÊÇËü²Â¶ÔÁË£¬Äã¾Í²»ÓÃÔÙ°´ÄÇÁ½´Î¡£
Õâ¼þʵÄÒâ˼ÔÚÓÚ£¬99% ÕÛ¿ÛרÃÅÖ¸Ïò Input (Cache Hit)£¬µ«Ä£ÐÍÏÖʵ·þÎñÓû§Ê±£¬input ºÍ output ÊÇͳһ´ÎÒªÇóÀï²úÉúµÄ¡ª¡ªÈôÊÇ output ûʡ£¬ÕûÌåÒªÇó³É±¾¾ÍֻʡÁËÒ»°ë¡£MTP Èà output ÄÇÒ»°ëÒ²½µÏÂÀ´£¬ÕûÌ×½µ¼ÛµÄÓ¯ÀûÄ£ÐͲŹػ·¡£
SWA ¼Ü¹¹ ¡ú KVCache 1/7 ¡ú Ë«³ØÕæÕý¿ªÊÍÈÝÁ¿ ¡ú ͳһ̨ GPU ÄÜ×° 5+ ±¶²¢·¢ ¡ú ǰ׺»º´æÉäÖÐÂÊ 93-95% ¡ú 95% ÒªÇóÏÕЩ²»ÓÃËã ¡ú GCache Èô洢³É±¾¹éÁã ¡ú µ÷¶È°ÑÉäÖÐÒªÇóÓÅÏȵ÷×ß ¡ú MTP ÈÃÌìÉúҲʡ ¡ú µ¥ÔªÒªÇó GPU ¹¦·ò½µÂäÒ»¸öÊýÁ¿¼¶ ¡ú µ¥Ôª³É±¾½µÂä 95%+ ¡ú ¶¨¼Û½µ 99%£¬Ã«ÀûÂÊÈÔΪÕý¡£
»ØÍ·¿´Òµ½çһ·ͷµÄ¼¸ÖÖ½â¶Á£¬Ã¿ÖÖ¶¼Óв¿õè¾¶Àí¡£ÕâÁ½ÄêÖйú´óÄ£Ð͹«Ë¾Ö®¼äµÄ¼ÛÖµÕ½ÊÇÕæµÄ£»Ó×Ã×ÀûÈóÑüÕ¶»¹ÒªÔÒ AI ÊÇÕæµÄ£»DeepSeek °ÑÐÐÒµ¶¨¼Û×§µ½µØ°åÉÏÒ²ÊÇÕæµÄ¡£
µ«ÂÞ¸£ÀòÕâ´Î¹«¿ª¼¼Êõ²©¿Í²¢ÇÒ¾ßÌåµÄ¼¼Êõϸ½Ú¹«¿ª²ð½â£¬ÎÞÒÉÊǵ«Ô¸»Ø»÷¶ÔÓÚ¼ÛÖµÕ½µÄ˵·¨£¬Èá°¼¼ÊõµÄÎÊÌâ¹é¼¼Êõ¡¢ÓªÏúµÄÎÊÌâ¹éÓªÏú¡£¡±
ËýÔÚ²©¿ÍÖÐд·£¬MiMo-V2.5 ϵÁÐÄ£Ð͵ÄÍÆÀíЧÄܲ¢·ÇÀ´×Ôijһ»·½ÚµÄµ¥µãÍ»ÆÆ£¬¶øÊǶàά¶ÈÐͬÓÅ»¯µÄÁ˾֡£Hybrid SWA Èà prefill Óë decode ͬʱÊÜÒæ£¬µ«Î´¾³ä·ÖÓÅ»¯µÄ KVCache ʵÏÖ·´¶ø»áÔÚ¸÷»·½Ú̧¸ß³É±¾¡£ÝÓÈÆÕâÒ»Ö¸±ê£¬MiMoÍŶÓϵͳÐÔ³Á¹¹ÁË KVCache ÖÎÀí¡¢·Ö¼¶»º´æ¡¢Ç°×º»º´æÊ÷£¬¹¥¿Ë SWA KVCache Ö÷ÌâÎÊÌ⣬ÓÅ»¯Á˵÷¶ÈÕ½Êõ¼° Prefill / Decode Á´Â·£¬²¢¾ÏßÉÏÕæÊµ³¡¾°¼ìÑ飬×îÖÕ½«ÆäÀíÂÛЧÄÜÓÅÊÆÕæÕý¶ÒÏÖµ½³ö²ú»·¾³¡£ÖÁ´Ë£¬Hybrid SWA ²Å²ûÑï³öÔÚ³¤ÎÄÍÆÀíÉϼæ¾ßÇ¿¶Å×ëЧÄܵļܹ¹ÓÅÊÆ¡£ÔÙ×éºÏ MoE ÅäÖúͶàÄ£Ì¬ÍÆÀíµÄ¸÷ÀàÓÅ»¯£¬¼«´óˮƽÌá¸ßÁËÏßÉÏÍÆÀí·þÎñµÄ»úÄÜ¡£
《恋爱暴君》动漫斯科特个人也有望迎来英格兰成年队首秀,周六在坦帕对阵新西兰的比赛他大概率登场。去年他随英格兰U21斩获欧青赛冠军。你问大家现在都忙什么?要么在健身、普拉提,要么在游泳、爬山、骑行、攀岩、拳击,每个人都有自己的赛场,忙着训练的、忙着变强的,想约闺蜜逛街都要提前预约了。《恋爱暴君》动漫¡¶ÀÏÆÅµÄ¾ÈÊê¡·作为典型的农业区,安定区“耕读传家”的文脉从未间断。面对农村生源减少、闲置校舍增多的现实,他们没有选择简单地“一刀切”撤并,而是盘活资源,变“包袱”为育人“财富”。说奥利弗·格拉斯纳“执教”我们,似乎有些平淡无奇。奥利弗·格拉斯纳“改变”了我们。不仅是阵型和风格,还有我们的韧性、精神力量——甚至我们整个信念体系。
20260606 ? 《恋爱暴君》动漫就在上个月,OpenAI已经实现了通过ChatGPT移动端远程控制电脑端Codex的功能。这种跨端联动的实现,意味着用户只要在手机上发个指令,就能让放在家里的电脑自动跑代码、改文件、甚至搭建一个轻量级网页。ÈýÈ˳ÉÐÐ(3)ÃùöDZÊȤ¸ó库库雷利亚说:“当我们进球时,我其实很紧张,因为还剩一些时间。我想千万别被逆转。能在决赛送出这样的助攻,感觉几乎就像自己进球一样,真的非常开心。”
20260606 ? 《恋爱暴君》动漫北美这个世界杯之夏首次出现天气干扰。当地时间周二晚,在佛罗里达州劳德代尔堡进行的新西兰对阵海地的热身赛,因天气原因推迟了将近40分钟。¡¶WWWËÄ»¢¡·2026年2月12日,黄石市中院一审审理认为,吴某平故意非法剥夺他人生命,致一人死亡,其行为已构成故意杀人罪。本案系婚姻矛盾纠纷引发,在量刑时酌情考量。综上,判决被告人吴某平犯故意杀人罪,判处死刑,缓期两年执行,剥夺政治权利终身,并赔偿原告人4万余元。