Ëæ×Ŷàģ̬´óÄ£Ð͵ķ¢Õ¹£¬¶Ëµ½¶ËGUIÖÇÄÜÌåÔÚÊÖ»ú¡¢µçÄÔµÈÉ豸ÉϵÄ×Ô¶¯»¯¹¤×÷ÖÐչʾ³ö¾Þ´óDZÁ¦¡£ËüÃÇ¿ÉÄÜ¿´¶®É豸ÆÁÄ»£¬·ÂÕÕÈËÀàÈ¥µã»÷°´Å¥¡¢ÊäÈëÎı¾£¬´Ó¶øÊµÏÖ¸´ÔӵŤ×÷¡£
È»¶ø£¬µ±Ç°¶Ëµ½¶ËGUI¶àÖÇÄÜÌåµÄѵÁ··¶Ê½ÈÔ´æÔÚÏÔÖøµÄÆ¿¾±£ºµ±Ç°Ä£ÐÍÍùÍùʹÓÃÏÕЩÃÀÂúµÄÀëÏßÑÝʾ¹ì¼£½øÐÐѵÁ·£¬Ê¹µÃÄ£ÐͲ»×㷴˼ºÍ¸üÕý×ÔÉíÃýÎóµÄÄÜÁ¦£¬²¢½øÒ»²½ÏÞ¶ÈÁËͨ¹ýÔÚÏßÇ¿»¯½ø½¨Òý·¢ºÍÌáÉýÄÜÁ¦µÄ¿ÉÄÜ¡£
GUI-ReflectionµÄÖ÷Ìâ˼ÏëÊÇÔÚÖÇÄÜÌåµÄ¸÷¸öѵÁ·½×¶ÎÒýÈë¡°·´Ë¼Óë¾À´í¡±»úÔ죬ÕâÒ»»úÔì¹áͨԤѵÁ·¡¢¼à¶½Î¢ºÍгÔÚÏßѵÁ·È«¹ý³Ì£¬·ÂÕÕÁËÈËÀà¡°·¸´í¡ú·´Ë¼¡ú³ÁÊÔ¡±µÄÈÏÖª¹ý³Ì¡£
GUIԤѵÁ·½×¶Î£ºÌá³öGUI-Reflection Task Suite¹¤×÷Ì×¼þ, ½«·´Ë¼¾À´íÄÜÁ¦½øÒ»²½·Ö»¯£¬ÈÃÄ£ÐÍÔÚԤѵÁ·½×¶Î¿ò¼ÜÈÃÄ£Ðͳõ²½½Ó´¥·´Ë¼À๤×÷£¬ÎªºóÐø´òÏ»ù´¡¡£ÀëÏ߼ල΢µ÷½×¶Î£º¹¹½¨×Ô¶¯»¯Êý¾Ý¹Ü·£¬´ÓÒÑÓÐÀëÏßÎÞ´í¹ì¼£Öй¹½¨´øÓз´Ë¼ºÍ¾À´íµÄÐÐΪÊý¾Ý£¬ÈÃÄ£Ðͳɹ¦Ï°µÃ·´Ë¼¾À´íÐÐΪ¡£ÔÚÏßѵÁ·½×¶Î£º´î½¨É¢²¼Ê½Òƶ¯¶ËGUI½ø½¨»·¾³£¬²¢Éè¼Æµü´úʽ·´Ë¼·´À¡µ÷ÓÅËã·¨£¬ÈÃÄ£ÐÍÔÚÓëÕæÊµ»·¾³½»»¥ÖнøÒ»²½ÌáÉýÓйØÄÜÁ¦¡£
GUI-Reflection ÊÇÒ»¸ö¹áͨѵÁ·È«¹ý³ÌµÄ¿ò¼Ü£¬Ö¼ÔÚϵͳÐԵظ³Óè¶àģ̬GUIÖÇÄÜÌåÒÔ¡°×ÔÎÒ·´Ë¼Óë¾À´í¡±µÄÄÜÁ¦¡£¸Ã¿ò¼ÜÓÉÈý´ó¹Ø¼ü½×¶Î×é³É£¬±ðÀë¶ÔӦģÐÍÄÜÁ¦µÄÈÏÖªÆô·¢¡¢ÐÐΪϰµÃÓë½»»¥Ç¿»¯£º
ÏÖÓÐGUIԤѵÁ·¶à¾Û½¹ÓÚ½çÃæÀí½âºÍ²Ù×÷¸ÐÖª£¬¶øºöÊÓÁË·´Ë¼ÓйصÄÔÉúÄÜÁ¦¹¹½¨¡£GUI-Reflection ³õ´ÎÌá³öרΪ·´Ë¼Éè¼ÆµÄGUI-Reflection Task Suite£¬Ô̺¬ÈýÀà¹Ø¼ü¹¤×÷£º
Action Verification£¨×÷ΪÑéÖ¤£©£ºÅжÏijһ²½²Ù×÷ÊÇ·ñ´ï³ÉÁËÔ¤ÆÚÖ¸±ê£¬ÑµÁ·Ä£Ðͼø±ðÖ´ÐÐÎó²î¡£Action Reversal£¨×÷Ϊ»Ø¹ö£©£º½ø½¨ÈôºÎ³·ÏúÃýÎó²Ù×÷£¬»ØÍ˵½ÕýÈ·µÄ¹¤×÷õè¾¶¡£Mistake-Informed Reattempt£¨»ùÓÚÃýÎóµÄÔÙ³¢ÊÔ£©£ºÔÚÃ÷È·´ÓǰÃýÎóµÄǰÌáÏ£¬ÌìÉúеġ¢¸Ä½øµÄ²Ù×÷Õ½Êõ¡£
Õë¶Ôµ±Ç°GUIÊý¾Ý¼¯¶Ìȱ·¸´íºÍ¾À´íÊý¾ÝµÄÎÊÌ⣬GUI-ReflectionÉè¼ÆÁËÒ»¸ö×Ô¶¯»¯·´Ë¼¾À´íÊý¾ÝÌìÉú¹Ü·¡£¸Ã²½Öè´ÓÒÑÓгɹ¦¹ì¼£ÖÐ×Ô¶¯»ú¹Ø³ö¡°´ø´í¹ì¼£¡±Óë¡°¾À´íÐÐΪ¡±£¬ÊµÏÖÊý¾Ýά¶ÈÉϵġ°·´Ë¼×¢È롱¡£¾ßÌåÔ̺¬£º
Ö¸±êÈŶ¯ÌìÉúÃýÎóÐÐΪ£ºÍ¨¹ýÅú¸ÄÔʼ¹¤×÷Ö¸±ê£¬Ê¹Ä£ÐÍÕý±¾µÄ×÷ΪÔÚÐÂÖ¸±êÏÂÔì³É¡°ÃýÎó¡±×÷Ϊ£¬²¢¹¹½¨¶ÔÓ¦µÄ·´Ë¼ÃýÎóÐÐΪÊý¾Ý¡£ÐÐΪ²åÈë·ÂÕÕʧÎó£ºÏò³É¹¦¹ì¼£ÖвåÈëÎÞЧ²Ù×÷£¬ÈÃÄ£ÐͶÔÎÞЧÃýÎó²Ù×÷×ö³ö·´Ë¼²¢³¢ÊÔеÄÕýÈ·²Ù×÷¡£
ΪÁ˽øÒ»²½ÌáÉýÄ£ÐÍÔÚÕæÊµ»·¾³ÖеÄÊÊÓ¦ÄÜÁ¦£¬GUI-Reflection¹¹½¨ÁËÒ»¸öÉ¢²¼Ê½°²×¿·ÂÕÕ»·¾³£¬º¸Ç11¸öappºÍ 215 ¸ö¹¤×÷Ä£°å£¬Ö§³Ö¸ß²¢·¢½»»¥¡£»ùÓÚ´Ë»·¾³£¬GUI-ReflectionÉè¼ÆÁËÒ»ÖÖ×Ô¶¯»¯µü´úʽÔÚÏß·´Ë¼µ÷ÓÅËã·¨£º
³É¹¦¹ì¼£½«±»Ï¸Á£¶ÈÑéÖ¤£¬½ö±£Áôÿһ²½µÄÓÐЧִÐУ»Ê§°Ü¹ì¼£Ôò±»×Ô¶¯¶¨Î»ÃýÎó²½Ö裬²¢Îª¸Ã²½Öè×Ô¶¯ÌìÉúǰÏò½¨¸Ä£¨Pre-Error Correction£©ÓëºóÏò·´Ë¼£¨Post-Error Reflection£©²Ù×÷¡£
ͨÓôóÄ£ÐÍ£¨Èç GPT-4o¡¢Gemini£©ÔÚGUI¹¤×÷Öо߱¸²»´íµÄÔÉú·´Ë¼ÄÜÁ¦£¬¿ÉÄܳõ²½¼ø±ðÃýÎó²¢½øÐкÏÀíÍÆÀí£»Ó×¹æÄ£¿ªÔ´Ä£ÐÍÔÚÕâ·½ÃæÄÜÁ¦ÏÔÖø²»¼°£¬ÓÈÆäÔÚÃæ¶Ôʧ°Ü²Ù×÷ʱÄÑÒÔ×ÔÎÒ½¨¸´£»¸ü¹Ø¼üµÄÊÇ£¬ÏÖÓеij߶ÈGUIԤѵÁ·Á÷³Ì£¬·´¶ø»á¼õÈõÄ£ÐÍÕý±¾¾ß±¸µÄ·´Ë¼ÄÜÁ¦
µ±ÔÚԤѵÁ·½×¶ÎÒýÈ뷴˼µ¼Ïò¹¤×÷Êý¾Ý£¬¼´±ãÊǽÏÓ×¹æÄ£µÄÄ£ÐÍ£¬Ò²ÄÜÏÔÖøÌáÉýÆäÔÚ·´Ë¼Óйع¤×÷ÖеIJû·¢£¬ÉõÖÁ´ïµ½¿¿½ü¹ØÔ´´óÄ£Ð͵Äˮƽ¡£
ÔÚÀëÏ߼ල΢µ÷½×¶ÎÒýÈ뷴˼ÀàÊý¾Ý£¬Äܹ»ÏÔÖøÌáÉýÄ£Ð͵Ť×÷ʵÏÖ²û·¢£»½øÒ»²½½áºÏÔÚÏß·´Ë¼µ÷ÓÅËã·¨½øÐÐѵÁ·£¬Ä£Ð͵ijɹ¦ÂʳÖÐøÌáÉý£¬²û·¢³ö¸üÇ¿µÄ·º»¯ÄÜÁ¦Óë²»±äÐÔ¡£
GUI-Relection-8BÄ£ÐÍÔÚAndroidWorld»ù×¼ÖÐҲʵÏÖÁË 34.5% µÄ³É¹¦ÂÊ£¬Ö¤ÁËÈ»GUI-Reflection¿ò¼ÜµÄÓÐЧÐÔ¡£ÕâһϵÁÐÁ˾ֳä·ÖÅú×¢£ºÔÚ¶à¸öѵÁ·½×¶ÎÏÔʽÒýÈ뷴˼»úÔ죬ÊÇÌáÉýGUIÖÇÄÜÌåÄÜÁ¦µÄ¹Ø¼üõè¾¶£¬¶ø²»½ö½öÒÀÀµ´ó¹æÄ£ÑÝʾÊý¾Ý»òǿģÐÍ×ÔÉí¡£
GUI-ReflectionΪ¶Ëµ½¶Ë¶àģ̬ GUI ÖÇÄÜÌå×¢ÈëÁËȫеġ°×ÔÎÒ·´Ë¼¡±ÄÜÁ¦¡£´ÓԤѵÁ·¡¢ÀëÏß΢µ÷µ½ÔÚÏß½»»¥£¬ËüϵͳÐÔµØÂòͨÁË¡°·¸´í¡ª·´Ë¼¡ª½¨¸Ä¡±µÄÈÏÖª¹Ø»·£¬Ê¹Ä£ÐÍÔÚÃæ¶ÔÕæÊµ»·¾³ÖеIJ»È·¶¨ÐÔʱ£¬¿ÉÄÜÔ½·¢Â³°ô¡¢½Ã½ÝµØÓ¦¶Ô¸÷ÀàÍ»·¢Çé¿ö¡£
《教授退休的日子BY茶引》与此同时,俱乐部始终坚持将利润和收入继续投入运营,而不是分配出去,因为这样才能不断推动价值增长。在此基础上,估值继续提升到50亿美元,随后又有更多资金进入。越来越多的投资者开始认同这种价值创造模式,并选择投入资金参与其中。老一辈父母,大多都这样,满心满眼都是孩子,从不防备。她美滋滋畅想以后的日子,房子装好,自己搬过去住,守着儿子儿媳,以后养老靠着孩子。《教授退休的日子BY茶引》¡¶ÎÒÅ®°éµÄÄаé¡·ÑÝÔ±±í此役,C罗佩戴队长袖标,代表葡萄牙首发出战。不过或许是考虑到大赛在即,C罗此役显然留力收着踢,并没有拼尽全力,因此表现难言出彩。然而,内维尔在天空体育和《坚持足球》节目的同事(卡拉格)却不那么确定,他认为——除非出现迟来的伤病——贝林厄姆将在世界杯揭幕战中坐替补席。
20260609 ? 《教授退休的日子BY茶引》去年国行 Apple Intelligence 比全球版晚了大半年才落地。这次大概率只会更晚——国行用户想用上一个「中国特供」的新 Siri,可能要等到 2027 年,甚至更久。而在这段空窗里,华为、小米们正带着各自的大模型猛攻高端市场。这道时间差,是 Apple 中国生意实打实的风险。²ÝݮӣÌÒÎ÷¹ÏÁñÁ«Í¨Óðü×°ºÐ尼古拉斯-科尔多瓦给智利搭的是4-1-4-1/4-4-2系的低位防守+反击体系,近10场场均失球1.4个、被射门12.4次,防线本来就是漏的;但6.0次/球的进攻转化率(平均每6.0脚进1球,约16.7%)比葡萄牙更高,这意味着智利的核心打法不是抢球权,而是少机会少射门、用反击效率咬比分。他们的场均犯规9.3次+红黄牌2.5张高于葡萄牙的6.9次和2.2张,中场会用身体接触切断葡萄牙的推进—中圈拦截带是这场战术对位的最关键30米。
20260609 ? 《教授退休的日子BY茶引》我们先来说说全新的 Apple 智能模型。和之前大张旗鼓的「预热」一样,新一代的 Apple 基础模型(Apple Foundation Model、下文简称 AFM)基于 Gemini 基础模型(暂时不确定是哪一代基础模型)打造的,而非直接使用 Gemini。¡¶¡¶Äá¹ÃÒ²·è¿ñ¡·¹úÓï¡·从衣着风格、课余出行,到学业安排、训练计划,甚至日常表情管理,全红婵的一言一行都被放大数倍解读:发挥未达预期即被嘲讽“躺平摆烂”,正常完成大学课程却被质疑“心不在跳水”。