×ß½øÄþ¾²ÐÐÒµ´óÄ£ÐÍ

Ðû²¼Ê±¼ä 2024-04-11
×ÔChatGPTÐû²¼ÒÔÀ´£¬Î§ÈÆ´óÄ£ÐÍ£¬¸öÈË¡¢ÆóÒµÄËÖÁ¹ú¼Ò£¬¶¼ÏÝÈëÓú·¢¾çÁÒµÄÀå¸ïÖС£ËüµÄÓ°ÏìÁ¦ÒѾ­Ô¶³¬¼¼ÊõÁìÓò£¬³ÉΪȫÇò¼¼Êõ¡¢¹¤ÒµºÍ¹ú¼Ê¾ºÕùµÄ×ÛºÏÕ½³¡¡£È»¶ø£¬´óÄ£Ð͵ÄÂäµØ²¢·ÇÒ»·«·ç˳£¬´ÓÐÐÒµÊý¾ÝµÄÊÕ¼¯µ½Êµ¼ÊÓ¦Óó¡¾°µÄ½áºÏ£¬Ëƺõÿһ²½Íƽø¶¼ÃæÁÙ×ŶàÖØÄÑÌâ¡£±¾ÎÄÖ÷Òª½éÉÜ»ù´¡´óÄ£ÐͺÍÐÐÒµ´óÄ£Ð͵ÄÐëÒªÐÔ£¬²¢Í¨¹ýL0-L2·Ö²ã¼Ü¹¹À´¼ÓËÙ´óÄ£ÐÍÂäµØ½ø³ÌÒÔ¼°Äþ¾²´óÄ£Ð͵ÄÓ¦Óó¡¾°µÈÄÚÈÝ£¬ÒÔ±ã×ÊÖú¸÷È˸üºÃµØÀí½âºÍÂäµØ´óÄ£ÐÍ¡£

ÔÚ´óÄ£ÐÍ·ºÆð֮ǰ£¬ÒÔ»úÆ÷ѧϰ¡¢Éî¶Èѧϰ¡¢¹æÔòÍÆÀíµÈΪ´ú±íµÄÈ˹¤ÖÇÄܼ¼ÊõÒѾ­¹ã·ºÓ¦ÓÃÓÚÍøÂçÄþ¾²ÁìÓòÁË¡£ÄÇôΪʲô»¹ÐèÒª´óÄ£ÐÍÄØ£¿


ΪʲôÐèÒª´óÄ£ÐÍ£¿


ÒòΪ´óÄ£ÐͲ»½ö¾ß±¸Í¨ÓÃÖÇÄܺÍ֪ʶ£¬»¹¾ß±¸ÖªÊ¶ÕûºÏÌáÈ¡ÄÜÁ¦ºÍÂß¼­Ë¼Î¬ÄÜÁ¦¡£ÀíÏëµÄ´óÄ£ÐÍÏñÊÇÈËÀàµÄÖúÊÖ£¨»òÕß˵¸±¼ÝÊ»£©£¬¶ø²»ÊÇÒ»¸ö¿É¹©²éÔĵŤ¾ßÊé¡£


ÒÔͨ¹ýÉî¶ÈѧϰѵÁ·µÃµ½µÄרÓÃСģÐÍΪÀý¡£Ð¡Ä£Ð͵ÄѵÁ·ÐèÒª´óÁ¿µÄ±ê×¢Êý¾Ý£¬¶øÇÒÖ»Äܽâ¾öµ¥Ò»ÎÊÌâ¡£Ïà±È֮ϣ¬´óÄ£Ð͵ÄͨÓÃÐÔÁé»îºÜ¶à£¬ÉõÖÁÖ»ÐèÒª¼¸Ìõ¼òµ¥µÄÑùÀý£¬¾ÍÄܾ߱¸ÐÂÄÜÁ¦£¬Õâ¾ÍʹµÃ´óÄ£ÐÍÓиü¹ã·ºµÄÓ¦Óó¡¾°¡£


OpenAIÔÚ2020ÄêÌá³öµÄËõ·Å¶¨ÂÉ£¨Scaling Law£©Ö¸³ö£¬Ä£Ð͵Ä×îÖÕÐÔÄÜÖ÷ÒªÓë¼ÆËãÁ¿£¬Ä£ÐͲÎÊýÁ¿ºÍÊý¾Ý¾ÞϸÈýÕßÏà¹Ø£¬¶øÓëÄ£Ð͵ľßÌå½á¹¹£¨²ãÊý/Éî¶È/¿í¶È£©»ù±¾Î޹ء£


¶ø´óÄ£ÐÍÏà±ÈÓÚ֮ǰµÄС²ÎÊýÁ¿ÓïÑÔÄ£ÐÍ£¬ÔÚÒÔÉÏÈý¸ö·½Ã涼×öÁ˾޴óÌáÉý£¬²¢ÏÔÏÖ³öһЩӿÏÖÄÜÁ¦£¨ÊÀ½ç֪ʶ£¬Ö¸Áî×ñÑ­£¬Öð²½ÍÆÀíµÈ£©¡£


ͨË×À´½²£¬»ù´¡´óÄ£ÐÍÓɹ㷺µÄͨÓÃÊý¾Ý£¨ÈçÍøÒ³¡¢°Ù¿Æ¡¢Êé¼®µÈ£©ÑµÁ·µÃµ½£¬ËüÏñÊÇÒ»¸ö¿ÉÒÔºÍÄã¶Ô»°µÄ°Ù¿ÆÈ«Ê飬Á˽âÈ´²»¾«Í¨ÖÖÖÖ֪ʶ£¬Í¬Ê±¾ß±¸Ò»¶¨µÄÂß¼­Ë¼Î¬ÄÜÁ¦£¬¶øÕâЩ¶¼ÊǹýÍùСģÐͺÜÄÑ×öµ½µÄ¡£


½ØÖÁ2023Äêµ×£¬¹úÄÚÒÑÐû²¼µÄͨÓôóÄ£ÐÍÁè¼ÝÁË200¸ö£¬ÄÇôΪʲô»¹Òª´òÔìÃæÏòÌض¨ÁìÓò»òÐÐÒµµÄÐÐÒµ´óÄ£ÐÍÄØ£¿


ΪʲôÐèÒªÐÐÒµ´óÄ£ÐÍ?


ÉÏÎÄÌáµ½ÁËÀíÏëµÄ´óÄ£ÐÍËù¾ß±¸µÄÄÜÁ¦¡£È»¶ø£¬ÐÔÄÜÊÜÏÞÓÚËõ·Å¶¨ÂÉ£¬»ù´¡´óÄ£ÐÍʵ¼ÊÓ¦ÓÃÆðÀ´È´²¢Ã»ÓÐÏëÏóÖÐÄÇôµÃÐÄÓ¦ÊÖ¡£´óÄ£ÐÍʹÓÃͨÓÃÓïÁÏ¿â½øÐÐѵÁ·£¬¶øÄþ¾²ÐÐÒµµÄÊý¾Ýͨ³£ÊÇÌØÊâÇÒÓÐÏ޵ġ£


Õâµ¼Ö LLM ȱ·¦Äþ¾²Ïà¹ØÊý¾ÝºÍרҵ֪ʶ£¬¶ÔÌض¨Äþ¾²ÎÊÌâµÄÀí½âÄÜÁ¦ØÑ·¦£¬ÎÞ·¨Ìṩ׼ȷ»òÉîÈëµÄרҵ½âÊÍ¡£


Ñо¿±íÃ÷£¬Í¨ÓôóÄ£ÐÍÔÚÄþ¾²ÎÊÌâÉÏÉú³É´ð°¸µÄ׼ȷÂʶàÊý²»×ã50%£¬¶ÔÖÐÎÄÎÊÌâ»Ø´ðµÄ׼ȷÂʸüµÍ¡£ÏÂͼչʾµÄÊDzîÒìÄ£ÐÍÔÚÍøÂçÄþ¾²ÎÊÌ⼯ÉϻشðµÄ׼ȷÂÊ£º


¶«É­¡¤(ÖйúÇø)¹Ù·½ÍøÕ¾



ͼƬÀ´Ô´£ºMiao, Yukai, et al. "An Empirical Study of NetOps Capability of Pre-Trained Large Language Models." arXiv preprint arXiv:2309.05557 (2023)


Òò´Ë£¬Í¨¹ýÔöÁ¿Ô¤ÑµÁ·£¨Continuous Pre-train£¬CPT£©µÈ¼¼ÊõΪ´óÄ£ÐÍ×¢ÈëÄþ¾²ÐÐҵ֪ʶ£¬¾Í³ÉΪÁËÄþ¾²ÐÐÒµ´óÄ£ÐÍÓ¦ÓõÄÐëÒªÊֶΡ£È±ÉÙÕâ¸ö²½ÖèÖ±½Ó¶ÔºóÐøÄþ¾²ÈÎÎñ×ö¼à¶½Î¢µ÷£¨Supervised Fine-tuning£¬SFT£©£¬´óÄ£ÐÍÔò»ò¶à»òÉÙ»áÃæÁÙ֪ʶØÑ·¦µÄÎÊÌ⣬Ëæ¼´·ºÆ𡰻þõ¡±ÏÖÏ󣬶Բ»¶®µÄÎÊÌâ×ö³öÒ»±¾Õý¾­µÄ»Ø´ð¡£


´ÓÇ°ÃæµÄÃèÊö¿ÉÒÔ¿´³ö£¬Í¬Ñù¶¼½Ð¡°´óÄ£ÐÍ¡±£¬µ«¾ßÌ庬ÒåºÍÊÊÓ÷¶Î§ÉÏÊÇ´æÔÚ²îÒìµÄ¡£ÄÇô´óÄ£ÐÍ»¹ÓÐÄÄЩÌõÀí»®·ÖÄØ£¿


L0-L2´óÄ£ÐÍ·Ö²ã¼Ü¹¹


ΪÁ˼ÓËÙ´óÄ£ÐÍÂäµØ½ø³Ì£¬¿É½«´óÄ£ÐÍ»®·ÖΪL0»ù´¡´óÄ£ÐÍ¡¢L1ÐÐÒµ´óÄ£ÐÍ¡¢L2Ó¦ÓôóÄ£ÐÍÈý¸öÌõÀí£º


L0»ù´¡´óÄ£ÐÍ£ºÖ÷Òª°üÂÞʹÓÃͨÓÃ֪ʶԤѵÁ·µÃµ½µÄ»ù×ùÄ£ÐÍ£¨Èç¾ÅÌì¡¢ÎÄÐÄÒ»ÑÔ¡¢Í¨ÒåǧÎʵȣ©£¬ÓÃÀ´Îª´óÄ£Ð͵Ļù´¡ÄÜÁ¦Ìṩ֧³Å¡£L1ÐÐÒµ´óÄ£ÐÍ£ºÔòÊÇʹÓÃÐÐҵ֪ʶÔöÁ¿Ô¤ÑµÁ·µÃµ½ÐÐҵģÐÍ£¬Îª´óÄ£ÐÍ×¢ÈëÁìÓò֪ʶ¡£ÔÚÄþ¾²ÐÐÒµ£¬ÎÒÃÇÐèÒªµÄ¾ÍÊÇÄþ¾²´óÄ£ÐÍ¡£L2Ó¦Óó¡¾°£ºÊÇͨ¹ýÖÖÖÖ¼¼ÊõʹL1ÐÐÒµ´óÄ£ÐÍÊÊÅäÓÚÏÂÓÎÓ¦Óó¡¾°µÄ·½Ê½£¬×¨×¢ÓÚÔÚÌض¨ÈÎÎñÉÏÈ¡µÃÓÅÐãµÄЧ¹û¡£


ͨË×À´½²£¬L0»ù´¡´óÄ£ÐÍÏñÊÇѧϰËùÓпÆÄ¿µÄ¸ßÖÐÉú£¬L1ÐÐÒµ´óÄ£ÐÍÀàËÆÓÚÑ¡¶¨×¨ÒµµÄ´óѧÉú£¬L2Ó¦ÓôóÄ£ÐÍÔòÊÇÑ¡¶¨Ìض¨Æ«ÏòµÄÑо¿Ô±¡£ÕâÖּܹ¹µÄÓÅÊÆÔÚÓÚ£¬½«´óÄ£ÐÍÓ¦ÓÃÓÚÒµÎñµÄ²½ÖèÁ÷³Ì»¯£¬¼ÓËÙÕûÌåÂäµØ½ø³Ì£¬½µµÍÂäµØ³É±¾¡£Í¬Ê±£¬¶ÔÓÚL0-L2ÌõÀíµÄ»®·Ö£¬Ò²ÈÃÒµÎñÊý¾ÝµÄ³ÁµíÔ½·¢ÓÐÌõÀí£¬·½±ãÊý¾Ý²»Í£»ØÁ÷µ½´óÄ£ÐÍ£¬²»Í£ÓÅ»¯´óÄ£ÐÍÖÇÄÜˮƽ¡£


¶«É­¡¤(ÖйúÇø)¹Ù·½ÍøÕ¾



ÔÚÎÒÃǹØ×¢µÄÍøÂçÄþ¾²ÁìÓò£¬ÓÐÁËÄþ¾²´óÄ£Ðͺ󣬾ßÌå¿ÉÒÔÓ¦ÓÃÔÚÄÄЩ³¡¾°ÖУ¬ÎªÎÒÃǵÄÈÕ³£ÊÂÇé´øÀ´ÄÜÁ¦ºÍЧÂʵÄÌáÉýÄØ£¿


Äþ¾²´óÄ£Ð͵ÄÓ¦Óó¡¾°


Äþ¾²´óÄ£ÐÍÔÚL2²ãÃæ¾ßÓй㷺µÄÓ¦Óó¡¾°¡£Äþ¾²´óÄ£ÐÍͨ³£ÔÊÐíÓû§Í¨¹ý×ÔÈ»ÓïÑÔÊäÈëµÄ·½Ê½Íê³ÉÄþ¾²ÔËÓªµÄÈÕ³£²Ù×÷£¬Æ¾¾ÝÓû§ÊäÈ룬°´Ðèµ÷ÓÃÒÑÓеÄСģÐͺͲúÎ﹦Ч£¬ÊµÏÖ¾ÞϸģÐÍЭͬµÄÖÇÄÜËã·¨Ìåϵ¡£


ÕâÖÖ×ÔÈ»ÓïÑÔµ÷Óù¦Ð§Ä£¿éµÄ·½Ê½£¬¿ÉÒÔÀûÓôóÄ£Ð͵Ä֪ʶ´¢ÐîºÍÀí½âÍÆÀíÄÜÁ¦£¬ÎªÁìÓòÎÊÌâÌṩרҵµÄ½â¾ö·½°¸¡£Í¬Ê±£¬¶ÔÓÚÒѾ­ÓÐÏà¹Ø¾­ÑéµÄÄþ¾²×¨¼Ò£¬Ôò¿ÉÒÔͨ¹ý´óÄ£ÐÍÌáÉýͨÀý·ÖÎöÊÂÇéµÄЧÂÊ¡£¼´¡°×ÊÖúÆÕͨÈ˳ÉΪר¼Ò£¬×ÊÖúר¼ÒÌáÉýЧÂÊ¡±¡£


ÏÂÃæÁоÙһЩ³£¼ûµÄÄþ¾²´óÄ£ÐÍÓ¦Óó¡¾°£º 


Ó¦Óó¡¾°1£ºÄþ¾²ÔËÓª

  

Äþ¾²³ÂËߣº´óÄ£ÐÍÍùÍù¿ÉÒÔÔÚ¼¸·ÖÖÓÄÚ»ã×ÜÖ¸¶¨·¶Î§ÄÚµÄËùÓи澯ʼþ£¬¶øÇÒÉú³É×ÛºÏÐÔÄþ¾²³ÂËߣ¬¹©Äþ¾²×¨¼Ò¼ì²ì¡£


¸æ¾¯½â¶Á£ºÊµÏÖ¶ÔÓÚÄþ¾²Ê¼þµÄÒªº¦ÒªËØ£¬°üÂ޸澯ÄÚÈÝ¡¢Ê¼þÀàÐÍ¡¢¹¥»÷ÊÖ·¨¡¢×ʲúÊôÐԵȽøÐÐרҵ·ÖÎöºÍ½â¶Á£¬Éú³É½â¶Á³ÂËߣ¬¸¨ÖúÓû§¸æ¾¯ÑÐÅС£


¸æ¾¯ËÝÔ´£º¶ÔÓÚÌØÊâµÄ¸æ¾¯£¬Äþ¾²×¨¼Ò¿ÉÒÔͨ¹ý´óÄ£ÐͽøÐнøÒ»²½ËÝÔ´·ÖÎö£¬ÒªÇó´óÄ£ÐÍƾ¾ÝÖÕ¶ËÈÕÖ¾Éú³ÉËÝԴͼµÈ¡£


ÏìÓ¦´¦Ö㺻ùÓÚʼþÐÅÏ¢ºÍÄþ¾²É豸²¿ÊðÐÅÏ¢£¬ÓÉ´óÄ£ÐÍ×Ô¶¯Éú³Éʼþ´¦ÖüÆı£¬Éϱ¨Óû§½øÈ¥Ð޸ĻòÈ·ÈÏ£¬ ʵÏÖ¶Ô¹¥»÷ÐÐΪµÄ¿ìËÙÏìÓ¦¡£


Ó¦Óó¡¾°2£ºÖªÊ¶ÕûºÏ


Äþ¾²Ç鱨£º´óÄ£ÐÍ¿ÉÒÔÀûÓÃÕûºÏ²îÒìÀ´Ô´µÄÄþ¾²Ç鱨Դ£¬²¢ÔÚÓû§»·¾³ÖÐ×Ô¶¯ÊÊÅä¡£ÔÚÄþ¾²×¨¼Ò½øÐÐʼþÊÓ²ìʱ£¬ÎªÄþ¾²¸æ¾¯ÌṩÉÏÏÂÎÄ¡£


Äþ¾²ÎÊ´ð£ºÍ¨¹ý¹¹½¨Äþ¾²ÖªÊ¶¿â£¬´óÄ£ÐÍ¿ÉÒԻشðÓû§µÄÄþ¾²ÎÊÌâ¡£Óû§¿ÉÒÔ²éѯÖÖÖÖÍøÂçÄþ¾²¡¢Ö÷»úÄþ¾²µÈ·½ÃæµÄÎÊÌ⣬²¢´Ó»Ø´ðÖлñȡרҵµÄÄþ¾²ÐÅÏ¢ºÍ½¨Òé¡£ 


Ó¦Óó¡¾°3£º´úÂë¹ÜÀí


©¶´ÍÚ¾ò£ºÍ¨¹ýѧϰ´óÁ¿´úÂëºÍ©¶´°¸Àý£¬´óÄ£ÐÍ¿ÉÒÔ»ýÀÛ¸»ºñµÄ©¶´´úÂë·ÖÎö¾­ÑéºÍרҵ֪ʶ£¬´Ó¶ø·¢ÏÖ´úÂëÖдæÔÚµÄDZÔÚ©¶´»ò·çÏÕ¡£


©¶´ÐÞ¸´£º´óÄ£ÐÍ¿ÉÒÔƾ¾Ý©¶´·ÖÎö½á¹û£¬Éú³Éµ÷Í£²½Öè¡¢×Ô¶¯Ö´ÐÐÅÓ´óµÄ·çÏÕ»º½â»î¶¯»òÔÚÎÞÐèÓû§½»»¥µÄÇé¿öÏÂÐÞ²¹Èí¼þ£¬Õâ´ó´ó¼Ó¿ìÁ˹ÜÀí©¶´ºÍÌá¸ß×éÖ¯Äþ¾²ÐÔµÄËٶȡ£


¶ñÒâ½Å±¾£º´óÄ£ÐÍ¿ÉÒÔ·ÖÎöºÍ½âÊͶñÒâ½Å±¾ÐÐΪ£¬Ð­ÖúÓû§·¢ÏÖ´æÔÚÍþвµÄ½Å±¾¡£ËüÔÊÐíÓû§µ¼Èë½Å±¾²¢·ÖÎöÆäÊÇ·ñ´æÔÚ¶ñÒâÐÐΪ£¬¼ì²âºÍ»º½âDZÔÚÍþв£¬±ê־©±¨ºÍÇå³ýÎ󱨡£ 


Ó¦Óó¡¾°4£ººÏ¹æ¼à¿Ø


ºÏ¹æÉó¼Æ£ºÐí¶àÆóÒµ±ØÐë×ñÊØÐÐÒµ³ß¶ÈÒÔ± £»¤¹«Ë¾Êý¾Ý²¢Âú×ã¼à¹ÜÒªÇó£¬È˹¤ÉóºËͨ³£½ÏΪ·¦Î¶£¬´óÄ£ÐÍ¿ÉÒÔ×ÊÖúÆÀ¹À×éÖ¯¶ÔÐÐÒµ³ß¶È¡¢¹æÔòÒªÇóºÍÄÚ²¿¼ÆıµÄºÏ¹æÐÔ¡£


Êý¾Ý´óÆÁ£º´óÄ£ÐÍ¿ÉÒÔ×Ô¶¯Éú³ÉÕâЩÊý¾Ý´óÆÁÀ´¼à¿Ø×éÖ¯Êý¾ÝµÄºÏ¹æÐÔ£¬¿ÉÒÔ×ÊÖúÄþ¾²×¨¼ÒÇáËɸú×ٺϹæÄ¿±êµÄ½ø¶È²¢ÏòÉóºËԱչʾ¡£


ºÏ¹æÐÞ¸´£º´óÄ£ÐÍ¿ÉÒÔͨ¹ýºÏ¹æÐÔÉó¼Æ½á¹û£¬ÌṩÏàÓ¦µÄÐÞ¸´½¨Ò飬×ÊÖúÆóÒµµ½´ï¼à¹Ü³ß¶È¡£


Á¬Ðø¸üУºËæ×ÅÐÐÒµ³ß¶ÈµÄ¸üк͹ÜÀí»ú¹¹¸ü¸ÄÆä¹æÔòÒªÇ󣬺ϹæÉó¼ÆÍùÍùÐèÒª×ö³öÏàÓ¦±ä»¯¡£´óÄ£ÐÍ¿ÉÒÔ¿ìËٵĸú½øÕâЩ±ä»¯£¬²¢Ìṩָµ¼½¨Òé¡£