廊坊新聞網(wǎng)-主流媒體,廊坊城市門戶

    熱訊:工聯(lián)院大模型測評:文心一言在工業(yè)領(lǐng)域表現(xiàn)超過GPT3.5,居國內(nèi)大模型首位

    2023-06-29 00:30:35 來源:人民郵電報(bào)

    近期,中國工業(yè)互聯(lián)網(wǎng)研究院(簡稱“工聯(lián)院”)針對人工智能大模型在中文工業(yè)領(lǐng)域的知識問答能力進(jìn)行系統(tǒng)性評測。結(jié)果顯示,百度文心一言表現(xiàn)超過GPT3.5,綜合評價(jià)指數(shù)在國內(nèi)排名第一。


    (相關(guān)資料圖)

    工聯(lián)院本次評測選取了工業(yè)領(lǐng)域典型的八大行業(yè)。百度文心一言在??電子設(shè)備、??裝備、???鋼鐵、采礦、電力、石化、建材等七大行業(yè)均獲國內(nèi)第一。

    5位院士,8位IEEE Fellow,共13位頂級專家構(gòu)成了專家委員會(huì)。評測對象涵蓋GPT4、GPT3.5、文心一言、ChatGLM等國內(nèi)外具有代表性的頭部大模型。評估結(jié)果選取性能前6名的模型進(jìn)行公布。

    百度文心一言在國內(nèi)“最懂工業(yè)”

    本次工業(yè)知識問答測試主要分為客觀題與主觀題兩大類,總計(jì)超過1100個(gè)問題。主觀題主要考察四大維度:基礎(chǔ)能力、語句能力、概括能力和邏輯能力。

    評測結(jié)果顯示,GPT4表現(xiàn)最佳。國內(nèi)頭部大模型表現(xiàn)亮眼,整體與GPT3.5相當(dāng)。其中百度文心一言表現(xiàn)超過GPT3.5,在國內(nèi)大模型中排名第一。

    在客觀題環(huán)節(jié),評測結(jié)果顯示,GPT4與文心一言表現(xiàn)好于其他大模型。但評測結(jié)果也同時(shí)指出,大模型普遍準(zhǔn)確率有較大的提升空間。

    主觀題方面,國內(nèi)大模型的基礎(chǔ)能力、語句能力與GPT4接近,概括能力、邏輯能力與GPT4有一定差距。

    在大模型的自我認(rèn)知能力和污染問題分析能力上,GPT4相較于其他大模型表現(xiàn)出更好的能力。

    大模型發(fā)展新熱點(diǎn):豐富特定行業(yè)專業(yè)知識

    雖然國內(nèi)大模型在本次評測表現(xiàn)較好,甚至在部分行業(yè)趕超GPT3.5,但工聯(lián)院評測報(bào)告也指出,國內(nèi)外通用大模型在工業(yè)知識問答領(lǐng)域探索仍處于初級階段,國內(nèi)大模型與GPT4有差距,比如行業(yè)間的泛化能力有待加強(qiáng)。

    實(shí)際上,工聯(lián)院評測報(bào)告揭示出通用大模型落地垂直行業(yè)的痛點(diǎn),缺乏特定行業(yè)的專業(yè)知識。

    關(guān)于解決難題的方法,工聯(lián)院評測報(bào)告給出的建議是,進(jìn)一步豐富相關(guān)專業(yè)領(lǐng)域的數(shù)據(jù)訓(xùn)練集,進(jìn)一步進(jìn)行專業(yè)化的微調(diào)。

    當(dāng)前,國內(nèi)科技公司紛紛加強(qiáng)與工業(yè)企業(yè)合作,期望通過在實(shí)際場景中探索應(yīng)用大模型,彌補(bǔ)差距,趕超GPT4.0。

    比如在本次評測中位居國內(nèi)模型第一的百度文心一言,與南方電網(wǎng)電力調(diào)度控制中心在電力調(diào)度場景探索使用調(diào)度AI大模型。在汽車行業(yè),長安汽車基于百度文心大模型正在開發(fā)生成式人工智能產(chǎn)品,賦能一款量產(chǎn)車型,實(shí)現(xiàn)提升用戶體驗(yàn)的目標(biāo)。除了能源、汽車制造,百度智能云還在建筑、采礦、物流、紡織等領(lǐng)域,探索使用大模型提升運(yùn)營效率和用戶體驗(yàn)效果。

    通過在實(shí)際場景的探索應(yīng)用,科技公司可以積攢更多的行業(yè)Know-how,擴(kuò)展相關(guān)領(lǐng)域的數(shù)據(jù)訓(xùn)練集。這種外部真實(shí)反饋有助驅(qū)動(dòng)大模型更加快速地實(shí)現(xiàn)迭代升級。

    未來,工聯(lián)院將持續(xù)開展通用大模型在工業(yè)領(lǐng)域更多維度的性能評測,包括但不限于大模型的魯棒性、安全性以及人類大價(jià)值觀等。

    (編輯:吳雙)

    關(guān)鍵詞:

    www国产亚洲精品久久久| 午夜亚洲av永久无码精品| 亚洲精品国产精品国自产观看| 亚洲精品无码久久久久APP | 亚洲视频在线免费播放| 亚洲av无码av制服另类专区| 日韩亚洲变态另类中文| 国产午夜亚洲精品理论片不卡| 亚洲一区二区视频在线观看| 亚洲精品第一国产综合精品99| 亚洲第一黄片大全| 18禁亚洲深夜福利人口| 精品亚洲成a人在线观看| 国产成人不卡亚洲精品91| 精品亚洲成A人在线观看青青| 亚洲AV无码片一区二区三区| 亚洲av无一区二区三区| 久久无码av亚洲精品色午夜 | 亚洲国产成人精品激情| ASS亚洲熟妇毛茸茸PICS| 国产精品亚洲精品青青青| 成人亚洲国产va天堂| 亚洲国产精品99久久久久久| 亚洲av无码成人精品区一本二本| 亚洲av色香蕉一区二区三区| 亚洲av无码专区首页| 国产成人亚洲午夜电影| 久久久久无码专区亚洲av| 亚洲永久无码3D动漫一区| 亚洲国产精华液网站w| 亚洲成人动漫在线| 亚洲欧洲精品视频在线观看| 亚洲人成影院在线高清| 亚洲熟妇无码一区二区三区导航| 亚洲第一成年网站视频| 亚洲M码 欧洲S码SSS222| 中文字幕中韩乱码亚洲大片| 亚洲国产精品VA在线看黑人| 久久精品亚洲精品国产色婷 | 亚洲一级特黄无码片| 亚洲精品乱码久久久久66|