日韩精品中文字幕久久臀_天堂av在线一区_午夜精品视频网站_99r精品视频_国产日韩亚洲欧美_亚洲欧美国产一本综合首页_日本一区二区三区久久久久久久久不 _国产精品高潮视频_久热99视频在线观看_91伊人久久大香线蕉

2023 AI 大語言模型 TOP10

2023-05-19 11:24:55 來源:ZAKER科技
(注:本次評測時間截至 2023.5.10,評價指標主要包括語義理解、邏輯推理、情感分析、百科知識、文本質量五個維度)

今年春節檔,一部《流浪地球 2》點燃了沉寂許久的中國科幻電影市場,也讓 MOSS 這一電影里冷酷無情的強人工智能形象變得深入人心。

無獨有偶,幾乎是相同時期,ChatGPT 憑借極其出色的文本生成和對話交互能力在世界范圍內迅速走紅,短短兩個月月活用戶已經破億,刷新了消費級應用程序用戶增長的速度紀錄。


(資料圖片)

從某種角度看,ChatGPT 之所以能夠引發現象級的社會現象,除了海量數據訓練引發的質變因素外,更重要的是在一個恰當的時機,滿足了人們長期以來對人工智能的想象,過往科幻作品中的猜想開始逐漸變為現實。

時代變革的大幕已掀開一角,一場由 OpenAI 引領的全球 AI 大語言模型軍備競賽就此打響。

雨后春筍

3 月 14 日,GPT-4 正式發布,大語言模型開始具備圖片和文字同時處理的多模態能力,繼續占據先入為主的優勢。

全球大廠中,率先回應的是百度。3 月 16 日,百度大語言模型 " 文心一言 " 正式推出,對外啟動邀測。據公開報道,文心一言具備五項核心能力:文學創作、商業文案創作、數理邏輯推算、中文理解和多模態生成。

緊接著,其他科技企業也陸續跟進。4 月 11 日,2023 阿里云峰會現場演示了通義千問的多項功能,并定向邀請企業用戶進行體驗測試;5 月 10 日,谷歌時隔一年推出了新一代語言大模型 PaLM2,被視為對此前發布會翻車的有力回應。

此外,還有復旦大學在 2 月 21 日發布的 "MOSS"、清華大學 3 月 28 日發布的 "ChatGLM-6B"、360 于 4 月 10 日發布的 "360 智腦 "、商湯科技 4 月 10 日發布的 " 商量 "、5 月 6 日發布的 " 訊飛星火認知大模型 " 等等。

截至 5 月,據不完全統計,國內已有超過 40 家公司、機構發布了大模型產品或公布了大模型計劃。項目數量井噴式的爆發,可預見的是,下半年的國內 AI 大模型市場競爭將會變得空前激烈。

不止于 " 大 "

提到大模型,很多人的關注點都會放在 " 大 " 字上,畢竟足夠量級的參數是語言模型實現智能涌現、形成質變的基礎。比如,不少大語言模型的參數量級達千億級,這也就意味著較為豐富的語言知識與較廣泛的語境理解能力。

不過,目前類 GPT 模型普遍采用的是 Transformer 架構,所以必然包含市面上存在的大量文本數據例如小說、教科書、論壇、開源代碼等內容的無監督預訓練過程,在此基礎上,僅需根據具體任務輸入少量的標簽數據進行監督學習。在這樣的模式下,訓練數據集質量的重要性開始愈發凸顯。

本次評測的結果就可以印證這一點。評測主要考察各大語言模型在中文語境下的理解與生成能力,基于目前用戶對大語言模型在生活、辦公的普遍需求,選取語義理解、邏輯推理、情感分析、百科知識、文本質量五個通用底層維度,以評估各大語言模型協助用戶日常處理事務、解決核心問題的能力,取 0(無效應答)、1(有效應答)兩個分數,其中文本質量維度按照行文邏輯、信息密度,取 0(一般)、0.5(良好)、1(優秀)三個分數。

評測問題也有別于針對 BERT 類判別式 AI 模型的選擇問法,采用更加適合 AI 生成式模型的相對開放式問法,以下為部分問題及回答評分示例:

在 "I"ve got a thing for you,用文言文表達這句話 " 這一問題中,ChatGPT 給出的回答是:" 朕對汝有所鐘情。" 理解正確,但生成文本質量欠佳,取 0.5 分。文心一言的輸出內容:" 吾心向汝,實生情之。" 文義相符,質量較高,取 1 分。星火認知大模型回答為:" 吾有物以贈君。" 存在理解有誤的情況,取 0 分。

從結果看 ChatGPT 在語義理解、邏輯推理、百科知識、文本質量四項中分別以 18、19、19、18.5 排名第一,綜合表現位居榜首,特別是在科技、學術、新聞等領域的文本生成部分領域表現突出,不過在相對復雜的情景下的情感識別,以及散文、詩歌、文言文等較為考察深度理解能力方面表現相對乏善可陳;

文心一言,作為首個全球大廠推出的知識增強大語言模型,本次排名位居國產大語言模型之首,效果僅次于 ChatGPT,且在語義理解、情感分析兩項位列第一,分數分別為 18、19,這或許與百度使用的自有數據集有關,在質量較高的文庫文本、百科數據等中文語料的訓練下,在語義理解和情感分析方面具有很高的精度,可以識別出復雜的情感表達和語言隱喻;

除此以外,谷歌 PaLM 在邏輯推理部分(分數 19)、通義千問在語義理解(分數 17)、清華 ChatGLM 在文本質量(分數 15.5)等成績均可圈可點。

結語

未來大模型的迭代也將更有針對性,對開發者的評估能力提出更高的要求。如何在有限的時間和資源條件下做出客觀的評價并給出有用的反饋,讓數據團隊更有針對性地準備數據,讓研發不偏離方向,保障模型的健康迭代,將是所有行業從業者的共同挑戰。

《互聯網周刊》也將持續跟蹤與關注各大語言模型的更新與迭代情況,定期進行相關評測與分析。未來,相信隨著算法、硬件、數據和應用場景的不斷發展,大型語言模型將會在各種自然語言處理任務中發揮更加重要的作用,為社會創造更多的價值。

(文 / 米欄)

e-Mail:lab@enet16.com

TEL:010-65283855

【排行 "i 系列標準 " 統一詳細說明】

關鍵詞:

相關新聞

日韩精品中文字幕久久臀_天堂av在线一区_午夜精品视频网站_99r精品视频_国产日韩亚洲欧美_亚洲欧美国产一本综合首页_日本一区二区三区久久久久久久久不 _国产精品高潮视频_久热99视频在线观看_91伊人久久大香线蕉
久久99热国产| 色狠狠av一区二区三区| 99精品在线观看视频| 亚洲精品日韩综合观看成人91| 91啪在线观看| 蓝色福利精品导航| 亚洲欧美日韩久久| wwwwww.欧美系列| 欧美日韩一级片网站| 国产福利一区二区三区视频在线 | 日韩精品一区二区三区视频在线观看| 国产成人免费视频一区| 偷拍与自拍一区| 亚洲成人黄色小说| 亚洲一二三区视频在线观看| 国产精品无码永久免费888| 欧美v国产在线一区二区三区| 欧美久久婷婷综合色| 在线观看免费成人| 欧美无砖专区一中文字| 91九色最新地址| 色系网站成人免费| av电影在线不卡| 成人黄色一级视频| 国产91丝袜在线播放| 天堂成人国产精品一区| 日本欧洲一区二区| 老色鬼精品视频在线观看播放| 奇米综合一区二区三区精品视频| 日韩在线一二三区| 日韩av一二三| 久久99九九99精品| 国产经典欧美精品| 99久久精品一区二区| 91污在线观看| 欧美日韩国产另类不卡| 91精品国产一区二区三区香蕉| 欧美一区二视频| 日韩欧美国产1| 国产女人18毛片水真多成人如厕| 国产精品乱人伦中文| 一区二区三区国产豹纹内裤在线| 午夜欧美视频在线观看| 国产伦精品一区二区三区免费 | 国产日韩综合av| 亚洲欧洲精品一区二区精品久久久| 亚洲另类春色国产| 日产欧产美韩系列久久99| 国产在线精品一区二区三区不卡| 成人v精品蜜桃久久一区| 欧美日韩视频在线第一区 | 日韩视频一区二区在线观看| xnxx国产精品| 亚洲电影第三页| 国产成人免费av在线| 欧美性猛交xxxx黑人交| 久久久国际精品| 午夜av一区二区三区| 丁香桃色午夜亚洲一区二区三区| 欧美日韩不卡一区二区| 亚洲免费av高清| 高清成人在线观看| 制服丝袜中文字幕一区| 亚洲免费av观看| 国产成人精品一区二区三区网站观看| 欧美在线看片a免费观看| 国产偷国产偷亚洲高清人白洁| 亚洲国产综合在线| 成人黄色国产精品网站大全在线免费观看 | 国产剧情一区在线| 欧美日韩另类一区| 中文字幕一区在线观看视频| 美女视频一区二区| 欧美日韩精品免费| 亚洲国产日韩在线一区模特| 99久久婷婷国产精品综合| 欧美久久久久免费| 亚洲第一福利一区| 欧美在线高清视频| 亚洲男同性视频| 色婷婷综合久久久中文字幕| 国产欧美日韩在线视频| 国产成人免费在线| 亚洲人成电影网站色mp4| 99久久夜色精品国产网站| 中文字幕国产一区| 99久久精品费精品国产一区二区| 国产精品国产三级国产aⅴ中文| 国产一区二区三区在线观看免费 | 国产成人自拍在线| 国产欧美1区2区3区| 国产毛片精品视频| 国产亚洲欧美在线| 久久99精品国产麻豆婷婷| 精品成人一区二区三区| 国产呦萝稀缺另类资源| 久久婷婷国产综合精品青草 | 麻豆成人免费电影| 久久尤物电影视频在线观看| 国产·精品毛片| 亚洲精品视频一区| 91精品国产91久久久久久一区二区 | 国产aⅴ精品一区二区三区色成熟| 久久新电视剧免费观看| 成人午夜电影久久影院| 亚洲日本va午夜在线电影| 91黄色小视频| 日本麻豆一区二区三区视频| 亚洲精品一区二区在线观看| 国产成人av影院| 亚洲欧美日韩在线不卡| 91福利在线导航| 国产麻豆精品theporn| 亚洲欧洲成人自拍| 欧美精品1区2区3区| 成人美女视频在线观看18| 一区二区三区四区中文字幕| 精品日韩在线观看| 不卡的电影网站| 五月天一区二区三区| 国产亚洲一区二区三区四区| 欧美精选一区二区| 国产不卡视频在线观看| 视频一区欧美精品| 中文字幕五月欧美| 精品免费国产一区二区三区四区| 成人黄色av网站在线| 日韩国产欧美在线视频| 亚洲一区二区三区在线| 久久精品人人做人人爽97| 欧美精品一二三区| 色综合天天性综合| 国产一区二区三区电影在线观看| 亚洲精品第一国产综合野| 国产欧美日韩视频一区二区| 日韩一级片网址| 欧美色图在线观看| 在线视频观看一区| 91麻豆.com| 一道本成人在线| 国产成人福利片| 成人一道本在线| 国产在线不卡视频| 国产一区二区影院| 精品一区二区三区日韩| 青青草视频一区| 五月婷婷激情综合| 免费在线观看一区| 久久99精品久久久| 精品写真视频在线观看| 麻豆一区二区在线| 精品一区二区在线视频| 日本最新不卡在线| 蜜臀91精品一区二区三区| 久久www免费人成看片高清| 六月丁香婷婷久久| 国产一区二区三区免费看| 裸体一区二区三区| 久久精品国产亚洲一区二区三区| 亚洲色图视频网| 亚洲成人免费在线观看| 奇米精品一区二区三区在线观看| 视频一区中文字幕| 日韩精品一级中文字幕精品视频免费观看 | 一区二区三区在线免费观看| 亚洲精品你懂的| 日韩经典一区二区| 激情久久五月天| 成人激情黄色小说| 欧美精选一区二区| 国产欧美视频一区二区| 亚洲精品一二三四区| 亚洲成a人片在线观看中文| 久久99这里只有精品| 不卡的电视剧免费网站有什么| 色爱区综合激月婷婷| 日韩欧美成人午夜| 中文字幕一区av| 日韩中文字幕亚洲一区二区va在线| 日韩国产在线观看| av电影天堂一区二区在线| 一本色道久久综合狠狠躁的推荐 | 久久精品国产免费| 成人高清免费在线播放| 欧美一区二区免费观在线| 亚洲天堂精品在线观看| 日本欧美一区二区| 91亚洲国产成人精品一区二区三 | 99国产精品久久久久久久久久 | 欧美午夜理伦三级在线观看| 亚洲精品一线二线三线无人区| 亚洲欧美经典视频| 精品一区二区三区av| 8x福利精品第一导航| 亚洲精品乱码久久久久久日本蜜臀| 国内精品不卡在线| 欧美三级视频在线播放| 亚洲精品高清在线观看| 成人小视频免费在线观看| 日韩精品一区二区三区在线|