國產(chǎn)中文大語言模型“天河天元”發(fā)布

來源:DoNews快訊


(相關(guān)資料圖)

在第七屆世界智能大會上,國家超級計算天津中心近日正式發(fā)布打造“天河E級智能計算開放創(chuàng)新平臺”,研發(fā)訓(xùn)練“天河天元大模型”。

天津超算中心搜集整理了網(wǎng)頁數(shù)據(jù)、各種開源訓(xùn)練數(shù)據(jù)、中文小說數(shù)據(jù)、古文數(shù)據(jù)、百科數(shù)據(jù)、新聞數(shù)據(jù)以及專業(yè)領(lǐng)域的中醫(yī)、醫(yī)藥、問診、法律等多種數(shù)據(jù)集,訓(xùn)練數(shù)據(jù)集總token數(shù)達到350B,訓(xùn)練打造了自己的中文語言大模型——天河天元大模型。

同時大模型還在持續(xù)訓(xùn)練和完善中,并在此基礎(chǔ)上啟動深度訓(xùn)練面向醫(yī)療、工業(yè)、法律等領(lǐng)域的專業(yè)模型。(科技日報)

標簽:

推薦

財富更多》

動態(tài)更多》

熱點