欧美一区二区三区不卡_中文字幕精品动漫一区_上课时同桌在我下面做污的事_色老汉影视

首頁 > 公司 > 內容
百川智能發布超千億參數大模型Baichuan 3
2024-01-29 14:49:34來源:中國證券網
分享到:

上證報中國證券網訊(記者 孫小程)1月29日,百川智能發布超千億參數大語言模型Baichuan 3。在多個英文評測中,Baichuan 3表現接近GPT-4水平。在CMMLU、GAOKAO、HumanEval和MBPP等多個中文評測榜單上,Baichuan 3超越GPT-4,展現了其在中文任務上的優勢。此外,在MT-Bench、IFEval等對齊榜單評測中,Baichuan 3超越了GPT-3.5、Claude等大模型。

在對邏輯推理能力及專業性要求極高的MCMLE、MedExam、CMExam等權威醫療評測上,Baichuan 3的中文效果同樣超過GPT-4,是中文醫療任務表現最佳的大模型之一。Baichuan 3還突破“迭代式強化學習”技術,進一步提升了語義理解和生成能力,在詩詞創作的格式、韻律、表意等方面表現優異。

據介紹,為了給Baichuan3注入豐富的醫療知識,百川智能在模型預訓練階段構建了超過千億Token的醫療數據集,包括醫學研究文獻、真實的電子病歷資料、醫學領域的專業書籍和知識庫資源、針對醫療問題的問答資料等。該數據集涵蓋從理論到實際操作,從基礎理論到臨床應用等各個方面的醫學知識,確保了模型在醫療領域的專業度和知識深度。

與百億、幾百億級別參數模型訓練不同,超千億參數模型在訓練過程中對高質量數據,訓練穩定性、訓練效率的要求都高出幾個量級。為更好解決相關問題,百川智能在訓練過程中針對性提出了“動態數據選擇”“重要度保持”以及“異步CheckPoint存儲”等多種創新技術手段及方案,有效提升了Baicuan 3的各項能力。

為全面提升數據質量,百川智能設計了一套基于因果采樣的動態訓練數據選擇方案,該方案能夠在模型訓練過程中動態選擇訓練數據,極大提升數據質量。訓練效率方面,百川智能針對超千億參數模型的并行訓練問題進行了一系列優化,通過多種技術創新,Baichuan 3的訓練框架在性能方面相比業界主流框架提升超過30%。

在擁有豐富高質量專業醫療知識,并能通過調優后的Prompt對這些知識進行充分激發基礎上,結合超千億參數的推理能力,Baichuan 3在醫療領域的任務效果提升顯著,在各類中英文醫療測試中的成績提升了2到14個百分點。

中方信富公眾號
更多資訊關注
中方信富公眾號