福州弘博通科技有限公司

作者 | 周愚

編輯 | 鄧詠儀

36 氪獲悉，9 月 25 日，百川智能正式發(fā)布了 Baichuan2-53B 閉源大模型，同時(shí)還一并開放了該模型的 API 接口，正式進(jìn)軍 To B 領(lǐng)域，開啟商業(yè)化進(jìn)程。

百川依舊保持著 " 小步快跑 " 的模型發(fā)布速度。這已是自 4 月 10 日成立以來(lái)，百川智能發(fā)布的第 6 款大模型，平均下來(lái)幾乎是每 28 天推出一個(gè)大模型。

對(duì)比上月初發(fā)布的 Baichuan1-53B，Baichuan2-53B 在數(shù)學(xué)、邏輯推理等能力上均有顯著提升，還在模型幻覺方面表現(xiàn)良好。百川智能稱，該模型是 " 目前國(guó)內(nèi)幻覺問題最低的大模型 "。

據(jù)百川智能，在 Baichuan1-53B 的基礎(chǔ)上，Baichuan2-53B 的邏輯推理能力提升了 100%，數(shù)學(xué)能力提升了 31%。此外，Baichuan2-53B 在語(yǔ)言理解能力、文本創(chuàng)作能力和知識(shí)問答能力上，也分別有 29%、18% 和 9% 的提升。

圖源：企業(yè)供圖

在模型幻覺方面，Baichuan2-53B 采取了兩方面的改進(jìn)措施。一方面，百川增加了模型的數(shù)據(jù)規(guī)模、提升數(shù)據(jù)質(zhì)量，另一方面也通過調(diào)用搜索等外部工具讓模型能夠獲取實(shí)時(shí)信息。

百川智能使用 FacTool 評(píng)測(cè)后的結(jié)果顯示，Baichuan2-53B 的綜合得分為 140.5，在主流基礎(chǔ)大模型中僅排在 GPT-4 之后，處于國(guó)內(nèi)領(lǐng)先水平。

據(jù)悉，F(xiàn)acTool 是由上海交通大學(xué)、卡內(nèi)基梅隆大學(xué)、香港城市大學(xué)、Meta 等機(jī)構(gòu)學(xué)者共同提出的一款通用框架，能夠查核大模型生成內(nèi)容的事實(shí)準(zhǔn)確性。

具體而言，Baichuan2-53B 獨(dú)創(chuàng)了一套數(shù)據(jù)質(zhì)量體系，以低質(zhì)、優(yōu)質(zhì)為標(biāo)準(zhǔn)將數(shù)據(jù)進(jìn)行分類，確保 Baichuan2-53B 始終使用優(yōu)質(zhì)數(shù)據(jù)進(jìn)行預(yù)訓(xùn)練。信息獲取方面，Baichuan2-53B 也對(duì)指令意圖理解、智能搜索和結(jié)果增強(qiáng)等多個(gè)模塊進(jìn)行了升級(jí)。

除了能力升級(jí)之外，開放 API 接口也是此次發(fā)布的一大亮點(diǎn)。企業(yè)和開發(fā)者可以通過 API 將 Baichuan2-53B 集成至他們的應(yīng)用程序和服務(wù)中，適配用戶在智能客服、智能寫作、智能推薦等多種不同場(chǎng)景的需求。

在安全合規(guī)問題方面，作為首批通過《生成式人工智能服務(wù)管理暫行辦法》備案的大模型企業(yè)，百川智能為 Baichuan2-53B 打造了覆蓋大模型預(yù)訓(xùn)練、精調(diào)、推理全周期的安全增強(qiáng)。

值得一提的是，Baichuan2-53B 的 API 接口對(duì) OpenAI 的接口高度兼容，客戶可以實(shí)現(xiàn)快速遷移，降低模型的部署和轉(zhuǎn)換成本。

新聞

開放 API 進(jìn)軍 To B，百川智能發(fā)布閉源大模型 Baichuan2-53B

產(chǎn)品

解決方案

關(guān)于我們

售前咨詢電話

建議反饋

新聞

開放 API 進(jìn)軍 To B，百川智能發(fā)布閉源大模型 Baichuan2-53B

售前咨詢電話

建議反饋

開放 API 進(jìn)軍 To B，百川智能發(fā)布閉源大模型 Baichuan2-53B