
文 | 周鑫雨
編輯 | 蘇建勛
在由ChatGPT引發(fā)的大模型熱潮中,不少國內(nèi)的初創(chuàng)企業(yè)希望能走出一條中國化道路。
成立于2021年的瀾舟科技是由李開復(fù)的創(chuàng)新工場(chǎng)從0孵化的AI企業(yè)。據(jù)創(chuàng)始人周明介紹,瀾舟科技致力于解決人類的語言理解和生成難題,提供基于NLP(自然語言理解)技術(shù)的開源大模型以及聚焦于營銷、金融、文化創(chuàng)意等場(chǎng)景的功能引擎和應(yīng)用。
2018年以來,BTA、華為等國內(nèi)互聯(lián)網(wǎng)廠商在大模型的研發(fā)上已經(jīng)開始涉獵。周明發(fā)現(xiàn),互聯(lián)網(wǎng)企業(yè)的大模型主要服務(wù)于企業(yè)內(nèi)部,鮮少對(duì)外賦能。研發(fā)大模型對(duì)中小企業(yè)來說有較高門檻,國內(nèi)相關(guān)的AI服務(wù)較少,大多公司只能選擇接入海外的開源模型。
為此,瀾舟科技于2021年7月推出了孟子大模型及相關(guān)系列開源模型。基于Transformer,孟子大模型可支持以及快速替換自回歸(如GPT)、自編碼(如BERT)等多種預(yù)訓(xùn)練模型。
在周明看來,初創(chuàng)公司在大模型領(lǐng)域依然有試探天花板的機(jī)會(huì)?;诰W(wǎng)上的公開數(shù)據(jù)和合作伙伴提供的數(shù)據(jù),瀾舟科技選擇在算法能力上下功夫,而非狂堆參數(shù)的“暴力”模式。
最終,瀾舟科技花了近一年的時(shí)間打磨出了孟子大模型。在模型榜單CLUE發(fā)布的中文理解評(píng)測(cè)排行榜中,孟子大模型分?jǐn)?shù)突破84分,逼近人類基準(zhǔn)分?jǐn)?shù)(85.61分)。
目前,孟子大模型已開源17個(gè)模型,分別可應(yīng)用于自然語言理解、金融資料分類、可控文本生成和圖片生成等場(chǎng)景。同時(shí),瀾舟科技還為下游應(yīng)用場(chǎng)景提供了句向量計(jì)算(用于捕捉文本間的語義相似性)和大模型定制的服務(wù)。
除此之外,面向營銷、金融、文化創(chuàng)意等場(chǎng)景,瀾舟科技推出了AIGC(智能創(chuàng)作平臺(tái))、機(jī)器翻譯平臺(tái)、金融NLP平臺(tái)等toB+toC服務(wù)。目前,瀾舟科技已與華為云、傳神語聯(lián)網(wǎng)、中文在線等企業(yè)達(dá)成合作,并與北大、清華等10所高校進(jìn)行產(chǎn)學(xué)研的聯(lián)璧。
目前瀾舟科技也在打磨不同規(guī)模的ChatGPT模型,從10億參數(shù)、100億元參數(shù)到1000億參數(shù),適應(yīng)不同需求。同時(shí)在大模型底座基礎(chǔ)上,也在考慮訓(xùn)練垂直領(lǐng)域的大模型。瀾舟長期以來一直從事金融領(lǐng)域的大模型,最近與中文在線合作宣布,合作打造一款用于網(wǎng)文寫作的類ChatGPT模型。
瀾舟科技創(chuàng)始人周明于1999年加入微軟亞洲研究院并長期領(lǐng)導(dǎo)NLP研究,其團(tuán)隊(duì)為微軟必應(yīng)搜索、Office、Azure、微軟小冰等產(chǎn)品貢獻(xiàn)了核心的 NLP 技術(shù)。瀾舟科技三名合伙人在大數(shù)據(jù)、人工智能等領(lǐng)域均有較為豐富的從業(yè)或研究經(jīng)驗(yàn)。
“在國內(nèi)開源語料稀缺的情況下,中文的數(shù)據(jù)量大概在英文的1/10,短期內(nèi),中文大模型追趕上ChatGPT有一定難度?!敝苊鞲嬖V36氪,“不過,只要AI大模型與上下游自上而下或自下而上形成一個(gè)良好的生態(tài)或閉環(huán)效應(yīng),國產(chǎn)的中文ChatGPT是可以期待的?!?/p>
