
OpenAI創(chuàng)始人奧特曼都還沒來得及和馬斯克掰扯完新仇舊恨,沒關(guān)系,還有其他人會悄悄出手——
北京時間3月4日晚間,Anthropic,毫無預(yù)警地發(fā)布了最新一代大模型Claude 3,距離上一代的Claude 2發(fā)布,僅相隔8個月。
Anthropic是OpenAI的勁敵,其核心團隊同樣是OpenAI的創(chuàng)業(yè)原班人馬。團隊因為與OpenAI理念不合而分家,于2021年成立了新公司Anthropic。
僅在2023年,Anthropic就連續(xù)獲得五輪,共計73億美元的融資。在大模型訓(xùn)練上,Anthropic可以說是業(yè)內(nèi)第一梯隊,同樣備受硅谷關(guān)注。
這次,毫無疑問,Claude 3直接對標OpenAI當(dāng)前最強大的模型GPT-4,多模態(tài)能力配齊,并且直接甩出超過46頁的技術(shù)報告,自豪表示:
全面超越GPT-4!
△來源:Claude來源:
新一代的Claude 3分為三個版本,分別為Haiku、Sonnet、Opus三款模型。從模型尺寸來看,可以理解為模型的中杯、大杯、超大杯。
雖然Anthropic并沒有給出模型的具體參數(shù),不過給出了三款模型所適用的場景:
從本周開始,Claude會向159個國家開放。其中,Opus和Sonnet模型的API均已上線,開發(fā)者已經(jīng)可以直接使用。經(jīng)濟性能兼顧的Sonnet,就在官網(wǎng)上提供免費體驗,Opus則可供Claude Pro訂閱者使用。
盡管OpenAI憑借Sora在文生視頻領(lǐng)域打了一場漂亮的翻身仗,但視頻賽道所在的發(fā)展階段更早。如今的主戰(zhàn)場仍在大語言模型(LLM)上,離產(chǎn)品化也更近。
圈內(nèi)人也看熱鬧不嫌事大。近期不少報道顯示,馬斯克將OpenAI告上法庭,讓OpenAI不得不內(nèi)部推遲有關(guān)GPT-5的發(fā)布——GPT-5被認為能夠?qū)崿F(xiàn)AGI(通用人工智能)。著名AI圈網(wǎng)紅、英偉達的首席AI科學(xué)家Jim Fan就表示:
Claude 3剛剛發(fā)布了,坐等幾個小時后OpenAI精心安排的GPT-5發(fā)布。
△來源:Twitter(X)
2024年才剛剛過去兩個月,我們就已經(jīng)見證谷歌Gemini Pro、OpenAI的Sora,再到如今的Claude發(fā)布……巨頭混戰(zhàn)再度拉開序幕,大有愈演愈烈之勢。
一口氣讀15萬單詞,還能自己拆解復(fù)雜問題
如果是OpenAI是大模型領(lǐng)域的“六邊形戰(zhàn)士”,無論是模型視頻、商業(yè)化綜合水平一騎絕塵,那么Anthropic從風(fēng)格上看更為低調(diào),也更強調(diào)專才,但這次的能力提升確實巨大。
有看客甚至表示:
Claude 3終結(jié)了GPT-4時代。
這次Claude 3的兩大更新亮點,一個是長文本,二是多模態(tài)能力。
長文本就是Anthropic的一個顯著優(yōu)勢,體現(xiàn)為在讀論文、小說等字數(shù)更多的文本時,Anthropic更擅長理解和回答用戶的相關(guān)問題。
這次,Claude 3大大提升了上下文對話窗口,達到200k——可以理解為單次和模型對話能夠輸入的文本。
具體而言,Claude 3 200k的對話長度,相當(dāng)于能夠單次處理超過15萬英文單詞,而GPT-4 Turbo的上下文窗口為128k,大約是9.6萬個英文單詞。
并且,Claude 3也第一次允許圖像和文檔上傳。和ChatGPT一樣,Claude 3能夠“認”出來圖里的是什么東西,直接描述,回答用戶的問題。
而更令人印象深刻的還是,Claude 3在分析一些復(fù)雜問題時,已經(jīng)能夠和人一樣,先拆解問題,并且交由子模型來進行調(diào)度。
在Anthropic的演示視頻里,就舉了一個需要用python模擬經(jīng)濟形勢走向的例子。當(dāng)把“分析美國十年GDP未來趨勢”的任務(wù)交給Claude 3之后,Claude就默默地做了這些事:
最有趣的就是,網(wǎng)頁中如果看到一個數(shù)據(jù)圖表,沒有明確數(shù)據(jù)的,Claude 3甚至能通過識別圖像,來估算每個階段大概數(shù)據(jù)是多少,進行還原。
△搜索引擎中的數(shù)據(jù)圖表
△Claude 3還原的折線圖,估算了每個時間節(jié)點的具體GDP
AI安全也是Anthropic區(qū)別于OpenAI的一點。在OpenAI和Anthropic團隊分家的時候,其最重要分歧正是包含對AI安全的考慮,Anthropic希望建立一個“更可信”的模型,而OpenAI顯然希望用商業(yè)化驅(qū)動模型更快地前進,路線上更為激進。
對此,Anthropic采取的措施包括但不限于:制定了一套框架,用于評估和減輕 AI 模型可能帶來的潛在災(zāi)難性風(fēng)險,比如繼續(xù)擰自動化評估和紅隊測試,以確保AI不會發(fā)展出可能造成傷害的能力。
2023年4月,Anthropic甚至開源憲法人工智能(Constitutional AI)引起了圈內(nèi)轟動,這是一個限制模型行為遵守特定憲法原則的AI。
以及2024年也是美國大選年, Anthropic 也在準備開發(fā)和執(zhí)行關(guān)于在政治和選舉背景下使用工具的政策,評估模型對選舉錯誤信息、偏見和其他濫用的反應(yīng),確保用戶能夠在選定國家獲得準確和最新的投票信息。
不過,Anthropic也因為太過重視AI安全,很多問題的評估上很謹慎,甚至直接不回答,惹來一片用戶吐槽。這次,Anthropic表示,Claude 3在這個問題上大有改進。
比如,Claude 3的對無害信息的拒絕回復(fù)率,普遍來到了10%附近,比Claude2.1和2.0都有進步。
△來源:Anthropic
據(jù)CNBC,Anthropic拒絕透露訓(xùn)練 Claude 3 到底花了多少時間和多少錢,但表示 Airtable 和 Asana 等知名SaaS公司有幫忙對模型進行了A/B測試,讓模型的可控性也有所改善。
技術(shù)以外,Anthropic商業(yè)化還要再提速
盡管Anthropic技術(shù)上又一次拿出了看家實力,但大模型領(lǐng)域如今已經(jīng)走過了一年多時間的技術(shù)競爭。如何從模型走向?qū)嶋H的產(chǎn)品落地,創(chuàng)造更大的商業(yè)價值,是懸在所有廠商頭上的劍。
如今Anthropic背后站著谷歌云、亞馬遜,已經(jīng)和OpenAI(背靠微軟)形成鮮明的陣營對比。但從商業(yè)化角度,當(dāng)前Anthropic遠趕不上OpenAI,這意味著Anthropic在2024年會面臨更大壓力。
和ChatGPT一樣,Anthropic也是To B和To C兩條腿走路。在企業(yè)側(cè),Anthropic已經(jīng)服務(wù)了包括 Slack、Notion 和 Quora等用戶。
而據(jù)The Information 2023年12月報道, Anthropic預(yù)計到2024年底將產(chǎn)生超過8.5億美元的年化收入。相比起來,同樣截至2023年底,OpenAI由于ChatGPT的強勁增長,年化收入從10月中旬的13億美元就增至16億美元。
往后,隨著OpenAI商業(yè)化提速,差距還可能越來越大。The Information援引一些 OpenAI 領(lǐng)導(dǎo)者的觀點,到 2024 年底,他們預(yù)計OpenAI年化收入可以達到50億美元,而其他人則認為可以達到更高的數(shù)字。
技術(shù)上的軍備競賽遠未結(jié)束。在2023年12月,Anthropic還在進行新一輪高達7.5億美元的融資,估值為184億美元,相比2023年初41億美元的估值,漲了4.5倍。
