
文|周鑫雨
編輯|蘇建勛
一場針對“中國AI巨頭”李一舟的聲討,正在轟轟烈烈地上演。
聲討者們,是圖像模型開源社區(qū)LiblibAI上的模型創(chuàng)作者。2月21日,不少創(chuàng)作者發(fā)現(xiàn),自己獨家授權(quán)給LiblibAI的開源模型,未經(jīng)允許被搬運到了名為“一舟智能”的網(wǎng)站上——據(jù)統(tǒng)計,至少有97個模型,遭到了搬運。
“一舟智能”的背后,則是彼時火遍全網(wǎng)的李一舟。當OpenAI的視頻生成模型Sora再次引爆輿論,李一舟以“AI教父”的形象出現(xiàn)在大眾面前,在直播間販賣199元的“每個人的人工智能課”和“只剩最后一個名額”的焦慮——當然,效果也是驚人的,據(jù)飛瓜數(shù)據(jù)統(tǒng)計,價值199的人工智能課一年內(nèi)賣出約25萬套,銷售額約5000萬。
但技術(shù)熱點造就的財富的B面,是李一舟經(jīng)不起推敲的學(xué)霸人設(shè),和對開源模型的涉嫌侵權(quán)。
成立于2023年5月,迄今已聚集了1萬多名模型創(chuàng)作者的LiblibAI,已經(jīng)是國內(nèi)最大的AI繪畫模型分享社區(qū)。社區(qū)中的模型,大多是愛好者們基于Stable Diffusion(以下簡稱“SD”)的微調(diào)模型,通過不同數(shù)據(jù)集的訓(xùn)練,模型能夠創(chuàng)作出特定風(fēng)格的圖像,比如被李一舟搬運的LEOSAM,主打3D寫實。
△LiblibAI社區(qū)中的模型。
上傳模型的愛好者們,共同點是“用愛發(fā)電”。即便是基于SD的微調(diào),這些模型前期依然要投入高昂的訓(xùn)練時間和成本。
LEOSAM的創(chuàng)作者“兔猻”曾公開自己訓(xùn)練模型付出的算力成本:在云計算平臺Autodl上租賃算力花費了大約兩萬元,購買了英偉達4090和6000ada兩塊顯卡花了大概8萬元。
LiblibAI聯(lián)合創(chuàng)始人張子捷告訴36氪,不同模型作者訓(xùn)練的方法不太相同,即便是最輕量化的微調(diào)模型LoRA,也要在訓(xùn)練過程中用數(shù)天的時間標注的幾十至數(shù)百張圖片,后期還要通過大量的XYZ plot測試(一種測試模型生圖能力的方法),來檢驗訓(xùn)練成果,以此對模型進行調(diào)優(yōu)。
“李一舟對模型的搬運讓人不適的點在于,一是他沒有得到作者本人的授權(quán),二是他通過模型進行了謀利。大家投入很多金錢和精力做出的模型,被李一舟用來賺錢?!?月21日,LiblibAI聯(lián)合創(chuàng)始人、運營負責(zé)人梅子收到了創(chuàng)作者給她私發(fā)的一舟智能網(wǎng)站截圖,“令人費解的是,一舟智能專挑熱門模型搬運,甚至沒有標注原創(chuàng)作者信息。”
△被搬運到一舟智能網(wǎng)站上的模型。圖源:B站UP主@朱尼醬等聯(lián)合創(chuàng)作者
她發(fā)現(xiàn),作者們授權(quán)(包括獨家授權(quán))給LiblibAI的多個模型,出現(xiàn)在了一舟智能的模型社區(qū)中,點擊后就會跳轉(zhuǎn)到會員的購買頁面,每個月的訂閱費在39元-399元不等——而這些模型,在LiblibAI上均為免費開源。
在創(chuàng)作者們多次聯(lián)系一舟智能下架模型未果后,2月22日,LiblibAI代表作者發(fā)出聲明:作為主張開源共享的社區(qū),LiblibAI 允許用戶直接使用模型、甚至下載模型,但未經(jīng)創(chuàng)作者許可就搬運模型、甚至擅自用作商業(yè)化,則被平臺視為“侵權(quán)”。
李一舟對開源模型的“偷襲”,也將一個問題拋到了行業(yè)面前:秉持著人人可用、技術(shù)共享理念的開源模型,使用的邊界到底在哪里?
“開源,不代表無版權(quán)。”張子捷告訴36氪。他認為,站在模型創(chuàng)作者的角度,真正用于模型訓(xùn)練的,是經(jīng)過標注的“數(shù)據(jù)對”,帶有極強的主觀性,微調(diào)模型可以被視作作者的二創(chuàng)。而站在平臺監(jiān)管的角度,LiblibAI作為社區(qū),也需要保證開源模型被合規(guī)合法的使用,而不是隨意搬運。
△LiblibAI上模型LEOSAM創(chuàng)作者“兔猻”關(guān)于使用權(quán)限的聲明。圖源:LiblibAI@LEOSAM是只兔猻
不過,證明開源模型具有著作權(quán),依然困難重重。比如,如何對訓(xùn)練模型的數(shù)據(jù)進行溯源,如何認證標注后的訓(xùn)練數(shù)據(jù)沒有對原數(shù)據(jù)作者構(gòu)成侵權(quán)。
但開源模型社區(qū)的困境更在于:李一舟不是第一個,也絕不會是最后一個。
成立不到8個月,LiblibAI上的模型已經(jīng)經(jīng)歷了不下十次大規(guī)模的被搬運。一些個人用戶將模型下載后,又上傳到其他的社區(qū)。
“李一舟甚至不是搬運最多的一次,但是影響最大的一次。”梅子表示。這幾天,她與25名被搬運的模型作者并行取證。作為平臺方,LiblibAI的兩個主張為:第一,李一舟對模型作者構(gòu)成著作權(quán)侵犯;第二,對LiblibAI構(gòu)成不正當商業(yè)競爭。
平臺和模型創(chuàng)作者們覺得,打贏這場戰(zhàn)爭,對構(gòu)建更有秩序的開源生態(tài)至關(guān)重要。
用8萬元和愛發(fā)電的模型,成了李一舟撈金的工具
36氪:大家是怎么發(fā)現(xiàn)模型被搬運到李一舟的網(wǎng)站上的?
梅子:我與模型作者有1V1建聯(lián)。上周三(2月21日),我們的作者截了一張李一舟網(wǎng)站上的圖,私發(fā)了我一份,也轉(zhuǎn)到了我們的原創(chuàng)作者交流群里。
我們就覺得截圖中的模型非常眼熟,發(fā)現(xiàn)這些模型都是熟悉的作者,甚至有的是LiblibAI獨家的模型。作者們也很詫異,李一舟網(wǎng)站用的封面圖和LiblibAI的也一模一樣,都不帶改的。
子捷:AI愛好圈的特色是彼此之間的交際非常緊密,大家有無數(shù)個小群。一旦有人收集整理被搬運的證據(jù),這些截圖和資料就會傳播到各種群里,事情就開始持續(xù)發(fā)酵。
36氪:被搬運的模型一共多少個?
子捷:一共是97個。最早的時候被搬運的模型其實有100多個,個別模型作者和李一舟的工作人員私聊后,有一些模型就下架了。
隨著越來越多的作者向我們反應(yīng),平臺隨即開始做侵權(quán)取證,比較各個群和渠道里面的截圖,并且給法院認證的網(wǎng)頁截屏做了“時間戳”,當時最終的計算結(jié)果是97個。
36氪:開源模型本身是可供各種用戶下載使用的,那么李一舟的哪些行為讓大家覺得自己的權(quán)益被侵犯了?
梅子:有人分析過李一舟網(wǎng)站的付費模式,一旦觸發(fā)模型的生圖功能,就會跳轉(zhuǎn)到付費鏈接,價格也有不同的檔位。相當于這些開源模型最終是為盈利目的搬運的。
子捷:被搬運的都是熱門模型,基本上是LiblibAI首頁推薦中的,其中不少模型還是獨家授權(quán)給LiblibAI的,其他網(wǎng)站不得私自轉(zhuǎn)載。開源模型的訓(xùn)練和微調(diào),也需要作者付出很多的腦力勞動和資源,李一舟沒有獲得授權(quán),就將模型作為牟利的手段,很不尊重創(chuàng)作者。
△一舟智能的收費模式。圖源:B站UP主@朱尼醬等聯(lián)合創(chuàng)作者
36氪:開源模型的微調(diào)需要投入多少資源?
子捷:具體的投入和模型的參數(shù)有關(guān)。一般而言,用一個非常小的微調(diào)模型LoRA,需要幾十到幾百張圖片,訓(xùn)練會根據(jù)參數(shù)調(diào)整和內(nèi)容需求的不同花費數(shù)個小時。但前期對圖片進行采集標注,至少需要花三四天,訓(xùn)練完后還要對模型進行調(diào)優(yōu),做大量的XYZ plot測試(一種測試模型生圖能力的方法),時間可能會無限長。
梅子:模型LEOSAM的作者“兔猻”提到過自己在云計算平臺Autodl上租賃算力花費了大約兩萬元,購買了英偉達4090和6000ada兩塊顯卡花了大概8萬元。像他做Stable Diffusion XL的模型對算力的要求很高。
△“兔猻”關(guān)于模型微調(diào)過程的分享。圖源:LiblibAI@LEOSAM是只兔猻
36氪:有聯(lián)系上李一舟方面的人嗎?
梅子:發(fā)現(xiàn)模型被搬運的當天,模型作者們嘗試與一舟智能相關(guān)的工作人員溝通,但是未達成一致的協(xié)商解決方案。
和作者們確認細節(jié)后,我們是2月22日發(fā)的官方聲明。在此之前已經(jīng)有一些模型作者假裝普通用戶,問一舟智能的客服這些模型是否有授權(quán),結(jié)果對方回答“有”。后來作者們亮出了真實身份,要求一舟智能立刻下架、道歉和賠償,客服才匆忙改口。
但并不是所有的被侵權(quán)模型都立馬下了架。不少作者發(fā)現(xiàn)幾輪溝通后,自己的模型還是被掛在網(wǎng)站上,一舟智能也沒有公開回應(yīng)和道歉。所以我們就直接發(fā)了公開聲明,給對方發(fā)了律師函。
36氪:大家的訴求是什么?
梅子:對于作者而言,李一舟應(yīng)該下架所有侵權(quán)模型,賠償通過侵權(quán)所得的不正當收入,并且公開道歉。對于LiblibAI而言,作者的訴求就是我們的訴求,平臺獲得了多少賠償反而沒那么重要。
開源,不代表無版權(quán)
36氪:發(fā)現(xiàn)模型被搬運后,大家采取了怎樣的維權(quán)措施?
子捷:其實在最開始的時候,我們平臺方比較謹慎和保守,和很多作者去了解情況。確認完后,我們再聯(lián)系了律師進行咨詢。
和律師溝通后,我們初步確定了維權(quán)的兩個方向:第一,李一舟對模型作者構(gòu)成著作權(quán)侵犯;第二,對LiblibAI構(gòu)成不正當商業(yè)競爭。
梅子:發(fā)現(xiàn)當天,被搬運模型的作者就拉了一個有小20人的群。我在里面逐一和作者們溝通,明確他們沒有把模型授權(quán)給李一舟使用。
模型作者是被侵犯著作權(quán)的直接主體,他們自己也在積極尋求法律途徑應(yīng)對。我們作為平臺方,因為有得到模型的授權(quán),所以我們認為有責(zé)任幫作者一起維權(quán)。但企業(yè)競爭和作者沒有關(guān)系,所以由平臺主動發(fā)起有關(guān)不正當競爭的維權(quán)比較合適。
36氪:開源社區(qū)是否就意味著上線的模型可以被使用?使用的邊界是什么?
子捷:很多用戶會把開源社區(qū)默認為無版權(quán),上架模型可以隨意轉(zhuǎn)載使用。但并不是這樣的。
從平臺的角度出發(fā),我們有責(zé)任對上線模型的使用進行監(jiān)管和規(guī)范,比如我們要限制用戶用開源模型去做生成違法的內(nèi)容。任意轉(zhuǎn)載將使平臺的內(nèi)容風(fēng)險管控發(fā)生較大的隱患。
從模型作者的角度出發(fā),作者會在社區(qū)明確規(guī)定模型的使用范圍,很多模型明確要求不得用于商業(yè)用途,僅供學(xué)習(xí)交流使用。擅自的轉(zhuǎn)載和商用,將使得作者創(chuàng)作研究模型的風(fēng)險陡然增高。
36氪:在維權(quán)的過程中,有哪些難點?
子捷:目前AI模型版權(quán)的歸屬與侵權(quán)等問題尚無明確的判例給到一些支持,比如原創(chuàng)作者的模型受到哪些條例保護,是按照計算機程序保護還是作品著作權(quán)等,所以平臺也要積極推動立法上對于AI模型知識產(chǎn)權(quán)的判定與保護。
36氪:律師對維權(quán)的態(tài)度怎樣?勝算大嗎?
梅子:我們咨詢了好幾個律師,他們的反饋都比較正向,給出的法律主張圍繞侵犯模型作者著作權(quán),以及對平臺的不正當競爭。
同時,之前AI繪畫侵權(quán)案是有判例的,當時案件結(jié)果明確表示AI繪畫的著作權(quán)歸原作者所有,未經(jīng)授權(quán)搬運他人用AI生成的畫作構(gòu)成侵權(quán)。這個判例給了我們很大的信心。
△北京互聯(lián)網(wǎng)法院針對人工智能生成圖片(AI繪畫圖片)著作權(quán)侵權(quán)糾紛作出一審判決,認定AI繪畫作者享有著作權(quán)。
我們期待生態(tài)的豐富,但前提是保護和尊重
36氪:這是LiblibAI上的模型第一次被侵權(quán)嗎?
子捷:李一舟事件不是最大規(guī)模的一次搬運,卻是影響力最大的。
其實從去年(2023年)5月平臺上線開始,一直有不少AI愛好者把模型放在小社區(qū)上。
梅子:沒有辦法,我們很難去追查。個別作者和我們反饋過,在其他平臺看到獨家授權(quán)給LiblibAI的模型,大家一般會各自聯(lián)系對方申訴,要求他們下架,但從來都沒有像李一舟這一次一樣形成規(guī)模效應(yīng)。
36氪:但有時候,沒有搬運,就沒有影響力。
子捷:我們對于普及AI知識的行為是比較開放的,大家可以用我們的平臺給公眾授課。當然我們也歡迎他們和不同的作者聯(lián)系,得到模型上線的授權(quán)。但前提是要保護或尊重,提前與作者及平臺進行溝通,在不涉及不正當競爭的前提下去進行搬運。
36氪:作為開源社區(qū),平臺方有哪些措施可以減少侵權(quán)的發(fā)生?
梅子:我們會鼓勵作者在模型聲明里寫明使用范圍,比如“未經(jīng)允許,不得商用”。同時,平臺也會在模型詳情頁對作者的授權(quán)范圍進行明確的展示。
我們最近也在和技術(shù)聊,短期內(nèi)我們在試驗?zāi)懿荒芡ㄟ^給模型加明暗水印的方式,來保護模型作者的權(quán)益。這個手段涉及技術(shù)方案的實現(xiàn),也涉及模型作者的配合。但更長期,平臺會投入更多精力關(guān)注并推動法律上AI版權(quán)保護的進一步明確。
開源社區(qū),創(chuàng)作者是核心
36氪:LiblibAI的第一批創(chuàng)作者是怎么入駐的?
子捷:毫不夸張地說,是我們早期運營同學(xué)“肉搏”出來的,每個核心作者都得一個個定向邀請入駐。
梅子:因為當時國內(nèi)是沒有這樣的圖像模型分享社區(qū),我們知道海外的AI社區(qū)Civitai上有很多中國作者苦于國內(nèi)沒有渠道,所以我們根據(jù)他們的公開聯(lián)系方式,比如B站賬號、QQ,只要能找到聯(lián)系方式的,我們就1V1定向邀請,然后向他們介紹說,我們是國內(nèi)第一家AI模型分享社區(qū),非常希望他能入駐。
包括一些作者在北京或者上海,我們都會趕過去見面聊。比較欣慰的是大家熱情挺高,基本上只要建聯(lián)就能聊上,然后了解完我們想做什么之后,大家都會授權(quán),再進來建立賬號,把模型同步發(fā)到LiblibAI上。
36氪:第一批入駐了多少模型?
梅子:應(yīng)該有幾百個。有的作者手里有非常多模型,當時我們站剛剛成立,他們上傳,我就覺得站子一下就滿了。
36氪:目前LiblibAI的月活有多少?
梅子:月訪問量是200多萬。因為早期的作者已經(jīng)在Civitai上有一些粉絲基礎(chǔ),加之一些KOL自發(fā)宣傳國內(nèi)有了新的模型站,當時帶動了不少作者入駐。去年六七月的時候,我們就進入了非常高速增長的階段。
36氪:LiblibAI應(yīng)該是國內(nèi)最早一家做作者激勵計劃的AI社區(qū),當時是怎么考慮的?
梅子:因為我們和作者綁定得很緊密,大家都是用開源的精神去做模型,開放給大家用。我們的激勵計劃其實就是基于模型對平臺的貢獻,每個月給一些補貼和激勵,可能不是特別多,只是對開源精神的一種感謝,同時也希望各位模型創(chuàng)作者相信可以與平臺長期共同發(fā)展。
36氪:AI開源社區(qū)能夠吸引作者的核心競爭力是什么?
梅子:我認為會分為不同的階段,最早期的作者真的是和我們一起拓荒,更在意平臺的理念與是否與他們契合,包括是否尊重原創(chuàng)作者及平臺的運營規(guī)劃;
而目前,平臺的發(fā)展規(guī)模也十分重要,這些作者的模型值得被更多的用戶看到、使用,雙邊關(guān)系的建立和效率尤為重要;同時,平臺的生態(tài)定位也很重要,需要比較開放和多元。如果生態(tài)中只有一類模型,那只能吸引一類人。我們是垂類最豐富的模型社區(qū),有攝影的、設(shè)計的模型,也有動漫的。不論偏好生產(chǎn)什么垂類的模型作者都可以在LiblibAI上找到歸屬感。
平臺的生態(tài)定位也很重要,需要比較開放和多元。如果生態(tài)中只有一類模型,那只能吸引一類人。我們是垂類最豐富的模型社區(qū),有攝影的、設(shè)計的模型,也有動漫的。
子捷:我們認為,AI首先是一個生產(chǎn)力工具,而不是娛樂工具。海外的一些AI社區(qū)把AI當做娛樂工具,根據(jù)用戶的喜好想生成什么,就生成什么,導(dǎo)致社區(qū)的氛圍很混亂。
所以我們在探索和扶持不同工業(yè)設(shè)計、建筑設(shè)計、室內(nèi)設(shè)計等垂類賽道的模型,甚至愿意用真金白銀去補貼。
36氪:開源社區(qū)如何商業(yè)化?
子捷:平臺在最開始的時候并沒有急著商業(yè)化變現(xiàn),因為我們覺得大多時候快速商業(yè)化靠的是情緒化的消費,比如李一舟的AI課就很會販賣焦慮。但這不是長遠的。
我們從Day 1起就在探索AI的跨模態(tài)表達應(yīng)該用怎樣的方式解決,我們未來的產(chǎn)品和布局都是圍繞回答這個問題去做的,當作為生產(chǎn)力工具的時機成熟了,在更多場景的應(yīng)用真的行之有效了,我們相信商業(yè)化會是一個水到渠成的事情。
36氪:你們覺得商業(yè)化合適的節(jié)點是?
子捷:我們的商業(yè)化最終會圍繞作者。從2023年12月開始我們進行了初步商業(yè)化的探索,一方面是為了彌補算力的消耗,另一方面也是為了更好的補貼作者,優(yōu)質(zhì)內(nèi)容的增長需要有一個良性的回報機制。
AI技術(shù)還處在不斷發(fā)展的階段,我們認為當一項產(chǎn)品或服務(wù)有恒定或者真正的價值出現(xiàn),而不是通過販賣類似于“不學(xué)AI就會被淘汰”的焦慮帶來的時候,正常的推進商業(yè)化才會給行業(yè)帶來更新的動力。
我們覺得一個良性的商業(yè)化應(yīng)該是長期的,要尋找供給和需求的平衡,而不是情緒化的。不然就會像李一舟那樣,容易被反噬。
歡迎交流!
