
在無數(shù)科幻游戲、科幻電影以及小說中,當(dāng)科技爆發(fā)到了一定階段,總少不了AI的身影。它們不吃不喝,卻又無所不知,扮演著人類身邊“完美搭檔”的角色。
微軟游戲《光環(huán)》中角色——科塔娜(圖源網(wǎng)絡(luò))
正如一切幻想都需要建立在認(rèn)知之上,人們對于AI的終極思考和幻想,無論如何也是繞不開現(xiàn)實世界的。
實際上,盡管人工智能代表了最前沿科學(xué)技術(shù),但它距離我們并不遙遠(yuǎn),對大部分人來說,日常用到AI的次數(shù),其實遠(yuǎn)比大家想象中多得多。
AI,隨處可見
眼下談及AI,大家會想到以ChatGPT代表的眾多生成式AI應(yīng)用。它們可以自動生成文本、摘要、翻譯、對話,也可以用于生成逼真的圖像、視頻和動畫,甚至協(xié)助用戶創(chuàng)作音樂,幫助開發(fā)者撰寫代碼等等。
AI能做的事情遠(yuǎn)不止這些,只不過ChatGPT的到來,讓人們對于AI能做什么有了切實體驗。
手機人臉識別
其實在日常生活中,AI應(yīng)用隨處可見,比如在AI視覺方面,小區(qū)的門禁系統(tǒng),手機的人臉解鎖,超市的人臉支付等等都用到了AI人臉識別技術(shù)。
還有每個人都離不開的智能手機,同樣應(yīng)用了大量的AI技術(shù)。最典型的就是影像場景,手機以遠(yuǎn)不及相機的光學(xué)素質(zhì)卻能拍出媲美專業(yè)設(shè)備的夜景照片和視頻,AI在其中起到了決定性的作用。
以最新的驍龍8Gen2第二代驍龍8旗艦手機為例,高通給第二代驍龍8移動平臺注入了強悍的AI“靈魂”,使得智能手機的拍照體驗得到了進一步的提升。高通在驍龍平臺打造了業(yè)內(nèi)首個“認(rèn)知ISP”,由此還實現(xiàn)了一種叫“實時語義分割”的技術(shù),該技術(shù)有點類似PS中的圖像分層,可針對圖像中的不同區(qū)域進行獨立優(yōu)化,大到背景,小到面部細(xì)節(jié),都能進行獨立優(yōu)化。
具體來說,大家平時拍照時用到的背景虛化,或者更換風(fēng)格化背景圖案,以及針對人像用到的一些美顏、美膚處理等等,借助實時語義分割實現(xiàn)起來將變得更加輕松。
這是AI在移動影像中的簡單用例,但透過這個例子,不難發(fā)現(xiàn)今天的智能手機早已和AI深深綁定。事實上,除了OCR掃描、智能語音助手、圖庫分類、屏幕識別、面部識別這類比較常見的手機AI應(yīng)用外,AI還在網(wǎng)絡(luò)連接、音頻、游戲、續(xù)航方方方面發(fā)揮著重要作用,比如上網(wǎng)時,合理分配網(wǎng)絡(luò),讓蜂窩信號、Wi-Fi更穩(wěn)定;玩游戲時,智能調(diào)用系統(tǒng)資源,讓畫面更流暢等等。
終端側(cè)算力大漲,AI大模型下沉
和智能手機一樣,AI在汽車、XRP、PC、物聯(lián)網(wǎng)領(lǐng)域同樣有著廣泛的應(yīng)用,也正是基于這種“AI+”的形式,從而涌現(xiàn)出了更多創(chuàng)新的應(yīng)用場景,進一步豐富用戶體驗。
無論是手機還是汽車,作為獨立的終端產(chǎn)品,與AI相結(jié)合確實有那么點天作之合的意思。但必須承認(rèn),盡管此前業(yè)界討論AI的聲量很大,但距離大模型AI真正落地終端側(cè),還是有一段距離的。
不同于云端AI,在終端側(cè)部署AI不是說想做就能輕易實現(xiàn)的,比如算力問題。和云端可以提供的算力相比,終端側(cè)所能提供的算力就很有限了,像目前比較火的一些大模型,過去就很難在智能手機這樣的終端產(chǎn)品上運行。這就意味著,想要AIGC應(yīng)用在智能手機上有個很好的體驗,其實很不容易,正如在云端生成一張AI圖片可能只需要十幾秒,但在手機上可能就要幾分鐘甚至更久,體驗可以說是大打折扣。
不過“有難度”并不代表“沒可能”。其實早在今年2月份,高通就已經(jīng)發(fā)布了全球首個運行在Android手機上的Stable Diffusion終端側(cè)演示,Stable Diffusion本身就是一個基于輸入的文本生成圖片的AI模型,它的參數(shù)超過10億,這樣的參數(shù)規(guī)模過去只能在云端計算集群內(nèi)運行,現(xiàn)如今也終于可以在終端側(cè)運行了。
很顯然,沒有強力的算力作為支撐,實現(xiàn)這樣的“壯舉”幾乎是不可能的。而高通之所以可以首個實現(xiàn),這里不得不說到驍龍移動平臺。
以最新的第二代驍龍8移動平臺為例,這款芯片的AI計算能力已經(jīng)是天花板級別的了。
根據(jù)全球知名的AI基準(zhǔn)測試網(wǎng)站AI-Benchmark排名統(tǒng)計,我們發(fā)現(xiàn)在前十位的智能手機中,搭載第二代驍龍8移動平臺的機型就占據(jù)了八席,其中就包括第一到第七名。
事實上,第二代驍龍8移動平臺能夠在AI計算方面大殺四方并不令人感到意外,它搭載最新的高通AI引擎,全新升級了Hexagon處理器,支持更高規(guī)格的張量加速器,并且增加硬件加速,從而可以快速高效地運行Transformer網(wǎng)絡(luò),這也使得第二代驍龍8在自然語言處理應(yīng)用上有著更突出的優(yōu)勢。
除此之外,驍龍移動平臺一向具備出色的可拓展性,大部分驍龍移動平臺通常都有一個Hexagon處理器,但如果面向的對象對AI計算量需求更高,比如汽車,則會使用兩個甚至多個Hexagon處理器來提高算力,這無疑為在更多元的終端設(shè)備上部署AI提供了強大的算力支持。
高通AI軟件棧,跨終端部署利器
借助第二代驍龍8移動平臺,讓我們看到了高通在硬件方面的一些優(yōu)勢,其實在推動終端側(cè)AI部署過程中,高通在軟件方面所提供的技術(shù),同樣起到至關(guān)重要的作用。
此前高通發(fā)布了可使AI由單一終端較容易地擴展到其他各種終端的高通AI軟件棧(Qualcomm AI Stack),它為OEM廠商和開發(fā)者提供一套完整的AI解決方案,這套方案是集成所有AI框架、開發(fā)者庫、操作系統(tǒng)的整合平臺,也同時具備了“一次開發(fā),多終端使用”的特點,簡單來說,用戶只需要開發(fā)一次模型,就能在不同的高通產(chǎn)品創(chuàng)建、優(yōu)化和部署其AI應(yīng)用,充分利用高通AI引擎的性能。
前面我們提到了高通AI Research利用高通AI軟件棧執(zhí)行全棧AI優(yōu)化,這一全棧優(yōu)化最終讓Stable Diffusion能夠在智能手機上運行,在15秒內(nèi)執(zhí)行20步推理,生成一張512x512像素的圖像。
而在智能手機上運行Stable Diffusion只是開始。目前,高通已經(jīng)能夠?qū)崿F(xiàn)在搭載驍龍計算平臺的筆記本電腦上運行Stable Diffusion,憑借行業(yè)領(lǐng)先的高通AI引擎,基于驍龍計算平臺的筆記本電腦在MLCommons V3.0上率先實現(xiàn)了出色的MLPerf基準(zhǔn)測試結(jié)果。在終端側(cè)運行如此大規(guī)模AI用例,高通再一次走在了行業(yè)前面。
最后:
作為終端側(cè)AI的重要推動者,高通已經(jīng)成為推動終端側(cè)AI規(guī)?;l(fā)展的關(guān)鍵力量,相關(guān)技術(shù)正在賦能數(shù)十億的終端產(chǎn)品。如今看來,無論是單一產(chǎn)品優(yōu)秀的性能功耗表現(xiàn),還是規(guī)模化成果,以及跨AI應(yīng)用、模型、硬件與軟件的全棧終端側(cè)AI優(yōu)化,高通都存在著顯著優(yōu)勢。
很顯然,在AI即將迎來“質(zhì)變”的關(guān)鍵時刻,高通正扮演著愈發(fā)關(guān)鍵的角色。甚至就在不久前,高通正式發(fā)布《混合AI是AI的未來》白皮書,明確提出了云邊一體混合AI發(fā)展路徑。從架構(gòu)設(shè)計來看,混合AI適用于幾乎所有生成式AI應(yīng)用和終端領(lǐng)域,而且具備低成本、高效率、低能耗、運行穩(wěn)定、隱私性強等優(yōu)勢,對開發(fā)者,對用戶,都可以說是非常值得期待的。
無論如何,AI發(fā)展的終極目標(biāo)還是更好服務(wù)于人,這個過程肯定艱難的,不過也正因為有了更多人的努力,才讓目標(biāo)離我們越來越近,直至觸手可及。
