邊緣計(jì)算在萬物互聯(lián)場景中至關(guān)重要
邊緣計(jì)算是一種分布式計(jì)算架構(gòu),將數(shù)據(jù)處理能力和應(yīng)用程序部署在更接近數(shù)據(jù)源的位置,以提高響應(yīng)性,增強(qiáng)安全性和保護(hù)用戶隱私。 所謂邊緣,一般包括:設(shè)備邊緣和云邊緣。設(shè)備邊緣:一般包括直接的終端設(shè)備以及一些異構(gòu)加速卡、邊緣網(wǎng)關(guān)等設(shè)備。 云邊緣:一般是在設(shè)備邊緣和中心云之間,比如就近部署的邊緣云節(jié)點(diǎn)/邊緣IDC。 萬物互聯(lián)場景中,云端處理存在時(shí)延較長、成本較高、涉及數(shù)據(jù)隱私等問題,引入邊緣計(jì)算至關(guān)重要。
邊緣AI將與云端AI相互補(bǔ)充
邊緣AI將AI能力引入到邊緣計(jì)算場景。 相較于云端集中的AI資源池運(yùn)算,邊緣AI具有實(shí)時(shí)響應(yīng)、增加隱私性、持續(xù)改進(jìn)等優(yōu)勢。 邊緣AI與云端集中的AI是相互補(bǔ)充、相互關(guān)聯(lián)的關(guān)系,而非替代關(guān)系。
AI算力預(yù)計(jì)將靈活分配
我們認(rèn)為AI算力將綜合考慮硬件能力、成本等因素,在邊端和云端靈活分配,簡單涵蓋: 邊端AI小模型場景:本地跑一些語音識別、圖像識別等算法復(fù)雜度比較低、對算力要求比較小的AI模型,同時(shí)也可以通過API調(diào)用云端AI算力/應(yīng)用來實(shí)現(xiàn)更加豐富的AI功能。邊端AI大模型場景:直接在邊緣側(cè)運(yùn)行AI大模型。這類場景我們認(rèn)為可能會(huì)率先在手機(jī)、PC、智能駕駛、具身智能、元宇宙、工業(yè)控制等自身具備一定算力基礎(chǔ)的場景落地。
大模型在邊緣端滲透的條件:模型壓縮+算力提升
大模型向邊緣端滲透,需要算法、硬件協(xié)同優(yōu)化,模型壓縮和邊緣側(cè)計(jì)算性能提升是兩大關(guān)鍵。 模型壓縮:比如GPT-175B 模型約有 1750 億參數(shù),以半精度(FP16)格式計(jì)算,至少占 320GB存儲(chǔ)空間。模型壓縮是大模型向邊緣滲透的其中一個(gè)重要條件。計(jì)算性能提升:包括算力、顯存、功耗等多方面的硬件綜合能力。目前在這兩個(gè)方向上,我們都可以看到不錯(cuò)的進(jìn)展預(yù)期,大模型在邊緣端滲透初見端倪。
算力提升:包括算力、顯存、功耗等多維度
算力:Transformer模型更加依賴大算力的支撐。參考壁仞科技數(shù)據(jù),對于40個(gè)字的文本序列,進(jìn)行一次Bert推理需要7Gflops,由中文翻譯到英文的Seq2Seq模型需要 20 Gflops。標(biāo)準(zhǔn)版BERT模型參數(shù)量是3.4 億個(gè)參數(shù)。 顯存:以一個(gè)100億參數(shù)模型,F(xiàn)P16精度為例,參數(shù)量需要20GB內(nèi)存(10B*2Bytes),梯度需要20GB內(nèi)存(10B*2Bytes),優(yōu)化器狀態(tài)需要40GB內(nèi)存(10B*2Bytes*2),總計(jì)需要80GB內(nèi)存。 功耗:隨著算力的提升,帶來功耗提升,對于芯片的散熱要求將明顯提升,同時(shí)不同場景對于設(shè)備耗電量、待機(jī)時(shí)長等也都有不同要求。
當(dāng)前進(jìn)展:手機(jī)、PC端已經(jīng)出現(xiàn)邊緣大模型場景落地
手機(jī):ChatGPT已推出IOS應(yīng)用,安卓版后續(xù)也會(huì)發(fā)布。高通在搭載第二代驍龍8移動(dòng)平臺(tái)的Android智能手機(jī)上部署Stable Diffusion(參數(shù)超10億個(gè)),在15秒內(nèi)執(zhí)行20步推理,生成一張512x512像素的圖像。 PC:微軟和高通、英特爾在AI領(lǐng)域展開合作,部署推出搭載AI引擎的PC產(chǎn)品。具身智能:英偉達(dá)創(chuàng)始人黃仁勛表示AI下一個(gè)浪潮將是“具身智能”,并且公布了多模態(tài)具身人工智能系統(tǒng)Nvidia VIMA。
邊緣計(jì)算市場快速增長
STL Partners數(shù)據(jù)顯示,邊緣計(jì)算潛在市場將在10年內(nèi)以48%的復(fù)合年增長率從2020年的90億美元增長到2030年的4450億美元,其中邊緣基礎(chǔ)設(shè)施的增長速度是最快的。 億歐智庫數(shù)據(jù)顯示,2021年我國邊緣計(jì)算市場規(guī)模已經(jīng)達(dá)到427.9億元,其中邊緣硬件市場規(guī)模為281.7億元,邊緣軟件與服務(wù)市場規(guī)模達(dá)146.2億元,2021-2025年中國邊緣計(jì)算產(chǎn)業(yè)規(guī)模預(yù)計(jì)年復(fù)合增速達(dá)到46.81%,2025年邊緣計(jì)算市場整體規(guī)模將達(dá)1987.68億元。
邊緣計(jì)算產(chǎn)業(yè)鏈:新增AI,強(qiáng)化算力與連接
從產(chǎn)業(yè)鏈角度,邊緣AI核心在于引入邊緣側(cè)的AI能力,進(jìn)一步增強(qiáng)邊緣側(cè)的算力能力、連接能力。重點(diǎn)包括AI芯片、算力模組、邊緣網(wǎng)關(guān)/服務(wù)器/控制器等硬件、AI算法/邊緣計(jì)算平臺(tái)等軟件環(huán)節(jié)。
AI芯片:專門用于處理AI大量計(jì)算任務(wù)的模塊
AI芯片是指專門用于處理人工智能應(yīng)用中的大量計(jì)算任務(wù)的模塊,其他非計(jì)算任務(wù)則更多仍由CPU負(fù)責(zé)。從技術(shù)架構(gòu)來看,Al 芯片主要分為 GPU、FPGA、ASIC三大類。其中,GPU 是較為成熟的通用型人工智能芯片,F(xiàn)PGA 和 ASIC 則分別是針對人工智能需求特征的半定制和全定制芯片。 典型AI運(yùn)算通常需要CPU或者ARM內(nèi)核來執(zhí)行調(diào)度處理,大量的并行計(jì)算靠GPU、FPGA或ASIC來完成。
模組:標(biāo)準(zhǔn)化的模組形態(tài)可以有效滿足物聯(lián)網(wǎng)碎片化需求
無線模組是物聯(lián)網(wǎng)中的連接器件,無線模組將芯片、存儲(chǔ)器、功放器件等集成在一塊線路板上,實(shí)現(xiàn)無線電波收發(fā)、信道噪聲過濾及模擬信號與數(shù)字信號之間相互轉(zhuǎn)換,并提供標(biāo)準(zhǔn)接口的功能模塊,終端借助無線模組可以實(shí)現(xiàn)通信或定位。 物聯(lián)網(wǎng)的碎片化需求,基于芯片的開發(fā)技術(shù)門檻高,客戶會(huì)選用標(biāo)準(zhǔn)的模組,直接使用模組的標(biāo)準(zhǔn)硬件接口和嵌入式應(yīng)用協(xié)議,不必關(guān)心底層邏輯,只要做好應(yīng)用側(cè)適配。
智能控制器:家電等場景實(shí)現(xiàn)智能化的“大腦”
智能控制器和邊緣節(jié)點(diǎn)算力同樣直接相關(guān)。 在智能家居、家電、工業(yè)控制等場景中,智能控制器是其實(shí)現(xiàn)智能化的大腦。 AI帶動(dòng)下游智能化能力提升,智能場景的功能及其交互方式將更加豐富,包括機(jī)器視覺、語音識別等AI算法將更多與應(yīng)用場景結(jié)合,同時(shí)控制器中也將引入算力芯片等,對于智能控制器的需求量和ASP也將會(huì)是直接正向的帶動(dòng)。
聯(lián)系我們
您好,我們隨時(shí)為您提供服務(wù)
全國統(tǒng)一服務(wù)熱線:4008081607
銷售熱線:13912903125