年初,上海重磅發(fā)布人工智能“模塑申城”實施方案,聚焦“5+6”領(lǐng)域和行業(yè),大力推進(jìn)大模型垂類應(yīng)用。記者最新獲悉,該方案進(jìn)展順利,醫(yī)療、制造兩個重點行業(yè)已率先破題,構(gòu)建起助推垂類應(yīng)用落地的功能性平臺。教育行業(yè)的功能性平臺也即將發(fā)布。
速度之外,功能性平臺本身亦引發(fā)關(guān)注。它們的定位,在于大模型垂類應(yīng)用“中試訓(xùn)練場”,旨在大幅降低大模型使用門檻。
落地不易
在東方醫(yī)院,被喂了6000本醫(yī)學(xué)教材的AI“醫(yī)生伴侶”,已在輔助醫(yī)生進(jìn)行診斷;在振華重工基地,大量并行交付海外的港機(jī)項目,正由多任務(wù)智能體協(xié)助統(tǒng)籌進(jìn)度。
大模型在不容出錯的醫(yī)療和工業(yè)領(lǐng)域,正表現(xiàn)出卓越執(zhí)行力。但殊不知,它們“出道”前卻頗多曲折。
“模型訓(xùn)練一般需要1至2個月,但此前,資源匹配及各項準(zhǔn)備工作的耗時,可能是真正訓(xùn)練的數(shù)倍!币患掖竽P痛诡悜(yīng)用服務(wù)商向記者詳述工業(yè)用戶為降本增效而苦練大模型的“漫漫長路”——
制造業(yè)一旦決定問計于大模型,往往自建團(tuán)隊,第一步是尋找算力;诂F(xiàn)實考慮,企業(yè)多半會選擇中外芯片“混搭”,這就牽出新的問題,即要在多元異構(gòu)的算力下絲滑地完成大模型訓(xùn)練,這絕非易事,需要專業(yè)公司幫助進(jìn)行混合訓(xùn)練、推理加速和算力調(diào)度。另一方面,模型廠商各有強(qiáng)項,有些擅長視頻、圖形和語音處理,有些在長文本記憶、推理運算上有優(yōu)勢。為此,應(yīng)用方又需要挨個試驗評估,才能找到最適配的,其中“交學(xué)費”在所難免。
通常而言,企業(yè)跑到這一階段,基本無力再跑。少數(shù)不甘心的企業(yè),會接續(xù)財力和資源,向外尋找專業(yè)人員,具體工作包括:開發(fā)工具鏈與中間件、外掛知識庫、對模型進(jìn)行反復(fù)精調(diào)和預(yù)訓(xùn)練等。與此同時,企業(yè)還需要為獲取高質(zhì)量語料而奔走……以上諸多環(huán)節(jié),每個環(huán)節(jié)略有偏差,最終訓(xùn)練出的智能體便可能“失之千里”。
因此,制造業(yè)潛心投入6至12個月,結(jié)果大模型垂類應(yīng)用始終難以交付的情況非常多見。
按需“中試”
不難想象,大量垂類應(yīng)用需求方都走過類似“彎路”。在上海市人工智能行業(yè)協(xié)會秘書長鐘俊浩看來,產(chǎn)業(yè)界大可不必“重復(fù)造輪子”。
那么,有沒有可能搭建一個平臺,將前輩“踩坑”“交學(xué)費”后泣血實踐出的成熟方案和諸多工具,進(jìn)行集中歸納展示,讓應(yīng)用方按需取用,看到捷徑的可能?
事實上,早在“模塑申城”實施方案正式發(fā)布前,一個致力于減少大模型試驗成本、幫助企業(yè)高效實現(xiàn)產(chǎn)品化的“中試訓(xùn)練場”,就已經(jīng)由政府部門牽頭推進(jìn)起來。
今年1月4日亮相的上海新型工業(yè)化MaaS(模型即服務(wù))平臺便是成果之一。該平臺的發(fā)起單位包括上海市經(jīng)信委、上海市委網(wǎng)信辦、上海聯(lián)通、上海市先導(dǎo)產(chǎn)業(yè)促進(jìn)中心、上海市人工智能行業(yè)協(xié)會、上海市互聯(lián)網(wǎng)業(yè)聯(lián)合會、西門子(中國)有限公司、上海庫帕思科技有限公司、上海稀宇極智科技有限公司、上海無問芯穹智能科技有限公司、上海羚數(shù)智能科技有限公司等。
從陣容可見,平臺集結(jié)了運營商、算力、行業(yè)語料、基礎(chǔ)模型及應(yīng)用服務(wù)商等,涵蓋大模型垂類應(yīng)用所需各類基礎(chǔ)能力。
記者發(fā)現(xiàn),去年11月成立的上海醫(yī)療領(lǐng)域公共服務(wù)大MaaS平臺、今年1月3日成立的天工人工智能工業(yè)平臺,都遵循這一邏輯。
關(guān)鍵在于,這些平臺足夠垂直、足夠?qū)I(yè)。如新型工業(yè)化MaaS平臺,已天然剔除了與工業(yè)領(lǐng)域大模型不相關(guān)的“輪子”。平臺上陳列的圖形生成式工具,均偏重于工程圖紙分類識別及生成,而非針對電商、游戲等2C端的圖形生成。平臺上五大場景,即研發(fā)設(shè)計、生產(chǎn)制造、裝備運維、運營服務(wù)、供應(yīng)鏈管理等,無不是為工業(yè)場景定做。
“這些平臺如同成衣店,已陳列了大中小號各款服裝,應(yīng)用方可入店試衣,并按需購買。不用再像過去那樣,把各款衣服先一路買下來,回家逐件試是否合身,白白浪費錢。”鐘俊浩說。
據(jù)透露,除醫(yī)療、工業(yè)行業(yè)之外,第三類“中試訓(xùn)練場”有望在教育行業(yè)誕生。
系統(tǒng)打法
“中試訓(xùn)練場”,只是上!澳K苌瓿恰毕到y(tǒng)性打法中的一環(huán)。
上海垂類應(yīng)用加速度的背后,有著上海算力基礎(chǔ)設(shè)施、基礎(chǔ)模型、語料、資本、人才等要素的全面布局與支撐。
大模型訓(xùn)練遵循“尺度定律”,即訓(xùn)練計算量、訓(xùn)練數(shù)據(jù)規(guī)模、模型參數(shù)量,與模型效能之間存在正向關(guān)聯(lián)。簡言之,就是“大力出奇跡”。為此早在2023年,上海就超前提出了10萬卡以上超大規(guī)模智算算力投入。而此次人工智能“模塑申城”實施方案中,又提出到2025年,全市智算規(guī)模力爭突破100EFLOPS(每秒能進(jìn)行100億億次浮點運算的計算能力)。這相當(dāng)于30萬張英偉達(dá)A100芯片的算力,規(guī)模超過目前北京和深圳算力規(guī)模的總和。
超大規(guī)模算力,致力于訓(xùn)練出上海自己的基礎(chǔ)模型。記者獲悉,經(jīng)數(shù)年苦練,上!1+3”基礎(chǔ)模型格局基本形成,包括上海人工智能實驗室書生·浦語大模型,以及商湯、MiniMax、階躍星辰模型。
語料方面,上海成立了全國首家人工智能語料公司“庫帕思”。
由此,算力、基模、語料,已然齊備。有此底氣,去年8月起,上海開始強(qiáng)力推進(jìn)大模型垂類應(yīng)用,敲定“5+6”領(lǐng)域及行業(yè),“5”指智能終端、科學(xué)智能、在線新經(jīng)濟(jì)、自動駕駛、具身智能5個關(guān)鍵領(lǐng)域;“6”指金融、制造、教育、醫(yī)療、文旅、城市治理6個重點行業(yè)。上海市人工智能行業(yè)協(xié)會也隨之轉(zhuǎn)變角色,從過去致力于生態(tài)搭建,轉(zhuǎn)向?qū)W⒂诋a(chǎn)業(yè)平臺建設(shè)。
此外,圍繞產(chǎn)業(yè)對接,上海相繼成立225億元人工智能母基金、600億元人工智能國家大基金,以及100億元人工智能生態(tài)基金,逐漸形成近千億元級的基金規(guī)模。
“所有努力,都在于以全要素支撐保障,來解決人工智能‘叫好不叫座、發(fā)光不發(fā)熱’問題!辩娍『普f。
殊不知,“中試訓(xùn)練場”的目標(biāo)已寫入“模塑申城”方案中,即到今年底,上海要建成50個具有顯著成效的行業(yè)開放語料庫示范應(yīng)用成果。種種跡象表明,而今,上海儼然將整座城市變成了一座人工智能大廠。

關(guān)注精彩內(nèi)容