新基建浪潮來臨,AI作為其重要篇章,將開啟產業(yè)智能化升級的新高潮。7月25日, 2020全球人工智能技術大會(GAITC)在杭州開幕,來自國內外產學研用各界的學者、專家、院士們,圍繞人工智能技術發(fā)展和產業(yè)應用實踐展開熱烈探討。為幫助國內外觀眾更好地理解報告內容,百度翻譯同傳為本次大會提供了機器同傳服務。
會上,百度CTO王海峰在演講中揭秘百度的AI新基建發(fā)展思路。他表示,人工智能作為新一輪科技革命和產業(yè)變革的重要驅動力量,具有很強的通用性,已進入工業(yè)大生產階段,具備了標準化、自動化和模塊化的工業(yè)大生產特征。人工智能既是新基建重點建設的新型基礎設施,也與其他新型基礎設施有重要的協同效應。人工智能的高速發(fā)展得益于數據井噴、算力突破和算法的創(chuàng)新,因此,完備的AI基礎設施包括數據、算力和算法等各個方面。百度打造的AI基礎設施是百度大腦,以它為基礎,通過百度智能云,將AI能力向各行各業(yè)輸出,助力各行各業(yè)的智能化升級,加速產業(yè)智能化的進程。
作為百度建設的軟硬一體AI基礎設施,百度大腦已發(fā)展成為AI大生產平臺,具備了標準化、自動化和模塊化的特征。百度大腦的基礎層包括算力、數據技術,以及以AI基礎設施的核心基礎——飛槳深度學習平臺為核心的算法平臺,感知層包括語音、視覺、增強現實和虛擬現實等技術,認知層是語言與知識技術。同時,百度大腦還擁有縱貫各層完整的安全體系,以及面向開發(fā)者和合作伙伴的AI平臺與生態(tài)。
百度在包括語音、視覺、語言與知識等AI核心技術上,持續(xù)創(chuàng)新突破,保持世界領先水平。
例如,在語音方面,流式多級截斷注意力模型讓語音識別的效果大幅提升;針對遠場語音處理研發(fā)的基于麥克風陣列的聲音增強和聲學建模一體化的端到端識別,使得語音識別的錯誤率降低了40%到50%;而在語音合成技術上,百度可做到動態(tài)組合聲音的音色和風格,使得單一風格的合成音具備向多種風格遷移的能力。
視覺方面,百度的視覺技術布局全面,包括圖像、視頻、AR/VR等等,以及人臉、視文字、車輛、人體等各種垂類的識別技術。同時,百度還開發(fā)了視覺AI SDK,3D結構光模組等等,構建軟硬一體的視覺技術能力。
而在語言與知識技術方面,主要解決理解語言,賦予機器“認知”能力這一挑戰(zhàn)性難題。百度打造了世界上最大的多源異構知識圖譜,擁有超過50億實體和超過5千億事實?沙掷m(xù)學習的知識增強語義理解框架百度文心(ERNIE),將深度學習與知識相結合,并可以進行持續(xù)的學習,語言理解能力不斷提升。進一步地,ERNIE提出了業(yè)界首個融合場景圖知識的多模態(tài)預訓練模型ERNIE-ViL,在多模態(tài)語義理解上取得突破。
基于百度大腦,百度通過智能云,將AI能力向各行各業(yè)輸出。百度智能云以“以云計算為基礎,以人工智能為抓手,聚焦重要賽道”為戰(zhàn)略,融合云計算、百度大腦、大數據等百度核心技術,提供了通用的基礎云平臺、AI中臺、知識中臺等多層次的平臺,以及為各行各業(yè)賦能的智能應用和解決方案。
王海峰介紹,眼下,各行各業(yè)正在借助AI實現智能化升級,而AI也必須與企業(yè)的實際應用場景深度結合。但現階段,大多數企業(yè)都缺乏AI的基礎能力和支撐AI開發(fā)及應用的平臺。百度智能云的AI中臺,可以幫助企業(yè)搭建自己的AI平臺,從而擁有AI開發(fā)和應用的自主能力,集約化管理企業(yè)AI能力和資源,統(tǒng)籌規(guī)劃企業(yè)智能化升級版圖。
除了支持企業(yè)AI開發(fā)應用的自主能力外,百度智能云還打造了知識中臺,助力企業(yè)的知識生產、知識加工以及知識應用,進一步滿足業(yè)務場景智能化的需求。
而在當前新基建浪潮下,百度智能云完備的產業(yè)智能化升級服務,正在各個領域中深度賦能產業(yè)。
例如,百度智能云提供的智慧城市解決方案,包括城市感知中臺、城市AI中臺、城市數據中臺、城市交互中臺等等,支持各種智能應用場景,讓城市更安全、更從容、更通暢、更宜居。
在與普通大眾息息相關的醫(yī)療衛(wèi)生方面,百度智能云打造的智慧醫(yī)療體系包括醫(yī)療AI中臺和醫(yī)療知識中臺,涵蓋篩查、診斷、管理三個重要環(huán)節(jié)。目前,已經服務27個省自治區(qū)市、超過1500家基層醫(yī)療機構,輔助數萬名醫(yī)生,服務人次超過了2500萬。
在國家加快推進新基建的背景下,百度正在通過AI新基建為產業(yè)智能化的進一步深入發(fā)展貢獻力量。正如王海峰所說,AI新基建將加速產業(yè)智能化,促進經濟高質量發(fā)展。