夢(mèng)想不息,創(chuàng )新不止。百度從成立的那一天起,就始終致力于人工智能技術(shù)(AI)的研發(fā)與應用。
百度高級副總裁、AI技術(shù)平臺體系(AIG)總負責人王海峰告訴《中國科學(xué)報》,2010年初,基于多年的技術(shù)積累,百度開(kāi)始全面布局AI,涵蓋自然語(yǔ)言處理、語(yǔ)音、圖像、深度學(xué)習、個(gè)性化推薦等技術(shù)的研發(fā)和應用,這些AI技術(shù)在悄然地改變著(zhù)百度內部的各個(gè)產(chǎn)品。而外界意識到百度從技術(shù)里“謀未來(lái)”則是在2014年2月。
彼時(shí),“2014中國民營(yíng)經(jīng)濟大家談”在全國工商聯(lián)舉行,百度董事長(cháng)兼首席執行官李彥宏首次對外披露,百度目前正在推進(jìn)一個(gè)名為“百度大腦”的項目,利用計算機技術(shù)模擬人腦,已經(jīng)可以做到2~3歲孩子的智力水平。同年7月1日,“百度大腦”亮相《人民日報》。從此“百度大腦”被外界廣為關(guān)注。
形成完整的技術(shù)體系
“百度大腦先后完成了基礎能力搭建和核心技術(shù)初步開(kāi)放,形成了完整的技術(shù)體系,逐步開(kāi)放AI核心能力?!蓖鹾7褰榻B,到了2018年,百度大腦已經(jīng)進(jìn)入“多模態(tài)深度語(yǔ)義理解”、并且核心AI能力豐富全面開(kāi)放的階段。
“多模態(tài)深度語(yǔ)義理解”是指對文字、聲音、圖片、視頻等多模態(tài)的數據和信息進(jìn)行深層次多維度的語(yǔ)義理解,包括數據語(yǔ)義、知識語(yǔ)義、視覺(jué)語(yǔ)義、語(yǔ)音語(yǔ)義一體化和自然語(yǔ)言語(yǔ)義等多方面的語(yǔ)義理解技術(shù)。
在語(yǔ)音方面,“百度大腦”中的語(yǔ)音語(yǔ)義一體化技術(shù),讓機器準確識別并理解人說(shuō)的話(huà),實(shí)現更自然的人機對話(huà),最具挑戰的遠場(chǎng)語(yǔ)音識別的準確率提升了10個(gè)百分點(diǎn)。在語(yǔ)音合成方面,WaveNet+拼接的情感語(yǔ)音合成技術(shù),使得流暢度和自然度也大幅提升。
百度還實(shí)現了“一次喚醒連續交互”的技術(shù)突破,讓機器在語(yǔ)音交互中更具備“人”的特質(zhì),用戶(hù)只需喚醒一次就可以連續多輪對話(huà),機器能夠準確識別用戶(hù)說(shuō)話(huà)時(shí)的猶豫停頓、能夠區分并跟隨首次喚醒的用戶(hù)等,用戶(hù)的體驗更自然、流暢。
在計算機視覺(jué)方面,“百度大腦”的視覺(jué)語(yǔ)義化技術(shù)可以讓機器在“看清”“看準”基礎上,具備“看懂”的能力。三維人臉技術(shù)將活體識別正確率由95.26%提升至99.55%,還通過(guò)整合場(chǎng)景分類(lèi)、圖像分割、SLAM等核心能力實(shí)現對場(chǎng)景的三維感知。在視頻分析方面,三維人體檢測及跟蹤的準確率極大提升,可以應用到新零售等場(chǎng)景中。
基于“百度大腦”的視覺(jué)語(yǔ)義化技術(shù),機器可以看懂視頻,并提煉出結構化語(yǔ)義知識。比如:機器可以識別出世界杯比賽視頻中的球員、裁判、球,以及球門(mén)、球場(chǎng)線(xiàn)等人、物和場(chǎng)景,可以捕捉射門(mén)、進(jìn)球、角球、任意球、換人等事件?;谶@樣的信息,既可以完成機器人自動(dòng)解說(shuō),還可以進(jìn)行精彩片段集錦,以及各種數據統計分析等。
語(yǔ)言是知識和思維的載體,自然語(yǔ)言處理(NLP)早已成為各AI巨頭的必爭之地。王海峰表示,百度在自然語(yǔ)言處理領(lǐng)域經(jīng)過(guò)多年沉淀與積累,目前在對話(huà)理解和閱讀理解方面取得了突破性的進(jìn)展。以對話(huà)理解為例,通過(guò)研發(fā)最新的深層注意力匹配模型,百度大腦的對話(huà)效果比已知的最好結果又提升了4.1%。
在閱讀理解技術(shù)上,“百度大腦”已經(jīng)閱讀了千億量級的文章,相當于6萬(wàn)個(gè)中國國家圖書(shū)館的藏書(shū),并由此積累了億級實(shí)體、千億事實(shí)的知識,百度閱讀理解技術(shù)已經(jīng)在百度搜索和信息流中廣泛應用,并使其越來(lái)越智能化。
“通過(guò)持續獲取和積累知識,百度大腦的理解能力不斷升級,智能水平顯著(zhù)提升,進(jìn)而能夠更好地服務(wù)用戶(hù)?!蓖鹾7逭f(shuō)。
開(kāi)放促進(jìn)百度AI落地應用
20年前,當互聯(lián)網(wǎng)剛剛興起的時(shí)候,“數字?zhù)櫆稀币欢瘸蔀樯鐣?huì )現象,并有越拉越大之勢。百度一直致力于彌補這樣的鴻溝,讓人們更平等、便捷地獲取信息。
當前,AI是新的生產(chǎn)力,它正在變革創(chuàng )新行業(yè)。人工智能和實(shí)體經(jīng)濟深度融合,正成為這個(gè)時(shí)代的核心驅動(dòng)力。但無(wú)論是AI算法所需的技術(shù)能力,還是硬件購置花費的成本,對于傳統企業(yè)來(lái)說(shuō)都是極高的門(mén)檻。
如何避免產(chǎn)生新的智能鴻溝?“百度的答案是開(kāi)放?!蓖鹾7逭f(shuō),“把百度多年積累的AI能力開(kāi)放出來(lái),通過(guò)數據、算力和算法的不斷迭代,讓每一個(gè)開(kāi)發(fā)者能夠接觸到全球最先進(jìn)的AI技術(shù),讓每一個(gè)公司、每一個(gè)企業(yè)都能夠很方便地使用這些最先進(jìn)的AI能力?!?/p>
據介紹,“百度大腦”每天被調用次數超過(guò)4000億次。調用的人中既有AI工程師,也有“零AI基礎”的入門(mén)者,還有來(lái)自各行各業(yè)希望用AI創(chuàng )新業(yè)務(wù)、為業(yè)務(wù)轉型升級的企業(yè)。他們雖然身份不同、目標不同,但都從百度找到了最適合的AI接入方式。
百度大腦不斷進(jìn)化,積極賦能?chē)窠?jīng)濟重點(diǎn)產(chǎn)業(yè),通過(guò)多元化的人工智能技術(shù)開(kāi)放模式,加速AI技術(shù)落地應用,繁榮AI技術(shù)生態(tài),逐步加速各行各業(yè)與人工智能的融合。
在工業(yè)應用方面,借助百度AI能力打造的智能零件分揀機,實(shí)現零件的自動(dòng)分揀,對零件的各種尺寸、外觀(guān)缺陷進(jìn)行精準快速檢測,分揀精度可達到90%,預測速度較同類(lèi)產(chǎn)品快20%。借助三維視覺(jué)、增強學(xué)習和邊緣計算等AI技術(shù),百度推出無(wú)人自主挖掘機,探索嚴酷環(huán)境下代替人工的自動(dòng)工程機械,實(shí)現少人化和無(wú)人化的智能施工。制造業(yè)與AI的深度融合,不僅可以解放人力,還可以激活產(chǎn)業(yè),推動(dòng)智能制造的發(fā)展。
“AI+醫療”是備受關(guān)注的領(lǐng)域?;凇鞍俣却竽X”打造的眼底AI篩查一體機,使基層醫療機構具備眼底篩查能力,幫助人們更早發(fā)現和預防眼科疾病。百度AI眼底篩查系統可以幫助患者快速篩查包括糖網(wǎng)、青光眼、黃斑病等多種眼疾病,目前已在多個(gè)地區落地,累計服務(wù)百萬(wàn)人次。
“百度大腦”還輸出全流程客服智能化解決方案,相對人工客服,人工通話(huà)接單量降低70%,人工客服通話(huà)人均時(shí)長(cháng)降低50%;相對傳統按鍵智能客服,人工通話(huà)接單量降低20%,人工客服通話(huà)人均時(shí)長(cháng)降低15%,從而提升行業(yè)效率,降低業(yè)務(wù)成本。
利用百度AI技術(shù)改造傳統行業(yè)的案例正在不斷涌現,作為百度AI多年技術(shù)積累和業(yè)務(wù)實(shí)踐之集大成者的百度大腦,已經(jīng)深入交通、醫療、零售、工業(yè)等多個(gè)領(lǐng)域,且成效顯著(zhù)。
王海峰表示,未來(lái)百度將繼續把自己積累多年的AI技術(shù),即數據、算力、算法開(kāi)放出來(lái),讓人們擁有平等獲取AI的能力,一起跨越“智能鴻溝”。
摘自《中國科學(xué)報》