國際口語(yǔ)翻譯先進(jìn)研究聯(lián)盟(U-Star)日前在倫敦發(fā)布23國語(yǔ)言翻譯實(shí)驗系統,以多國語(yǔ)言翻譯服務(wù)迎接奧運。作為該聯(lián)盟的發(fā)起單位之一,中科院自動(dòng)化所承擔了其中中英互譯項目。
此次發(fā)布會(huì )由日本情報通信研究機構(NICT)主辦,來(lái)自26個(gè)研究機構的代表出席發(fā)布會(huì ),會(huì )上進(jìn)行了多人同時(shí)運用不同語(yǔ)言的在線(xiàn)翻譯展示。
U-Star此次發(fā)布的系統名叫“Voice Tra4U-M”,涵蓋了世界應用較為廣泛的23個(gè)語(yǔ)種,并能同時(shí)支持5人以移動(dòng)終端在不同地點(diǎn)用不同語(yǔ)種進(jìn)行實(shí)時(shí)對話(huà)?;谠撓到y,會(huì )話(huà)用戶(hù)在手機上以各自語(yǔ)種通話(huà),系統會(huì )將各方的語(yǔ)音信息通過(guò)網(wǎng)絡(luò )傳送到后臺云計算中心,計算中心首先對口語(yǔ)語(yǔ)音進(jìn)行識別,并將語(yǔ)音信息轉換為文本信息,隨后將文本信息翻譯為會(huì )話(huà)各方所需語(yǔ)種的文本信息,最后通過(guò)文本轉語(yǔ)音模塊,將翻譯后的目標語(yǔ)音發(fā)送到相應會(huì )話(huà)用戶(hù)的手機上,從而實(shí)現跨語(yǔ)種對話(huà)。
實(shí)現無(wú)障礙的跨語(yǔ)言溝通一直是機器翻譯追求的目標。從1945年信息論先驅W(xué)arren Weaver提出機器翻譯的可計算性,計算機自動(dòng)翻譯之路已走了60多年。而由于語(yǔ)音識別因口音問(wèn)題帶來(lái)的大量模糊,以及周?chē)h(huán)境中的噪音影響,正確可靠的口語(yǔ)翻譯并不是一件容易的事,科學(xué)界一度將此技術(shù)突破的難度比作“人類(lèi)登陸火星”。
近年來(lái),互聯(lián)網(wǎng)海量數據的爆炸性增長(cháng)、大規模云計算技術(shù)應用為口語(yǔ)翻譯技術(shù)的突破提供了有力的技術(shù)支撐,而基于3G移動(dòng)通信技術(shù)的智能終端普及為該項技術(shù)從實(shí)驗室走向應用提供了理想的平臺,降低了此技術(shù)的應用門(mén)檻,使其快速發(fā)展起來(lái)。
“我們要讓普通民眾都可以應用此項技術(shù),僅僅通過(guò)手機終端就可進(jìn)行無(wú)語(yǔ)言障礙的流暢對話(huà)?!盢ICT發(fā)言人堀智織教授介紹。但目前,翻譯速度受到網(wǎng)絡(luò )環(huán)境的影響,在網(wǎng)絡(luò )條件良好的條件下,整個(gè)翻譯交互過(guò)程在數秒鐘之內即能完成,為用戶(hù)帶來(lái)了便捷和高效的使用體驗。
該項目中,中科院自動(dòng)化所承擔了其中中英互譯項目,其中包括漢語(yǔ)普通話(huà)識別、中文-英文雙向翻譯以及漢語(yǔ)普通話(huà)合成等四大任務(wù)。據中科院自動(dòng)化所副所長(cháng)徐波介紹:“我所研究成果的最大突破,便是無(wú)專(zhuān)業(yè)領(lǐng)域的限定。例如以往總是考慮在旅游中會(huì )用到的詞匯,而在真實(shí)情況下很難判斷語(yǔ)句實(shí)際應用的可能性,使得系統的可靠性很難保證。云計算技術(shù)和3G技術(shù)的推進(jìn),讓我們能獲取海量數據信息,運用有效的算法進(jìn)行翻譯轉換,因此該系統并沒(méi)有限定翻譯領(lǐng)域?!?
目前,該所自主研發(fā)的基于A(yíng)ndroid和iPhone手機的中文-英文雙向口語(yǔ)翻譯系統“紫冬口譯Beta版”(又名“由你說(shuō)”)已開(kāi)發(fā)完成,并將于倫敦奧運會(huì )前在A(yíng)ndroid和iphone平臺上免費提供下載。該系統加入了奧運場(chǎng)館、競賽項目等奧運相關(guān)詞匯。在奧運期間,用戶(hù)可以在3G或者無(wú)線(xiàn)局域網(wǎng)環(huán)境中通過(guò)該軟件獲得在線(xiàn)中英口語(yǔ)翻譯服務(wù)。