來(lái)源:科技日報
本報記者房琳琳
3月,對于微軟亞洲研究院院長(cháng)洪小文來(lái)說(shuō),最興奮的事莫過(guò)于參加“微軟技術(shù)節”了。
他很認同西安交通大學(xué)校長(cháng)鄭南寧院士的感觸:“無(wú)所不在的計算機,造就了無(wú)所不在的微軟,同時(shí)微軟的創(chuàng )造活動(dòng)加速推動(dòng)了現在計算機技術(shù)在人的社會(huì )及生產(chǎn)活動(dòng)的各個(gè)方面的滲透?!?BR> 此次技術(shù)節,微軟亞洲研究院帶去了不少令世界IT同行感到振奮的“中國創(chuàng )新”,他們的創(chuàng )新技術(shù),也讓世界各地來(lái)訪(fǎng)的記者為之嘖嘖稱(chēng)贊。
筆者試著(zhù)解讀其中之二三,以饗廣大讀者。
動(dòng)態(tài)煙實(shí)時(shí)測繪:讓電影煙霧效果更形象
創(chuàng )意由來(lái):很多愛(ài)玩游戲的朋友都有同感,做得越接近真實(shí)世界的游戲畫(huà)面越能引人入境。而其中表現自然現象的哪怕一個(gè)小細節,背后所蘊含的都是巨大的數據運算量。
現在表現建筑光的特效技術(shù)都已經(jīng)成熟,但是,諸如云、煙、水、皮膚等越是自然的東西卻越難表現得真實(shí)。
煙的繪制是計算機圖形學(xué)中一個(gè)具有挑戰性的問(wèn)題,因為光在煙中的傳播非常復雜。于是,微軟亞洲研究院網(wǎng)絡(luò )圖形組的研究員周昆和副研究員任重,就想實(shí)現“動(dòng)態(tài)煙的實(shí)時(shí)測繪”。
任重對記者解釋?zhuān)诓紳M(mǎn)煙的三維空間中,光在每一點(diǎn)都會(huì )被吸收或者散射,由于煙在空間中的不規則性,空間中每一點(diǎn)的吸收和散射程度都是不相同的。
即使是對一個(gè)靜止的煙,這些吸收和散射的次數和復雜度都會(huì )帶來(lái)龐大的計算“開(kāi)銷(xiāo)”,對于動(dòng)態(tài)煙來(lái)說(shuō),這種計算代價(jià)更為昂貴。也就是說(shuō),“實(shí)時(shí)”的難度,在于獲得大數據量的處理能力。
據了解,這項技術(shù)在全世界范圍,屬于國人“首創(chuàng )”。
按照以往的技術(shù)水平,每20秒的動(dòng)態(tài)煙的數據處理量要達到4—5個(gè)G,而任重小組創(chuàng )新了一種實(shí)時(shí)煙的繪制算法,可以減少10—20倍的數據量。如果做個(gè)簡(jiǎn)單的計算,原來(lái)用1-2天來(lái)處理復雜實(shí)時(shí)光源,現在只用幾秒就可以解決了。
這樣,電影導演就可以在拍攝現場(chǎng)加入想要的煙霧效果,而不需后期大量的離線(xiàn)繪制后再回放成動(dòng)畫(huà)了,游戲也是如此。
那么,除了電影和游戲,還有哪些應用領(lǐng)域呢?微軟亞洲研究院常務(wù)副院長(cháng)郭百寧說(shuō),“防火門(mén)和指示燈的設計也需要用到這個(gè)技術(shù)”———一旦發(fā)生火災大家都會(huì )沿著(zhù)指示燈標注的路去逃生,大家知道火燃起來(lái)就有煙霧,煙霧會(huì )在這里面到處跑,這些標志到時(shí)候還能不能看到呢?所以在設計的時(shí)候就需要模擬煙霧的擴散路徑。
洪小文補充說(shuō):“現在非常通用的航空模擬器,也需要用到這個(gè)技術(shù)?!痹诿绹硷w機駕照的人非常多,因此美國很流行航空模擬器,但是里面有一個(gè)東西做得不好———就是云霧?!盀槭裁催@個(gè)東西重要呢?實(shí)際上飛機出事就是因為云霧等惡劣天氣導致的。怎么讓飛行模擬器做到更真實(shí)化,在那種情況下能夠辨別你的飛行方向是正確的呢?這個(gè)動(dòng)態(tài)煙的實(shí)時(shí)繪制技術(shù)就很重要了。
能說(shuō)會(huì )唱的小人頭:讓您時(shí)時(shí)刻刻聽(tīng)“演講”
創(chuàng )意由來(lái):我們很早以前就通過(guò)看電影,或者讀科幻小說(shuō)知道了“機器人”這個(gè)名詞了,但是到目前為止,真正能夠動(dòng)起來(lái)的機器人還只是按照一定程序作機械運動(dòng)的流水線(xiàn)機器人。
當然,要真正實(shí)現機器人的仿真化還需要有很遠的路要走,但是,能不能讓個(gè)人電腦這種機器,在某種程度上像人一樣能說(shuō)會(huì )唱呢?
這就是微軟語(yǔ)音組的最初想法,負責研發(fā)的是兩個(gè)女研究員,她們的頭兒叫宋哥平。
記者看到,在計算機屏幕上,一個(gè)卡通形象演唱一首流行音樂(lè )《喜唰唰》,每一句歌詞都和小人頭的嘴形相對應,真是個(gè)“能說(shuō)會(huì )唱的小人頭”。
據錢(qián)瑤研究員介紹,這種技術(shù)集中展示了一個(gè)新的音頻/視頻的人機界面。這個(gè)活潑可愛(ài)的小人頭背后,是一個(gè)復雜的統計模型,它可以將文字轉成語(yǔ)音,將詞與譜轉換成歌唱。此外,頭部動(dòng)作與嘴形同步的視頻信號也與說(shuō)/唱的音頻信號一同播放。
也就是說(shuō),只要你輸入一段文字、或者一段詞和相關(guān)的譜,小人頭就會(huì )繪聲繪色地給你演講,或者歡快地一邊搖頭一邊唱歌。
能讓小人頭說(shuō)話(huà),是基于用一個(gè)統計模型進(jìn)行批量資料的學(xué)習和訓練的結果,而能讓小人頭搖頭晃腦并對準口型,也是通過(guò)在學(xué)習相關(guān)視頻資料中,因韻律變更而產(chǎn)生相應的發(fā)音口型。
還不等科研人員說(shuō)出來(lái),記者們已經(jīng)在你一言我一語(yǔ)地幫著(zhù)想這個(gè)技術(shù)的應用領(lǐng)域了。
“比如,在公共場(chǎng)所有很多人需要接待員重復同樣一段話(huà)的時(shí)候,就可以把這個(gè)小人頭搬上去,據研究員介紹,小人頭的形象是可以根據不同需要而變化的”;“再比如,你可以在開(kāi)車(chē)上路之前,從網(wǎng)絡(luò )上下載一些當日的新聞,然后一邊開(kāi)車(chē),一邊享受小人頭給你播送的最新消息”;“還比如,有些失聰的殘障人士需要學(xué)習發(fā)音,可以用小人頭一遍一遍不厭其煩地教會(huì )他們讀唇直至學(xué)會(huì )說(shuō)話(huà)?!薄?BR> 可視化電子地圖:以動(dòng)畫(huà)形式重現旅游經(jīng)歷
創(chuàng )意由來(lái):不知道你有過(guò)這樣的煩惱沒(méi)有。某一天,您跟家人到北京好幾個(gè)景點(diǎn)玩了一圈,回家后通過(guò)上傳照片到自己的博客里想分享給朋友們,但是朋友要想看全它們還是需要不斷地打開(kāi)不同時(shí)間、不同主題的博客頁(yè),這些照片看起來(lái)還是非常零碎而無(wú)章法。怎么能讓朋友直觀(guān)地、方便地認同你的感受呢?
有這種困擾的人不在少數,搜索組的鄭宇也很早就意識到,這已經(jīng)成為一個(gè)問(wèn)題———隨著(zhù)GPS設備,如GPS手機、PDA在人們日常生活中逐漸普及,大量的GPS數據正伴隨著(zhù)照片、視頻等多媒體數據而不斷積累。他和同伴所要做的,就是管理好并利用這些數據為人們提供更有利的服務(wù)。
這種技術(shù)被命名為GeoLife,它是以GPS數據為中心,并基于電子地圖的應用系統。它不但是可視化、管理和理解個(gè)人旅行經(jīng)歷的工具,也是多個(gè)用戶(hù)共享GPS數據和交流生活經(jīng)歷的平臺。
基于用戶(hù)拍攝的照片和相關(guān)的GPS數據,GeoLife可在地圖上以動(dòng)畫(huà)的形式生動(dòng)地重現用戶(hù)的旅游經(jīng)歷,既有助于自身對過(guò)去往事的回憶又方便了朋友之間的生活經(jīng)歷分享。此外,從多人的數據中,GeoLife可以有效地發(fā)掘熱點(diǎn)區域和經(jīng)典的旅行線(xiàn)路,并推薦給游客。同時(shí),GeoLife可以幫助用戶(hù)快速找到特定區域和/或時(shí)間段的軌跡。
該搜索不但有助于用戶(hù)從他人的數據中高效發(fā)掘出自己感興趣的經(jīng)歷,也有利于個(gè)人從自己模糊的記憶中快速激發(fā)想要回憶的事件。
比如,用戶(hù)可通過(guò)空間搜索功能查看他人在頤和園區域內拍攝的照片和視頻,從而為自己日后的行程安排積累豐富的經(jīng)驗。此外,基于時(shí)間段的查詢(xún)方式,用戶(hù)也可發(fā)掘他人在圣誕節期間的有趣經(jīng)歷。在2008年奧運會(huì )期間,大量的外國游客將來(lái)到北京,此時(shí),GeoLife提供的基于時(shí)間和/或空間的搜索功能將為外國游客消除語(yǔ)言障礙,并幫助他們快速獲取自己想要的信息。
總之,通過(guò)搜索地圖,用戶(hù)可以反思自己的過(guò)去并規劃自己的未來(lái)。
■新聞緣起
最近,微軟技術(shù)節在美國微軟總部開(kāi)幕。微軟亞洲研究院攜45項最新研究成果參展,這些成果涉及多媒體技術(shù)在互聯(lián)網(wǎng)的應用、網(wǎng)絡(luò )信息處理等廣闊領(lǐng)域??捎^(guān)的參展技術(shù)數量和創(chuàng )新的研究成果,使微軟亞洲研究院再次成為備受矚目的焦點(diǎn)。
被譽(yù)為“計算機研究領(lǐng)域盛宴”的微軟技術(shù)節是微軟研究院年度最大的活動(dòng),其主要目的就是讓微軟產(chǎn)品部門(mén)可以零距離接觸各種最新技術(shù),從而為技術(shù)向產(chǎn)品轉化提供便利。
■記者手記
不斷變革的新技術(shù)給我帶來(lái)快樂(lè )
很多年前,我想要一臺計算機,但又不知道拿它干什么;后來(lái),當我有了一臺計算機,就逐漸知道了它能干什么。是不斷變革的新技術(shù)教會(huì )了我享受計算機帶來(lái)的快樂(lè )。
“技術(shù)創(chuàng )造需求”。這句話(huà)放在這里似乎很合適。然而,我仍然認為,計算機新技術(shù)的神秘在于,你幾乎永遠不能準確地知道,今天的創(chuàng )造能給明天的人類(lèi)帶來(lái)怎樣的改變。
美國著(zhù)名電視欄目《科學(xué)美國人》主持人艾倫·奧德說(shuō)———“我們正在建立一個(gè)由計算機組成的社區,人們既對這個(gè)社區貢獻知識,又從中吸取知識”。
是的,自從以互聯(lián)網(wǎng)為代表的計算機革命出現,到現在,人們在瞬間可獲得的知識已經(jīng)成幾何倍數增長(cháng),而且還將不斷增長(cháng)下去。生于“計算機時(shí)代”,我應該感到慶幸。
但是,蘊藏在互聯(lián)網(wǎng)和計算機里的海量數據中,能夠被有效用于分析和解決問(wèn)題的數據有多少?能夠讓計算機社區中的人們順暢溝通甚至相互協(xié)作的智能工具又有多少?
數據畢竟是對孤立事件的描述,而應用數據的人則是社會(huì )性動(dòng)物,只有讓數據活起來(lái),變成社會(huì )運行不可缺少的一部分,我們及我們的后人才可以說(shuō),這是個(gè)真正偉大的時(shí)代!