人工智能技術(shù)可從參與者大腦活動(dòng)中解碼單詞和句子,其準確性令人不可思議,準確率可達73%,這意味著(zhù)人工智能朝向大腦活動(dòng)數據“無(wú)創(chuàng )解碼”大腦語(yǔ)言和意識邁進(jìn)一步!
北京時(shí)間9月14日上午消息,據報道,目前,人工智能技術(shù)使得非侵入式大腦解碼技術(shù)更進(jìn)一步!盡管該技術(shù)尚不能使無(wú)法語(yǔ)言交流人群像正常人那樣談笑風(fēng)聲,但可使科學(xué)家精準解碼他們的語(yǔ)音內容。
這項人工智能技術(shù)可從參與者大腦活動(dòng)中解碼單詞和句子,其準確性令人不可思議,但仍無(wú)法達到100%精準,人們僅需幾秒鐘的大腦活動(dòng)數據,即能通過(guò)人工智能技術(shù)推測出人們聽(tīng)到什么內容,他們在一項初步研究中發(fā)現,參與者從選擇性測試中找到正確答案的概率平均達到73%。
未參與該項研究的愛(ài)爾蘭都柏林三一學(xué)院計算機科學(xué)家喬瓦尼?迪?利伯托(Giovanni Di Liberto)稱(chēng),人工智能的表現已超出許多人認為可能實(shí)現的水平。
8月25日,有媒體報道稱(chēng),Facebook母公司Meta研發(fā)一項最新人工智能技術(shù),最終有望應用于全球數以萬(wàn)計無(wú)法通過(guò)語(yǔ)音、打字或者手勢進(jìn)行交流的人群,其中包括:最低限度的意識狀態(tài)、閉鎖綜合癥或者“植物人狀態(tài)”患者,現在他們通常被稱(chēng)為無(wú)反應清醒綜合癥人群。
據悉,目前大多數幫助語(yǔ)言表達障礙人群的技術(shù)具有一定程度的身體侵入性,需要進(jìn)行高風(fēng)險腦部手術(shù)植入電極,Meta公司AI研究員、神經(jīng)科學(xué)家珍妮-雷米·金(Jean-Remi King)表示,最新研發(fā)的人工智能技術(shù)有望提供一種可行方案來(lái)幫助溝通障礙患者,而不是使用侵入性方法。
珍妮和同事研發(fā)了一種計算工具,可以檢測53種語(yǔ)言的56000小時(shí)語(yǔ)音錄音中的單詞和句子,該工具也被稱(chēng)為語(yǔ)言模型,學(xué)習如何在細微等級(例如:字母或者音節)和更廣泛等級(例如:?jiǎn)卧~或者句子)識別語(yǔ)言的具體特征。
該研究團隊將帶有語(yǔ)言模型的人工智能系統應用于4個(gè)機構的數據庫,其中包括169名志愿者的大腦活動(dòng),在這些數據庫中,參與者傾聽(tīng)不同的故事和句子,例如:作家歐內斯特·海明威的《老人與?!泛蛣⒁姿埂た_爾的《愛(ài)麗絲夢(mèng)游仙境》,期間工作人員使用腦磁波描記器(MEG)或者腦電圖儀對參與者的大腦進(jìn)行掃描,這些設備可以測量大腦信號的磁成分或者電成分。
之后在一種有助于解釋實(shí)際大腦間物理差異的計算方法幫助下,研究團隊試著(zhù)利用每位參與者3秒鐘的大腦活動(dòng)數據來(lái)解碼他們聽(tīng)到的內容,他們指示人工智能系統將故事錄音中的語(yǔ)音與人工智能計算出人們聽(tīng)到的內容相對應的大腦活動(dòng)模式進(jìn)行匹配,然后依據1000多種可能性,預測參與者在短時(shí)間內可能聽(tīng)到的內容。
研究人員發(fā)現使用腦磁波描記器進(jìn)行測試,參與者選擇的前10種可能性答案的準確率達到73%,然而通過(guò)腦電圖儀的測試結果,該準確率下降至不足30%,因此腦磁波描記器性能非常好。利伯托說(shuō):“但是我們預測該系統的實(shí)際應用并不樂(lè )觀(guān),它能有什么用途呢?腦磁波描記器是一部笨重且成本昂貴的機器,將該項技術(shù)應用于診所需要技術(shù)創(chuàng )新改良,從而使該設備成本更低、更易于使用。
美國密歇根大學(xué)安娜堡分校語(yǔ)言學(xué)家喬納森·布倫南(Jonathan Brennan)說(shuō):“在這項最新研究中,理解‘解碼’的真正含義非常重要,這個(gè)詞經(jīng)常被用于描述直接從信息源破譯信息的過(guò)程,這里特指從大腦活動(dòng)中破譯語(yǔ)言,人工智能技術(shù)可以實(shí)現這一點(diǎn),因為該系統能提供一個(gè)有限范圍的可能性答案,大幅提高的準確率。對于語(yǔ)言來(lái)講,如果我們想將該人工智能系統擴展至實(shí)際應用,這是很難實(shí)現的,因為語(yǔ)言應用是無(wú)限的?!?/p>
更重要的是,人工智能能解碼被動(dòng)傾聽(tīng)音頻的參與者信息,這與非語(yǔ)言患者沒(méi)有直接關(guān)聯(lián),為了使它成為一種具有意義的交流工具,科學(xué)家需要學(xué)習如何從大腦活動(dòng)中解密患者想表達的信息,例如:饑餓、不適表情或者簡(jiǎn)單的“是”或者“不是”的表情。
事實(shí)上,這項人工智能技術(shù)是解碼語(yǔ)音感知,而不是語(yǔ)音生成,雖然語(yǔ)音生成是科學(xué)家的最終目標,但就目前而言,亟待進(jìn)一步完善提升相關(guān)的科學(xué)技術(shù)。
來(lái)源:《新浪科技》