• <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

    <table id="fficu"></table>

    <sup id="fficu"></sup>
    <output id="fficu"></output>
    1. ACS880-07C
      關(guān)注中國自動(dòng)化產(chǎn)業(yè)發(fā)展的先行者!
      橫河電機-23年10月11日
      2024
      工業(yè)智能邊緣計算2024年會(huì )
      2024中國自動(dòng)化產(chǎn)業(yè)年會(huì )
      2023年工業(yè)安全大會(huì )
      OICT公益講堂
      當前位置:首頁(yè) >> 資訊 >> 行業(yè)資訊

      資訊頻道

      深耕智能語(yǔ)音前沿技術(shù)
      • 點(diǎn)擊數:669     發(fā)布時(shí)間:2023-05-17 21:31:31
      • 分享到:
      “智能語(yǔ)音音頻技術(shù)應用十分廣泛,可以賦能許多場(chǎng)景?!北笨迫鹇暥麻L(cháng)劉軼說(shuō),公司通過(guò)與高速交通、智慧醫療、數字政務(wù)等行業(yè)深度融合,創(chuàng )新研發(fā)了一系列智能產(chǎn)品,并與多個(gè)國產(chǎn)主流平臺完成兼容性互認證,實(shí)現智能語(yǔ)音系統全鏈自主可控運行,持續推動(dòng)智能語(yǔ)音技術(shù)應用研發(fā)及產(chǎn)業(yè)化。2022年,北科瑞聲營(yíng)業(yè)收入突破億元,同比增速超過(guò)56%。

      走進(jìn)深圳市北科瑞聲科技股份有限公司(以下簡(jiǎn)稱(chēng)“北科瑞聲”)的人工智能展廳,一件件智能語(yǔ)音產(chǎn)品引人注目。

      “智能語(yǔ)音音頻技術(shù)應用十分廣泛,可以賦能許多場(chǎng)景?!北笨迫鹇暥麻L(cháng)劉軼說(shuō),公司通過(guò)與高速交通、智慧醫療、數字政務(wù)等行業(yè)深度融合,創(chuàng )新研發(fā)了一系列智能產(chǎn)品,并與多個(gè)國產(chǎn)主流平臺完成兼容性互認證,實(shí)現智能語(yǔ)音系統全鏈自主可控運行,持續推動(dòng)智能語(yǔ)音技術(shù)應用研發(fā)及產(chǎn)業(yè)化。2022年,北科瑞聲營(yíng)業(yè)收入突破億元,同比增速超過(guò)56%。

      專(zhuān)注技術(shù)研發(fā)

      2003年,劉軼從香港科技大學(xué)博士畢業(yè)留校任教,從事嵌入式智能語(yǔ)音識別技術(shù)研究?!白约貉邪l(fā)的東西能夠實(shí)現應用,產(chǎn)生經(jīng)濟效益、服務(wù)社會(huì ),這是每一個(gè)工科人的夢(mèng)想?!睅е?zhù)這樣的夢(mèng)想,2008年,他與兩位合伙人來(lái)到深圳,創(chuàng )立北科瑞聲。

      實(shí)現夢(mèng)想的路上,需要不斷探索和創(chuàng )新。嵌入式智能語(yǔ)音識別技術(shù)通過(guò)將聲音轉換成文本和命令,能夠實(shí)現語(yǔ)音輸入、語(yǔ)音控制,可應用于多種應用系統、移動(dòng)設備,大大改善人機交互方式。但是,要把這個(gè)技術(shù)落地實(shí)現產(chǎn)品化,并不是件容易的事。

      “那時(shí),人們對語(yǔ)音識別還沒(méi)什么概念,相關(guān)技術(shù)也不夠成熟,鮮有成功的商業(yè)化案例。風(fēng)口沒(méi)到的時(shí)候,我們需要沉下心來(lái),做好基礎性工作,錘煉好自己的本領(lǐng)?!眲⑤W說(shuō)。

      瞄準語(yǔ)音音頻交互核心技術(shù),北科瑞聲組織研發(fā)團隊開(kāi)展持續攻關(guān),不斷突破技術(shù)瓶頸?!霸谌斯ぶ悄芎蜋C器學(xué)習技術(shù)領(lǐng)域,有一大一小兩個(gè)難題。大難題是指超大規模預訓練模型,小難題是指芯片級神經(jīng)網(wǎng)絡(luò )模型?!北笨迫鹇暱偨?jīng)理王昕介紹,針對兩個(gè)難題,公司研發(fā)了音頻信息感知、語(yǔ)音識別、人機交互系統等全鏈多模態(tài)人工智能技術(shù),并將這些技術(shù)封裝在自研芯片上,打造存算一體芯片級小型神經(jīng)網(wǎng)絡(luò )模型語(yǔ)音芯片,推出“云+端+芯”全鏈條、自主可控智能語(yǔ)音產(chǎn)品,實(shí)現從人工智能語(yǔ)音技術(shù)創(chuàng )新到產(chǎn)業(yè)應用的生態(tài)閉環(huán)。

      “云+端+芯”即云、設備終端和芯片,三者鏈條打通之后,能夠實(shí)現對數據的存儲、處理、整理、分析和傳輸?!肮タ诉@個(gè)技術(shù)并非易事,我們面臨許多挑戰?!蓖蹶空f(shuō),語(yǔ)音交互具有時(shí)變性。在溝通過(guò)程中,設備每一分鐘都要通過(guò)提取語(yǔ)音特征、參數,與后臺的模型進(jìn)行大量比對計算,快速反饋語(yǔ)音內容。這不僅需要一個(gè)速度非??斓挠嬎銌卧?,還需要中央處理器的算力足夠快、存儲器容量足夠大。與此同時(shí),還要實(shí)現低功耗,降低應用成本。

      為了破解這一系列難題,北科瑞聲不斷提升數據、算法和算力能力,積累了超10萬(wàn)小時(shí)語(yǔ)音音頻數據、TB級語(yǔ)言數據及語(yǔ)音音頻行業(yè)標桿級數據資源;研發(fā)出行業(yè)領(lǐng)先的中文復雜場(chǎng)景語(yǔ)音音頻交互技術(shù),普通話(huà)語(yǔ)音識別準確度達99%,限定領(lǐng)域的意圖識別準確度達到95%。

      語(yǔ)音交互技術(shù)好不好,不僅要看測試的識別準確率,還要看其在實(shí)際場(chǎng)景下的語(yǔ)義理解能力?!凹幢闳缃衿胀ㄔ?huà)普及程度越來(lái)越高,但由于每個(gè)人的經(jīng)歷或生活環(huán)境不同,產(chǎn)生了很多‘不標準’的普通話(huà)發(fā)音。這個(gè)‘不標準’千變萬(wàn)化,識別起來(lái)十分困難。而基于中文復雜場(chǎng)景的語(yǔ)音音頻交互技術(shù),可以做到在無(wú)需事先指定口音類(lèi)型的情況下,處理國內50多個(gè)地方的帶口音普通話(huà)?!眲⑤W說(shuō)。

      面對互聯(lián)網(wǎng)時(shí)代層出不窮且逐漸融入人們生活的網(wǎng)絡(luò )新詞,中文復雜場(chǎng)景語(yǔ)音音頻交互技術(shù)還能通過(guò)自進(jìn)化能力,在30秒內對這些新詞進(jìn)行全面學(xué)習、掌握,以快速跟上互聯(lián)網(wǎng)信息迭代速度。而原先的傳統技術(shù)若想識別新詞,一般需要數天甚至數周的技術(shù)訓練。

      經(jīng)過(guò)持續研發(fā)創(chuàng )新,北科瑞聲攻克了多項人工智能核心技術(shù),實(shí)現了端云架構以及端到端一體化產(chǎn)品應用。目前,北科瑞聲擁有知識產(chǎn)權200多件,其中發(fā)明專(zhuān)利100多件,參與了智能語(yǔ)音識別和交互國家標準制定,獲得我國智能科學(xué)技術(shù)最高獎“吳文俊人工智能科學(xué)技術(shù)獎”、中國專(zhuān)利優(yōu)秀獎以及多項廣東省科學(xué)技術(shù)獎等獎項,發(fā)展成為人工智能音頻領(lǐng)軍企業(yè)。

      拓展應用場(chǎng)景

      創(chuàng )新不能閉門(mén)造車(chē),還需要根據市場(chǎng)需求將科研成果落地轉化?!巴ㄓ卯a(chǎn)品僅僅將語(yǔ)音轉化為文字,無(wú)法滿(mǎn)足醫療、交通、政務(wù)等細分領(lǐng)域的需求。比如一些專(zhuān)業(yè)術(shù)語(yǔ),如果我們的智能語(yǔ)音系統沒(méi)有與行業(yè)進(jìn)行深度融合或者定制化處理,就達不到好的效果?!眲⑤W告訴記者,人工智能要想真正為市場(chǎng)所用,一定要與具體的行業(yè)應用結合起來(lái),做深、做精,為行業(yè)發(fā)展賦能。

      在探尋技術(shù)落地及差異化競爭路徑的過(guò)程中,北科瑞聲將目光首先聚焦于車(chē)載應用領(lǐng)域。

      “支持語(yǔ)音交互是車(chē)載導航智能發(fā)展的必然趨勢,出于對安全駕駛的考慮,人們不能一邊開(kāi)車(chē)一邊操作導航。我們嘗試將智能語(yǔ)音識別技術(shù)嵌入汽車(chē)車(chē)機,通過(guò)車(chē)機總線(xiàn)進(jìn)行總控,可執行高達幾萬(wàn)條的語(yǔ)音命令?!北笨迫鹇暱偛棉k公室副總監王詩(shī)雨說(shuō),“車(chē)主只需說(shuō)出路線(xiàn)需求,車(chē)機就能規劃合適的路線(xiàn),實(shí)現無(wú)手化操作?!?/p>

      車(chē)載應用成功落地讓北科瑞聲在智能語(yǔ)音應用領(lǐng)域摸索出一些經(jīng)驗,隨后開(kāi)始在數字政務(wù)、智慧醫療和高速交通等領(lǐng)域發(fā)力。

      在數字政務(wù)智能語(yǔ)音解決方案中,北科瑞聲基于其智能語(yǔ)音核心能力開(kāi)發(fā)出一套主要用于政企會(huì )議場(chǎng)景的智能語(yǔ)音會(huì )議系統?!皶?huì )議記錄是政企日常工作中的重要部分,但傳統記錄方式效率較低?!眲⑤W說(shuō),智能語(yǔ)音會(huì )議系統提供基于私有云的語(yǔ)音轉文字、實(shí)時(shí)轉寫(xiě)上屏顯示、離線(xiàn)語(yǔ)音轉寫(xiě)、紀要成稿、會(huì )議記錄留存查詢(xún)等功能,避免了傳統人工整理記錄會(huì )議內容存在的時(shí)間長(cháng)、易遺漏、準確率低等問(wèn)題,從而提升會(huì )議交互體驗與辦公效率。目前,北科瑞聲智能語(yǔ)音會(huì )議系統已在深圳許多政企單位實(shí)現應用。

      “數據不只是一種資源,更是一種能力,是企業(yè)的核心競爭力?!眲⑤W說(shuō),在高速交通領(lǐng)域,北科瑞聲通過(guò)運用云計算、大數據分析能力,提升人工智能認知能力,實(shí)現大交通領(lǐng)域用戶(hù)數據安全可靠。

      ETC卡剛剛推行時(shí),由于需求量不高,高速客服中心的線(xiàn)上客服配置并不多。隨著(zhù)ETC熱潮的到來(lái),2019年,粵通卡車(chē)主大幅上漲,給客服工作帶來(lái)了巨大壓力?;跀祿?、算法、算力三大要素技術(shù)積累,北科瑞聲結合高速交通業(yè)務(wù)場(chǎng)景及高速視頻云系統,打造出覆蓋互聯(lián)網(wǎng)渠道、電話(huà)通道及高速場(chǎng)景線(xiàn)下服務(wù)窗口的人工智能高速交通綜合信息服務(wù)平臺——全終端高速交通平臺。

      這一平臺以智能外呼機器人替代人工客服,通過(guò)與粵高速客服中心電話(huà)線(xiàn)路集成,實(shí)現從流程設置、外呼呼叫到數據處理與匯總的全流程自動(dòng)化處理。智能外呼機器人集成語(yǔ)音識別、自然語(yǔ)言理解、信息檢索、語(yǔ)音合成等智能技術(shù),聽(tīng)得懂、能理解、會(huì )說(shuō)話(huà),人機交互流暢自然,機器人單條電話(huà)線(xiàn)單日可完成外呼電話(huà)上千次,外呼數據同步轉寫(xiě)生成保存。

      “與傳統人工外呼相比,智能外呼機器人具備自動(dòng)撥打、多輪對話(huà)、自動(dòng)生產(chǎn)外呼數據等優(yōu)勢,還可不間斷工作,有效提升了工作智能化、數字化水平?!蓖蹶空f(shuō),深圳具有良好的創(chuàng )新土壤,為企業(yè)積累場(chǎng)景應用經(jīng)驗、促進(jìn)技術(shù)迭代提供了舞臺。立足這個(gè)資源優(yōu)勢,北科瑞聲在不斷拓展應用場(chǎng)景的同時(shí),將繼續破解技術(shù)瓶頸,持續迭代產(chǎn)品,用人工智能技術(shù)賦能更多行業(yè)發(fā)展。

      來(lái)源:《經(jīng)濟日報》

      熱點(diǎn)新聞

      推薦產(chǎn)品

      x
      • 在線(xiàn)反饋
      1.我有以下需求:



      2.詳細的需求:
      姓名:
      單位:
      電話(huà):
      郵件:
      欧美精品欧美人与动人物牲交_日韩乱码人妻无码中文_国产私拍大尺度在线视频_亚洲男人综合久久综合天

    2. <blockquote id="fficu"><optgroup id="fficu"></optgroup></blockquote>

      <table id="fficu"></table>

      <sup id="fficu"></sup>
      <output id="fficu"></output>