我單位“遠場聲學信息人機交互關鍵技術及其應用”項目提名2020年度北京市科學技術獎,現進行公示。公示期: 2020 年 11 月 4 日至 11 月 10日,公示期內如有任何單位或個人對公示內容有異議的,請您以書面方式向中國科學院聲學研究所科技發展部(公示單位科管部門名稱)反映,以單位名義提出的,需加蓋單位公章;以個人名義提出的,需要提供個人身份證明文件。
聯系人及聯系電話:金老師 010-82547935
中國科學院聲學研究所
2020年11月4日
公示內容:
項目名稱:遠場聲學信息人機交互關鍵技術及其應用
候選單位(含排序):1.中國科學院聲學研究所; 2.北京聲智科技有限公司; 3.北京建筑大學
候選人(含排序):1.楊軍; 2.陳孝良; 3.楊飛然; 4.吳鳴; 5.馮大航; 6.程曉斌; 7.常樂; 8.余紫瑩; 9.周若華; 10.蘇少煒; 11.許勇; 12.李良斌; 13.武帥兵; 14.劉博; 15.欒天祥
提名意見:
本項目突破了遠場復雜聲學場景下語音交互的聲學感知和語義理解關鍵技術,融合了基于經典陣列信號處理的模型驅動算法和基于深度學習的數據驅動算法,開發出具有自主知識產權的遠場聲學信息人機交互系統和平臺,提高了遠場人機交互質量和用戶體驗,促進了人工智能技術在聲學信息交互領域的落地。本項目的推廣應用產生了重大的經濟效益和社會效益,技術成果在智能音箱、AI數字人紅外測溫與監管系統、智慧電梯與安全監管平臺等多個領域獲得成功應用,服務海內外包括中國移動、華為、百度、小米、阿里、騰訊等120家企業,擁有4000多萬用戶,產生直接經濟效益超1.6億。本項目成果產品國內首款智慧電梯與安全監管平臺和AI數字人紅外測溫與監管系統已迅速落地北京、武漢、上海、青島、深圳等地的新冠肺炎定點醫院,以及全國人大機關辦公樓、北京東城區政協、中國殘聯大廈等等海內外近百個城市的辦事服務中心、機場、酒店、辦公樓宇、區民小區等公共場所,為抗擊新冠疫情作出了突出貢獻,獲得工信部突出貢獻企業表彰,入選工信部AI助力疫情防控重點物資清單。
提名該項目為北京市科學技術獎科學技術進步獎(類別:技術開發類)(一等獎和二等獎)。
項目簡介:
聲學信息人機交互對人工智能產業發展具有重要戰略意義,遠場交互是聲學信息人機交互產業的創新升級方向。從近場交互到遠場交互,噪聲、混響、回聲等干擾帶來了語音識別、語義理解等難題,亟需攻克。本項目面向聲學信息人機交互產業落地的重大需求,突破了多項遠場語音交互的聲學感知和語義理解關鍵技術,構建了陣列信號處理融合深度學習的先進聲學模型和通用語義理解模型,形成了涵蓋麥克風陣列、前端聲學處理、語音喚醒、語音識別、語義理解、語音合成等技術深度融合的端+云一體化系統,大幅提高了系統泛化能力和識別精度,促使我國智能產品萬物互聯現象級產業直接對標超越歐美標桿企業。主要技術創新點:
1. 提出了不同場景下低復雜度穩健的時頻域自適應濾波算法,解決了高度依賴雙端對講檢測、收斂速度慢等難題,實現了單通道和多通道回聲抵消系統應用。
2. 提出了基于麥克風陣列噪聲消除和盲源分離等方法,建立了帶噪語音的特征修復技術,去除了人聲及背景噪聲干擾,大幅提升了系統的識別性能。
3. 提出了抗混響、抗干擾的低復雜度聲源定位方法,有效解決了復雜聲學環境特別是電梯、家居、會議室等場景的聲源定位問題。
4. 提出了加權有限狀態轉換機解碼圖喚醒算法,實現了多個聲學模型深度融合的在線語音識別引擎,提高了系統在各種環境下語音識別、喚醒的性能。
5. 提出了基于用戶對話交互歷史的詞匯-領域詞庫映射算法、領域感知的詞向量訓練算法,提高了領域識別精度,提升了信息交互的流暢度與準確性。
本項目在國家科技支撐計劃等課題支持下,開發出具有自主知識產權的全球領先的遠場聲學信息人機交互系統,技術成果形成了智能音箱、AI數字人紅外測溫與監管系統、智慧電梯與安全監管平臺等產品在多個領域落地應用,占據了全球70%以上的中文遠場智能語音市場。本項目獲授權發明專利44項、實用新型專利37項、軟件著作權61項,發表論文135篇,參與制定國家標準15項、團體標準15項,產生直接經濟效益超1.6億。本項目促進了人工智能技術的推廣應用,產品覆蓋家居、會議、軍工、醫療、交通等行業,服務120多家企業,擁有4000多萬用戶,數十億次人機交互真實場景的規模驗證,服務海內外客戶包括中國移動、華為、百度、小米、阿里、騰訊等。實現了先進的智能交互體驗,有力促進了北京建設具有全球影響力的科技創新中心。本項目產品在抗擊新冠疫情期間作出了突出貢獻,獲得工信部突出貢獻企業表彰,入選工信部AI助力疫情防控重點物資清單。
附件:主要支撐材料目錄