人工智能與機器學習在聲學信號處理中的應用
AI and Machine Learning in Acoustic Signal Processing
客座編輯:陳婧, 北京大學智能學院研究員、博士生導師;盧晶,南京大學聲科學與工程系副系主任、教授、博士生導師;錢彥,上海交通大學計算機科學與工程系教授,博士生導師;牛海強,中國科學院聲學研究所研究員,博士生導師;Alan Hunter, 英國巴斯大學工程學院機械工程系副教授;Timothy Rogers,英國謝菲爾德大學高級講師
期刊名稱:npj Acoustics
截止日期:2025.10.3
客座編輯
陳婧, 北京大學智能學院研究員、博士生導師
陳婧于2009年獲北京大學智能科學系信號與信息處理專業(yè)博士學位。2009年到2012年,她在英國劍橋大學從事博士后研究。她于2013年加入北京大學智能科學系,任百人計劃研究員。她的主要研究領域包括聽覺和語音感知、聽覺計算模型、語音信號處理以及通過腦-機接口進行語音神經解碼。
盧晶,南京大學聲科學與工程系副系主任、教授、博士生導師
盧晶博士現任南京大學聲學研究所副系主任、教授和南京大學地平線智能音頻聯合實驗室主任。他是npj Acoustics的編委會成員,中國聲學學會常務理事,中國聲學學會/中國電子學會聲頻工程分會副主任委員,美國聲學學會(ASA)語音通信(Speech Communication)、信號處理(Signal Processing)和工程聲學(Engineering Acoustics)技術委員會委員。他曾十余次擔任聲學領域頂尖國際會議(ASA、ICA、InterNoise、ICSV)國際科學委員和分會主席。他的主要研究方向包括音頻信號處理、沉浸式音頻、聲學換能器以及音頻處理系統(tǒng)的實時實現。他主持了20多個政府和行業(yè)項目,并發(fā)表了300多篇期刊和會議論文,其中包括聲學領域頂刊美國聲學學報(J. Acoust. Soc. Am.)論文30余篇。他獲得授權發(fā)明專利超過40項,研究成果已在工業(yè)界得到廣泛應用。
錢彥,上海交通大學計算機科學與工程系教授,博士生導師
錢彥博士于2007年獲得中國華中科技大學電子與信息工程系學士學位,并于2012年獲得中國北京清華大學電子工程系博士學位。自2013年以來,他一直在中國上海交通大學計算機科學與工程系工作,目前擔任全職教授。2015年至2016年,他在英國劍橋大學工程系擔任副研究員。他在語音和語言處理領域的同行評審期刊和會議上發(fā)表或共同發(fā)表了300多篇論文,包括T-ASLP、Speech Communication、ICASSP、INTERSPEECH和ASRU。申請80余項中美專利,6次帶隊獲得國際評測冠軍。他目前的研究興趣包括語音和音頻信號處理、自動語音識別和翻譯、說話人和語種識別、語音抗噪與分離、音樂生成與理解、語音情感感知、多模態(tài)和跨模態(tài)信息處理、自然語言理解、深度學習建模,多媒體信號處理等。他曾獲得中國多個頂級學術獎項,包括教育部長江學者計劃和國家優(yōu)秀青年基金。
牛海強,中國科學院聲學研究所研究員,博士生導師
牛海強博士是中國科學院聲學研究所聲學國家重點實驗室的全職教授。他目前擔任《美國聲學學會期刊》(JASA)的副編輯。同時,他還是Chinese Physics Letters (CPL)、Chinese Physics B (CPB)、《物理學報》、《物理》的 四刊聯合青年編委、《聲學學報》青年編委。此外,他還是中國科學院青年創(chuàng)新促進會的成員。2015年至2017年,他在美國加州大學圣地亞哥分校Scripps海洋研究所擔任博士后研究員。他于2018年成為副教授,并于2021年晉升為全職教授。他的研究興趣包括機器學習在海洋聲學中的應用、稀疏貝葉斯學習在聲學信號處理中的應用、地聲反演和海洋聲學層析成像。
Alan Hunter, 英國巴斯大學工程學院機械工程系副教授
Alan Hunter 博士于2001年和2006年分別獲得新西蘭坎特伯雷大學的電氣與電子工程榮譽學士學位和博士學位。2007年至2010年,他在英國布里斯托大學擔任研究助理,2010年至2014年,他在荷蘭海牙的 TNO(荷蘭應用科學研究組織)擔任國防科學家。2014年,他加入了英國巴斯大學工程學院,目前擔任機械工程系的副教授和副系主任。自2017年以來,他還擔任挪威奧斯陸大學信息學系的兼職副教授。他的研究興趣包括水下聲學、信號處理、成像和機器智能。他特別關注使用聲納和海洋機器人進行水下遙感的應用。Alan博士是電氣電子工程師學會(IEEE)的高級會員,并擔任《IEEE 海洋工程期刊》的副編輯。
Timothy Rogers,英國謝菲爾德大學動力學研究組高級講師
Timothy Rogers 博士是謝菲爾德大學動力學研究組的高級講師。他的研究興趣是數據驅動分析與工程動力學的交叉領域。他感興趣的問題包括機器學習、尤其是貝葉斯方法,在信號處理、系統(tǒng)識別和工程系統(tǒng)監(jiān)測中的應用。他的研究旨在將能從工程洞察和理解中獲取的最大價值,與能夠從數據中學習的模型的靈活性相結合。在這個過程中,他不僅關注所開發(fā)模型的預測準確性,還關注所返回解決方案在物理意義上的可解釋性。
專題征稿
人工智能與機器學習在聲學信號處理中的應用
AI and Machine Learning in Acoustic Signal Processing
近年來,人工智能(AI)、機器學習(ML)與聲學信號處理的交叉領域迅速發(fā)展,提供了新的方法來分析、解釋和增強聲音。將 AI 和 ML 技術整合到聲學信號處理中的潛力,將有力促進從語音識別、音頻內容分析、環(huán)境聲音監(jiān)測和生物醫(yī)學診斷等眾多應用。本特刊旨在探討這個領域的最新發(fā)展和突破,為研究人員和從業(yè)者提供一個展示他們前沿進展的平臺。
本特刊的主要目標是探索如何利用 AI 和 ML 技術來應對聲學信號處理中的復雜性。應用AI和ML的優(yōu)勢在于能夠有效處理大量數據、實時適應新模式以及提高信號分析和增強任務的準確性和效率。本特刊希望吸引推動理論研究和實用解決方案的論文,提供可在實際應用中實施的新工具。我們歡迎如下投稿主題:
聲學場景分析:開發(fā)用于識別和分類各種聲學環(huán)境的算法,這對于智能監(jiān)控、城市噪聲監(jiān)測和上下文感知系統(tǒng)等應用至關重要。
信號增強:特別關注基于 AI 的降噪、去混響和信號清晰度改善技術。這些方法在通信、助聽器、水下通信以及在各種噪聲環(huán)境中微弱水下信號檢測等場景中至關重要。
聲源定位與分離:AI/ ML 模型在多聲源環(huán)境中檢測、定位和隔離目標聲源。應用包括會議系統(tǒng)中的說話者分離、提高娛樂系統(tǒng)中的音頻質量、增強自主系統(tǒng)中的環(huán)境感知,以及提高水下聲源定位/檢測的準確性和分辨率。
語音與音頻處理:將深度學習模型應用于語音識別(ASR)、音頻生成、語音轉換、情感識別、語音翻譯等任務。這些任務對于開發(fā)更自然和直觀的人機交互系統(tǒng)至關重要。
音樂信號處理:研發(fā)用于訪問、分析、操作和創(chuàng)作音樂的 AI 模型,例如音樂信息檢索、音樂生成、音樂合成、計算機伴奏和機器音樂演奏。
環(huán)境與生物醫(yī)學聲學:這些領域中的 AI 應用涉及利用聲學信號進行野生動物監(jiān)測、檢測環(huán)境變化以及醫(yī)學診斷。例如,處理水下聲學信號用于海洋生物學和環(huán)境監(jiān)測,分析心臟或肺部聲音用于診斷,超聲信號處理用于醫(yī)學成像。
聲學檢測方法:用于其他物體檢測的新方法。例如,在聲學數據中檢測異常、時間序列分類、裂縫/缺陷定位。
我們鼓勵能展示跨學科方法或 AI/ML 與聲學信號處理融合的研究,歡迎能突出新方法、新應用和塑造聲學信號處理未來新興趨勢的投稿。