职称 教授
研究方向 语音识别、语音合成、语音对话、自然语言理解与生成、声学信号处理、情感计算、多模态大模型、具身智能
导师类别 博导/硕导
主讲课程 《语音信息处理》
教育与工作背景
2016.9-至今 中国天津大学 菁英教授
2012.9-2016.8 日本国立长冈技术科学大学 副教授
2008.4-2012.9 日本国立静冈大学 助理教授
2000.7-2002.8 中国建设银行福州市广达支行 助理工程师
2005.4-2008.3 日本丰桥技术科学大学-电子与信息工学专业 研究生/博士
2003.4-2005.3 日本丰桥技术科学大学-信息与计算机科学专业 研究生/硕士
个人简介
长期从事语音交互、自然语言处理、声学信号处理、情感计算、人工智能等方向的研究,承担/曾承担科技部重点研发项目、国家自然科学基金委面上项目、联合重点项目等20余项。研究了自主可控的“海河·谛听”语音交互意图理解大模型,中、英、维、藏、日、俄等三十多个语种的拟人化语音交互,部分语种的语音识别性能超过微软、谷歌达到国际前三,相关成果被应用到二十余家龙头企业,产生的经济效益超过3亿元。“面向复杂交互时变场景的对抗语音处理和语义计算关键技术及应用”获得天津市科技进步一等奖。在IEEE/ACM TASLP、 IEEE TNNLS、NIPS、ACL等国际一流期刊会议上共发表了超过200 篇学术论文,出版专著两部。
代表性成果
(一)代表性论文
(3-5篇,作者. 论文题目. 期刊名称, 发表年份)
(1) Wang, T., Li, J., Ma, Z., Cao, R., Chen, X., Wang, L., Ge, M., Wang, X., Wang, Y., Dang, J. and Tashi, N.. Progressive Residual Extraction based Pre-training for Speech Representation Learning [J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2025, 33: 1825-1837.
(2) Yiwei Wei, Hengyang Zhou, Shaozu Yuan, Meng Chen, Haitao Shi, Zhiyang Jia, Longbiao Wang*, Xiaodong He. DeepMSD: Advancing Multimodal Sarcasm Detection Through Knowledge-Augmented Graph Reasoning. IEEE Trans. Circuits Syst. Video Technol. 35(7): 6413-6423 (2025)
(3) Gong, C., Wang, X., Cooper, E., Wells, D., Wang, L*., Dang, J., ... & Yamagishi, J.* Zmm-tts: Zero-shot multilingual and multispeaker speech synthesis conditioned on self-supervised discrete speech representations[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2024, 32, 4036-4051.
(4) Lin, Y., Wang, L.*, Yang, Y., & Dang, J*. CFDRN: A cognition-inspired feature decomposition and recombination network for dysarthric speech recognition[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2023, 31: 3824-3836.
(5) Wei, X., Li, Y., Si, Y., Wang, L.*, Wang, X., & Dang, J. A Prompt-Based Hierarchical Pipeline for Cross-Domain Slot Filling[J]. IEEE/ACM Transactions on Audio, Speech, and Language Processing, 2024, 32, 3061-3075.
(二)科研项目
(3-5项,项目名称,立项单位,立项年份,角色(主持/参与))
(1) 基于语言认知机理的类脑自然语言识别与交互 国家重点研发计划,“智能机器人”专项计划课题 2019-06-01至2022-05-31 课题主持人
(2) 感知驱动的细粒度语音表征解耦与跨模态可控语音合成 国家自然科学基金,联合基金重点支持项目 2024-01-01至2027-12-31 天大课题负责人
(3) 面向复杂场景的声纹识别和声纹反欺诈研究 国家自然科学基金,面上项目 2022-01-01至2025-12-31 主持
(4) 面向混响环境的多口音语音识别研究 国家自然科学基金,面上项目 2018-01-01至2021-12-31 主持
(5) 面向机器人的复杂环境语音对话关键技术及系统实现 省部级项目,天津市新一代人工智能重大专项 2018-10-01至2021-09-31 主持
(三)主要获奖
(1) 省部级奖励:2022 年度天津市科技进步一等奖 天津市科学技术局 2023-03-13
(2) 天津大学研究生优秀在线课程一等奖 天津大学研究生院 2020-06-15
(3) 清华校友三创大赛人工智能赛道成长组冠军 清华校友总会和天津市河北区人民政府 2023-06-20
(4) 清华校友三创大赛全球人工智能与大数据赛道总决赛成长组十强奖(本场赛事的最高奖项) 清华校友总会 2023-08-29
其他补充信息
(1) APSIPA Speech and Language Processing Technical Committee 副主席
(2) Japan Advanced Institute of Science and Technology 客座教授
(3) 指导硕士生获得校级优秀论文 天津大学 2023-06-01
(4) 第十八届全国人机语音通讯学术会议 最佳论文 2023-12-8至2023-12-10
(5) 第12届中文口语语言处理国际会议(ISCSLP 2021) ISCSLP 2021 Best Student Paper 2021-01-24至2021-01-26