研究方向

大规模语音识别

利用深度学习技术，通过构建极深极广神经网络，实现超大规模声纹识别；结合多模态信息融合等技术，以提升原有声纹识别系统性能；利用语音识别技术，实现高精度自动文本转写。

考虑言语障碍的多样性，我们以认知神经心理学的科学理论为基础，融合多模态客观声学评估和语音识别技术，实现对患者发音质量、准确度、流利度以及言语运用能力的客观评价；引入先进的三维虚拟头像发音模型，实现模仿训练，有效地促进发音练习。

声学数据同步采集，建成最全面的汉语语音系统。

从行为、认知、脑机制全方位获取标记AD早期症状的特征向量，基于人工智能方法实现多模态数据融合，提出便利的、无创的、敏感的多模态生物标记指标。

友情链接：中国科学院 | 中国科学院深圳先进技术研究院 | 国家自然科学基金委员会 | 中华人民共和国科学技术部