大规模语音识别利用深度学习技术,通过构建极深极广神经网络,实现超大规模声纹识别;结合多模态信息融合等技术,以提升原有声纹识别系统性能;利用语音识别技术,实现高精度自动文本转写。
言语康复及病理语音考虑言语障碍的多样性,我们以认知神经心理学的科学理论为基础,融合多模态客观声学评估和语音识别技术,实现对患者发音质量、准确度、流利度以及言语运用能力的客观评价;引入先进的三维虚拟头像发音模型,实现模仿训练,有效地促进发音练习。
多模态言语交互声学数据同步采集,建成最全面的汉语语音系统。
汉语言的脑认知从行为、认知、脑机制全方位获取标记AD早期症状的特征向量,基于人工智能方法实现多模态数据融合,提出便利的、无创的、敏感的多模态生物标记指标。
|