-
语音技术范围及技术框架特点-技术范围
语音识别:语音到文本
命令词识别:关键词检测
语音合成:文本到语音
声纹识别:声音生物信息认证
声音时间检测:呻吟场景分类,稀有事件检测,现实场景中的声学事件检测
语音前端(降噪,增强,定位,回声消除。。。)
ASR(语音识别):语音转录:实时转录(输入法),文件转录(病例,庭审记录)
KWS(关键词检测):siri,小爱同学,车载命令词
TTS(语音合成):TalkBot,有声书,泛娱乐
VPR(声纹识别):司法认证,生物信息认证
DCASE(事件检测):看护,咳嗽
FrontEnd(语音前端):直播降噪,鸡尾酒会问题(盲源分离)
查看全部 -
人工智能--语音
查看全部 -
讲了语音人工智能入门知识
第一语音发展现状
语音数据集、语音的特征提取和处理,以及所需的预备知识
查看全部 -
知识点
查看全部 -
本章复习
查看全部 -
DCASE
查看全部 -
tts
查看全部 -
语音技术范围
查看全部 -
框架选择
查看全部 -
语音技术范围
查看全部 -
语音技术范围
查看全部 -
语音技术范围
查看全部 -
语音技术范围
查看全部 -
语音基础
查看全部 -
语音基础
查看全部
举报
0/150
提交
取消