语音识别
DUI Speech API允许开发者通过易用的API,来接入经由强大的深度网络模型优化过的语音转文字能力。ASR SDK支持Android平台在线语音API接入,开发者通过集成SDK获取从采集音频到识别结果输出的全链路支持。结合DUI平台可定制语言模型的特性,开发者可以通过上传说法和词表的方式,对偏僻的说法以及用户相关内容的识别效果进行优化。DUI speech API还支持离线的识别,支持用户在集内自定义相关说法。
使用场景
识别引擎提供音频信息转换成相应的识别文本的能力,按照其使用条件又可分为:云端识别、本地识别。开发者应该按照设备的使用场景(网络条件)和需求,合理的选择识别方案。
云端识别
在线识别依托云端识别服务,将大规模的语言模型和声学模型托管在服务端,可承载领域信息复杂的识别需求,云端识别引擎依赖网络,通过网络传输,可支持较大规模词汇的识别能力,如:导航、音乐、信源数据查询等领域的说法。云端识别方案特别适合网络环境稳定的产品选择。
本地识别
本地识别不依赖网络,允许用户内置部分说法(词条)到本地的本地语言模型,因为识别模块属于计算密集度较高的复杂计算,依赖设备的计算性能。因此不推荐将太多的说法内置到本地语言模型内,只推荐将一些离线必须的说法(词条)内置到本地语言模型内,支撑一些离线必备的功能,如车载场景下的 :车身控制,系统控制等说法。
总结
SDK内提供了多种识别方案,开发者应该按照自己的需求合理选择适合的识别方案使用。