语音识别

DUI Speech API允许开发者通过易用的API，来接入经由强大的深度网络模型优化过的语音转文字能力。ASR SDK支持Android平台在线语音API接入，开发者通过集成SDK获取从采集音频到识别结果输出的全链路支持。结合DUI平台可定制语言模型的特性，开发者可以通过上传说法和词表的方式，对偏僻的说法以及用户相关内容的识别效果进行优化。DUI speech API还支持离线的识别，支持用户在集内自定义相关说法。

使用场景

识别引擎提供音频信息转换成相应的识别文本的能力，按照其使用条件又可分为：云端识别、本地识别。开发者应该按照设备的使用场景(网络条件)和需求，合理的选择识别方案。

云端识别

在线识别依托云端识别服务，将大规模的语言模型和声学模型托管在服务端，可承载领域信息复杂的识别需求，云端识别引擎依赖网络，通过网络传输，可支持较大规模词汇的识别能力，如：导航、音乐、信源数据查询等领域的说法。云端识别方案特别适合网络环境稳定的产品选择。

本地识别

本地识别不依赖网络，允许用户内置部分说法(词条)到本地的本地语言模型，因为识别模块属于计算密集度较高的复杂计算，依赖设备的计算性能。因此不推荐将太多的说法内置到本地语言模型内，只推荐将一些离线必须的说法(词条)内置到本地语言模型内，支撑一些离线必备的功能，如车载场景下的：车身控制，系统控制等说法。

总结

SDK内提供了多种识别方案，开发者应该按照自己的需求合理选择适合的识别方案使用。

results matching ""

No results matching ""