上海优同科技有限公司

语音识别

简介

语音识别技术(Auto Speech Recognize，ASR)，是让机器能够"听懂"人类的语音，将语音中包含的文字信息"提取"出来，相当于给机器安装上"耳朵"，使其具备"听"的功能，进而进行人机通信和交互。

适配平台

MTK、Windows、CSR、Android、Melis、Mcrp、IOS、linux

技术优势

开发了可移植性强的中文嵌入式语音识别引擎，尺寸小，能耗低。
开发了响应速度快，识别率高的中文云端语音识别引擎
在声学模型建模方面拥有独到的技术，口音适应能力、抑制环境噪音方面优势明显
支持数十种主流语言（中文、英文、法语、俄语、德语、西班牙语等）的语音识别

支持5米以上的远距离识别，支持命令数上千
云端语音识别引擎部署方式多样化，数据保密性强
超大规模N-Gram语言模型，能够支持50万词条级别的普通话语音识别
研发出软硬一体的语音识别模组，能够提供全面的语音解决方案

语音合成

简介

语音合成技术（Text to Speech，TTS），是将文字信息转化为可听的声音信息，也即"让机器像人一样开口说话"。

适配平台

MTK、Windows、CSR、Android、Melis、Mcrp、IOS、linux

技术优势

引擎开发了覆盖世界大多数国家的25种语言（中文、英文、法语、俄语、德语、西班牙语、日语、韩语等），填补国内空白
2-3个月可以定制一门新语言
普通话及英语合成技术处于业界前沿

支持中英文无缝对接
研发出软硬一体的语音合成模组，能够提供全面的语音解决方案

语音测评技术

简介

语音评测技术又称计算机辅助语言学习(Computer Assisted Language Learning)，是利用机器自动对用户口语发音进行评分、检错并给出矫正指导的技术，能为学生提升口语和听力水平提供实质性的帮助。

适配平台

MTK、Windows、CSR、Android、Melis、Mcrp、IOS、linux

技术优势

综合利用前沿的大词汇量连续语音识别技术和高质量语音合成技术，从音素、音节、词汇到句子篇章一级进行全面细致深入的评测，并从宏观层面使用时长和音高曲线等多种韵律模型进行相似度比对拟合，使打分结果和矫正指导更加准确、可靠和合理
利用领先的高质量语音合成技术可以为任意文本自动生成清晰流畅的标准音，解决生词、新词和非常用词发音难的问题

支持数十种主流语言（中文、英文、法语、俄语、德语、西班牙语等）的语音评测；
已将语音评测技术应用到K12英语教育中，对口语发音进行评分、检错并给出矫正；
基于长期的技术积累和优势，英语语音评测技术已经到达国内领先水平，并能自动据识无关语种
配合口型动画演示单词发音过程，矫正发音更加形象生动

说话人识别

简介

说话人识别技术（Speaker Recognize），是一项根据语音波形中反映说话人生理和行为特征的语音参数，自动识别说话人身份的技术。

适配平台

MTK、Windows、CSR、Android、Melis、Mcrp、IOS、linux

技术优势

校验和鉴别用户身份，确定该说话人是否为本人或是否为集群中的哪个人
数据采集极为方便，造价低廉，是非常经济、可靠、简便和安全的身份识别方式
唯一可用于远程控制的非接触式生物识别技术

任何时候，只需输入说话者的语音，依靠独特的声纹便可被安全地鉴别
研发出软硬一体的说话人识别模组，能够提供全面的语音解决方案

多国语言

简介

在外文的语音合成和语音识别方面，优同的技术引擎已经开发了25种语言，支持所有主流语言，覆盖全世界绝大多数国家，目前国内只有我们公司能做到。如客户有个性化定制需求，如发音人、语言，包括多国语言和少数民族语言，优同可以在2-3个月之内研制出一门全新语言的合成和识别引擎，快速实现定制。

适配平台

MTK、Windows、CSR、Android、Melis、Mcrp、IOS、linux

技术优势

优同语音合成引擎开发了覆盖世界大多数国家的25种语言（中文、英文、法语、俄语、德语、西班牙语、日语、韩语等），填补国内空白
快速（2-3个月）定制新语言

优同语音识别引擎支持数十种主流语言（中文、英文、法语、俄语、德语、西班牙语等）的语音识别