语音系统性能简介
⒈ SMARTQ-VOICE 语音系统采用 语音合成技术 (Text To Speech),简称TTS,它涉及声学、语言学、数学信号处理技术、多媒体技术等多个学科技术,是中文信息处理领域的一项前沿技术,主要是处理如何将文字信息转化为语音信息。广泛应用于各个行业的呼叫中心及其他需要把文本转语音的场合。本软件包为软件开发人员提供了良好的语音合成效果以及简洁实用的开发接口。
2.主要技术优势特点:
• 支持对汉字、英文字母、阿拉伯数字进行语音合成;
• 支持 GB2312码(简体中文)、BIG5码(繁体)、UNICODE码;
• 合成效果平滑、自然,有较强语感;
• 支持多音字(自定义读音)编辑,并且自带常用的多音字词组库;
• 支持多线程;支持 MS-PCM WAV 、 Dialogie VOX 、 Alaw 、Ulaw 格式,支持采样率 44K、32K、22K 、 16K 、 11K 、 8K 、 6K;
• 提供标准函数接口 ,方便易用,支持各种开发语言,如VC、VB、Delphi、C++Builder等;
• 兼容微软 SAPI接口。
3. SMARTQ-VOICE_TTS 软件运行的硬件环境是:适用于 PC 机, CPU 主频 500 以上 ; 内存 128MB ; 硬盘空间 800MB 以上 ; 有声卡,光驱 ; Windows 兼容之鼠标、键盘。
运行的软件环境是: Microsoft Windows 98/ME/NT4.0/2000/XP 简体中文版(推荐: Microsoft Windows 2000/XP 简体中文版)。
技术指标:
• 语音库的大小: 37M、170M(可选)女声;
• 能够对所有的汉字、英文、阿拉伯数字进行语音合成;
• 支持繁体字及多音字的编辑;
• 合成效果:自然、平滑;
• 规范的函数调用接口,同时支持微软 SAPI的调用;支持同步调用和异步调用方式;
• 经过了严格的压力测试,稳定可靠;
• 支持 PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等多种语音格式;
• 支持 GB2312码(简体中文)、BIG5码(繁体)、UNICODE码;
• 支持多路通道同时合成;
• 支持 Windows98/2000/xp/me等操作系统;
• 支持多种语音板卡;
• 适用于企业级中小规模语音平台的应用。
4.系统结构图 :

5.SmartQ Intone 1.0技术指标:
• 语音库的大小: 90M,女声;
• 能够对所有汉字、英文、阿拉伯数字进行语音合成;
• 支持用户自定义读音,对多音字的读法可进行灵活定制;
• 支持 PCM Wave,uLaw/aLaw Wave,ADPCM,Dialogic Vox等多种语音格式;
• 规范的函数调用接口,支持微软 SAPI的调用;支持同步调用和异步调用方式;
• 应用了 PSOLA、LMA等算法,合成效果平滑、自然,接近真人的发声;
• 支持时间、日期、特殊符号等格式的合成;
• 运用了词性切分,智能停顿、语感强、智能化判断人名、地名;
• 支持 TCP/IP及局域网内的调用;
• 支持 GB2312码(简体中文)、BIG5码(繁体)、UNICODE码;
• 支持对合成的语速、音量、音高等参数的无级调整;
• 支持多种语音板卡;
适用于医院排队系统语音平台的应用 |