当前位置:主页 > 国内 > 基于DSP的中文语音合成系统设计【亚博APp买球首选】
基于DSP的中文语音合成系统设计【亚博APp买球首选】
时间:2021-04-05 00:07 点击次数:
本文摘要:第三章阐述了一种基于数字信号处理器的汉语语音合成系统的构建方法。随着语音信号处理技术的快速发展和成熟,语音合成逐渐成为信息技术中人机界面的关键技术。 DSP芯片,即数字信号处理器,是专门为慢慢构建各种信号处理算法而设计的结构类似的微处理器,其处理速度比最慢的CPU慢10~50倍。1.语音合成在系统整体方案中的第二个唯一特征是从有限的存储单元中准备具有无限词汇量的互易句。

亚博APp买球首选

第三章阐述了一种基于数字信号处理器的汉语语音合成系统的构建方法。随着语音信号处理技术的快速发展和成熟,语音合成逐渐成为信息技术中人机界面的关键技术。

DSP芯片,即数字信号处理器,是专门为慢慢构建各种信号处理算法而设计的结构类似的微处理器,其处理速度比最慢的CPU慢10~50倍。1.语音合成在系统整体方案中的第二个唯一特征是从有限的存储单元中准备具有无限词汇量的互易句。为了做到这一点,系统设计为:(1)前端预处理模块将输出的文本文件转换成系统能够处理的标准格式;(2)从韵律规则库中获取当前语言环境中每个音节的韵律特征参数;(3)语音合成器根据等效韵律特征参数,扩展并调整完整语音库中合适语音单元的声学参数;(4)将调整后的语音单元拼接在一起,得到适合输出文本的互逆语音输入。

系统的基本原理框图如右图所示。硬件系统设计这个中文语音合成系统的目的是将输出的文本文件以交互语音的形式清晰、自然、莫名其妙地输入。ATMEL公司的AT89S52单片机对键盘输入的文本文件进行扩展,然后发送给TMS320VC5402进行处理。最后,输入准备结果。

硬件结构框图如图2右图所示。2.1指示电路AT89S52的键盘电路和键盘模块电路采用中断方式。当按下一个键时,将产生一个中断请求,中断处理将被转移。

然后,通过查找P1.0和P1.1的条件,将执行适当的处理。电阻和电容不足以消除电路抖动,以免电路误操作。AT89S52将键盘输入的文本信息呈现给液晶显示器,并将数据写入外部存储器CY7C133。

然后TMS320VC5402将信息加载到CY7C133上进行处理。1LCD的指令格式如表1右图:表1,要求RS和R/W自由选择哪个寄存器,如表2右图:表2,自由选择寄存器2.2 TMS320VC5402与AT89S52、AT89S52、TMS 320 VC 5402之间的通信工作在独立国家,它们的信息和数据交换是通过共享一个外存储器来构建的,它们之间的信号通信是通过软连接和软件判别来构建的[2]外存储器采用CY7C1它有两组独立国家的地址线、数据线和控制信号线,允许两个控制设备中的数据通过共同连接的存储器进行通信。

双端口RAM允许两个控制器同时加载任意存储单元(包括同时读取同一单元),但不允许同时写出统一地址单元或一次读写。对于TMS320VC5402,数据存储器CY7C133对应的地址是4000H~47FFH。对于AT89S52,数据存储器CY7C133对应的地址是2000H~27FFH。

3.软件系统将汉语设计为声调语言,其韵律特征非常复杂。为了从有限的存储单元中准备出词汇量无限的倒易句,需要在一定的韵律规则下,扩展和调整语音库单元的韵律参数,从而获得符合当前语言流环境的语音变化单元。根据获取语音单位的方法不同,语音合成器可以分为两种类型:(1)波形拼接准备;(2)参数准备(也称为源/过滤器准备)。

在该系统中,需要利用波形拼接准备的方法,对时域和频域波形进行扩展和调整,以获得必要的语音单元。很难通过非常简单的波形拼接方法来调整音高和时长(时长)。因此,在该系统中,必须将中性语调音节拼接在一起,以适应音高实时波形变换(PSOLA)算法,然后使用代码启发的线性预测(CELP)编码方法对完整的采样声音库进行编码和传输。基本流程图如图3右图所示。

4结论本系统使用单片机动态指示输出文本文件,需要在准备好的语音和输出文本文件之间建立对比输入,直观;准备算法的计算复杂度低,需要使用尽可能小的声音库来构造容量有限的存储空间的空闲度的拒绝,清晰度、可懂度、自然度较低。


本文关键词:基于,DSP,的,中文,语音,合成,系统,设计,【,亚博APp买球首选

本文来源:亚博APp买球-www.ziruidz.com

Copyright © 2004-2021 www.ziruidz.com. 亚博APp买球首选科技 版权所有  网站地图   xml地图  备案号:ICP备78320447号-3

在线客服 联系方式 二维码

服务热线

054-646184776

扫一扫,关注我们