语音生成简介

语音生成是经过机械的、电子的方法产生人造语音的技能。TTS技能（又称文语转化技能）隶属于语音组成，它是将计算机自己产生的、或外部输入的文字信息转变为能够听得懂的、流利的汉语白话输出的技能。采用世界领先的语音组成技能，研制出来的“语音组成助手”软件能够完美的完结语音组成作业。

语音生成简介图1

概述

语音生成是利用电子计算机和一些专门装置模拟人，制作语音的技能。

专业技能

语音组成和语音辨认技能是完成人机语音通讯，建立一个有听和讲才能的白话体系所必需的两项关键技能。使电脑具有类似于人相同的说话才能，是当今时代信息产业的重要竞争商场。和语音辨认比较，语音组成的技能相对说来要老练一些，并已开端向产业化方向成功迈进，大规模应用指日可下。

语音生成，又称文语转化（Text to Speech）技能，能将恣意文字信息实时转化为标准流畅的语音朗读出来，相当于给机器装上了人工嘴巴。它触及声学、言语学、数字信号处理、计算机科学等多个学科技能，是中文信息处理范畴的一项前沿技能，处理的首要问题就是如何将文字信息转化为可听的声响信息，也即让机器像人相同开口说话。咱们所说的“让机器像人相同开口说话”与传统的声响回放设备（体系）有着实质的差异。传统的声响回放设备（体系），如磁带录音机，是经过预先录制声响然后回放来完成“让机器说话”的。这种方式无论是在内容、存储、传输或者方便性、及时性等方面都存在很大的限制。而经过计算机语音组成则能够在任何时候将恣意文本转化成具有高天然度的语音，然后真正完成让机器“像人相同开口说话”。

转化体系

文语转化体系实际上能够看作是一个人工智能体系。为了组成出高质量的言语，除了依赖于各种规矩，包含语义学规矩、词汇规矩、语音学规矩外，还必须对文字的内容有很好的了解，这也触及到天然言语了解的问题。下图显示了一个完整的文语转化体系示意图。文语转化进程是先将文字序列转化成音韵序列，再由体系根据音韵序列生成语音波形。其间第一步触及言语学处理，例如分词、字音转化等，以及一整套有效的韵律操控规矩；第二步需求先进的语音组成技能，能按要求实时组成出高质量的语音流。因此一般说来，文语转化体系都需求一套杂乱的文字序列到音素序列的转化程序，也就是说，文语转化体系不只要应用数字信号处理技能，并且必须有很多的言语学常识的支撑。

语音生成简介

相关下载

相关文章

相关软件