tn系统有哪些(tn系统是什么)
TN全称Text Normalization,意思是文本规整、文本正则化 。
TN是 TTS (Text-to-speech,文本转语音) 系统中的重要组成部分,主要功能是将文本中的数字、符号、缩写等转换成语言文字。
如:20% >> 在中文TTS系统里会被转换成“百分之二十”,在英文TTS系统里则会被转换成“twenty percent”。
15:02 >> 可能被转换成“十五点零二分”(现在是15:02),也可能被转换成“十五比二”(AC米兰以15:02暂时领先)。
由此可以看出TN会根据语境对同一文本进行不同的转换。
扩展资料中文文本正则化(Text Normalization)是把非汉字字符串转换为汉字字符串以确定其读音的过程。
文本正则化在语音合成、语音识别、机器翻译、主题检测、文本挖掘等领域有着重要应用。
加权有限状态转换器(Weighted Finite StateTransducer,WFST)是一种很好的规则与统计相结合的技术,本文以WFST为框架,设计并实现了一个中文文本正则化系统。
中文文本正则化所设计的文本正则化系统主要由三个模块构成:规则集合,词典和语言模型。
本文利用合成(Composition)算法对各层模型进行合并,并使用WFST的确定化(Determination)、最小化(Minimization)算法对搜索网络进行优化。
参考资料来源:百度百科--TN。