蝴蝶结变声器(名侦探柯南同款变声器)

领结变声器(名侦探柯南的同一个变声器)

编者按:智慧显示未来,洞见显示新知。中国科学院之声和中国科学院自动化研究所联合开设科普专栏《至理名言》为您介绍人工智能相关的知识和故事。从最新的成果到背后的趣闻轶事,带你走遍AI空,看看人工智能如何唤醒万物,让世界变得更美好。

在《名侦探柯南》中,最令人羡慕的黑科技是阿笠博士制造的领结变声器。为了隐藏自己的身份,柯南会通过变声器模仿毛利小五郎等人的声音来隐藏自己的身份。有了这个变声器,声音可以变成任何人的声音。

要实现变声器的变声功能,可以使用语音转换技术。语音转换,广义上是指对语音的个体特征进行修改,目的是修改语音信号的一个或多个方面,同时保留语音中语言内容的信息;狭义上是指将源语者的语音转换成具有目标语者发音特征的语音。

语音转换系统的基本框架图

语音转换研究算法主要包括训练模块和转换模块。

训练模块包括特征分析、特征对齐、模型训练和转换功能。特征对齐模块用于建立两个说话者的语音特征之间的映射规则。一些语音转换要求源语音和目标语音具有相同的语音文本内容。在建立训练语音转换模型之前,由于说话人发音速度的差异,提取的说话人语音特征需要在时间尺度上对齐。常用的方法有动态时间规整和基于隐马尔可夫模型的强制对齐算法,而有些语音转换系统不需要并行语料库,需要其他特殊处理。

语音转换模型可以建立源语音和目标语音声学特征之间的映射关系,其方法是估计一个或一组映射函数,使转换后的特征与目标特征之间的误差最小。常用的语音转换模型包括码本映射、高斯混合模型、隐马尔可夫模型和人工神经 *** 。

一个完整的语音转换系统要解决以下三个问题:语音朋友资源 *** 的哪些特征可以代表语音信号中说话人的信息,如何估计这些特征?如何建立源语者和目标语者语音特征之间的对应规则?如何从转换后的语音特征合成转换后的语音信号?

之一个问题指的是三个方面:演讲内容,演讲人的性格特征,演讲背景信息。说话人的个性是语音转换的重点。

第二个问题是,如果在言语信息的三个方面根据说话人的个性特征建立源与目标的对应关系,则排除了其他两个方面的干扰。一般来说,假设语音背景信息相同或一致,所以主要干扰信息来自语音内容信息。这就是数据对齐的目的。它是语音转换中非常重要的模块,会直接影响语音转换的结果。

第三个问题可以通过模型训练模块和转换模块来解决,这也是语音转换中比较成熟的技术。

语音转换技术应用广泛,例如:

个性化语音合成系统:在语音合成系统中,单词直接合成语音,合成的新语音个性单一,听起来像生硬的机器语言,不自然。如果语音是由语音合成系统生成的,则使用语音转换系统作用于语音,或者合成单元先经过语音转换系统,再进行语音合成,然后得到具有特定说话人个性特征的合成语音。语音转换研究涉及大量说话人个性特征的分析和建模,其研究成果对情感、个性化语音等特色语音的分析和生成具有重要意义,可以弥补单一语音合成系统存在的缺陷,使合成的语音具有丰富的个性化特征,进而得到听觉效果更好的语音。

个性化语音合成系统

语音翻译系统:语音翻译系统是将一种语言的语音翻译成另一种语言的语音,同时保持说话人的身份和说话风格。首先由系统通过语音识别转换成单词,然后由机器翻译成另一种语言,最后由语音合成系统和跨语言语音转换系统合成翻译出来的句子。

语音翻译系统

说话人的语音认证系统:语音转换系统将语音转换成特定目标说话人的风格,不法分子可以通过语音转换系统伪造语音数据,说话人认证系统就是识别说话人真伪的系统。

改变说话人的身份:可以使用语音转换技术保护重要人物的身份,也可以用于配音。

把……戏称为;给……起绰号

说话和助听器:社会上有很多人因为后天的原因而患上声道损伤。他们说话的时候会包含更多的噪音,声音嘶哑,不清晰,很难识别。我们可以通过语音转换系统来提高他们的声音质量,该系统可以通过合成更容易理解或典型的声音来帮助有语言障碍的人,也可以应用于使用电动喉头装置的辅助语音设备。可以用类似的方法来提高语音的可懂度,特别是在嘈杂的环境下,提高未来助听器的性能,从而获得识别度更高的语音,这将为这些患者提供极大的便利,改善他们的生活。


本文标题:蝴蝶结变声器(名侦探柯南同款变声器) - 鲁菜
本文地址:www.hbeat.net/caixi/40057.html

河北美食网微信公众号

我看你很有天赋,关注河北美食网,跟我学做菜吧!

扫描二维码 或 搜索微信公众号"hbeat.net"即可立即关注!
让您每天胃口大开。

上一篇:南北是什么意思(你知道东西南北的来历吗?)

下一篇:联合国下半旗(联合国为蒋介石降半旗)