返回首页  设为首页  加入收藏  今天是:
网站首页科技手机智能科学时尚教育亲子艺术房产
相关文章
 3秒就可模仿逼真人声AI语音系…
 详细剖析汉云通信——人工智…
 人工智能AI在AI语音识别系统…
 2023年公考时政常识积累(5月…
 《十万个为什么》第六版编写…
 科技常识:科技常识积累二
 科学小知识大全100合集
 科学小知识摘抄文字
 网易时尚杂志Android版上线 …
 时尚杂志告别“黄金一代”
 可持续时尚专辑 总第21期应用…
 VOGUE服饰与美容杂志订阅202…
 2020年-21年度869本日本时尚…
 助学海报
 数字禁毒教育宣传基地、数字…
 万载交警组织出租车驾驶员进…
 泰和县实验小学开展“关爱生…
 “双争”进行时丨兴隆开展双…
 【团团圆圆过中秋】海星大自…
 【亲子活动】——红军梦主题…
 宅家带娃“三十六计”之大班…
 信阳新蕾幼教《亲近自然 快乐…
 红红火火过大年——东方岚谷…
 六一之际小学生们动手制作最…
 不敢置信!这些手工艺品居然…
 青岛同安路小学:学生制作海…
 《手工剪纸花》——浐灞第十…
 “童心向党共筑家园”—长安…
 nba2k23安卓版下载破解版
 欧洲卡车模拟3破解版全部车解…
 trucksimulatorultimate下载…
 iOS内购破解单机游戏推荐 不…
 Ovidiu Pop游戏中文版-Ovidi…
 在家学画画:教你画科技满满…
 2023年“乌鲁木齐节水有我”…
 南岗街道联合新港小学推进垃…
 禁毒宣传进校园这里的学生画…
 中宁县科协:点亮精神火炬 放…
 10月份最值得购买3款手机前两…
 10月最值得买的4部手机堪称“…
 十月份值得购买的三款手机性…
 盘点十月最值得购买的几款机…
 10月国庆买手机别盲目跟风这…
 WP7版Siri 语音软件Ask Zigg…
 不用再说“嘿 Siri”了 直接…
 Siri最新资讯-快科技--科技改…
 Hey Siri将改成Siri语音助手…
 每日一评:并非中文版Siri A…
 维基百科 20 周年
 百度百科十年上线万词条全新…
专题栏目
网络
您现在的位置: tac新闻网 >> 智能 >> 正文
高级搜索
3秒就可模仿逼真人声AI语音系统有什么用
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/6/23 6:39:13 | 【字体:

  泳池水循环2022年出现了一系列有趣的AI工具,AI绘画可以根据文本提示创建图像、艺术品甚至视频;AI写作如ChatGPT也引起了人们对写作未来的兴奋和恐惧。而最近,人工智能的另一个强大用处也进入人们的视野——AI拟音。据悉,微软研发的新语言模型Vall-E仅需3秒钟的样本录音即可模仿任何声音。逼真的声音模仿使Vall-E具有一定的安全隐患,但部分媒体认为妥善使用AI语音则会有很大帮助。

  微软将VALL-E称为“神经编解码器语言模型”,它根据文本输入和目标说话者的短样本生成音频。微软研究者在发表的报告中写道:“Vall-E出现了理解上下文的学习能力,可用于合成高质量的个性化语音,只需录制3秒的声音作为声学提示。实验结果表明,就语音自然度和说话人相似度而言Vall-E明显优于其他AI语音系统,是目前最先进的零样本(文本到语音)系统。”

  此外,Vall-E不仅可以模仿音调或质地,还可以模仿说话者的情绪基调以及说话环境的声学效果。也就是说,如果目标语音存在干扰,VALL-E也会像有干扰一样模仿该语音,“我们发现VALL-E 可以保留说话人的情感和声音环境。”在测试合成句子中,Vall-E就曾睡眼惺忪地说了这样一句话:“我们必须减少塑料袋的数量。”

  为了模仿语音,目标说话人的语音必须与训练数据紧密匹配。研究人员表示,他们已经对VALL-E进行了6万小时的英语语音训练,其中语音来自Meta的LibriLight音频库中的7000多名演讲者,这个训练量比现有其他系统都大数百倍。通过这种方式,AI可以使用其“训练”来尝试模仿目标说话者的声音或大声朗读所需的文本。

  VALL-E是微软在人工智能领域的阶段性成果,这家公司在这方面投入了大量资金,并且是OpenAI的支持者之一。OpenAI就是ChatGPT和DALL-E的幕后公司。这家软件巨头在2019年向OpenAI投资了10亿美元,近日,美国财经媒体的一份报告称微软正在考虑向该公司再投资100亿美元。

  然而,文本到语音AI拟音存在一定的安全隐患。伴随着一个警告,研究人员表明:“由于Vall-E可以合成并保存用户的语音,它可能会出现被滥用的潜在风险,例如欺骗目前软件的语音识别功能或是冒充特定的说话人。”例如,人们可以使用VALL-E使骚扰电话听起来更加真实,从而欺骗人们;政治家或具有社会影响力的人也可以被冒充;需要语音命令或语音密码的应用程序也可能受到威胁。

  此外,VALL-E还可能会侵占目前声优的工作。洛杉矶一家专注于科技与创业新闻的媒体在评述中提到:“如果更多像詹姆斯·厄尔·琼斯(James Earl Jones,演员)这样的名人同意VALL-E使用他们的声音,或是企业将可以从供应商处购买到可以完美模仿艾迪·墨菲(Eddie Murphy,演员、歌手)的软件时,那么为什么要聘请一个相对不知名的人进入录音室并花费数小时进行配音呢?”

  对于Vall-E存在的安全隐患,微软公司发表了一份伦理声明:“这项工作中的实验是在假设模型的用户是目标演讲者并得到演讲者认可的情况下进行的。当模型被推广到现实世界中无法辨别说话人时,它将包括一个协议来确保说话人批准使用和合成他们的声音。”目前,这款被微软称为“神经编解码器语言模型”的Vall-E尚未向公众开放。

  虽然AI语音存在一定的安全隐患,但多年来,互联网公司从未停止开发更真实的AI语音系统。英国的Papercup一直在为Sky News,Discovery,Cinedigm等主要媒体品牌提供多种语言的自然人声AI配音。Sonantic公司通过将非语音声音融入其音频模拟中,例如微小的嘲笑声、微弱的呼吸声,或咯咯笑声,以生成极其逼真的效果。

  不可否认的是AI合成语音有很多潜在优势,在适当的环境下,AI语音可以帮助节省大量时间和金钱。例如,一位创作者存入自己的声音就可以让AI帮忙录制整个有声读物。在处理重要公共卫生信息或重要安全通知时,音频工程师可以尝试更多的声音和说话风格,以找到最有效的声音并广为流传。

  在2014年接受喉癌治疗后永久失声的演员瓦尔·基默(Val Kilmer)就曾与Sonantic公司合作,为自己在日常生活中创造了一种由人工智能驱动的说话声音。而当日渐成熟的AI语音技术与AI对话技术相结合,逼真声音将为虚拟对话带来更真实的体验。新聊天机器人Character.AI可以让用户与几乎任何人交谈,不管是历史上诸如马克思、伊丽莎白等名人,还是去世的亲人。那么,将Vall-E与Character.AI结合,怎样的元宇宙将展现在我们面前?

智能录入:admin    责任编辑:admin 
  • 上一个智能:

  • 下一个智能: 没有了
  •  
     栏目文章
    普通智能 3秒就可模仿逼真人声AI语音系统有什么用 (06-23)
    普通智能 详细剖析汉云通信——人工智能语音交互系统 (06-23)
    普通智能 人工智能AI在AI语音识别系统中是怎样应用的包… (06-23)
    普通智能 WP7版Siri 语音软件Ask Ziggy免费上架 (06-22)
    普通智能 不用再说“嘿 Siri”了 直接“Siri”即可唤醒… (06-22)
    普通智能 Siri最新资讯-快科技--科技改变未来 (06-22)
    普通智能 Hey Siri将改成Siri语音助手越发受重视国产手… (06-22)
    普通智能 每日一评:并非中文版Siri Airi安卓版评测 (06-22)
    普通智能 jovi语音名字在哪里改 jovi语音修改名字方法教… (06-22)
    普通智能 vivo智能语音助手Jovi:覆盖主流应用应用场景… (06-22)
    普通智能 vivo手机智能辅助语音控制在哪 (06-22)
    普通智能 智能一周烩:多款IoT新品来袭vivo全新TWS耳机… (06-22)
    普通智能 5G前夜vivo转身:AI奇袭物联网 (06-22)
    普通智能 视声智能已收到第 34 次审议会议公告:广州市… (06-21)
    普通智能 36氪研究院 2020年智能家居行业研究报告 (06-21)
    普通智能 5G加持预见2020智能家居 顺丰丰修品质服务多点… (06-21)
    普通智能 智能家居正在入侵 (06-21)
    普通智能 全球速看:15万以内智能·家居SUVMUFASA 沐飒… (06-21)
    普通智能 微软人工智能聊天机器人Tay曝光:或亮相Build… (06-21)
    普通智能 人工智能聊天机器人有哪些 (06-21)