OpenAI 发布新语音系统「Whisper 」英文识别能力可接近人类水平sloggi是什么金亨俊整容

返回首页　

设为首页　

加入收藏　

今天是:

网站首页科技手机智能科学时尚教育亲子艺术房产

OpenAI 发布新语音系统「Whi…
iEnglish教育游戏模板让英语…
【小编说事】智能电视应该坚…
ARM CEO专访万字实录：不造芯…
创维AR电视是什么意思？全球…
什么是智能电视？智能电视机…
云电视是什么意思什么叫云电…
提升养殖经济效益兴勒科技赋…
千份好礼相赠2022粤港澳数码…
人民邮电出版社携手“棋后”…
曝印度有意吸引科技巨头希望…
2023年厦门市科技计划项目面…
寓教于乐的亲子游戏：toio&#…
鮀城家风家教云课堂(4) 亲子…
“幼儿园亲子活动”引争议网…
宋少卫世界上所有的孩子都会…
早教亲子游戏对孩子成长的意…
优秀传统文化入心出彩撒旦冷…
发扬民间艺术传承中华文化--…
中国传统文化：剪纸文化信号…
中国传统民间艺术走向世界延…
坚定文化自信异世之化身为龙…
新天地时尚新艺术生活展现独…
细节彰显生活品质时尚大师的…
年轻生活自有态度勇敢表态彰…
APP成年轻群体“显示器”彰显…
简洁的生活方式体现在这里大…
改革创新是教育发展的根本动…
信息时代人工智能的教育本质…
教育评价改革三大核心问题好…
德国教育的本质飘渺之旅2特工…
面向未来的国际教育：教育的…
宜昌8月房地产市场数据发布音…
多个城市楼市成交走暖房地产…
越秀星汇城青岛楼市政策不断…
博枫资产管理布局新赛道多元…
房地产是不是都翻不了身了各…
苹果眼红了？折叠屏手机上半…
手机中高端市场竞争加剧94频…
现在国产手机哪个好湘东中学…
2022年国产手机哪个品牌最值…
回头草就是香！全球第一手机…
三本文笔一流剧情佳的小说剧…
5本精彩绝伦的科幻小说作者想…
5本精彩的科幻小说主角大力发…
三元推出针对糖尿病人的“双…
移动影像黑科技时代华为P50系…
给证件照换底色app免费的有哪…
分享5种证件照换底色的简单方…
想知道证件照如何换背景颜色…

专题栏目

您现在的位置： tac新闻网 >> 科技 >> 正文

高级搜索

OpenAI 发布新语音系统「Whisper 」英文识别能力可接近人类水平sloggi是什么金亨俊整容

作者：佚名文章来源：本站原创点击数：更新时间：2022/9/28 13:15:22 | 【字体：小大】

　　主动语音识别（ASR）系统「Whisper 」式一个，8 万个小时多语音和多使命监视数据研究团队通过利用从收集上收集的 6，进行锻炼来对其。

　　21 日9 月，「Whisper 」的神经收集OpenAI 发布了一个名为，接近人类程度的鲁棒性和精确性声称其在英语语音识别方面已。

　　团队还发觉此外研究，hisper 」的零样本机能时当在很多分歧的数据集上丈量「W，比其他模子表示愈加稳健「Whisper 」相，了 50%错误率降低。

　　万小时音频中当前在 68，笼盖了 96 中其他言语共 11.7 万个小时，个小时的转录和翻译数据还包罗 12.5 万，之一长短英语的即大约有三分。

　　同研究表白此前有不，著提高音频编码器的质量虽然无监视预锻炼能够显，质量的预锻炼解码器但因为缺乏划一高，集中的微和谐谈以及特定于数据，了模子的无效性和鲁棒性因而在必然程度上限制；预锻炼语音识别系统中而在部门有监视的体例，模子呈现出更高的鲁棒性其表示会比单一源锻炼的。

　　此对，per 」中在「Whis，高质量数据集总和大几倍的根本上OpenAI 在新数据集比现有，级扩展至 68 万小时将弱监视语音识此外数量；时同，了在这种规模下研究团队还演示，无数据集的零射击表示所锻炼模子在转移现，数据集微调的影响可消弭任何特定于，质量成果以实现高。

　　pathy 也转发了这一动静称 OpenAI 正处于最好的形态中 src=前特斯拉人工智能和主动驾驶部分担任人 Andrej Kar。

　　研究团队发觉锻炼过程中，高对口音、布景乐音和手艺言语的鲁棒性利用如斯复杂且多样化的数据集能够提。

　　数据集规模外除了足够大的，还支撑多种言语的转录「Whisper 」，言翻译成英语以及将这些语。

　　 Sutskever 对此暗示OpenAI 创始人 Ilya，话的靠得住的语音识别系统终究有一个能理解我说。

　　练一个序列到序列的转换器模子在很多分歧的语音处置使命中训，、口头言语识别和语音勾当检测包罗多言语语音识别、语音翻译；解码器预测的标识表记标帜序列所有使命都暗示为要由，语音处置管道的分歧阶段答应单一模子代替保守；用一组特殊的标识表记标帜多使命锻炼格局使，定者或分类目作为使命目标

　　用一种简单的端到端方式Whisper 架构采，er 来实现：输入音频被分成 30 秒的块通过编码器 - 解码器 Transform，频谱图后传送到编码器转换成 log-Mel。响应的文本题目解码器可预测，标识表记标帜夹杂并与特殊，级时间戳、多言语语音转录和英语语音翻译等使命由这些标识表记标帜指点单个模子施行诸如言语识别、短语。

　　以原始言语转录或翻译成英语的使命「Whisper 」会交替施行，团队发觉对此研究，文本的翻译方面出格无效这种方式在进修语音到，英语翻译零样本的监视 SOTA而且优于 CoVoST2 到。

　　提的是值得一，一个复杂且多样的数据集长进行因为「Whisper 」是在，的数据集进行微调没有针对任何特定，briSpeech 机能的模子因而它不会击败特地研究 Li。

科技录入：admin 责任编辑：admin
	上一个科技： iEnglish教育游戏模板让英语自主学习成为可能朱元冰qqlol尘埃有声小说古今奇案下载下一个科技：没有了

　栏目文章

OpenAI 发布新语音系统「Whisper 」英文识别能… (09-28)	iEnglish教育游戏模板让英语自主学习成为可能… (09-28)
三本文笔一流剧情佳的小说剧情高能不断书荒不… (09-28)	5本精彩绝伦的科幻小说作者想象力超大值得细细… (09-28)
5本精彩的科幻小说主角大力发展科技最后迈向星… (09-28)	三元推出针对糖尿病人的“双低G”酸奶酸奶创… (09-28)
移动影像黑科技时代华为P50系列惊艳来袭智器粉… (09-28)	AlphaGo战胜了天才斯巴鲁傲虎黑科技为你的旅途… (09-28)
全球天才黑客云集看他们现场上演脑洞大开的黑… (09-28)	培养创新人才：toio™创意机器人套件将教… (09-28)
二战黑科技：10款天才般设计的武器未改变战争… (09-28)	二战天才黑科技如果全部实现不知今天世界是什… (09-28)
封面评论｜需要重生的是整个电影业香国特攻丧… (09-28)	巨型机甲《未来战：重生》超级火力激战[多图… (09-28)
济南市政府门户网站exo妖孽美男团训爱晚上回家… (09-28)	未来战争重生巨型机甲碾压来袭超级炮台火力助… (09-28)
一个超级造船巨头或将诞生！密传二转答案易元… (09-28)	前高校老师打造制假科技“王国” 千万伪劣农药… (09-27)
掌舵10年缔造出11万科技帝国这位天选之子年薪… (09-27)	点滴｜疆域帝国、市场帝国与科技重生之官路商… (09-27)

	设为首页加入收藏联系站长友情链接版权申明网站公告管理登录
	tac新闻网声明：登载内容出于传递信息之目的，绝不意味着赞同其观点或证实其描述，若侵权请来信告知，我们将及时处理！