楚霸王称霸现代语音机器人是指有较强对话能力的机器人。如引导机器人、手机语音助手等。发展到现在,语音机器人不单单是简单机械对话,更多是智能语音。
智能语音主要经历了四个阶段:模板匹配与特征分析方法为主导的认知阶段;以概率统计建模方法为主导的起步阶段;以深度神经网络为主导的发展应用阶段以及综合应用阶段。
智能语音市场的城市、政府和资本的扶持与重视以及数字化、智能化的市场需求不断扩大,中国智能语音行业市场规模将进一步增长,预计在2030年市场规模将达到1452亿元。
据分析,2020年中国智能语音行业市场竞争格局与发展前景分析市场规模增速超25%。
语音机器人是指有较强对话能力的机器人。如引导机器人、手机语音助手等。发展到现在,语音机器人不单单是简单机械对话,更多是智能语音。
定义:智能语音主要研究如何通过语音实现人机交互,相关支撑技术主要可分为基础语音技术、智能化技术以及大数据技术。
作用:人工智能的关键技术均以实现感知智能和认知智能为目标。语音识别、图像识别和机器人视觉、生物识别等目前最火热的领域,主要解决的是感知智能的需求,就是使得人工智能能够感知周围的世界,能够“听见”或者“看到”。
智能语音是人工智能技术的重要组成部分,包括语音识别、语义理解、语音交互等。
自然语言理解、智能会话、智能决策、人机交互等技术更加侧重的是认知智能的领域,解决“听懂”、“看懂”,并且根据学习到的知识对人类的要求或者周围的环境做出反应的能力。
在关键技术层中,语音识别、自然语义理解Nature Language Process, NLP)机器学习领域的关键技术在人工智能技术当中居于重要地位,是人机交互技术的基础。
智能语音作为人工智能的核心技术之一,随着人工智能时代的到来,加以国家政策以及技术 发展等因素的驱动,智能语音必将会消费级以 及企业级等得到更深度的发展。
智能语音主要经历了四个阶段:模板匹配与特征分析方法为主导的认知阶段;以概率统计建模方法为主导的起步阶段;以深度神经网络为主导的发展应用阶段以及综合应用阶段。
人类对机器语音识别的探索始于20世纪50年代,迄今已逾70年。2016年,在深度神经网络的帮助下,机器语音识别准确率第一次达到人类水平,意味着智能语音技术落地期到来。
后随着近场语音识别准确率提升、远场语音识别和唤醒发展、全双工语音交互出现、基于NLP的对话和问答能力逐渐成熟、知识图谱技术助力对话引擎以及针对实际应用中的算法优化,智能语音技术的落地可用性不断突破。
但其背后涉及的声学研究、模式识别研究、通用NLP研究及垂直场景的深度语义理解等还未成熟到拼成一个没有明显短板的“木桶”。
因此尽管部分智能语音产品如语音助手、语音转写、智能客服等已取得了产品价值突破或商业上的显著成就,但在细分产品的交互体验、使用效果、场景优化等方面仍面临长期求索。人们面对“AI”时希望得到的自然、类人、甚至高信息密度的交互体验,仍然是一个宏伟的开放性课题。
2020年与2021年,我国智能语音技术在多方面实现创新,取得突破性进展。从语音技术成熟度曲线来看,多数语音技术已经进入稳步爬升期,甚至语音识别技术已经处于生产成熟期,这意味着智能语音技术逐渐成熟,语音机器人未来几年市场将维持高速发展。
语音合成:科大讯飞研究院同中科大联合团队,在2020国际银色转换大赛中夺冠。
语音识别:网易数帆易智团队在DCASE 2021挑战赛Task6自动音频描述任务中以绝对优势夺冠。
说话人分离:在DIHARD-3中,科大讯飞联合中科大语音及语言信息处理国家工程实验室在四个任务排行上包揽所有指标第一。
语音增强:快手公司取得了ABC challenge回声消除比赛双讲回声消除的单项世界冠军。
声音检测:科大讯飞研究院联合中科大,在DACSE2020挑战赛Task3声音事件定位与检测任务中夺冠。
语音交互:科大讯飞获得DSTC10比赛“多模拟态对话场景文本回复”任务冠军。
随着智能音箱等交互类产品市场的逐渐饱和,语音识别增长速度放缓;而随着医疗、教育、金融等行业各领域市场交互需求的释放,语义理解市场份额将快速上升。
智能语音产业主要分上游基础设施供应商、中游智能语音服务商与下游应用领域。
基础硬件供应商为行业上游提供人工智能芯片、传感器等智能硬件,软件服务商主要包括数据服务平台商、云计算服务商等参与主体。
基础硬件——芯片人工智能芯片作为智能语音产业的核心,芯片的技术成熟度将影响智能语音设备的性能。人工智能芯片行业的技术门槛较高,海外厂商技术领先,中国人工智能芯片较依赖进口,导致智能语音服务商的制造成本居高不下,压缩企业利润空间。
人工智能芯片按照不同应用场景可分为通用类 AI 芯片、云端 AI 芯片、终端 AI 芯片。在通用类 AI 芯片领域,美国英伟达的 GPU 芯片占据主导地位,中国 AI 芯片企业人工智能基础层建设实力较薄弱,缺乏国际竞争力。
在云端 AI 芯片领域,英特尔、亚马逊等海外企业占据较大的市场份额,部分中国企业陆续布局云端推断市场,但竞争实力较弱。在终端 AI 芯片领域,中国企业取得了较大的突破,代表企业包括寒武纪、地平线和深鉴科技等优质厂商。伴随定制化芯片和类脑芯片的发展,中国人工智能芯片将逐渐打破海外芯片企业对中国市场的垄断。
(1)算法智能语音算法主要应用于数据的计算、分析和语音识别中国在智能语音算法领域优势较弱。算法及算法框架的技术门槛较高,以 Facebook 、谷歌、 IBM 、微软为主的海外科技巨头占据算法行业较大的市场份额,中国仅有少数几家科技公司拥有针对算法的开放平台,如百度。核心环节技术实力薄弱削弱中游智能语音服务商的国际竞争实力。智能语音在各领域应用程度的加深导致行业对于核心算法的需求将逐渐提升,算法制约亟待解决。
(2)云计算服务中国云计算服务商众多,可以分为以阿里、腾讯为代表的互联网企业、以华为为代表的传统 IT 企业、以中国移动、中国电信、中国联通为代表的运营商、以及自主研发初创企业。云计算服务为智能语音设备提供强大的运算能力和资源整合能力,提高了智能语音后台技术的智能化水平,进一步提高语音识别能力,推动智能语音技术应用的落地。
智能语音科技企业:中国国内专注于智能语音技术研发的代表性企业为科大讯飞和捷通华声。
在智能语音行业发展前期,智能语音科技企业以研发单一的智能语音技术为主,利用其技术优势获取企业收益。
近年来,伴随智能语音行业的发展,深度学习技术的应用、海量语音语料数据的积累、以及计算机算力的提升,使智能语音技术的调用得以简化,技术门槛逐渐降低,导致智能语音科技企业的技术优势逐渐被削弱,智能语音科技企业逐渐从单一的智能语音技术商转型为全方位人工智能技术服务商。
智能语音科技企业依托其技术优势,积极布局下游各应用场景,通过为下游应用领域提供高端定制化的智能语音服务解决方案,加速企业产品和服务对下游的渗透。基于智能语音领域较好的发展前景,以 BAT 为代表的互联网巨头开始布局中国智能语音领域。
互联网企业通过开放语音生态系统,以产业内合作的方式,将语音技术植入合作方的产品中,并利用其 C 端优势推动产品在下游各应用场景的落地。互联网巨头用户流量优势明显,企业对于市场产品喜好的把控优于其他行业参与者。互联网企业可以基于对用户偏好的分析,对下游消费者进行产品的精准投放。
在消费者产品领域,AI学习机、翻译笔等AI+学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI+办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI+生活产品,让更多人享受AI科技的便利。
在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。以科大讯飞为代表的国内AI龙头已占据中国语音交互车端应用行业的领先地位。
在运营商领域,智能语音技术与健康养老、家庭教育、家庭娱乐等场景结合,带来更加智慧的家庭生活体验。融合5G与机器翻译技术的无障碍智能通信,让普通的5G手机用户,不用下载任何软件,就可以使用实时翻译和转写服务,实现跨语种的无障碍视频通话。
在教育领域,利用智能语音和人工智能技术可实现英语听说教、学、考、评、管一站式服务,减少无效训练。
在医疗领域,智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。
在城市领域,智能语音技术已在安徽省一体化网上政务服务平台、聊城城市大脑、三亚市崖州湾科技城智慧产城园区、天津市AI银发智能服务平台等创新示范项目中应用。姚建铨院士指出,智能语音与建设智慧城市的要求完全吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。
在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新“国家队”, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。国家智能语音创新中心打造的工业听诊器、声学成像仪、工业设备卫士、智能巡检机器人等“工业六感”产品,已广泛应用到生产、质检、巡检等多个工业环节。
在金融领域,声纹识别技术已经被应用在各类身份认证环节。得意音通董事长郑方表示,声纹是目前除DNA外最可靠的身份认证方式,相比传统方法具有明显优势。此外,科大讯飞智能客服机器人、智能联络中心AICC等AI+金融应用,帮助金融机构提升客服和运营效率。
“十四五”规划将人工智能列为前沿科技领域的“最高优先级”,包括智能语音在内的人工智能产业及相关业务将受到政府支持,进一步迎来有利宏观环境。
随着中央政府政策陆续出台,各地方政府对于人工智能产业也日益重视。截至目前,中国已有超过20个省市出台了人工智能产业相关的利好政策。
2021年4月,中国人民银行发布的《关于我国人口转型的认识和应对之策》显示,2019年中国劳动力人口(15-65岁)占总人口的70.6%,老年人占12.6%,少儿人口占16.8%;预计中国人口将在2030年达到峰之后趋于下降,同时老年人占比继续增加,小儿和劳动人口继续减少。
根据测算,我国人口红利至2030年只剩8年。人口红利逐渐消失,自动化和机器换人成为发展趋势。语音机器人将会取代部分人工客服、人工呼叫等岗位。
受新冠疫情催化,人工智能应用场景迅速铺开。一系列基于AI算法的软硬件设施在抗疫的方方面面发挥巨大作用。智能语音在减少医患接触,及确保教学质量等方面发挥巨大作用。
智能语音,作为人工智重要组成部分,应用下沉加速。教育、医疗、驾驶三个场景的需求增加将最为明显,语音机器人发挥重大作用。
2020年中国智能语音行业市场竞争格局与发展前景分析市场规模增速超25%。
随着人工智能技术的不断成熟和应用迭代,未来中国智能语音市场将保持高于25%的增长速度,到2021年,智能语音市场规模将达到285亿元。
智能语音市场的城市、政府和资本的扶持与重视以及数字化、智能化的市场需求不断扩大,中国智能语音行业市场规模将进一步增长,预计在2030年市场规模将达到1452亿元。
【注】语音市场包含教育产品市场、消费电子市场、智能平台市场、电信运营 商市场、智能服务市场和车载语音市场。
在消费者产品领域,AI学习机、翻译笔等AI+学习产品帮助学生学习减负增效;智能录音笔、智能办公本、智能鼠标等AI+办公产品深受职场人士欢迎;AI翻译机、智能麦克风、智能语音键盘、智能耳机、智能助听器等AI+生活产品,让更多人享受AI科技的便利。
在汽车领域,智能语音已成人机交互关键环节,并从车内交互衍生车外交互,从单模交互走向多模交互,从被动交互发展为主动交互,为车企提供全栈技术赋能。以科大讯飞为代表的国内AI龙头已占据中国语音交互车端应用行业的领先地位。
在运营商领域,智能语音技术与健康养老、家庭教育、家庭娱乐等场景结合,带来更加智慧的家庭生活体验。融合5G与机器翻译技术的无障碍智能通信,让普通的5G手机用户,不用下载任何软件,就可以使用实时翻译和转写服务,实现跨语种的无障碍视频通话。
在教育领域,利用智能语音和人工智能技术可实现英语听说教、学、考、评、管一站式服务,减少无效训练。
在医疗领域,智能外呼和智医助理可用于独居老人、留守儿童的日常关爱和兜底保障。
在城市领域,智能语音技术已在安徽省一体化网上政务服务平台、聊城城市大脑、三亚市崖州湾科技城智慧产城园区、天津市AI银发智能服务平台等创新示范项目中应用。姚建铨院士指出,智能语音与建设智慧城市的要求完全吻合,可以实现各种语音高效转换和智能处理,为智慧城市进一步建设带来新的机遇。
在工业领域,我国打造了包括国家智能语音创新中心在内的一批语音技术创新“国家队”, 开展工业声学、多语种、AI语音芯片等关键共性技术研究工作。国家智能语音创新中心打造的工业听诊器、声学成像仪、工业设备卫士、智能巡检机器人等“工业六感”产品,已广泛应用到生产、质检、巡检等多个工业环节。
在金融领域,声纹识别技术已经被应用在各类身份认证环节。得意音通董事长郑方表示,声纹是目前除DNA外最可靠的身份认证方式,相比传统方法具有明显优势。此外,科大讯飞智能客服机器人、智能联络中心AICC等AI+金融应用,帮助金融机构提升客服和运营效率。
未来区域结构的总体格局基本保持不变,到2021年,中南、华东、华北仍然占据最大比重,这些区域企业的智能语音技术将会进一步提升,垂直行业的应用落地和发展也主要集中在这些区域。
国际权威研究机构IDC公布《中国人工智能市场软件及应用半年度研究报告》,科大讯飞占比接近20%,为智能语音市场龙头;
中国智能语音的市场规模中,科大讯飞占领近一半的市场,有绝对性的市场优势。
虽然科大讯飞在中国的市场当中占据绝对性优势,但从全球宏观市场格局来看,中国产品仅占全球市场的8%,不足10%,因此中国的产品仍然需要继续做大做强,才能被世界所认可。此外,从全球市场格局来看,Nuance 与谷歌均占据近30%的全球市场。
智能语音下游需求不及预期:重点应用场景落地仍需提速,传统行业开放场景动能不足等。
商业竞争:智能语音技术是人工智能的研究领域之一,其技术原理渉及声学、谱言学、数字信号处理、计算机科学等多个学科,同时智能语音技术的研究周期长、投入大,使得智能语音行业具有较高的进入壁垒。
在全全球范围内,目前已形成寡头垄断竞争格局,仅有Nuance 、IBM 、微软、 Google 、科大讯飞等少数厂商具备较强竞争力。
本文件提供的任何内容(包括但不限于数据、文字、图表、图像等)均系海南卓戴私募基金管理有限公司独有的高度机密性文件(在报告中另行标明出处者除外)。未经海南卓戴私募基金管理有限公司事先书面许可,任何人不得以任何方式擅自复制、再造、传播、出版、引用、改编、汇编本报告内容,若有违反上述约定的行为发生,海南卓戴私募基金管理有限公司保留采取法律措施,追究相关人员责任的权利。
本报告中行业数据及相关市场预测主要为行业研究员采用桌面研究、行业访谈、市场调查及其他研究方法,建立统计预测模型估算获得,只提供给用户作为市场参考资料。在任何情况下,本报告中的信息或所表述的意见均不构成对任何人的投资建议。在不同时期,卓戴资本可能撰写并发布与本报告所载资料、看法及推测不一致的报告。
本公司不保证本报告所含信息及资料保持在最新状态,本公司将随时补充、更新和修订有关信息及资料,但不保证及时通知或发布。在任何情况下,本公司亦不对任何人因使用本报告中的任何内容所引致的任何损失负任何责任。
|