山东卫视儿女传奇如果不是身边的亲人或好友得了语音障碍症,你就无法真正体会那种痛苦以及痛苦带来的困扰。两个人之间,一方的语言或语音能力被屏蔽了,就像一个绑匪用黑色的胶条封住了你孩子的嘴。面对拿着刀指着你孩子的绑匪以及无法说话的孩子,完全的无力感会让你和你的孩子崩溃。
VocieIT技术可以识别非标准语音,为语音障碍者和家庭到来福音,解除绑匪贴在孩子嘴上的黑胶带。
生活在在美国费城的Nat今年34岁。受父亲影响,Nat从小就是狂热的棒球迷,他的房间里贴满了家乡球队费城人队海报。与其他球迷不同的是,Nat患有脑瘫,不仅从未离开过轮椅,还患有严重的语言障碍,无法清晰地讲话。而父亲更是坦言,照顾Nat几乎把家庭压垮:“我们不是在Nat房间里,就是在去Nat房间的路上,天黑了我们要帮Nat关灯,Nat想休息了我们得去把电视关掉……”
非标准语音(non-standard speech)智能识别软件Voiceitt的到来让这个家庭稍稍轻松了⼀些,“不仅是我们不需要再为Nat代劳生活中的每⼀件小事,更是因为Nat有了掌控环境、掌控人生的能⼒,面对未来,我们不再像过去那样无助。”
Voiceitt软件由一个以色列创业团队开发,能够识别语言障碍群体的非标准语音,并实时翻译为普通⼈能够听懂的清晰语言,帮助语言障碍者与外界沟通。同时,接入智能家居的Voiceitt还能帮助行动不便的语言障碍者控制外部环境,实现一定程度的生活自理。
在Voiceitt的协助下,Nat可以让智能家居系统为他做简单的居家行动协助,如开关灯、播报最新的体育新闻、赛事等;不仅如此,有了与人沟通和操作电脑的能力,Nat现在正在为热爱的球队费城人队的主场球场工作,负责打扫球场和统计比赛数据。棒球对于Nat或许是一生的遗憾,但在某种程度上,Voiceitt帮助Nat实现了梦想:站在棒球场上,为家乡球队贡献自己的力量,每一场胜利都有Nat的印记。作为人生的角斗士,Nat不逊色于任何一个挥洒汗水的运动员。
每个人都有表达和被理解的权利。然而,全世界大约有一亿像Nat一样的语言障碍人士因患有退行性疾病、先天残疾、脑损伤等,从而失去了清晰表达自我的能力。由于无法与外界正常交流,语言障碍群体失去了与主流社会的连接。不仅如此,由于语言障碍往往伴随着行动障碍,需要他人照顾的语言障碍者往往无法清晰地表达自己的需求,这不仅造成了患者的痛苦,也极大增加了照顾的成本和难度。
Voiceitt由Danny Weissberg、Stas Tiomkin和Sara Smolly共同创立。十年前,Danny Weissberg的祖母在一次严重的中风后丧失了行动能力和大部分语言能力。家人们竭尽所能,悉心照顾祖母,但是祖母连像“口渴”这样的感受都无法向家人表达。祖母的不幸让Danny心如刀割,也让Danny认识到了这个世界上存在着的庞大的语言障碍群体。Danny找到了自己的使命——将表达的权利还给语言障碍人士。
2011年,苹果发布了Siri语音助手;借助Siri,用户可以通过语音控制手机,实现接打电话、上网等一系列操作。身为软件工程师兼创业者的Danny敏锐地察觉到,语音将成为未来人们与智能设备进行交互主要方式之一,借助移动智能设备迅速发展的浪潮,语音识别技术的开发将成为科技行业的下一个风口。但是Danny想法远比打造另一个Siri更加远大,因为Danny设想的语音识别不仅要能够听懂普通人讲话,更要理解语言障碍者的非标准语音,帮助千千万万和自己祖母一样的人重新获得声音。
后来,Danny结识了语音识别技术专家Stas Tiomkin以及同样是祖母身患语言障碍的Sara Smolly;三人在2012年共同成立了Voiceitt,Danny作为主要创始人担任了公司的CEO。
现在看来,Danny对于语音交互的预见是正确的,Siri横空出世的几年后,微软发布了Cortana小娜,而亚马逊则是更进一步,推出了内嵌Alexa语音助手的Echo音箱,早早布局了基于语音交互的智能家居领域。然而,对于Danny和Voiceitt,前方的路要艰难得多:科技巨人们尚且为研发相对简单的标准语音识别付出了巨大的研发成本,那么Voiceitt这样一家创业公司想要开发针对语言障碍者的非标准语音识别可以说是不可能任务。
对非标准语音的识别是Voiceitt技术研发中的重中之重,Voiceitt首先要“听懂”语言障碍人士,才能把他们要表达的思想翻译给其他人或者智能设备。为了克服这一难题,Voiceitt团队采用了“迂回路径”。婴儿同样没有语言能力,但是母亲却总能知道自己孩子的需求;这是因为婴儿的每一声呓语、甚至每一次呼吸都深深地印在了母亲的潜意识当中,这样的联系超越了任何语言所能表达的极限。语言障碍群体虽然不能以普通人所熟知的方式讲话,但是他们每个人都有自己独特的发声方式:与众不同的发音、节奏、甚至呼吸声……这些往往被普通人忽略的非语言信息能够对语音识别所采集的信息进行有效补充,使得非标准语音能够被识别。
Voiceitt的另一项技术重点是机器学习。Voiceitt最初会要求使用者对软件说出一系列常用词汇和短语,以使Voiceitt对使用者说话习惯建立初步的了解。在长期的使用中,Voiceitt软件会不断丰富用户个人的语音数据库,并建立一套针对用户的个性化语音识别模型。这一方面大大提升了Voiceitt的识别准确度,另一方面使得Voiceitt具备了预测用户讲话的能力。语言障碍者只需说出句子的一部分,Voiceitt便能够知道用户想要表达的语句或指令,这让使用Voiceitt变得更加轻松。
此外,因为Voiceitt对非标准语音的识别基于用户独特的语言特征,它的运行不受到语言和口音的限制。这样以来,除了生理性语言障碍者能够受益于Voiceitt,被口音困扰的移民、国际劳工也能够在工作和生活中使用Voiceitt与人交流。这显示了Voiceitt促进社会融合的巨大潜力。
非标准语音识别可以说是Voiceitt的核心竞争力,为了不断精进这项技术,Voiceitt花费了大量精力在软件研发上;因此在公司成立以来的很长一段时间,Voiceitt没有推出任何产品。Danny这样解释道:“为语言障碍者研发一款帮助他们重新与外界连接的技术,我们每时每刻都感受到肩上的责任;我们并不想把不完善的产品交给用户,因为这关乎他们的生活。”
2018年,Voiceitt推出了一款实验性的语音识别音箱,虽然基本实现了帮助语言障碍人士与他人沟通的功能,但是产品的形态很大程度上限制了技术的使用场景。同年,Voiceitt被选入亚马逊Alexa Accelerator项目,开展智能手机应用的研发,并将Voiceitt的无障碍语音识别技术融入Alexa语音助手。
2021年,Voiceitt App作为Voiceitt的第一款商业产品正式在苹果App Store上线,Danny表示安卓版本的Voiceitt App也会很快到来。除了非标准语音的识别和转换,Voiceitt App还允许用户与Alexa进行对话,进而控制智能家居设备。对于语言障碍家庭,Voiceitt App省去了硬件成本,更加容易获得,而且199美元一年订阅的价格相比过去长期看护所付出的经济成本和精力支出也更加划算。不过更重要的是,有了控制身边环境的能力,行动不便的语言障碍者不再需要因为开灯、放音乐这样的小事反复麻烦家人;这不仅极大地缓解了语言障碍家庭的照料压力,更帮助语言障碍者树立了掌控生活的自尊自信。
Voiceitt App的受欢迎程度超出了团队的预期。Voiceitt不仅在非标准语言群体中收到了良好的反响,团队还注意到相当多的标准语音被收录进数据库。Sara Smolly表示:“很多用户是希望使用更加精准且能够控制智能家居的语音识别技术的普通人,也有些用户存粹觉得Voiceitt很好玩。这才是科技的本质,科技本应该是有趣的”。
疫情期间,Voiceitt顶流而上,完成了1000万美元的A轮融资;从最初由以色列政府部门支持的5000美元开始,Voiceitt已累计融资超过1500万美金,在社会创新领域属实不易。
一个具有公益性质的创业项目如何受到如此多投资人的青睐,对此Danny非常坦诚地说道:“投资社会企业不会带来商业投资那么高的回报,投资人们非常清楚这点,而我们也只向投资人展示最真实的数据。如果有经验可谈,那就是让很多人看到我们的初心以及做的事情,这样他们就愿意帮助我们。”除了风投和政府资助之外,Voiceitt中也有一直相伴的个人投资者,他们中很多是语言障碍者的家人,或者自己就是语言障碍者,其中一位以一己之力累计投资了Voiceitt 30万美元,他的孙子是脑瘫患者。
人们常说“科技是一把双刃剑”,而在今天,这句话有了更加深刻的含义:科技的发展不应该仅仅满足于“不作恶”的底线,而更应该追求人文主义和包容精神。Voiceitt创新性地将非标准语音识别与机器学习结合起来,帮助语言障碍群体重新找回自己的声音,也找回了生活的意义。同时Voiceitt也向世界展现了新的希望:未来社会将不会是一个技术战胜人性的异化世界,因为有像Danny这样的社会创新者,将人文关怀注入冰冷的技术,不仅帮助享受平等的生活,也通过感召更多人关注社会创新事业而促进构建了一个更加富有人性、更加可持续的明天。
|