zcg电磁阀人形机器人具有突破残障人士和/或神经多样性人士面临的一些长期且顽固的包容性障碍的潜力。然而,新技术的现有承诺与其交付能力之间仍然存在巨大差距,其中一个重要的原因是新技术的开发缺少包容性。开发者应在新技术的设计阶段通过纳入更广泛的使用者意见,识别潜在的排斥,从多样性中学习,并在扩展解决方案之前满足特定需求。在本文最后,作者为计划开发、采购与使用人形机器人的组织和个人提供了一些行动建议。
“桑尼(Sunny),你是否和我们一样,对苹果公司的产品着迷?”这句话源自一部神秘悲剧中对人形机器人系统的戏剧性评价。该剧集由拉什达·琼斯(Rashida Jones)主演,她在片中饰演机器人桑尼。
过去,以机器人为主角的影片通常被牢牢地设定在科幻领域,但该片却并非如此。我们不必勉为其难地接受这部剧集,但必须明白,真正的人形机器人和机器人工具正在飞速发展。随着大型语言模型技术(large language model technologies, LLMs)的出现,它们比以往任何时候都更接近人们想象中的机器人。
目前,我们认为人形机器人是生成式人工智能最具前景的新兴应用之一。具体而言,我们看到它们有潜力尽早突破残障人士和/或神经多样性人士所面临的一些长期且顽固的包容性障碍。对于个人、雇主和社会而言,这将改变游戏规则。
目前市场上的人形机器人产品可以提供身体协助、社交互动支持和认知辅助等功能。例如,在身体协助方面,它们可以帮助个人在工作或家庭场景中轻松地移动(如扶门、协助从轮椅至床榻的移动)。它们可以成为神经多样性人群、焦虑症患者或听力损失人士的互动练习伙伴,在私人、低压力的环境中反应更为敏捷。它们还可以管理日程安排,指导减压练习,或作为同伴缓解孤独感。总之,人形机器人学习的内容越多,进步就越快。
但是,这些新技术的现有承诺与其交付能力之间仍然存在巨大差距。据《2024年埃森哲技术愿景》(Accenture’s 2024 Technology Vision)的调查显示,在5042位残障或神经多样性受访者中,39%的人因技术无法准确理解他们的指令而感到沮丧。相比之下,非残障受访者中这一比例仅为 28%。约一半(49%)的残障人士认为,技术给他们带来了太多的责任,而不是适应他们的具体需求。尽管根据我们的研究,超过一半(52%)的残障人士认为生成式人工智能有潜力提高他们在创造力、关系建立和产生想法等方面的表现,但现实却不尽如人意。
现有和新兴人工智能技术的开发缺乏包容性,这是一个具有讽刺意味的根本问题。
现在纠正还不算太晚。眼下就是践行残障社群的原则与口号“没有我们的参与,就不要做与我们有关的决定”(Nothing about us without us)的时机。包容性研究和设计非常重要。本文合著者之一劳里·亨内伯恩(Laurie Henneborn)作为该群体的一员,同时也是一位企业高管,亦指出了包容性设计的重要性,并认为不管再怎么强调都不为过。
由生成式人工智能驱动的工具要想达到我们的期望和要求,必须具备灵活、可定制的交互功能。为此,它们需要尽可能更广泛地反映人类使用者的意见。
技术设计者应该将包容性视为一种基本的设计原则,而不是事后的修正。包容性需要体现在内置功能中,以便各种明显或不明显的残障及神经多样性人士能够更容易地从“A点”到达“B点”,无论这段旅程是物理距离、通信距离,还是期望笔记本电脑能够实现某项功能。
在实践中,这意味着技术开发者在开发和界定新技术的应用范围时,把他们的经验、见解和观点付诸实践。这一设计过程实际上识别了潜在的排斥,从多样性中学习,并在扩展解决方案之前满足了特定的需求。通常情况下,它避开了技术义(technoableism)的陷阱。技术义一般指对能力的规范性假设,这种假设通常指导技术设计的过程和落地。
谷歌(Google)的Euphonia正是开发此类人工智能工具的范例。这是一个具有开创性的项目,旨在在增强语言障碍人士的语音识别能力,进而提高他们的沟通能力和独立性。
Euphonia的运作方式:Euphonia向所有音频提供者开放。它要求参与者自行录制300条音频,然后利用这些音频来训练LLM工具,以识别更为广泛的发音和节奏。该项目早前主要收集英语数据,但在撰写本文时我们了解到,Euphonia也启动了法语、印度语、日语和西班牙语的试点项目。
Euphonia产生积极影响的案例:Euphonia正在帮助患有肌萎缩侧索硬化症(amyotrophic lateral sclerosis, ALS;也称卢伽雷氏病,Lou Gehrig’s disease)的前美国橄榄球联盟(NFL)球员蒂姆·肖(Tim Shaw)恢复与他人沟通的能力。Euphonia能够解读蒂姆的指令并相应地对任务进行提示。它还可以用与蒂姆极为相似的声音“复述”他所说的话。(这种量身定制的解决方案之所以能够实现,是因为蒂姆在作为职业橄榄球运动员时,其声音被录制了下来。)
试想一下,这种人形机器人在教育环境中针对神经多样性学生的应用潜力,它们可以协助社交技能的教授,并提供一致、可靠的互动。例如,人形机器人可以学习个体学生的语言模式,并快速准确地转录其对试题的回答,或者在学生使用键盘有困难时,协助其撰写文本。
这种人形机器人还可以在医疗保健领域发挥作用,例如识别不同的口音和方言,为急救人员提供实时传译,以便救助伤患。目前,人形机器人已经在药品分发和协助身体康复活动方面发挥作用。人形机器人还可以担任各类客户服务角色,例如在机场和博物馆等大型公共场所处理基础咨询并引导游客。由于人形机器人可以为更多具有不同语音模式和通信需求的人提供更好的服务,因此加强的语音识别和语音生成功能可以使其效果倍增。
除了以上所提到的交互之外,我们还观察到生成式人工智能加速了人形机器人的进化。基于生成式人工智能技术的人形机器人可以从不同的数据集中得到训练,因此它越来越能够适应不同的环境和任务,从而提高其在不断变化的现实场景中的工作效率。同样,生成式人工智能也促进了虚拟环境的创建,以便对机器人的行为进行全面测试和改进。它还支持个性化定制,不断提高机器人与个体环境之间的关联能力。
过去,人们通常认为机器是为帮助人类而创建的不同实体。现在,我们可以开始将其视为某一个人的延伸。如果有人无法行走或不便亲自到场,或许他们可以远程操控人形机器人代为执行(比如检查工厂车间)。未来,机器人将越来越能够充当人类的腿、手、眼睛和声音。
例如,如果你的组织正在开发生成式人工智能机器人,请首先参考一些既定且备受推崇的指导方针,如由就业和无障碍技术伙伴关系(Partnership on Employment and Accessible Technologies,PEAT)提供的指南。PEAT的包容性设计原则“不是具体‘教你怎么做’,而是提供一个框架,用于开发产品时与既定的无障碍指南一起使用,以超越“仅满足合规要求”。
即使你的组织不设计机器人,而是采购它们,也要考虑这些指导方针以及负责任的人工智能“护栏”。请一组背景多元的员工对机器人进行测试,也许是根据PEAT设计原则,并让你知道他们的想法。你可以尝试先试后买,考虑如何能够使其更易于使用。我们建议组织制定负责任的人工智能使用指导原则,涵盖透明度、安全性、保障性和公平性等主题。
如果你能够投资生成式人工智能的创新,请支持那些将包容性作为设计中不可或缺的一部分的创新。寻找那些尚处于早期开发阶段的应用程序,并询问组织有关负责任设计的政策。你应该与潜在的受资助者深入讨论,着眼于制定出一套适合各利益相关方的设计原则。此外,请支持那些正在识别和破除障碍的创新者。例如,最近开发的机器人传感器,它结合了人工智能技术,其阅读盲文的速度大约是大多数人的两倍。这将帮助视障人士阅读盲文,同时帮助非视障人士解读由盲文所书写的内容,支持其更容易为自己身处的环境做出贡献。
作为个人可以做什么呢?首先,加强沟通。三年前,劳里在《哈佛商业评论》中撰文指出,让残障员工安全披露自己在工作场景中所遇到的问题非常重要(部分原因是效仿那些披露自己所面临挑战的领导者)。同事和领导者越了解残障员工所面临的困难,残障员工会感觉更安全,领导者也更能理解需要提供哪些帮助。在这种情况下,能够确保其声音被设计或采购生成式人工智能工具(如人形机器人)的相关人员听到。
其次,请记住,人形机器人有其局限性,请基于此进行应用。例如,如果你是神经多样性人士,且正在向人工智能工具询问有关治疗计划的问题,那么请把你收到的信息作为后续对话的开始。正如我们的一位同事所指出的:“人工智能可以帮助你跨越新的界限,但不能马上开始单独行动,应该将所获取的信息告知医疗团队并进行讨论。作为一名脑损伤患者,有时人工智能并不能提供有价值的信息,或者我对数据的理解不完全正确。当我了解人工智能的局限性时,我更清楚何时该向我的医疗团队请教。”
此外,请记住,你的反馈很重要。与人形机器人的互动体验对于提供这些工具的组织来说非常重要,你的反馈应该被用心对待;如果缺少正式的反馈渠道,请即时告知(提供工具的组织)。
一直以来,人类利用技术克服限制,做更多事情。但人类一直没能做到的是,在努力突破限制的同时采取更多行动,为残障和神经多样性人士提供意义更为广泛的公平竞争环境。让我们立即行动吧!
劳瑞·亨内伯恩是埃森哲增长和战略负责人,以及人才和组织思想领导力研究总监。
作者要感谢埃森哲创新下一代机器人技术全球负责人克里斯蒂安·苏切(Christian Souche)、埃森哲思想领导力和技术研究全球董事总经理 H. 詹姆斯·威尔逊(H. James Wilson)以及埃森哲云咨询高级经理丹尼斯·格拉斯科克(Denise Glasscock)在撰写本文过程中所提供的帮助。
|