返回首页  设为首页  加入收藏  今天是:
网站首页科技手机智能科学时尚教育亲子艺术房产
相关文章
 多模态功能上线OpenAI让Chat…
 看图识双顶—教你如何交易“…
 ChatGPT重磅升级:可以看图、…
 苹果iOS 17进一步增强“看图…
 ChatGPT“看图说话”大变身动…
 方肇伦:中国流动注射分析的…
 科学饮水正确使用饮用水净水…
 422主题用英语怎么说?subje…
 王晋康系列之:“科学是科幻…
 许俊堂教授:正确理解和定义…
 教育部校外教育培训监管司负…
 介绍中共中央办公厅、国务院…
 关于博雅教育
 同题共答、同向发力 加快推进…
 10月7日语合中心发布关于开展…
 安康一夫妇遭遇“假警察”险…
 无证医生承包医院科室造假药…
 36万买个女孩却一直上不了户…
 解码司法鉴定“国家队”:专…
 养儿十二年亲子鉴定非亲生男…
 这才是线岁女人的穿搭从初秋…
 马兰欧尼学院人机交互专业介…
 不愧是国际超模!豪门阔太奚…
 10月最流行的穿搭是什么?看…
 时尚是用钱堆出来的?真正有…
 第八届成都非遗节开幕!怎么…
 【网络中国节·中秋】哈尔滨…
 于飞导演电影《皮皮鲁与鲁西…
 中华笔墨书写亚洲风采 传统书…
 画意书魂——黄胜凡书法展亮…
 北京二套房契税2023年多少
 二套房税费多少契税是多少?
 三部门:个人购买保障房免征…
 官宣!湖南契税税率最新明确…
 契税税率最新标准(税率+免征…
 爱康科技:截至本公告披露日…
 美股三大指数收盘走势分化 科…
 航天科技:预计2023年前三季…
 科技创新驱动高质量发展 三大…
 甄零科技助力鹰角网络开启「…
 龙虎榜丨龙建股份今日跌停 中…
 中关村:融资净偿还134万元融…
 中国联通:正积极布局天地一…
 【调研快报】中关村接待安信…
 中国联通:正积极布局天地一…
 最美证件照 去水印教程【详解…
 最美证件照app怎么使用 最美…
 最美证件照更换照片背景颜色…
 中科院开发“智能花卉识别系…
 最美证件照保存照片方法【详…
专题栏目
网络
您现在的位置: tac新闻网 >> 智能 >> 正文
高级搜索
多模态功能上线OpenAI让ChatGPT能说话、会看图
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/10/14 20:07:49 | 【字体:

  网游之逍遥琴师此前谷歌无疑是AI领域无可争议的领头羊,它开源的深度学习框架TensorFlow更堪称是AI世界的基石,但是这一切却在2022年秋季戛然而止,OpenAI的ChatGPT横空出世让谷歌很快就黯然失色。并且外界没有想到的是,就在一年后,OpenAI又一次“截胡”谷歌。

  日前在毫无征兆的情况下,OpenAI发布了题为《ChatGPT现在能看、能听、能说》的公告,宣布将在未来两周内面向Plus和企业用户推出ChatGPT的语音和图像功能。

  根据OpenAI方面透露的信息显示,ChatGPT的多模态版本在10个月前就已经训练好了。那么为什么此前一直藏着掖着,现在却突然发布呢?外界推测,或许是因为不能让谷歌抢了先。

  最近这段时间,业内风传谷歌方面即将发布多模态模型Gemini,并且它可能会成为AI行业游戏规则的改变者。按照桑达尔·皮查伊的说法,Gemini集成了多种技术,支持同时输出文本和图像,还可以使用工具和API。所以在外界看来,面对来势汹汹的谷歌,OpenAI方面自然要用实际行动来还以颜色。

  所以在这一轮的更新中,ChatGPT不仅仅能够理解用户输入的文字,甚至还拥有了识别并理解语音、图像信息的能力。语音识别能力很简单,因为该功能使得ChatGPT获得了类似Siri、小爱同学的能力,并将提供五种不同的语音供用户选择,同时支持语音音频生成文本、将播客内容翻译成其他语言等功能。其实早在今年5月,ChatGPT已经支持了语音转文本功能,所以现在更进一步上线文本转语音功能并不那么令人意外。

  至于ChatGPT读取图像的能力,则早在今年春季OpenAI演示GPT-4时就已经被曝光。彼时OpenAI联合创始人Greg Brockman在纸上画出了他构想的网站草稿示意图,并拍了一张照片上传给GPT-4,后者立刻生成了这个网站的HTML代码。只不过这一能力在当时,被GPT-4更加耀眼的推理判断能力所掩盖。

  尽管看起来OpenAI为ChatGPT赋予的这两个新能力似乎有些平平无奇,但实际上它们会让ChatGPT的体验更上一层楼。

  先来说说ChatGPT能听懂用户说什么,并直接用语音与用户对话这个功能,据悉OpenAI联手专业配音演员为ChatGPT提供了Juniper、Sky、Cove、Ember和Breeze五种不同的合成声音。其实ChatGPT的语音能力确实没有出人意料,因此它的本质还是语音合成TTS(Text-to-Speech)。

  在经过十余年的发展后,如今的TTS技术其实已经相当成熟,AI会将输入的文本内容先切分词语、分割句子、标注语音语调,进而确定文本结构和语义信息,再结合语音合成模型,来生成包括音高、音量、语速、韵律在内的声学模型,最后加入波形合成就让AI能说话了。而ChatGPT的优势,在于它可以进行自然流畅的对话,几乎能模仿人类对话的方式,这就会让用户与它的对话有一种和人类、而非机器,隔着屏幕交流的体验。

  如果说语音能力让ChatGPT更像“人”,那么读取图像的能力就可以说是此次ChatGPT多模态能力中最让人惊喜的部分了。此前,OpenAI在GPT-4上展示从草稿到网站的功能被称为“代码解释器”(后改名为高级数据分析),但其面向的场景极为有限。而如今ChatGPT的图像读取能力则更加贴近用户的日常生活,毕竟随便一拍的照片就能得到ChatGPT的回应。

  根据OpenAI方面给出的示例,用户现在可以拍一张冰箱的照片,然后让ChatGPT来推荐菜谱;在旅行时拍一张地标的照片,让ChatGPT来讲述这处景点的有趣之处;还能拍一张数学题的照片,让ChatGPT来解答;更可以在炒股时拍一张K线图,让ChatGPT来替你看盘。但值得一提的是,OpenAI也主动对ChatGPT的图像读取能力进行了限制。

  如果想要凭借一张电影的截图来让ChatGPT追溯电影的出处,ChatGPT是不会理你的,如果想要用一张名人的照片来让ChatGPT评价这个人,它也会拒绝。简单来说,ChatGPT会拒绝一切可能在法律和伦理上引发风险的问题。其实这也很好理解,毕竟正处于风口浪尖上的OpenAI,确实需要爱惜羽毛以避免陷入更多的漩涡中。

  在已经收到更新的用户测试中,ChatGPT的图像读取并非是传统的“以图搜图”。有网友使用Midjourney现场生成的图片,但ChatGPT依然能够准确辨识这张图片的内容,这也就意味着ChatGPT是在真正意义上拥有了理解图像的能力。当然,ChatGPT的图像读取功能并非万能,OpenAI方面就在相关论文中指出,ChatGPT会在空间感、多个图层混合、上下文推理、遮挡纹理等场景产生“幻觉”。

  如果仅仅只是这样,ChatGPT的图像读取能力可能并不会让人特别兴奋,它真正的“王炸”在于识别验证码。现在许多用户对于验证码厌烦透顶,这显然已经是不争的事实,面对各种稀奇古怪的验证码,特别是诸如12306验证码识图这种让机器束手无策、更难倒了许多用户的情况,未来也完全可以让ChatGPT代劳。只不过,这一技术也会带来一定的弊端。

  要知道,验证码这一如今在互联网上被广泛使用的技术,其实就是为了区分人类和机器的操作而诞生。ChatGPT能够准确识别验证码,就等于动摇了整个验证码体系。毕竟验证码作为一个反向的“图灵测试”,确实在一定程度上隔绝了机器人的侵扰。一旦ChatGPT辨识验证码的能力被黑产应用,或许X、Instagram、微博、知乎等社交平台的机器人恐怕就会更加猖獗。

  本文来自微信公众号“三易生活”(ID:IT-3eLife),作者:三易菌,36氪经授权发布。

  与历史平均水平相比,亚马逊股票的交易价格处于合理水平,如果新举措成功,我们可以看到良好的上涨潜力。

智能录入:admin    责任编辑:admin 
  • 上一个智能:

  • 下一个智能: 没有了
  •  
     栏目文章
    普通智能 多模态功能上线OpenAI让ChatGPT能说话、会看图 (10-14)
    普通智能 看图识双顶—教你如何交易“双顶形态” (10-14)
    普通智能 ChatGPT重磅升级:可以看图、听声音、说话啦! (10-14)
    普通智能 苹果iOS 17进一步增强“看图查询”功能 帮助用… (10-14)
    普通智能 ChatGPT“看图说话”大变身动嘴传图秒解答幕后… (10-14)
    普通智能 最美证件照 去水印教程【详解】 (10-14)
    普通智能 最美证件照app怎么使用 最美证件照app使用教程… (10-14)
    普通智能 最美证件照更换照片背景颜色教程【详情】 (10-14)
    普通智能 中科院开发“智能花卉识别系统” 拍花识植物成… (10-14)
    普通智能 最美证件照保存照片方法【详解】 (10-14)
    普通智能 Lnton羚通算法算力云平台员工工作服穿戴算法检… (10-13)
    普通智能 瞄准谷歌和亚马逊Klarna推出人工智能图像识别… (10-13)
    普通智能 智慧气象数据秒回(解码) (10-13)
    普通智能 蚂蚁消费金融:去年成功协助超10万用户避免欺… (10-13)
    普通智能 国产AI加速芯片半年出货50万片:华为又是遥遥… (10-13)
    普通智能 智能锁十大品牌排行 (10-13)
    普通智能 2023年双十一智能锁购买指南智能锁什么品牌比… (10-13)
    普通智能 盘点2022凯迪仕建博会:新品智能锁惊艳亮相、… (10-13)
    普通智能 2022智能锁十大品牌之TONYON通用锁具为家庭打… (10-13)
    普通智能 2022华为智能门锁简评选购参考 (10-13)