穆勒嘲讽梅西近日,在第三届图像识别竞赛WebVision中,阿里AI以82.54%的识别准确率击败了来自世界各地的150 多支队伍,获得了冠军,同时也将万物识别领域的历史纪录提升了3个百分点。BigVideo和华为云分别获得第二名和第三名。
资料显示,WebVision由谷歌、美国卡耐基梅隆大学、苏黎世联邦理工大学等机构联合全球视觉技术领域顶级学术会议CVPR发起,是目前图像识别领域最权威的竞赛之一,被业界誉为人工智能“世界杯”。
此次竞赛,阿里AI引入构建类别语义标签关系的模型,并采用辅助信息模型进行图像去噪的深度学习技术。阿里AI的超强能力背后是阿里自研的可以支持数十亿图片分类训练的超大平台。相比经过人工标注完毕的ImageNet数据集,WebVision 所用数据集直接从互联网爬取,没有经过人工标注,含有较多噪音,且数据类别的数量组成极大不平衡,AI的识别难度更高。而阿里AI在WebVision 竞赛结果表明,现代深度学习技术可以不完全以人工标注数据为基础,人工智能有望真正摆脱“人工”。
据悉,目前阿里AI不仅能够以超级速度对海量图片进行分类,还能识别超过100万种物理实体,例如5万种植物、1万种鸟、1千种不同型号的车,堪称电商圈内的“博物君”。此前阿里方面就曾透露,其在2016年全年,仅在电商领域进行的图片识别就已累计计算1000亿张图片,相当于每日计算商品图片6亿张。正是经过了如此密集的图片识别训练,令阿里相应的技术进步一日千里,更加速了其落地造福用户的速度。在高德地图推出的智慧高速解决方案,其中就包括基于阿里云人工智能的图像识别能力,识别道路异常拥堵、事故等事件信息,以便做到更为快速的反馈。
其实,AI技术不仅能提升图像识别的准确性,在一些领域,更能应用于识别图像真假,甚至是还原处理过的图片。
据CNET报道,日前,Adobe与加州大学伯克利分校的研究人员合作研究利用AI甄别图片是否被修改过,不仅如此,在识别出被修改过的痕迹之后,还可以将照片还原到它被修是改之前的样子。
这一技术通过训练卷积神经网络识别面部的细微调整,研究人员通过编写Photoshop脚本建立大量的图像训练集,然后通过网络上抓取的图片使用面部感知液化调整。随机选择这些照片的子集进行训练。另外Adobe还聘请了以为艺术家改变相关参数设置到数据集中。根据研究人员的说法,人眼能够在53%的情况下识别出哪些照片有被修改过,而神经网络算法可以将这一概率提高到99%,这一技术能有效的甄别网络上的虚假图片。
图像识别作为人类获取和交换信息的一种相对精准的途径,正成为研究界的焦点,图像识别技术的发展正在经历巨大的变化。
诸如像RetailDeep等面部识别公司,他们可以在消费者走进商店时,使用智能手机摄像头识别和记录下这些人,销售人员可以则可以对应的访问他们的整个购买记录,轻易地将线上线下结合起来,未来则可以更有针对性地提升他们的销售。
今年5月,阿里推出人工智能(AI)安全厨房解决方案,探索用AI图像识别技术和红外热成像技术,来解决厨房的安全生产问题。目前,AI安全厨房已在盒马上海部分门店投入使用。据了解,AI安全厨房背后是阿里安全图灵实验室推出的安全AI技术体系,它倡导在安全场景中孕育出更强大的AI,进而推动AI技术的持续进化。除在餐饮行业可使用外,还可在小区电瓶车集中充电场、供电所、机房等场景应用,及时预警,防止火情发生。
今年6月,华为云与金域医学在2019中国生物产业大会上联合宣布,双方在人工智能(AI)辅助病理诊断应用开发方面取得突破性进展。金域医学病理专家团队与华为云AI团队合作,首次基于病理形态学,通过深度学习技术,训练出精准、高效的AI辅助宫颈癌筛查模型。该模型在排阴率高于60%的基础上,阴性片判读的正确率高于99%,同时,阳性病变的检出率超过99.9%。这是目前国际上已公布的AI辅助宫颈癌筛查的最高水平。通常情况下,细胞病理医生镜下阅读宫颈细胞涂片,平均每例要花费6分钟,而AI识别仅需36秒,通过AI辅助宫颈癌筛查模型判读速度是人工判读的10倍。
此外,作为目前图像识别领域的一个较新的研究领域,情感分析也正成为众多科技企业“试水”的标配。Facebook在这方面拥有多项专利,其中一项被称为“情感检测和内容传递技术techniques for emotion detection and content delivery”,可以用相机跟踪情绪状态,同时观看不同的东西,如小狗视频,它还可以服务于未来的内容,只需阅读用户的情绪状态。这种类型的图像识别为个性化添加了一个全新的层面。
图像图形技术是人工智能的重要研究领域,当下已广泛应用于安防、医疗、工业检测、出行等各行各业。随着计算机硬件和算法的不断发展,图像图形诸多技术将迎来更大突破,并在更广泛的应用场景中落地。
|