84年广西法卡山之战AI大模型掀起的浪潮,一浪高过一浪。不久前,英伟达总市值首次突破万亿美元,成为仅次于苹果、微软、谷歌、亚马逊的美股市值第五大公司。这是一个标志性的事件,随着大模型、生成式AI的快速发展,来自全球市场对AI算力的旺盛需求,将英伟达送上了浪潮之巅。
“英伟达一天暴涨2000亿美元的市值,等于一个AMB、两个英特尔,很大程度上正是源于AI训练对算力的需求。”6月17日,在华为开发者联创日深圳首站的活动现场,北京前沿金融监管科技研究院执行理事长、贝克资本董事长兼CEO张克感叹道。
行业专家指出,大模型的参数规模正越来越大,ChatGPT-3拥有1750亿个参数,GPT4没有公开,但预计超过万亿的量级,已经和人类神经元连接数差不多,这也让大模型的推理决策能力达到了令科学家恐慌的地步。
在当天活动现场,与会嘉宾围绕AI技术的趋势前瞻、行业应用、开发者成长等展开交流探讨。华为开发者关系部部长许劲松表示,数字经济已经成为推动经济增长的主引擎之一,人工智能正在推动产业进入数字时代,AI正在从感知理解世界到创造生成式世界,生成式AI很火,并推动整个产业智能化的升级。
回顾人工智能发展的历史,1960年代至1990年代,第一代人工智能是以知识驱动的人工智能,主要代表是专家系统;1990年至2020年,第二代人工智能是以数据驱动的深度学习为代表的连接主义,其特点是数据+算力+算法;2020年至今,第三代人工智能以“知识+数据”为驱动,特点是常识、经验、推理等类人思考的能力。
自2022年12月ChatGPT问世以来,AI大模型正是加速了新一代人工智能的发展。当大模型和生成式AI的技术不断取得突破,众多行业人士纷纷开始思考大模型技术在商业化运营中,将会产生何种效用。
会上,华为AI技术规划专家王琛表示,大模型正在引领新一轮人机革命,为用户带来颠覆式使用体验。他介绍,在PC时代,“鼠标+图形用户界面”开启了第一次交互革命;“触屏+手势”开启了移动互联时代;而“对线G”则开启了智能互联时代,标志就是以ChatGPT为代表的大模型技术。
王琛表示,大模型技术还正被用于企业服务,通过公有云、私有云、Finetune(专有训练+推理资源)等部署模式,助力企业应用升级。随着AI能力的不断强大,未来,华为与众多行业伙伴需要考虑的,将是如何有责任地使用AI,让其真正成为人类社会进步的推动力。
王琛认为,当前人工智能的深度学习还面临三大难题:一是泛化性差,二是难以与领域知识融合,三是安全可信。美国自然科学基金会指出,AI系统进入千行百业,关键是融合更多的关键知识领域,比如说AI和农业、物理、化学的技术相结合;在今年的AI大会上,则发布了坚守有责任的使用AI的章程,提出了大模型时代坚持的原则,如人类可审计、开源可获取等标准。
王琛表示,当前正处于第二代人工智能向第三代人工智能交替的阶段,“知识+数据”驱动使得AI的系统是具有常识经验推理等人类思考的能力。
他认为,未来AI技术突破有三个方向:一是以大模型为基础,“语言”牵引“AI编解码”模型架构趋于统一,未来模型向“模态时空动态”演进;二是通用求解器,从游戏到AI4Science,结合专家知识突破挑战NP-hard难题,未来“预测与控制”深入应用;三是EmobodiedAI,集成AI,AI与物理世界的交互,积累更多经验和常识,提升推理能力,达到与人类共生。
王琛也提醒说,未来要有责任地使用AI,过去人们讨论AI能做什么,现在谈论AI不能做什么,未来要讨论不能让AI做什么。
人工智能迈入新阶段,AIGC持续火爆。Al生成内容 (Al Generated Content, AlGC),生成式Al是指计算机通过机器学习从现有数据中学习一个对象(物品、产品或任务)的要素,进而生成一个全新的、原创的、真实的、与原来内容相似的对象。
华为云AI生态技术专家夏飞认为,AIGC的火爆预示着人工智能发展的趋势,从感知世界到理解世界,如今已经开始创造世界。
Gartner在2021年发布的《人工智能对人类和社会的影响》,预计至2023年将有20%的内容被生成式Al所创建,至2025年,生成式AI产生的数据将占所有数据的10%,而今天这个比例还不到1%。当前的生成式AI仍处于萌芽期,预计将在2-5年内实现规模化应用。
夏飞援引的数据显示,预计2030年,中国AIGC市场(仅包含内容创作,不含Al代码生成)将达到万亿的规模。与Al市场空间比例类似,全球市场约5~7万亿。最近1-2年的市场空间主要集中在AI直接生成的内容作为业务变现点。未来3~5年,更大的市场空间会延伸至营销推广、数据合成(作为补全数据的方式)、虚拟陪伴、游戏策略生成、游戏角色生成等方面。
夏飞也指出,当前很多的公司进入AIGC这个赛道,但是AIGC不光需要技术突破,还是一项系统性的工程,从底层的算力资源需求,到上面的集成框架层以及AI平台层都需要有一定的积累,不能盲目跟风冒进。比如模型训练的成本很高,估算一个大模型一次训练成本在几百万美元到几千万美元不等,训练的过程中稍有差池就打水漂了。
大模型军备竞赛是巨头间的战争,国内相继诞生了百度文心一言、阿里云通义千问、腾讯混元大模型、华为盘古大模型等。业内人士认为,国内能够把两万块GPU卡训练出来的公司,只有5家企业以内,能够把通用大模型做出来的只有3到4家。
而华为是这场竞赛中重要的种子选手。此前,南都湾财社记者曾向一名华为内部的接近人士处了解到,华为盘古Chat会在今年7月发布。在当天的活动现场,夏飞也提到盘古大模型在7月会有重磅的升级。
夏飞介绍,华为盘古大模型发布了CV大模型、NLP大模型、科学计算大模型等,华为在大模型的领域研究多年,拥有多模态中文数据库,判别模型与生成模型结合,能够灵活支持下游任务,如文生图、文本导向的图像补全、图片编辑等。
活动现场,夏飞还展示了在华为盘古大模型的支持下,AIGC完成了文本生成、图片生成、视频剪辑等内部应用,以及AIGC跟手机厂商合作,自动生成手机的屏保,跟品牌零售商合作,生成不同商品的海报和广告图片。
|