(CWW)4月17日上午消息,随着数据井喷、算法进步以及算力的突破,效果好、泛化能力强、通用性强的预训练大模型(简称“大模型”),已成为人工智能发展的新方向。近日,在2021百度认知AI创意赛“AI创意派”决赛现场,百度首次将文心大模型能力向公众开放,让每一位对AI感兴趣的人,都能够自上手使用大模型进行创意设计开发。
决赛现场,百度集团副总裁吴甜出席并围绕大模型行业趋势、产业价值、落地成果,分享了百度文心大模型的进展。在与新浪科技等媒体沟通中,吴甜指出,数据、算法、算力的发展,为人工智能技术带来了新的机遇,预训练大模型正驱动着人工智能的规模化应用,今年是文心大模型应用落地关键年。
大模型正驱动AI规模化应用
近年来,国内外科技巨头如谷歌、微软、英伟达、百度等,纷纷在AI大模型领域展开相应探索。频频获得国内外科技巨头关注的背后,大模型真正的魅力在于——人工智能作为新一轮科技革命和产业变革的重要驱动力量,它需要在各行各业深度地绑定融合,才能真正成为驱动产业转型升级的关键力量。
然而,受制于不同行业规则迥异,以及支撑特定场景AI模型训练的数据获取难、算力及人力成本高等因素,目前大多数的人工智能技术,往往只能被少数企业开发并用于解决特定领域问题,难以进行场景迁移和规模化复制,通用性和普适效果差。
大模型的出现,大幅降低了人工智能的应用门槛。其通过集中提供通用算法模型,打造技术底座,让大多数企业能够“站在巨人的肩膀上”,使标注数据更少、开发效率更高、应用成本更低。
据吴甜介绍,目前百度文心大模型已成为产业级知识增强大模型,包含NLP(自然语言理解)大模型、CV(计算机视觉)大模型、跨模态大模型,既有基础通用的大模型,也包含面向重点领域、重点任务的大模型,以及丰富的工具与平台。其中,多个大模型达全球领先水平,例如全球首个百亿参数中英文对话大模型PLATO-XL、首个聚焦中英文场景大规模 OCR 结构化预训练模型 VIMER – StrucText等。
与此同时,为进一步降低AI应用难度,文心大模型还通过与百度飞桨等开源框架结合,为开发者提供了成套的工具平台,配套易上手的大模型开发、轻量化、部署工具,让各行各业的开发者都能低门槛地实现AI的应用。
“百度大模型与国产深度学习框架融合发展,打造了自主创新的AI底座,真正发挥大模型驱动AI规模化应用的产业价值。”吴甜表示。
今年是大模型产业落地关键年
据吴甜介绍,百度文心大模型的诞生可追溯到2019年3月,当时百度发布的中国首个正式开放的预训练模型,便是文心大模型的ERNIE1.0版本。该模型不断升级并取得突破,2021年7月,作为首个在百亿级预训练模型中引入大规模知识图谱的模型,ERNIE 3.0刷新了五十多个中文NLP任务基准。2021年12月,ERNIE 3.0升级为全球首个知识增强千亿大模型,模型数量突破2600亿。
从行业角度来看,大模型的参数规模是评估一个模型好坏的关键指标,参数越大一般来说意味着大模型具备更多的能力,泛化性、通用性也更加强。目前,文心大模型参数规模达到2600亿。“从十亿级参数到千亿级,可以明确看到模型规模增长和训练数据增加带来了显著效果提升。”吴甜表示。
当然,一味地比拼参数,并不是衡量大模型优劣的唯一标准。模型质量、算力大小等软硬件协同能力,以及大模型的工程落地能力,也是重要的评价维度。
据吴甜介绍,文心大模型最大的特点是“知识增强”。传统大模型只从海量的文本中学习,只能死记硬背文本的规律,并不能从本质上理解世界是怎样运行的,在具体应用时,一些涉及逻辑推理和认知的任务表现较差。为弥补这一缺点,百度引入了知识图谱,通过“知识增强”的方法,将数据与知识融合,提升了文心大模型的通用性。
在落地运用方面,目前文心大模型已大规模应用于百度内部的各类产品,包含搜索、信息流、小度智能屏、百度地图等。与此同时,文心大模型通过飞桨开源开放平台、百度智能云等,已赋能到工业、能源、金融、通信等行业,个人、企业开发者数量已超过6万。
“在保险领域应用中,文心大模型的智能解析能力,能使文本处理效率提升30倍;在人力资源领域应用中,文心大模型能实现候选人信息智能分类,模型识别准确率达到99%。”吴甜表示,据他介绍,今年是文心大模型产业落地关键年,未来百度还将不断去降低门槛,让这一系列的创新技术能普惠到更多的人与行业。
在2021百度认知AI创意赛“AI创意派”决赛现场,百度开放了ERNIE 3.0的能力,让每位对AI感兴趣的人,都能够亲自上手使用大模型进行创意开发。据介绍,该比赛自2021年10月正式开启,目前已吸引近2000名选手参与,收集超过300份创意方案。