对话百度吴甜：驱动“AI规模化” 今年是大模型落地关键年

（CWW）4月17日上午消息，随着数据井喷、算法进步以及算力的突破，效果好、泛化能力强、通用性强的预训练大模型（简称“大模型”），已成为人工智能发展的新方向。近日，在2021百度认知AI创意赛“AI创意派”决赛现场，百度首次将文心大模型能力向公众开放，让每一位对AI感兴趣的人，都能够自上手使用大模型进行创意设计开发。

决赛现场，百度集团副总裁吴甜出席并围绕大模型行业趋势、产业价值、落地成果，分享了百度文心大模型的进展。在与新浪科技等媒体沟通中，吴甜指出，数据、算法、算力的发展，为人工智能技术带来了新的机遇，预训练大模型正驱动着人工智能的规模化应用，今年是文心大模型应用落地关键年。

大模型正驱动AI规模化应用

近年来，国内外科技巨头如谷歌、微软、英伟达、百度等，纷纷在AI大模型领域展开相应探索。频频获得国内外科技巨头关注的背后，大模型真正的魅力在于——人工智能作为新一轮科技革命和产业变革的重要驱动力量，它需要在各行各业深度地绑定融合，才能真正成为驱动产业转型升级的关键力量。

然而，受制于不同行业规则迥异，以及支撑特定场景AI模型训练的数据获取难、算力及人力成本高等因素，目前大多数的人工智能技术，往往只能被少数企业开发并用于解决特定领域问题，难以进行场景迁移和规模化复制，通用性和普适效果差。

大模型的出现，大幅降低了人工智能的应用门槛。其通过集中提供通用算法模型，打造技术底座，让大多数企业能够“站在巨人的肩膀上”，使标注数据更少、开发效率更高、应用成本更低。

据吴甜介绍，目前百度文心大模型已成为产业级知识增强大模型，包含NLP（自然语言理解）大模型、CV（计算机视觉）大模型、跨模态大模型，既有基础通用的大模型，也包含面向重点领域、重点任务的大模型，以及丰富的工具与平台。其中，多个大模型达全球领先水平，例如全球首个百亿参数中英文对话大模型PLATO-XL、首个聚焦中英文场景大规模 OCR 结构化预训练模型 VIMER – StrucText等。

与此同时，为进一步降低AI应用难度，文心大模型还通过与百度飞桨等开源框架结合，为开发者提供了成套的工具平台，配套易上手的大模型开发、轻量化、部署工具，让各行各业的开发者都能低门槛地实现AI的应用。

“百度大模型与国产深度学习框架融合发展，打造了自主创新的AI底座，真正发挥大模型驱动AI规模化应用的产业价值。”吴甜表示。

今年是大模型产业落地关键年

据吴甜介绍，百度文心大模型的诞生可追溯到2019年3月，当时百度发布的中国首个正式开放的预训练模型，便是文心大模型的ERNIE1.0版本。该模型不断升级并取得突破，2021年7月，作为首个在百亿级预训练模型中引入大规模知识图谱的模型，ERNIE 3.0刷新了五十多个中文NLP任务基准。2021年12月，ERNIE 3.0升级为全球首个知识增强千亿大模型，模型数量突破2600亿。

从行业角度来看，大模型的参数规模是评估一个模型好坏的关键指标，参数越大一般来说意味着大模型具备更多的能力，泛化性、通用性也更加强。目前，文心大模型参数规模达到2600亿。“从十亿级参数到千亿级，可以明确看到模型规模增长和训练数据增加带来了显著效果提升。”吴甜表示。

当然，一味地比拼参数，并不是衡量大模型优劣的唯一标准。模型质量、算力大小等软硬件协同能力，以及大模型的工程落地能力，也是重要的评价维度。

据吴甜介绍，文心大模型最大的特点是“知识增强”。传统大模型只从海量的文本中学习，只能死记硬背文本的规律，并不能从本质上理解世界是怎样运行的，在具体应用时，一些涉及逻辑推理和认知的任务表现较差。为弥补这一缺点，百度引入了知识图谱，通过“知识增强”的方法，将数据与知识融合，提升了文心大模型的通用性。

在落地运用方面，目前文心大模型已大规模应用于百度内部的各类产品，包含搜索、信息流、小度智能屏、百度地图等。与此同时，文心大模型通过飞桨开源开放平台、百度智能云等，已赋能到工业、能源、金融、通信等行业，个人、企业开发者数量已超过6万。

“在保险领域应用中，文心大模型的智能解析能力，能使文本处理效率提升30倍；在人力资源领域应用中，文心大模型能实现候选人信息智能分类，模型识别准确率达到99%。”吴甜表示，据他介绍，今年是文心大模型产业落地关键年，未来百度还将不断去降低门槛，让这一系列的创新技术能普惠到更多的人与行业。

在2021百度认知AI创意赛“AI创意派”决赛现场，百度开放了ERNIE 3.0的能力，让每位对AI感兴趣的人，都能够亲自上手使用大模型进行创意开发。据介绍，该比赛自2021年10月正式开启，目前已吸引近2000名选手参与，收集超过300份创意方案。