新年伊始,新型智能AI聊天机器人模型ChatGPT横空出世,在全球掀起广泛热潮。它能够通过学习和理解人类的语言来进行对话,如流畅对答、写代码、写剧本、内容纠错等,表现出各种惊人的能力。短短两个月,ChatGPT用户量破亿,日活量也已突破1000万。与此同时,微软、谷歌、百度等互联网公司与科技巨头宣布跟进布局,发布或将发布最新的对话式AI产品。ChatGPT正在以其强大的人工智能语言处理能力,再次掀起公众对AI聊天机器人的关注热潮。
一、ChatGPT为何如此火爆?
ChatGPT是美国人工智能知名研究机构OpenAI公司对外发布的一款聊天机器人,使用的是该公司的大型语言模型GPT-3.5加上instructGPT融合形成的一个语言大模型,用于处理自然语言问答。OpenAI的官方说法是,“我们已经训练了一个名为 ChatGPT 的模型,它以对话的方式进行交互。对话模式使 ChatGPT能够回答连续的问题、承认错误、质疑不正确的前提并拒绝不恰当的请求。ChatGPT是InstructGPT的兄弟模型,InstructGPT模型被训练为遵循对话中的指令并提供详细的响应。”
(资料图)
ChatGPT能够如此火爆的根本原因,在于它能够迅速响应用户输入的文本请求,通过其广泛的知识面与流畅的回答,使得AI聊天机器人趋近于一个“真人”的表现。ChatGPT目前主要被用于聊天机器人、问答系统和其他自然语言处理应用中,目前大家在线体验的ChatGPT服务,是基于ChatGPT模型封装的在线问答SaaS服务,可以基于用户输入文本实现对话聊天、内容创作甚至是修订代码等功能。
二、ChatGPT的三大核心能力
1、具备媲美人类的创造力,替代部分脑力性质劳动
ChatGPT使用基于Transformer、GPT3.5架构的大规模语言模型(LLM,Large Language Model),大模型参数高达1750亿。区别于之前的“小模型”针对单类任务、根据已有数据进行分析、判断进而预测,大模型通过海量数据学习归纳后可以实现对复杂任务理解进而演绎创造。因此ChatGPT具备一定的创造能力,可被应用在多个行业。比如根据人类提供的文字描述,编写高质量的广告文案、教学材料;根据任务描述和提示,帮助程序员写代码,甚至通过代码发送邮件。ChatGPT比人类更具有效率,可以替代部分脑力劳动,从而大幅提升生产力。
2、多模场景相互结合,应用前景广阔
ChatGPT在多模态领域的能力同样也令人期待。事实上,得益于大模型千亿级的参数和TB级别的数据集量,其在图像、视频、语音语义等领域的应用效果也十分出众,已涌现以文本输入为主导,不同模态的生成模型。包括文字-图像生成(Dalle-2模型)、文字-文字生成(ChatGPT)、文本-视频生成(Make-A-Video模型),文本-3D建模生成(DreamFusion)等。以ChatGPT对文字任务的理解能力,赋能多模态场景的应用,将高效完成更多创造性工作。比如设计师简要描述一种风格,用ChatGPT扩展成具象化、细节繁多的文字描述,再用Dalle-2模型生成高质量图像。过程中设计师只需要提供一个点子,就可生成具象的图像、视频、3D模型方案,这将大幅拓展其应用场景。
3、深度理解人类语音语义,大幅提升对话体验
ChatGPT通过使用人类反馈强化学习(RLHF)算法针对对话进行了优化,根据人类回答反馈和对话上下文逻辑,生成更连贯、更准确的对话内容。不同于现有的聊天机器人的一问一答模式,与ChatGPT的交流更贴近正常聊天,它可以深度理解你的语义,增添聊天的乐趣。比如根据多轮的提示和指引,ChatGPT已经可以正确回答脑筋急转弯,或者回答出“高情商”的答案(图1)。
图1:ChatGPT“高情商”回答
三、ChatGPT赋能运营商三大业务方向
1、toC端:赋能AI个人助理场景
ChatGPT有望成为用户真正的私人工作助理和生活小帮手,植入到用户所有智能终端中,基于其强大的“生成式”AI能力,对个人用户提供面向生活、工作多场景全方位服务,大幅增强用户体验。基于ChatGPT技术的AI个人助理,可以根据用户平时的工作、生活习惯以及行程安排,结合与用户对话内容的上下文分析,为用户提供合理的决策建议与解决方案。比如,用户可以列出本周的工作关键词,让它写一篇工作报告;或者让它帮订一张从上海到北京的机票,以及不方便接电话时,自动生成文字应答与来电者对话。ChatGPT能够大幅超越运营商通信助理的智能应答、留言信箱等传统功能,并结合多元化音色与外形的虚拟数字人形象,全方位提升C端用户AI助理使用体验及用户黏性。
作为运营商利用ChatGPT研发AI助理产品的先行者,SK电讯在近日公布了其首款大型商用AI产品“A.”的产品愿景。据其首席财务官表示,“A.”是第一款韩语GPT3产品,重点加强了长期记忆能力和处理图像、语音、数据以及文本的“多模”能力上。“A.”将被打造成为个人客户服务的一个“日常数字伙伴”,提供更自然的交互界面,以及提供“基于差异化对话的差异化服务”的能力。
2、toB端:赋能政企服务场景
目前,ChatGPT在B端产品中的定位相对明确,可作为辅助工具来改进或提升现有企业服务类产品功能。当把ChatGPT的文本交互与内容生成能力,扩展到语音、视觉等多模态数据空间中时,与图像识别、音频识别等技术的结合将产生无限可能。搭载ChatGPT的toB工具主要提供语义理解与信息检索、代码纠错与生成、文案、图片内容创作等功能,赋能法律、媒体、IT等垂直行业。
目前,在该应用领域,诸多科技巨头开始布局并发布相关产品战略,例如京东云宣布旗下言犀人工智能应用平台将推出产业版ChatGPT:ChatJD,并公布ChatJD的落地应用路线图“125”计划。“1”是指ChatJD智能人机对话平台;“2”即零售、金融;“5”即包括内容生成、人机对话、用户意图理解、信息抽取、情感分类五大应用场景。
ChatGPT等大模型的运行和服务离不开算力和网络支撑,运营商作为新型云、网、算力等信息基础设施服务运营者,应积极关注产业版“ChatGPT”,考虑在政企等业务上通过自研、投资、合作研发等方式,为千行百业数字化转型赋能提供重要工具,通过合作打造亿级参数量的垂直行业领域大模型,以更小规模、更短训练周期、更低计算资源达到百亿甚至千亿参数量级的模型效果,实现通用大模型结果可复现、成本可控制、应用可落地的目标。
3、toH端:赋能智能家居场景
传统智能家居中智能音箱、家居机器人中语音助手的交互更类似于搜索引擎,产品仅能对相应问题及指令做出简单回应。未来搭载ChatGPT生成式AI加上语音控制功能后,能够自动生成完整的对话语句,智能家居产品反馈的丰富程度及准确性将大幅提升,对用户需求的理解更加智能。同时,基于ChatGPT的自回归特性下的自学习能力,当用户发出指令时,ChatGPT能够根据用户平常的使用习惯和当时的场景,给出最合适的执行意图。用户不再需要进行复杂的操作,让过去的被动式智能家居操控有望变成个性化的主动服务,将为用户提供更简化、自然、智能的居家体验。
图2:亚马逊家庭陪护机器人Astro
以亚马逊的家庭陪护机器人Astro为例,其带有智能显示器,麦克风,扬声器,夜视LED,潜望镜摄像头等设备,能够语音交互、监控家庭安全、检测宠物等,已具备自学习与多模交互能力。智慧家庭作为运营商业务中越发重要的一环,从家庭云到IPTV、智慧安防监控、全屋智能等产品形态及终端来看,搭载ChatGPT的家庭侧智慧终端AI助手会进一步普及人机自然对话的交互方式,并很可能从文本对话模式扩展到语音对话模式,进而将大大提升信息通信流量和用户粘度,将为家庭用户带来更加高效和智能的体验,提升智慧家庭和垂直行业的数字化水平。
四、结语
短短三个月,关于ChatGPT的讨论席卷全世界,引发各行各业的无限遐想。作为AI技术发展的新高度,ChatGPT所引发的“AI即服务”趋势拓展了更大的业务空间,为通信业创新提供了广阔舞台。作为通信运营商,应该积极跟进AI领域前沿技术发展及基础研究工作,基于垂直行业及关键场景拓展相关业务布局,并时刻关注ChatGPT相关创新产品应用及发展趋势。从重要举措来看,一是以服务对象为切入角度,加大基于垂直行业领域的大模型建设,以通用模型能力高效赋能2C、2B、2H等业务,提升现有算法服务能力及水平。二是升级运营商平台侧的通用AI能力,积极探索AI+多模态融合的新场景,挖掘新兴AI技术的落地应用,如智能数字人助理、家庭服务机器人等。三是要关注生成类AI产品的应用风险和监管问题,只有确保在合法、合规、合理的范围内服务用户,才能顺利引导新技术的广泛应用,在这波AI产业发展热潮中占得先机。