随着ChatGPT以前所未有的速度火出圈,大模型也迅速从过去的遥不可及走到了我们身边。从今天开始,元碳院将开始解读大模型,依旧保持硬核且专业。今天是第十五期,李开复正与他的零一万物,一起蓄势待发。


【资料图】

今年三月下旬,创新工场董事长兼CEO李开复,正式宣布以Project AI2.0之名入局大模型。时至盛夏的今天,零一万物千呼万唤始出来,官网也在今日一并上线,链接:https://01.ai/

要说谁是国内目前最具竞争力的大模型创业团队,零一万物就算不能排名第一,也一定会榜上有名。原因无他,这就是李开复的魅力与号召力。零一万物是他亲自下场带队,塔尖孵化的公司,致力于AI2.0和大模型赛道。 至少从今天开始,零一万物这个名字将开启被关注、被讨论、被追踪的新阶段。 另外,1876年的今天,我国近代历史上第一条铁路,淞沪铁路正式通车运营。1886年的今天,德国工程师卡尔·本茨的第一辆三轮奔驰车在曼海姆完工并出售,现代汽车的时代大门由此开启。

振臂一呼,赢粮影从

在李开复表态,公司筹办数月以来,虽然具体的大模型产品尚未发布,但零一万物并没有卷款跑路,具体进展包括总部注册于北京的公司,同时面向全球招募各种人才;零一万物正专注于自研大模型,自建平台,构建数千卡GPU集群进行训练、调优和推理,提高数据有效参数量,以及使用的高质量数据的密度,以构建连续、可控、科学化的训练能力;三个月内已经实现百亿参数规模的模型内测,正往300亿到700亿参数规模扩大。

短短不到半年的时间里,零一万物已经团结了一批几十名核心成员的团队,集中在大模型技术、AI算法、NLP、系统与算力架构、数据安全、产品研发等领域。已加入的联创团队成员中,不乏来自各路企业的英雄豪杰,如前微软与思科副总裁,前SAP高管,前阿里巴巴和百度副总裁、前滴滴和百度自驾首席算法负责人、前谷歌中国高管,算法和产品团队背景均来自国内外一线大厂。

从1998年在北京中关村创办微软亚洲研究院开始,李开复就成为国内电脑和AI产业里数一数二的伯乐,促进微软在国内外相互推广和了解的同时,客观上也助推了国内互联网和AI产业的发展浪潮。 如今站在大模型的潮头、AI2.0的时代大门口,再次追随并集结在李开复身边的,大都是他曾经的学生、旧部和仰慕者。

从零到一再到万物

零一万物是李开复创办的创新工场AI工程院塔尖孵化的第七家公司,主导的特殊打法将用基金投资和塔尖孵化两个途径相结合,加速打造AI2.0时代的全新创业生态。根据现有公开的工商资料,北京零一万物科技有限公司于5月16日成立,经营范围涵盖AI双创服务平台、AI基础资源与技术平台、工程和技术研究和试验发展、数据处理服务等,而这个时间点距离李开复表态亲自入局大模型创业恰好两个月。

“零一万物”之名并不难理解,电脑与AI的底层规则都遵循二进制,01就是这些工程师们使用的语言与逻辑基础。 不过也有江湖传言表示,在李开复眼里的是从零到一乃至宇宙万物,所谓道生一,一生二,二生三,三生万物,也与“零一智能,万物赋能”的雄心壮志更好契合。

此外,前面提到的以AI及其服务为主的经营范围,也与李开复对AI2.0的思考判断保持一致。 半年多前在ChatGPT带动大模型热潮之后,李开复就曾表示过,以基座大模型为突破的AI2.0时代即将到来,随后将掀起技术、平台到应用多个层面的革命。 如同Windows系统带动了PC的普及,安卓系统催生了移动互联网的生态,AI2.0作为全新时代,也将孕育比移动互联网大十倍的平台机会,将把既有的软件、应用、UI等都重写一次,也将诞生新一批AI-first的应用,并催生由AI主导的商业模式。

国产大模型的三步走

李开复自表态后就开始紧锣密鼓的筹备了,也甚少露面。很明显的,零一万物的下一步是推出多模态模型,结合图片、视频、3D等内容,入口级的Super App也是计划中的一部分,平台中间件和开发者工具也将逐步对外发布。将来还有零一万物在AI2.0时代的“七大模块技术路线”,需要七种不同方向的科学家和工程师:1.定义模型能力天花板的预训练框架技术;2.精进模型实现能力的Post-train技术;3.支撑模型高效训练的AI Infra技术;4.更多元化多介质的多模态模型技术;5.实践训练规模化技术;6.平台中间件及工具链技术;7.推理和服务部署技术。

根据李开复本人对于大模型演进发展的最新讲话与思考判断,国内LLM的演进不会一帆风顺或一步到位,而是会经历三个阶段,简称为L1到L3。 目前国内大部分相关企业都处于L1阶段,下一步需要攻克“涌现”的难题,在L2阶段成为主流,最后再追赶ChatGPT等L3,实现全球一流的目标,逐步发展成为强大的AI2.0“技术基建”,最终实现高质量、高性能发展的目标。

零一万物之所以选择走自研大模型之路,除了李开复坚持本人的理念外,还有个不能忽视的重要原因在于目前开源模型和小模型的技术实现,目前都无法达到与海外竞品掰手腕的程度。 从现阶段各家产品的实际体验看,许多声称效果类似ChatGPT的LLM,都只局限于简单对话。一旦遇到长文本生成,或推理等复杂任务上立刻露馅成“人工智障”。受到模型本身结构和参数量级大小的限制,这种模型很难适应稍微泛化或复杂的任务,只能当做玩具。

李开复曾多次表态,大模型公司与企业的多元化出现不是坏事,会催生一波在新时代从事模型、基建再到应用的全新创新生态产业链。全球市场上将发展成上游的少数几家公司,具有丰富资源支撑算力需求,带动各种中下游配套与应用的繁荣发展,逐步完善AI2.0的全新生态,探索崭新的商业模式,进而创造巨大的经济价值及社会价值。“如果市场风平浪静或只有少数玩家,那我们才真的需要担心落于人后。”

零一万物显得如此与众不同,李开复本人的躬身入局与亲自带队是不可忽视的原因,在众多的创新梯队中,零一万物具有显著优势和竞争特色。之前他曾表示“大模型的技术门槛很高,非常需要整合一个兼具科研能力和开发实力的高效团队,制定贯彻公司的技术和产品战略,从上到下一致执行。”

客观来看,中国现在研发突破落后几年,但擅长技术迭代且具极其优异的工程能力和执行速度,未来可期。而这也可能是李开复选择亲自入局、塔尖孵化零一万物的最核心原因。自研大模型的创业赛道上,不仅需要技术、人才,塔尖资源整合和认知视野同样举足轻重。

推荐内容