2022-02-14
焦点要闻:逐浪AIGC丨李开复新公司首次亮相:定名“零一万物” 将自研大模型
在官宣3个多月后,创新工场董事长兼CEO李开复筹组的新AI公司有了重要进展。7月3日,创新工场宣布,新AI公司定名为“零一万物”,并已有数十名核心成员。对于公司名字,李开复表示,零一即01,代表的是数字世界,从零到一,乃至宇宙万物,寓意 “零一智能,万物赋能” 的雄心。
【资料图】
据介绍,零一万物总部注册于北京,目前团队的数十名核心成员,集中在大模型技术、人工智能算法、自然语言处理、系统架构、算力架构、数据安全、产品研发等领域。已加入的联创团队成员包含前阿里巴巴副总裁、前百度副总裁、前滴滴/百度首席算法负责人、前谷歌中国高管、前微软/SAP/Cisco/副总裁,算法和产品团队背景均来自国内外大厂。
自研大模型
在技术路径上,零一万物选择了自研模型之路。据悉,零一万物将大模型平台研发拆解为七大模块技术路线图,包含预训练框架(Pre-train)技术、 Post-train技术、AI Infra技术、多模态模型技术、平台中间件及工具链技术、推理和服务部署技术。
零一万物方面表示,这七大技术模块均需招募顶级科学家和工程师,以及集合全球最先进的大模型技术认知和最新论文实践。目前,零一万物正搭建实验平台,并构建数千卡GPU集群进行训练、调优和推理,在三个月内已经实现百亿参数规模的模型内测,正往300到700亿参数规模扩大。
对于为何选择自研大模型,零一万物认为,开源模型和小模型的技术实现,绝对无法达到与海外大厂自研模型的性能。从现阶段实际体验看,许多声称效果类似ChatGPT 的开源模型,都只局限于简单对话,在长文本生成和推理等任务上受到模型本身结构和大小的限制,无法适应稍微泛化或复杂的任务。
而且从中长期发展看,过度依赖模型意味着只能知道结果,不掌握过程,这样一来,自身能力天花板和边界将被他人定义,很快会碰到实现多种多样任务的能力天花板。另外,海内外国情、文化、用户习惯、法律法规也不尽相同,海外开源技术随时有关停、切换高额收费或限制地区访问等风险。
因此,零一万物认为,大模型创业公司应该拥抱开源,但不能过度依赖于开源模型。只有尽快建立自己的技术优势,构建起强大的生态护城河,才能真正抓住AI2.0的历史机遇。不过据零一万物透露,其未来也计划推出开源的模型版本,吸引优秀人才共同提升模型,推动全球 AI 2.0 的开发者生态。
而在李开复看来,中国大语言模型的演进不会一步到位,而是会经历L1到L3三个阶段。现阶段,中国大多数公司处于L1阶段,下一步需要跨越“涌现”门槛,成为L2级主流大语言模型,最后追赶L3全球一线公司,成为强大的人工智能“基础设施”,实现高质量、高性能的目标。
押注平台机会
对于AI 2.0未来的商业前景,李开复已经不止一次的提到,如同Windows带动了PC普及,Android催生了移动互联网的生态,AI2.0将诞生比移动互联网大十倍的平台机会,将把既有的软件、使用界面和应用重写一次,也将诞生新一批AI-first的应用,并催生由AI主导的商业模式。
零一万物在官网也写道,其致力于打造全新的AI 2.0平台,将有效帮助提升人类生产力,进而创造巨大的经济价值及社会价值。
所以,零一万物的发展路径也十分明确:首先是构建行业领先的通用大语言模型,之后推出结合图片、视频、3D等能力的多模态模型。接着就是用最新 AI2.0 技术来打造亮眼的应用,具有颠覆性的入口级Super App,同时逐步发布完善的平台中间件和开发者工具。
李开复认为,大模型公司的多元化,会催生一波从 AI 2.0 模型、AI 2.0基础设施、到 AI 2.0 全新应用的创新生态,“我们预测一旦中国有了真正原生、高质量的大模型产生,高质量和有创意的应用会百花齐放,宛如移动互联网和AI 1.0时代一样。”
其判断,全球市场上将出现少数几家具有丰沛资源支撑算力需求的大模型公司,带动各种下游应用的繁荣发展。“大模型的技术门槛很高,非常需要整合一个兼具科研能力和开发实力的高效团队,制定贯彻公司的技术和产品战略,从上到下一致执行。”李开复表示,客观来看,中国现在研发突破也许落后几年,但擅长技术迭代且具极其优异的工程能力和执行速度,未来可期。
李开复还提到,AI2.0市场规模巨大,容纳得下巨头、中小企业、初创公司三个层级的公司赛马。和大厂相比,技术顶尖、能专注掌握大模型打法的创业公司有着集中资源、策略灵活、能打硬仗、落地执行力强等优点,反而更有机会领跑行业,正如ChatGPT背后的OpenAI公司一样。
(文章来源:21世纪经济报道)
标签:
- 精心推荐
X 关闭
X 关闭