新火种AI | AI发展何去何从?李开复:中美大模型只能存活五六家

作者:小岩

如果把时间回拨5年,我们会发现,全世界范围内能够进行ai大模型研发的团体,屈指可数。要知道,能够训练大模型的算力设备基本是近3年发布的,而现象级产品chatgpt的诞生,不过是最近一年的事情。
毕竟,大模型的发展需要极高的门槛,不仅需要强大的算力资源,更需要丰富的数据资源给予支持。大模型时代,离不开大算力,也离不开大数据。
但也就在一年的时间,各式各样,专供大模型的公司和机构如雨后春笋般冒出头。大家开始角力,继而陷入白热化的竞争状态。就连著名ai科学家李开复都表示,未来中美的大模型公司中,能存活下去的只有5、6家。
我们不禁感叹,大模型赛道从“高处不胜寒”到挤兑严重,竟然只需要如此短的时间。
“除了大厂,中美加起来应该可以支撑5、 6家左右”。
12月14日,在一场与ai相关的对话中,零一万物的ceo李开复被问到了一个问题:大模型赛道最终能有几家活下来?对此,李开复也算是知无不言,他认为,除了大厂,中美加起来应该可以支撑五六家左右。
李开复表示,如今来看,做巨大预训练模型的机会正在变少。这个通道不能说是完全关闭了,但势必会越来越难。未来只有在需要新技术的时候,才会出现更多的机会。与此同时,李开复还给出了ai未来的发展方向:ai infra(人工智能基础框架技术)和ai应用等方面。
李开复解释,“做ai应用的机会就是现在,正如10多年前移动互联网所面临的时代一样。较早抓到机会的微信就成功了。当然,后续也有抖音,拼多多等陆续崛起。但一定是越早入局,机会越大。真正有梦想有野心的开发者,应该是要做ai-first(ai优先) ,ai-native(ai原生)的应用,这些应用才可能成为ai 2.0时代最伟大或是最赚钱的应用”。
事实的确如此。专业性大模型ai的开发竞争激烈,各大公司在训练自家大模型时,还不得不面临巨大的挑战和限制。一方面,大模型的训练需要庞大的计算资源和时间,如果不是大厂或者拥有雄厚的资本支持独角兽,这势必会成为一个难以逾越的壁垒。另一方面,大模型的训练数据需要大量的人工标注和清洗,这个过程专业性极高,复杂而耗时。更重要的是,大模型的应用面临着数据隐私和安全方面的挑战,“如何保护用户数据和防止滥用”是每个大模型开发者都需要考虑清楚,亟待解决的问题。稍有不慎,就会陷入泥潭。
李开复领衔零一万物,发布首款开源中英双语大模型“yi”。
虽然强调ai大模型即将发展成“红海赛道”,但李开复本人却是赛道里卷的最凶的那个。
作为创新工场的董事长兼ceo,他成立了自己的ai公司“零一万物”。就在上个月,零一万物发布了首款开源中英双语大模型“yi”。
此次开源发布的yi系列模型,包含34b和6b两个版本,11月2日,零一万物在hugging face上传了这两个参数。据悉,hugging face是全球最受欢迎的大模型,数据集开源社区,被认为是大模型领域的github,在大模型英文能力测试中具有相当权威性。
根据hugging face英文开源社区平台和c-eval中文评测所提供的最新榜单,yi-34b分别在预训练大语言模型和中文大模型榜单c-eval排行榜爬升到第1位。这也是迄今为止唯一成功登顶 hugging face全球开源模型排行榜的国产模型。
与此同时,零一万物新一轮的融资十分顺利,由阿里云领投。目前,零一万物估值已超10亿美元,跻身独角兽行列。李开复在2023年3月创建了零一万物团队,6月开始运营。也就是说,在短短8个月的时间里,零一万物不仅推出了核心产品,更跻身成为估值超10亿美元的“独角兽”。
行业内尽是大厂和“独角兽”,也难怪李开复要感叹大模型赛道竞争激烈了。
大模型yi全球领跑,旨在打造打造更多的to c super app。
据了解,yi-6b和yi-3b分别代表数据参数量为60亿和340亿,按照李开复的说法,“34b是一个黄金尺寸”。
34b的最大优势在于一方面它不会小到没有涌现或者涌现不够,甚至已经完全达到了涌现的门槛;另一方面,它又没有太大,允许高效率的单卡推理。yi-34b模型在多项评测基准中全球领跑,基于超强infra下模型训练成本实测下降40%,模拟千亿规模训练成本则可以下降多达50%。
所谓ai infra,全称为ai infrastructure ,即人工智能基础架构技术,主要涵盖大模型训练和部署提供各种底层技术设施,包括处理器,操作系统,存储系统,网络基础设施,云计算平台等,是模型训练背后极其关键的“保障技术”。
​ai infra是大模型行业发展至今较少被关注到的硬技术领域,但也是十分关键的领域。用李开复的话说,“做过大模型infra的人比做算法的人才更稀缺”。
对于零一万物而言,因为有了yi做基础,更多to c端的超级应用才有可能出现。yi的定位是通用底座,已在 hugging face,modelscope,github 3大全球开源社区平台正式上线。与此同时,yi系列量化版本,对话模型,数学模型,代码模型,多模态模型等都将很快亮相。
按照李开复的逻辑,ai的技术壁垒终将会被一个个的攻破,对于ai公司来说,可持续,可增长的盈利才是要紧事,无法商业化的公司终将被淘汰。在ai 2.0时代,最大的商机一定是来自超级应用,而且是消费者级别的,诸如抖音,微信一样的超级应用。
目前,零一万物已经启动100b以上参数规模的模型训练,而多模态大模型团队也已经集结了10多个人,说明零一万物将朝着“消费级应用”的方向努力。而这些,恰恰与李开复所说的“ai infra和ai应用才是未来”的理念,不谋而合。


人工智能在消费电子行业应用进入加速阶段
室内家装灯光设计光源的分类
争“江湖地位” 荣耀V9和一加3T对比评测
次世代显示技术微发光二极体获新进展
澜起科技发布全球首款CXL™内存扩展控制器芯片
新火种AI | AI发展何去何从?李开复:中美大模型只能存活五六家
“动力电池用高性能结构粘接材料创新解决方案”的主题演讲
电机中的常用轴承简介
海康机器人与大族视觉合作瞄准机器视觉和智能检测
泰尔实验室破解AI伪造人脸,准确率达98.9%
中国联通推出XR内容开发者孵育计划!强势助力5G文创生态共振
德国BAHR直角坐标机器人在无损探伤设备的应用
使用数字I/O IC简化您的PLC设计
基于图像识别技术的银行ATM监控方案
5G网络部署逐步启动 国内通讯产业抢占至高点
日本呼吁41个国家尽早针对先进技术施行出口管制,目的是防堵中国?
小米地震预警上线 352 天,成功预警 4.0 级以上地震 24 次
泰克PA1000--唯一满足最新LED模块测试规范要求的功率分析仪
源码免费下载!C6678+K7视频采集处理方案,这里全都有
小米有线充电技术已经突破100W,未来高端旗舰机都将配备三重快充