新火种AI | AI发展何去何从？李开复：中美大模型只能存活五六家

作者：小岩

如果把时间回拨5年，我们会发现，全世界范围内能够进行ai大模型研发的团体，屈指可数。要知道，能够训练大模型的算力设备基本是近3年发布的，而现象级产品chatgpt的诞生，不过是最近一年的事情。
毕竟，大模型的发展需要极高的门槛，不仅需要强大的算力资源，更需要丰富的数据资源给予支持。大模型时代，离不开大算力，也离不开大数据。
但也就在一年的时间，各式各样，专供大模型的公司和机构如雨后春笋般冒出头。大家开始角力，继而陷入白热化的竞争状态。就连著名ai科学家李开复都表示，未来中美的大模型公司中，能存活下去的只有5、6家。
我们不禁感叹，大模型赛道从“高处不胜寒”到挤兑严重，竟然只需要如此短的时间。
“除了大厂，中美加起来应该可以支撑5、 6家左右”。
12月14日，在一场与ai相关的对话中，零一万物的ceo李开复被问到了一个问题：大模型赛道最终能有几家活下来？对此，李开复也算是知无不言，他认为，除了大厂，中美加起来应该可以支撑五六家左右。
李开复表示，如今来看，做巨大预训练模型的机会正在变少。这个通道不能说是完全关闭了，但势必会越来越难。未来只有在需要新技术的时候，才会出现更多的机会。与此同时，李开复还给出了ai未来的发展方向：ai infra（人工智能基础框架技术）和ai应用等方面。
李开复解释，“做ai应用的机会就是现在，正如10多年前移动互联网所面临的时代一样。较早抓到机会的微信就成功了。当然，后续也有抖音，拼多多等陆续崛起。但一定是越早入局，机会越大。真正有梦想有野心的开发者，应该是要做ai-first（ai优先），ai-native（ai原生）的应用，这些应用才可能成为ai 2.0时代最伟大或是最赚钱的应用”。
事实的确如此。专业性大模型ai的开发竞争激烈，各大公司在训练自家大模型时，还不得不面临巨大的挑战和限制。一方面，大模型的训练需要庞大的计算资源和时间，如果不是大厂或者拥有雄厚的资本支持独角兽，这势必会成为一个难以逾越的壁垒。另一方面，大模型的训练数据需要大量的人工标注和清洗，这个过程专业性极高，复杂而耗时。更重要的是，大模型的应用面临着数据隐私和安全方面的挑战，“如何保护用户数据和防止滥用”是每个大模型开发者都需要考虑清楚，亟待解决的问题。稍有不慎，就会陷入泥潭。
李开复领衔零一万物，发布首款开源中英双语大模型“yi”。
虽然强调ai大模型即将发展成“红海赛道”，但李开复本人却是赛道里卷的最凶的那个。
作为创新工场的董事长兼ceo，他成立了自己的ai公司“零一万物”。就在上个月，零一万物发布了首款开源中英双语大模型“yi”。
此次开源发布的yi系列模型，包含34b和6b两个版本，11月2日，零一万物在hugging face上传了这两个参数。据悉，hugging face是全球最受欢迎的大模型，数据集开源社区，被认为是大模型领域的github，在大模型英文能力测试中具有相当权威性。
根据hugging face英文开源社区平台和c-eval中文评测所提供的最新榜单，yi-34b分别在预训练大语言模型和中文大模型榜单c-eval排行榜爬升到第1位。这也是迄今为止唯一成功登顶 hugging face全球开源模型排行榜的国产模型。
与此同时，零一万物新一轮的融资十分顺利，由阿里云领投。目前，零一万物估值已超10亿美元，跻身独角兽行列。李开复在2023年3月创建了零一万物团队，6月开始运营。也就是说，在短短8个月的时间里，零一万物不仅推出了核心产品，更跻身成为估值超10亿美元的“独角兽”。
行业内尽是大厂和“独角兽”，也难怪李开复要感叹大模型赛道竞争激烈了。
大模型yi全球领跑，旨在打造打造更多的to c super app。
据了解，yi-6b和yi-3b分别代表数据参数量为60亿和340亿，按照李开复的说法，“34b是一个黄金尺寸”。
34b的最大优势在于一方面它不会小到没有涌现或者涌现不够，甚至已经完全达到了涌现的门槛；另一方面，它又没有太大，允许高效率的单卡推理。yi-34b模型在多项评测基准中全球领跑，基于超强infra下模型训练成本实测下降40%，模拟千亿规模训练成本则可以下降多达50%。
所谓ai infra，全称为ai infrastructure ，即人工智能基础架构技术，主要涵盖大模型训练和部署提供各种底层技术设施，包括处理器，操作系统，存储系统，网络基础设施，云计算平台等，是模型训练背后极其关键的“保障技术”。
ai infra是大模型行业发展至今较少被关注到的硬技术领域，但也是十分关键的领域。用李开复的话说，“做过大模型infra的人比做算法的人才更稀缺”。
对于零一万物而言，因为有了yi做基础，更多to c端的超级应用才有可能出现。yi的定位是通用底座，已在 hugging face，modelscope，github 3大全球开源社区平台正式上线。与此同时，yi系列量化版本，对话模型，数学模型，代码模型，多模态模型等都将很快亮相。
按照李开复的逻辑，ai的技术壁垒终将会被一个个的攻破，对于ai公司来说，可持续，可增长的盈利才是要紧事，无法商业化的公司终将被淘汰。在ai 2.0时代，最大的商机一定是来自超级应用，而且是消费者级别的，诸如抖音，微信一样的超级应用。
目前，零一万物已经启动100b以上参数规模的模型训练，而多模态大模型团队也已经集结了10多个人，说明零一万物将朝着“消费级应用”的方向努力。而这些，恰恰与李开复所说的“ai infra和ai应用才是未来”的理念，不谋而合。

人工智能在消费电子行业应用进入加速阶段
室内家装灯光设计光源的分类
争“江湖地位” 荣耀V9和一加3T对比评测
次世代显示技术微发光二极体获新进展
澜起科技发布全球首款CXL™内存扩展控制器芯片
新火种AI | AI发展何去何从？李开复：中美大模型只能存活五六家
“动力电池用高性能结构粘接材料创新解决方案”的主题演讲
电机中的常用轴承简介
海康机器人与大族视觉合作瞄准机器视觉和智能检测
泰尔实验室破解AI伪造人脸，准确率达98.9％
中国联通推出XR内容开发者孵育计划！强势助力5G文创生态共振
德国BAHR直角坐标机器人在无损探伤设备的应用
使用数字I/O IC简化您的PLC设计
基于图像识别技术的银行ATM监控方案
5G网络部署逐步启动国内通讯产业抢占至高点
日本呼吁41个国家尽早针对先进技术施行出口管制，目的是防堵中国？
小米地震预警上线 352 天，成功预警 4.0 级以上地震 24 次
泰克PA1000--唯一满足最新LED模块测试规范要求的功率分析仪
源码免费下载！C6678+K7视频采集处理方案，这里全都有
小米有线充电技术已经突破100W，未来高端旗舰机都将配备三重快充