定义一种全新的“定制化”模式。
百川智能依然保持着一如既往的快节奏。
12月19日,百川智能宣布开放基于搜索增强的baichuan2-turbo系列api,包含baichuan2-turbo-192k及baichuan2-turbo。在支持192k超长上下文窗口的基础上,还增加了搜索增强知识库的能力。
即日起,api用户可上传文本资料来创建自身专属知识库,从而根据自身业务需求打造更完整、高效的智能解决方案。
2个多月前的9月25日,百川智能便发布了baichuan2-53b闭源大模型,全面升级了baichuan1-53b的各项能力。作为首批通过备案的大模型企业之一,百川智能此次还开放了baichuan2-53b api接口,正式进军to b领域,开启商业化进程。
在当天的媒体沟通会上,百川智能创始人、ceo王小川,百川智能联合创始人、联席总裁洪涛,百川智能技术联创陈炜鹏及百川智能商用业务部总经理李剑共同出席,为「甲子光年」等媒体解答了百川智能在to b模式中最新的技术与商业思考。
1.行业模型之外,大模型to b的第二条路
在过去一年对大模型商业化的讨论中,行业大模型一直被认为是大模型在b端商业落地的主要路径。
而百川智能此次走出了一条不同的路。
百川智能认为,企业自有数据/知识库是企业的核心竞争力。大模型如果不能与企业自有数据/知识库进行结合,对企业而言是没有价值的。
如何将大模型与企业自有数据/知识库更好地相结合呢?
一个已经为人熟知的方法是,打造行业大模型。然而,基于特定数据预训练或微调垂直行业大模型需要高密度的技术人才团队、大量的算力支持,并且每更新一次数据都要重新训练或微调模型。
这种方式不仅成本高昂、灵活性差,更关键的是不能保证训练的可靠性和应用的稳定性,多次训练后仍会出现问题。
此外,大部分企业数据,都是结构化的数据,也不适合sft(supervised fine-tuning,有监督微调),模型无法准确记忆结构化信息,就会带来幻觉。
针对这些痛点,行业摸索了一套基本操作,即“向量数据库+长上下文窗口”。而百川智能在此基础上进一步完善了大模型技术栈,拓展至四个维度:
向量数据库,百川智能在向量检索c-mteb位列第一
长窗口baichuan2-192k,一次可输入35万字
实现稀疏检索(索引库)与向量搜索并行,模型的可用率从80%提升至95%
搜索系统和大模型对齐
具体来看,百川智能将向量数据库升级为搜索增强知识库,提升了大模型获取外部知识的能力;把搜索增强知识库和超长上下文窗口结合,让模型可以连接全部企业知识库以及全网信息,能够替代绝大部分的企业个性化微调,解决99%企业知识库的定制化需求。 这套技术栈背后,也反映了百川智能对于大模型更深层次的思考。 在百川智能的技术思考中,大模型+搜索增强是大模型时代的新计算机——
大模型类似于计算机的cpu,通过预训练将知识内化在模型内部,然后根据用户的prompt生成结果;
上下文窗口可以看做计算机的内存,存储了当下正在处理的文本;
互联网实时信息与企业完整知识库共同构成了大模型时代的硬盘。
那么,百川智能如何将这套技术栈真正落地在商业场景呢?
2.用“产品化”取代“项目化”
事实上,无论王小川还是他所召集的搜狗“旧部”,过往的工作经验更多集中在to c领域。此次带领百川智能进军to b,无疑会面临诸多挑战。
洪涛告诉「甲子光年」:“企业真正要用好大模型的起点,是把企业知识和大模型结合,而这也是最大的困难。”
王小川认为,to b要面对的最大需求是定制化,光靠调用api可能不够。
“我们今天用搜索增强最大的意愿不是解决幻觉问题,而是解决大模型可定制化的问题。如何让企业的私有数据为模型所用,让模型为企业服务,是大模型to b商业化过程中要解决的关键问题。”王小川表示。
在上一波以计算机视觉为核心的ai浪潮中,ai公司变成了集成商,需要下场做很重交付的定制化项目,往往利润很低,甚至越做越亏。如何避免在定制化项目中“越做越亏”的故事在大模型的商业化路上重演,是所有大模型创业公司今天要面对的一大难题。
在王小川的判断中,定制化是客户天生的需求,to b企业真正要避免的是“项目化”。
所以,基于上述技术栈,百川智能定义了一种全新的“定制化”方式——用“产品化”取代“项目化”。
“整体来看,一些能盈利的to b公司卖的大多是产品。我们目前打造的可配置、可调整的搜索增强知识库,就是希望用产品的方式,以更低的成本解决客户的定制化需求。客户提出的各种需求可以通过我们不同的产品组合来解决, 我们不需要单独开发一套全新的数据库。”洪涛进一步解释道。
据「甲子光年」观察,百川智能并不直接针对某个行业做“企业服务”,而是基于不同的场景需求,构建大模型解决问题的能力。这些能力最终可被应用在多个行业。
在众多场景中,百川智能主要瞄准有两大特征的场景——有大量文本数据,并且需要与客户打交道,如客服场景。
目前,和大多数企业类似,百川智能为企业提供api调用、云上部署以及本地部署三种大模型部署方式。
在此次沟通会中,王小川还透露了c端产品的最新信息。
王小川表示,c端产品依然是百川智能十分看重的方向。关于c端超级应用的定义,王小川认为:“以往做应用更多是在造工具,我们要求它以更精确的方式和我们互动,提高我们的效率。但今天,我们要造的是新物种,是一种人类的伙伴。”
王小川进一步透露,百川智能的c端产品第一重心是医疗方向,产品预计会在明年上线。
电源pfc电路可以取消吗?电源pfc电路图解
Microsoft Teams视频聊天人性化设计,更方便用户使用
PyTorch如何实现自定义CUDA算子并调用的方法且测量CUDA程序耗时
2011韩国电子展深圳或将组团参展掘商机
屏幕里的产线世代是个什么?屏幕产线里的那些道道解说!
百川智能发布Baichuan2 Turbo系列API,或将替代行业大模型
安达发专注于APS高级计划管理系统解决方案
三大运营商实现固定通信业务收入3494亿元,同比增11.5%
iPhone8什么时候上市?iphone7s/iphone8发布会日期确定,新功能汇总,价格太贵没人买?
区块链技术怎样在社会管理上发挥作用
中石化智慧工厂之化工厂人员定位解决方案
比亚迪计划加入车内乘员体温监测系统 乘员体温情况一目了然
三星Note8什么时候上市?三星Note8最新消息:三星Note8正面屏面板和外观渲染图最新爆料
薄膜电容器推动新能源科技发展
关于同步复位与异步复位的仿真详解
NGcodec谈FPGA编码在HEVC和AV1上现状与未来
云计算市场竞争激烈,5G时代将会带来哪些新变化
为新机让道而降价的手机:华为P9、荣耀8、魅族pro6plus、三星S7edge哪一款能够入得了你的法眼?
华为荣耀9什么时候上市?荣耀9最新消息:华为荣耀9可能卖不动?无法再创华为荣耀8的辉煌?
封装类型的选择