chatgpt 是一种专注于对话生成的语言模型。它能够根据用户的文本输入,产生相应的智能回答。这个回答可以是简短的词语,也可以是长篇大论。其中gpt是generative pre-trained transformer(生成型预训练变换模型)的缩写。
通过学习大量现成文本和对话集合(例如wiki),chatgpt能够像人类那样即时对话,流畅的回答各种问题。(当然回答速度比人还是慢一些)无论是英文还是其他语言(例如中文、韩语等),从回答历史问题,到写故事,甚至是撰写商业计划书和行业分析,“几乎”无所不能。甚至有程序员贴出了chatgpt进行程序修改的对话。
chatgpt也可以与其他aigc模型联合使用,获得更加炫酷实用的功能。例如上面通过对话生成客厅设计图。这极大加强了ai应用与客户对话的能力,使我们看到了ai大规模落地的曙光。
1、chatgpt的传承与特点1.1 openai家族我们首先了解下openai是哪路大神。
openai总部位于旧金山,由特斯拉的马斯克、sam altman及其他投资者在2015年共同创立,目标是开发造福全人类的ai技术。而马斯克则在2018年时因公司发展方向分歧而离开。
此前,openai 因推出 gpt系列自然语言处理模型而闻名。从2018年起,openai就开始发布生成式预训练语言模型gpt(generative pre-trained transformer),可用于生成文章、代码、机器翻译、问答等各类内容。
每一代gpt模型的参数量都爆炸式增长,堪称“越大越好”。2019年2月发布的gpt-2参数量为15亿,而2020年5月的gpt-3,参数量达到了1750亿。
gpt家族主要模型对比
1.2 chatgpt的主要特点chatgpt 是基于gpt-3.5(generative pre-trained transformer 3.5)架构开发的对话ai模型,是instructgpt 的兄弟模型。chatgpt很可能是openai 在gpt-4 正式推出之前的演练,或用于收集大量对话数据。
chatgpt的主要特点
openai使用 rlhf(reinforcement learning from human feedbac,人类反馈强化学习) 技术对 chatgpt 进行了训练,且加入了更多人工监督进行微调。
此外,chatgpt 还具有以下特征:
1)可以主动承认自身错误。若用户指出其错误,模型会听取意见并优化答案。
2)chatgpt 可以质疑不正确的问题。例如被询问 “哥伦布 2015 年来到美国的情景” 的问题时,机器人会说明哥伦布不属于这一时代并调整输出结果。
3)chatgpt 可以承认自身的无知,承认对专业技术的不了解。
4)支持连续多轮对话。
与大家在生活中用到的各类智能音箱和“人工智障“不同,chatgpt在对话过程中会记忆先前使用者的对话讯息,即上下文理解,以回答某些假设性的问题。chatgpt可实现连续对话,极大的提升了对话交互模式下的用户体验。
对于准确翻译来说(尤其是中文与人名音译),chatgpt离完美还有一段距离,不过在文字流畅度以及辨别特定人名来说,与其他网络翻译工具相近。
由于 chatgpt是一个大型语言模型,目前还并不具备网络搜索功能,因此它只能基于2021年所拥有的数据集进行回答。例如它不知道2022年世界杯的情况,也不会像苹果的siri那样回答今天天气如何、或帮你搜索信息。如果chatgpt能上网自己寻找学习语料和搜索知识,估计又会有更大的突破。
即便学习的知识有限,chatgpt 还是能回答脑洞大开的人类的许多奇葩问题。为了避免chatgpt染上恶习, chatgpt 通过算法屏蔽,减少有害和欺骗性的训练输入。,查询通过适度 api 进行过滤,并驳回潜在的种族主义或性别歧视提示。
2、chatgpt/gpt的原理2.1 nlpnlp/nlu领域已知局限包括对重复文本、对高度专业的主题的误解,以及对上下文短语的误解。
对于人类或ai,通常需接受多年的训练才能正常对话。nlp类模型不仅要理解单词的含义,还要理解如何造句和给出上下文有意义的回答,甚至使用合适的俚语和专业词汇。
nlp技术的应用领域
本质上,作为chatgpt基础的gpt-3或gpt-3.5 是一个超大的统计语言模型或顺序文本预测模型。
2.2 gpt v.s.bert与bert模型类似,chatgpt或gpt-3.5都是根据输入语句,根据语言/语料概率来自动生成回答的每一个字(词语)。从数学或从机器学习的角度来看,语言模型是对词语序列的概率相关性分布的建模,即利用已经说过的语句(语句可以视为数学中的向量)作为输入条件,预测下一个时刻不同语句甚至语言集合出现的概率分布。
chatgpt 使用来自人类反馈的强化学习进行训练,这种方法通过人类干预来增强机器学习以获得更好的效果。在训练过程中,人类训练者扮演着用户和人工智能助手的角色,并通过近端策略优化算法进行微调。
由于chatgpt更强的性能和海量参数,它包含了更多的主题的数据,能够处理更多小众主题。chatgpt现在可以进一步处理回答问题、撰写文章、文本摘要、语言翻译和生成计算机代码等任务。
bert与gpt的技术架构(图中en为输入的每个字,tn为输出回答的每个字)
除硫化就可以修复好电池吗?
富士康将大幅缩减对美国威斯康星州工厂的投资规模
维信诺牵引AMOLED显示产业融通创新发展
荣耀7C最新拆解:优缺点并存 按需选择
英国航空成为了国际航空集团旗下运营最大A350-1000飞机的航空公司
ChatGPT的特点及原理
安全稳定,向日葵远程控制助推物流行业信息化转型
【方案精选】让你出行更舒适更安全,大联大推出基于NXP的Panda ADAS解决方案
Hirth Engines风冷二冲程发动机的特征
Raychem防波套在电缆中的应用,它的实际作用是什么
领跑行业的坚果投影的品牌影响力源于何处?
苹果拟开设“材料回收”实验室 利用机器人技术和机器学习来拆解设备
微处理器温度控制模拟初始化和整体参数设定
布线技巧六:光纤电缆
为什么智慧城市的发展需要强大的5G网络支持
PCIe 6.0入门之事务层
MediaTek 构建 Wi-Fi 7 全球生态系统,迎接规模化量产
GPT-4发布!多领域超越“人类水平”,专家:国内落后2-3年
安科瑞精密配电监控解决方案
图像尺寸测量仪维护保养