一个教你逐步实现和适应简单的实词NLP任务的教程

人工智能技术目前越来越火爆,近日,2018 年图灵奖得主揭晓,获奖的三位科学家是分别是 yoshua bengio、yann lecun 和 geoffrey hinton。相信在人工智能领域,没有人不知道这三位,众所周知,他们被称为「深度学习三巨头」。
作为人工智能领域「皇冠上的明珠」,nlp 技术在经历了过去几年的发展之后,证明了它落地的可行性,因此目前也是相当火爆。想必同学们也会经常在网上找一些好的学习资源。
最近,小编在 github 上发现了一份基于的 nlp 学习教程。这份教程内容相当丰富,内容涵盖神经网络机器翻译、问答匹配、电影评价分类、新闻分类等多个领域。
项目的 github 地址为:https://github.com/lyeoni/nlp-tutorial。
这是一个教你逐步实现和适应简单的实词 nlp 任务的教程:
项目里面有 4 个资源:神经机器翻译、问答匹配、新闻分类和电影分级。这些资源都提供了源码,对初学者来说,极为友好。初学者可以学会建立自己的模型。
废话就不多说了,让我们一起来具体看看这些资源吧~
神经机器翻译:这个 repo 提供了神经机器翻译的简单 pytorch 实现,以及机器翻译过程中各种序列到序列(seq2seq)模型的比较。
关键词:序列到序列网络(seq2seq),注意机制,自回归,teacher-forcing
问答匹配:这个 repo 提供了简单的 pytorch 问答匹配实现。在这里,我们使用来自 stack exchange 的英语语料库来构建整个问题的嵌入。使用这些嵌入,我们找到给定问题的类似问题,并找到相应的答案。
关键词: 长度可变的 lstm 序列,tf-idf,文本分类
新闻分类:此报告包含一个简单的源代码,用于基于 textcn 的文本分类。语料库是英文的赫夫波斯特新闻分类数据集。大多数开放源代码对于初学者来说有点难以学习和建立文本分类模型。所以,我希望这个 repo 对于那些想要拥有自己的文本分类模型的人来说是一个很好的解决方案。
关键词:textcn,文本分类,文本分类
电影分级(韩国 nlp):此 repo 包含一个简单的源代码,用于基于 textcnn 的文本分类任务中。其语料库是 huffpost 的新闻分类数据集。对初学者来说,学习大多数开放源代码、建立文本分类模型是有难度的。所以,我希望这个 repo 可以帮助他们拥有自己的文本分类模型。
关键词:textcnn、文本分类、情感分析
如果在学习中遇到相关问题,还可以点击下面的网址,加入小组答疑:https://github.com/lyeoni/nlp-tutorial/tree/master/question-answering-squad
拥有这么好的资源,同学们赶快开始学习吧!

采用可编程逻辑器件实现高速数据中继器的设计
蒂森克虏伯大动作,200多个配备了最新安全传感器的机器人即将上线
锐龙52600和i5-9400F哪个好
如何使用宏偷梁换柱
国外程序员的一天日常是什么样
一个教你逐步实现和适应简单的实词NLP任务的教程
开启MMU会出现的问题及解决方案
RDA5807的RSSI信号响应RF强度测试
金鸽科技发布R40 多功能4G工业路由器
基安云智慧供水解决方案:用“智”水之道捍卫城市生命线
2024年,中国电信将深耕卫星通信领域
通嘉宏瑞获评 “中国IC独角兽企业”
什么成为了5G商用的跳板
小米狗狗定位器开售,可随时监测狗狗并进行定位
关于AR的8个方面的应用解析
新能源汽车渗透率明年有望冲刺40%
UMS微波检测器的特点
磁电式传感器和霍尔传感器的外观区别
在很多金融场景中,百融云创都运用了AI技术
小米6什么时候上市?小米6最新消息:小米6本月发布 成本提升告别1999元时代!