GAT模型如何来编码依存关系

本文贡献有如下两点:
提出了一个面向方面的树结构,通过重塑和修剪普通的依存树来关注目标方面。
提出了一个新的gat模型来编码依存关系,建立方面和意见词之间的联系。
餐厅评论中的三个例子来说明 absa 中方面aspect、注意力和句法之间的关系。labeled edges表示依存关系,每个单词下的分数表示由lstm分配注意力权重。具有高注意力权重的词在「红色框」中突出显示,括号中的词是目标方面target aspect,后面是它们的情感标签。
面向方面的树的构建
输入:原来的解析结果以及句子和方面。(原文有伪代码)
「第一步」 将目标方面放在根节点
「第二步」 我们将与方面有直接连接的节点设置为子节点,保留原始的依存关系
「第三步」 舍弃了其他的依存关系,取而代之的是一个从aspect到每个对应节点的虚拟关系n:con,其中n表示两个节点之间的距离。
注意 如果句子包含多个方面,我们为每个方面构建一个唯一的树。
根据是前人研究证明只关注在语法上接近目标方面的一小部分上下文词就足够了。好处是每个方面都有自己的依存树,可以减少不相关节点和关系的影响,同时这种统一的树结构不仅使模型专注于方面和情感词之间的联系,而且在训练过程中便于批量操作和并行操作。
r-gat
为了对上述树进行编码,在gat的基础上提出了一个新的r-gat:relation graph attention network
gat实现的是:
每个结点只对邻居结点进行注意力计算权重。这个得到的是。注意 表明一共使用了个做转换矩阵,最后将它们得到的结果拼接到一起。
作者认为没有考虑到和相邻接点的依存关系是存在不同的,不可以用同样方法去计算。因此引入了考虑不同的依存关系的r-gat来补充信息。大致的思想相同,只是对于(1)中的有考虑进新的信息,也就是不同的依存关系。
「r-gat」:
作者将各种依存关系映射到嵌入中,结点i和结点j之间的就是
也就是先将依存关系经过两层线性层,然后对一个结点的所有边的结果归一化,变成对应的系数。
整个网络结构
结构很简单如下:
具体来说首先需要把句子的依存分析结果通过变换得到面向方面的数,这个结果将参与后续的图编码。
「第一步」,将句子的词嵌入经过bilstm编码得到,利用另一个bilstm编码方面词作为根节点嵌入的初始化。
「第二步」,利用gat和r-gat分别去处理h,得到和,注意相当于只用处理一个根节点。将得到的结果拼接到一起,再经过一个线性层就是该方面词的表达。
「第三步」,softmax分类得到方面词预测结果。
loss function
实验和分析
不同方法在三个数据集上的实验:
多方面分析结果,表明距离较近的方面往往导致准确度得分较低:
不用parser的影响:
消融研究的结果,其中“ordinary”表示使用普通依存树,“reshape”表示使用面向方面的树,“*-n:con”表示不使用n:con的面向方面的树:
r-gat 和 r-gat+bert 对来自restaurant数据集的 100 个错误分类示例的错误分析结果。原因分为四类,并给出了样本。上表对应 r-gat 的结果,下表对应 r-gat+bert:


控制结构、顺序结构和公式节点
大圆柱电池或是电动车最佳选择
还在为3.8节礼物发愁 下面性价比高的蓝牙耳机解决你的烦恼
类I2C介绍及应用注意事项
基于SA-1110微处理器实现网络实时监控系统的设计方案
GAT模型如何来编码依存关系
传统的石化巨头投资新能源汽车 加油站+充电桩并非想象中那样简单
Arphic加入MIPS联盟计划,为MIPS全球授权客户提供
基于紫光同创FPGA的EtherCAT方案可实现满足大面积口罩需求
dfrobotDF9GMS 360度微型舵机简介
是否掌握重组全球产业链的能力 才是贸易战中决胜的关键
DARPA为开发长距离远程水下航行器向三家公司授予开发合同
自动驾驶那么火 丰田为什么押注机器人?
东芝列出采用CMR或SMR的主要硬盘型号 消费者可自行判断
董明珠的造芯计划在加速实施,正筹谋参与近几年里最大的一次半导体并购案
Q2拿下近6成东南亚份额!印度市场受挫之后,国产手机或发力新市场
超高速激光技术可改善癌症的治疗
消费电子巨头纷纷布局无线充电,未来前景有这几大预测
关于预兼容EMI测试解决方案的详细介绍
RA6快速设计指南 [10] 存储器 (2)