如何解决NER覆盖和不连续问题

论文:a span-based model for joint overlapped and discontinuousnamed entity recognition
链接:https://aclanthology.org/2021.acl-long.372.pdf
代码:https://github.com/foxlf823/sodner
提取摘要
由于普通的ner问题被研究的透透的了,本文主要解决一种稍微复杂些问题:一种带有覆盖和不连续(overlapped and discontinuous)的命名实体识别任务。
而在这两者研究上来说,前人只是要么解决覆盖问题,要么解决不连续问题,但是本文提出一种联合解决这两种问题的span-based方法。
span-based方法昨天也提到过了,所以关于实体+关系抽取的任务都可以尝试。
本文通过两个步骤构建模型:
通过列举所有可能的text span来识别出实体片段(entity fragments);
在这些entity fragments上预测是两种关系overlapping or succession。
这样,我们不仅可以识别discontinuous的实体,同时也可以对overlapped的实体进行双重检查。
通过上述方法轻松将ner装换成re(relation extraction)任务。最终实验在很多数据集上比如clef, genia andace05上展现除了很强劲的性能。
该模型的步骤为
input一方面通过pre-train模型获取word rep,一方面通过dependency parsing获取句法信息;
gcn集合lstm的输出和句法输入,得到syntax-enhanced的新的表达;
获取所有span表示;
通过两个mlp预测span是否为实体,以及实体时间是否有关系;
最后每个loss加上权重,为最终优化目标。
关键分类
aggcn用来融入句法信息
attention-guided gcn (aggcn)比普通gcn要强一些,所以这里选用该方法。传统的gcn:
而aggcn就是使用self-attention,替换以前的邻接矩阵a,最后通过线性方法将multi head生成的结果合一:
span的表示
解码先预测实体片段,再预测关系。
解码公式
损失计算
实验实验数据介绍
在数据上的表现
在其他数据上与前人的对比,虽然性能不如sota,但是这种span-based方式和sota差不了多少,是个新颖的想法。


智能型测量控制系统电路设计攻略 —电路图天天读(168)
意法半导体CFO转任合资公司COO
libusb的嵌入式移植
3D打印机进军教育市场,Stratasys推出3D打印“教育包”
汽车用品激光打标机的性能特点以及优势介绍
如何解决NER覆盖和不连续问题
可扩展的类似部落协作的加密货币经济网络
英飞凌与安森美争抢收购仙童半导体
盛屯矿业去年业绩因钴业务暴增收获满满
国产16bit/24bit模数转换器MS5196T/MS5197T的应用及特点
Oracle Linux 8.7正式发布了GA版本
诺基亚7Plus和坚果Pro2哪个好
日本瑞萨电子拟以67亿美元收购美国芯片厂商IDT
BEV感知算法:下一代自动驾驶的核心技术
奥地利微电子UHF RFID阅读器IC获Nordic ID应用
换装潮来袭,全球LED户外照明进入高增长期
防丢器PCBA解决方案
荣耀畅玩7X高清图赏
索尼Xperia 20曝光整体设计方面与Xperia 10相似搭载骁龙710处理器
干货,一文看懂半导体的投资机会和投资逻辑