介绍NMT模型鲁棒性对抗训练的三部曲

本文主要介绍nmt模型鲁棒性的相关改进工作,介绍一下对抗训练的三部曲,一作皆是chengyong,分别中了2018,2019和2020的acl。
第一项工作为 towards robust neural machine translation (acl 2018)
本文的问题引入为一个小实验,即将机器翻译的源句进行微小扰动(同义词替换),69.74%的翻译句子也随之改变,并且原始输入和扰动输入对应的翻译句间bleu仅为79.01,因此,作者希望通过对抗训练来加强encoder和decoder的抗干扰能力。
具体做法如上图,首先是噪声的引入,作者提出两种方式:
1)词汇级别,计算余弦相似度进行同义词替换;
2)特征级别,在词向量上加入高斯噪声。
然后是噪声数据的使用,对应上图中三个损失函数:
1)ltrue(x, y)是正常训练nmt的损失函数;
2)lnoisy(x', y)是加强decoder的去噪能力,即对应有噪声的hx',decoder也能得到正确的输出;
3)linv(x, x'),旨在加强encoder的去噪能力,即针对噪声数据x',encoder得到的hx'也应与原表征hx相近,训练过程采用了min-max two-player策略,引入discriminator进行交互对抗训练,encoder得到hx和hx'应该尽可能相似骗过discriminator,而discriminator则要分开有、无噪声的数据,两者迭代训练以加强encoder对噪声数据x'的建模能力。
文章优势在于不改变模型结构,可拓展到任意噪声干扰或是针对特定任务进行设计,如作者对输入数据进行删除、替换等token级噪声时,发现使用词汇级别噪声的引入训练的模型更鲁棒。
第二项工作为 robust neural machine translation with doubly adversarial inputs (acl 2019)
这项工作不同于上文的模型无关,而是将nmt看成“白盒”,从而基于梯度生成对抗输入,文章的核心思想就是下面这条式子,其中x',x分别代表有无噪声的数据,r(·)为相似性度量,后面的是负对数loss,通俗来讲就是找到噪声不是太大的x'(保证x'与x语义相近),使得模型的loss最大,这样才能最有效地加强模型鲁棒性。
具体做法分为两部分,分别是encoder攻击和decoder防御。在encoder端,x为encoder的输入,模型会算出某个词表征xi的梯度gxi,然后在词表中找出使loss最大的x替换原有的词xi,做法是在词典中计算表征“e(x)-e(xi)”与gxi的相似度,使相似度最大的xi'为所得。同时,噪声xi'不应与原始xi差太远,作者使用了masked lm提取候选词,在原句中,会将需要替换的词先mask,然后选择预测的topk作为候选项,至于哪些词会被mask或替换则为随机均匀采样。
在decoder端,z为decoder的输入,与encoder中的噪声xi'类似,以同样的方法得到zi',但针对zi的采样与xi有关,即xi随机采样,zi需要大概率在xi替换的同样位置进行替换。因此,回望整个训练方式,encoder的作用是找到使梯度最大的xi'扰乱模型,decoder的作用是即使输入为zi',仍能输入正确的结果,具有一定鲁棒性。
我觉得本文有两点值得思考,首先是基于梯度最大来找噪声词,能够更有力的对模型鲁棒能力发起攻击,其实这个可以更进一步,encoder输入中需要被替换的词并非随机采样,而是找使loss最大的词,相关文章改进ce loss为focal loss也就是这个思想,我们可以直觉判断,模型建模较好的是高频词,建模不好的是低频词,低频词的loss比较大,我们在大loss的基础上再找大梯度,这样攻击效果更强力,同时可以提高模型对低频词的鲁棒性。第二点是作者对xi的替换处理,还要回词典中寻找进行词替换,这样未免更加麻烦了,为什么不在一定范围内,直接找梯度最大的向量进行替换了呢?如果怕语义信息不相似,缩小相似度量范围就好了,这样更方便。
第三项工作为 advaug: robust adversarial augmentation for neural machine translation (acl 2020)
这项工作是在第二项的基础上进行了数据增强的改进,采用的方法为线性插值,首先针对原始数据(x, y),作者用第二项工作的方法造出一堆噪声数据,然后对噪声数据进行线性插值生成更多的伪数据,令人比较奇怪的是,作者对不同的parallel data pair同样进行了线性插值,可能两句话虽不同含义,但是插值后在向量空间,源句和目标句也能表达类似语义?


诺基亚的倒下将带来芬兰科技业的春天
机智云三种APP开发方式介绍
炽芯微电开业!专注于碳化硅塑封功率模块封测研发
何谓激光器?大功率激光器如何老化测试?
基于华为30年ICT技术积累和制造经验
介绍NMT模型鲁棒性对抗训练的三部曲
Xilinx宣布收购Auviz Systems,Xilinx与Altera将变战略盟友
日本在华为的全球供应链中起到非常重要的作用
智慧畜牧养殖解决方案
意能通牵手圆通速递搭建“小秘机器人”
微型逆变器的电源转换集成方案
ANDON图像传感器插座的优点
空中客车计划联合柔宇科技为乘客打造未来化数字化个性化的客舱
工信部将在若干个城市发放5G临时牌照
TCLML-56液晶显示器维修全过程
怎样看懂令人困惑的电路图
24年潜心锻造电力之剑 创四方一出谁与争锋
波音在777X飞行试验飞机上成功安装了两台史上最大的GE9X喷气发动机
磁吸附爬壁机器人现有技术有哪些 磁吸附爬墙机器人技术性能指标
智算中心新基建赋能智慧经济转型,让数据进去让智慧出来