西湖大学在 EMNLP 2019 上提出了一种序列标注模型,在比 BiLSTM-CRF 训练解码速度更快的情况下,取得了更高的精度。


论文链接: arxiv.org/abs/1908.08676
源码链接: Nealcly/BiLSTM-LAN(https://github.com/Nealcly/BiLSTM-LAN)


1. 序言


统计自然语言处理中,条件随机场(Conditional Random Field)在词性标注,命名实体识别,中文分词等序列标注任务上都取得了惊人的效果。然而在深度学习时代,很多情况下 BiLSTM-CRF 并没有比不对输出序列进行建模的 BiLSTM-softmax 取得更好的效果。一个可能的原因是神经网络编码器已经有很强的序列信息编码能力,在此基础上 CRF 并没有引入更多的有效信息。
为了更好的对输出序列进行编码,论文中提出了一种逐层改进的基于标签注意力机制的网络(Hierarchically-Refined Label Attention Network)。该模型通过利用标签知识,更好的捕捉标签间长期的依赖关系。在英文词性标注,命名实体识别和组合范畴语法超标注的任务上,BiLSTM-LAN 在比 BiLSTM-CRF 训练解码速度更快的情况下,取得了更好的效果。
如下图所示,以词性标注为例,对输入句子 "They can fish and also tomatoes here", 第一层中,模型通过局部信息对每个单词词性进行判断,倾向于判断 "can" 为情态动词(MD),"fish" 为动词(VB)。在经过多层LAN信息交互以后,长期标签依赖关系被考虑以后,"tomatoes"为名词的信息帮助模型对 "can" 和 "fish" 的词性进行重新判断,认定 "can" 和 "fish" 应为动词(VB)和名词(NN)。

示意图



2. 模型
下图模型中包含了两层 BiLSTM-LAN。每一个 BiLSTM-LAN 由对序列信息进行编码的 BiLSTM Encoding Layer 和对标签信息进行推理的 Label Attention Inference Layer 组成。

LAN-Model

3. 实验
本文在词性标注(WSJ, UD v2.2),命名实体识别(OntoNotes 5.0)和组合范畴语法超标注(CCGBank)上进行了实验。

其中,*表示利用多任务与半监督学习取得的结果
4. 分析
4.1 标签可视化
论文使用t-SNE对词性标注的标签向量进行了可视化分析。

训练开始前,所有标签随机分散到空间内。模型训练5轮后,可以看到"NNP"和"NNPS","VBD"和"VBN"等相似词性聚集到一起。在训练38轮后,几乎所有相似的词性被聚集到了一起,例如"VB","VBD","VBN","VBG"和"VBP"。
4.2 超标签复杂度
为了验证BiLSTM-LAN捕捉长距离标签依赖关系的能力,论文中对不同复杂度的超标签标注准确率进行了分析。

越复杂的超标签需要更长期的标签依赖关系进行判断。随着复杂度的增加,BiLSTM-CRF 并没有比 BiLSTM-softmax 表现的好,然而 BiLSTM-LAN 表现显著高于其他模型。
4.3 案例分析
下图是不同模型的预测结果,错误部分使用黄色标注。

由于进行局部预测,BiLSTM-softmax 并不能捕捉到 "settled" 和 "at" 的关系。BiLSTM-CRF在出现"/PP"后,由于马尔科夫假设,预测 "with" 为 "PP/NP"。可以看出,BiLSTM-LAN 基于全局信息更好地进行了预测。


5. 总结


理论和序列标注实验结果证明,BiLSTM-LAN 通过对所有候选标签进行编码的方式,很好的捕捉了标签间长期依赖关系,并在一定程度上解决了标注偏执问题。在比BiLSTM-CRF训练解码速度更快的情况下,在词性标注,命名实体识别和组合范畴语法超标注任务上可以达到更高的精度。




本文由作者授权AINLP原创发布于公众号平台,点击'阅读原文'直达原文链接,欢迎投稿,AI、NLP均可。





关于AINLP


AINLP 是一个有趣有AI的自然语言处理社区,专注于 AI、NLP、机器学习、深度学习、推荐算法等相关技术的分享,主题包括文本摘要、智能问答、聊天机器人、机器翻译、自动生成、知识图谱、预训练模型、推荐系统、计算广告、招聘信息、求职经验分享等,欢迎关注!加技术交流群请添加AINLP君微信(id:AINLP2),备注工作/研究方向+加群目的。



©著作权归作者所有:来自51CTO博客作者mb5fdb0a4002420的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. CAD 入门 平面图
  2. 百分点认知智能实验室:基于不完全标注样本集的信息抽取实践
  3. CV学习笔记(二十五):数据集标注与制作
  4. Android(安卓)Google Map实例 - 不同的图标标注在同一图层(Andro
  5. android的popupwindow点击返回按钮关闭
  6. Android自定义控件中的自定义attrs
  7. android学习笔记(十) android 使用 google Map
  8. 关于android编译失败的集中情况
  9. iOS和Android交互设计

随机推荐

  1. 年终总结 | 小鹿给读者拜年啦!
  2. JavaScript中的执行上下文和堆栈[每日前
  3. 现代浏览器探秘(part 1):架构 [每日前端夜
  4. 讲真,Markdown有啥魅力,竟让如此多人入迷!
  5. 深入探讨 Undefined [每日前端夜话(0x0E)
  6. 《大前端吊打面试官系列》之备战面试篇!
  7. 现代浏览器探秘(part2):导航[每日前端夜
  8. 用Python和Tableau对母婴商品销量进行数
  9. 浅议 Promise/Futures 模型 [每日前端夜
  10. 1-20