模  型 语义记忆模块

语义记忆模块指的是词嵌入(词向量表示),例如 Glove 向量,即输入文本在被传递到输入模块之前被转换成的向量。

 输入模块

输入模块即指标准的 GRU(或 BiGRU),每个句子的最后的隐状态是明确可访问的。

 问题模块

问题模块也是标准的 GRU,其中待解答的问题作为输入项,并且最后的隐状态是可访问的。

 情景记忆模块

这一模块可让输入数据进行多次前馈。在每次前馈时,输入模块中的句子嵌入表示(sentence embedding)作为输入传递到情景记忆模块中的 GRU。 此时,每个句子嵌入表示都会被赋予权重,权重与其被询问的问题的相关性相对应。

对于不同的前馈,句嵌入表示会被赋予不同的权重。 比如,在下面的例子中:

由于句子(1)与问题没有直接关系,因此可能不会在第一次被赋予高权重。 然而,在第一次前馈时,模型发现足球与约翰相关连,因此在第二次前馈时,句子(1)被赋予了更高权重。

在第一次前馈(或第一个“episode”)中,问题嵌入表示(question embedding)'q'被用于计算来自输入模块的句子嵌入表示(sentence embedding)的注意力分数。然后,将句子 sᵢ的注意力得分输入 softmax 层(使得注意力得分总和为 1)或单个 sigmoid 单元来获得 gᵢ。gᵢ是赋予句子 sᵢ的权重,并作为在 timestep i 中 GRU 的输出项的全局门 (global gate)。

timestep i 和 episode t 的隐状态计算如下:

当 g = 0 时,直接复制隐状态:

论文中用 mᵗ来表示 GRU 第 t 个 episode 最后的隐状态,可被视为在第 t 个 episode 中发现的事实聚集。 从第二个 episode 开始,mᵗ被用于计算第 t+1 个 episode 中句子嵌入表示以及问题嵌入表示 q 的注意力分数。

计算过程如下:

论文采用了许多简单的度量方法来计算 sᵢ和 q 以及 sᵢ和 mᵗ-1 之间的相似性,即元素相乘法和绝对值。然后将连接的结果输入一个 2 层的神经网络来计算 sᵢ的注意力得分。 对于第一个 episode,m⁰被替换为 q。

episode 的数量可以是固定的、预定义的数字,也可以由网络本身确定。在后一种情况下,为输入附加一项特殊的前馈结束表示(end-of-passes representation)。如果门函数(gate function)选择该向量,则停止迭代。

 回答模块

回答模块由解码器 GRU 组成。 在每个 timestep,之前的输出将与问题嵌入表示一同作为输入项输入该模块。

然后使用词汇表上的标准 softmax 生成输出。

解码器通过 m 个向量的一个函数(来自情景记忆模块的 GRU 计算的最后隐藏状态)进行初始化。

情感分析应用

该论文发表时,其模型取得了当时情绪分析领域的最先进结果。

例如,在下面示例中,模型会关注所有的形容词,在仅允许 1 次前馈时,模型会产生不正确的预测。 然而,当允许 2 次前馈时,该模型在第二次前馈时会对积极的形容词倾注非常高的注意力,并产生正确的预测。

(情感的注意力分析)

其它数据集的表现

替换模块

模块化的一个重要好处是,可以在不修改任何其他模块的情况下将一个模块替换为另一个模块,只要替换模块具备正确的接口。

论文《用于视觉和文本问答的动态记忆网络》展示了动态记忆网络在基于图像回答问题中的作用。

输入模块被另一模块替换,后者基于 CNN 的网络从图像中提取特征向量。然后提取的特征向量会像以前一样输入到事件记忆模块。


©著作权归作者所有:来自51CTO博客作者mb5fdb0a1b25659的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. 无代码开发,站到了程序员鄙视链顶端
  2. 落地三年,两次架构升级,网易的Service Mesh实践之路
  3. 月入 2 万的中国程序员,撑起 Zoom 千亿市值
  4. 华为最新年报发布:海外市场损失超百亿美金,力争 2020 年活下来
  5. .NET for Apache Spark 预览版正式发布
  6. 谷歌开源新模型EfficientNet:图像识别效率提升10倍,参数减少88%
  7. 谷歌技术面试终极通关指南
  8. 5年内最大手笔!谷歌豪掷26亿美元收购数据分析公司Looker
  9. 对话式交互崛起,从百度度秘看对话式AI的技术实践

随机推荐

  1. 比較具体的handle机制
  2. Android面试题总结(一)
  3. 开源公司IronTec将推动PHP进驻Android平
  4. Android/iOS内嵌Unity开发示例
  5. Kotlin在AndroidStudio中的环境搭建以及
  6. 【Android自助餐】Handler消息机制完全解
  7. Android数据库高手秘籍(零)——前言[转载
  8. android 系统服务
  9. adb设备连接以及文件拷贝
  10. Android与HTML JavaScript交互