CasRel学习笔记（二）

Post author:xfxia
Post published:2023年9月24日
Post category:其他

具体实现

如何抽取头实体

(

)

p_i^{start_s} = σ(W_{start}x_i + b_{start})

$p_{i}^{s t a r t_{s}} = σ (W_{s t a r t} x_{i} + b_{s t a r t})$

(

)

p_i^{end_s} = σ(W_{end}x_i + b_{end})

$p_{i}^{e n d_{s}} = σ (W_{e n d} x_{i} + b_{e n d})$

表示句子第

个词是头实体开头的概率，

表示训练的权重，

表示句子第

个词的词嵌入，

表示偏差，

是

激活函数

p_i^{start_s}表示句子第i个词是头实体开头的概率，W_{.}表示训练的权重，x_i表示句子第i个词的词嵌入， b_{.}表示偏差，σ是Sigmoid激活函数

$p_{i}^{s t a r t_{s}} 表示句子第 i 个词是头实体开头的概率， W_{.} 表示训练的权重， x_{i} 表示句子第 i 个词的词嵌入， b_{.} 表示偏差， σ 是 S i g m o i d 激活函数$

即利用Sigmoid激活函数+线性函数来得到实体的头尾概率，再利用设定的阈值来判断是0还是1

如何在特定关系上抽取尾实体

(

)

p_i^{start_o} = σ(W_{start}^r(x_i+v_{sub}^k) + b_{start}^r)

$p_{i}^{s t a r t_{o}} = σ (W_{s t a r t}^{r} (x_{i} + v_{s u b}^{k}) + b_{s t a r t}^{r})$

(

)

p_i^{end_o} = σ(W_{end}^r(x_i+v_{sub}^k) + b_{end}^r)

$p_{i}^{e n d_{o}} = σ (W_{e n d}^{r} (x_{i} + v_{s u b}^{k}) + b_{e n d}^{r})$

表示句子第

个词是尾实体开头的概率，

表示对于关系

训练的权重，

表示句子第

个词的词嵌入，

表示第

个头实体的向量平均值，

表示对于关系

的偏差，

是

激活函数

p_i^{start_o}表示句子第i个词是尾实体开头的概率，W_{.}^r表示对于关系r训练的权重，x_i表示句子第i个词的词嵌入，v_{sub}^k表示第k个头实体的向量平均值，b_{.}^r表示对于关系r的偏差，σ是Sigmoid激活函数

$p_{i}^{s t a r t_{o}} 表示句子第 i 个词是尾实体开头的概率， W_{.}^{r} 表示对于关系 r 训练的权重， x_{i} 表示句子第 i 个词的词嵌入， v_{s u b}^{k} 表示第 k 个头实体的向量平均值， b_{.}^{r} 表示对于关系 r 的偏差， σ 是 S i g m o i d 激活函数$

抽取也是同理

别人论文对CasRel的一些改进

1.更换编码器。

2.加入隐藏层，尽量保持模型的精度。

3.针对不同领域的数据特征，提前处理，并加入到输入，充分利用信息，提高抽取三元组的效果。

4引入注意力网络。

5.将知识蒸馏，对抗训练引入文章。

6.将模型应用到时序知识图谱。

原文链接：https://blog.csdn.net/weixin_45968555/article/details/129273823

具体实现

如何抽取头实体

如何在特定关系上抽取尾实体

别人论文对CasRel的一些改进

你可能也喜欢