前段时间准备了数据,试了一下《基于Attention model的Aspect level文本情感分类–用Python+keras实现》
http://blog.csdn.net/orlandowww/article/details/53897634?utm_source=itdadao&utm_medium=referral
这篇文章里面的模型。
结果和文章里差不多,验证集准确率在75-80%左右。但仔细去看模型预测的结果,这个数据其实并不好。剔除掉单个aspect的句子,多aspect句子预测的准确率一点都不高。其中有大量的多个aspect但情感极性相同的情况,拉高了准确率。多aspect但情感极性不同时预测结果只是略好于瞎猜。
我最终的目的能够区分出一个句子中,提到两个aspect但是正负面极性不同的情况。
比如一个句子包含AB两个aspect,其中A应该是pos,B应该是neg,当前预测的时候会把AB都预测成pos或者都预测为neg。极少数情况能够区分出来。
而且哪怕是同样的句式,即便能够区分上面的句子,但换成C pos D neg,模型并不能完全习得并准确预测出来。
当然啦,这个模型对预测单个aspect句子的情感极性预测效果非常非常好,还是很推荐的。
接下来我还是打算加lstm进去试一下,或者再折腾点别的。
2017.9.21
墩墩墩
————————————————————————————————————————————————————————
还是bilstm+attention效果好啊,看到我这篇的小伙伴可以跳过自己试验的部分了。准确率稳稳的上85%。
接下来往里面多加点信息,但可以尝试的东西太多了好难选择。加点句子依存信息,aspect相关的信息,位置啊,文档信息啥的吧?
跪求有建议的小伙伴留言留言留言。
2017.9.26