前言
网络新闻观点挖掘系统事实上本质是属于文本数据挖掘范畴的,对于文本挖掘的方式,在早期主要是基于Web文本挖掘领域的。当然这个挖掘的尺度是可以控制的,粗粒度的挖掘相对于细粒度的挖掘要简单不少,粗粒度挖掘可以快速的多数网民们对某新闻的观点倾向,这也是我毕设作品所需要达到的目标。
系统设计目标
平时做了许多挖掘算法的研究,一直懒得去做一些能智能分析化的工具,恰好这次可以利用毕业设计的机会,做一个观点挖掘分析系统。系统设计的目标就是能对一则特定的新闻,通过利用千条评论数据,挖掘出其中的观点倾向分类,提供给人们信息参考。
系统设计模块
系统主要模块分为4大模块,下面是主要的模块组成:
字典库与数据源的获取
字典库是利用已经收集好的一个多达2w余条记录的txt文件,这个是比较简单的,但是数据源的获取就需要经过一些步骤,利用了之前我介绍过的QQ爬虫工具,
版权声明:本文为Androidlushangderen原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。