用R语言画文本分析词频词云

  • Post author:
  • Post category:其他




设置存储目录

setwd("C:/Users/swift/Desktop")



读取数据

df<-read.csv("工作报告.csv",header=FALSE)
# 把全部工作报告放在第一行第一列的格子里



安装jieba分词包

install.packages("jiebaR")
library(jiebaR)



删掉中文停用词

wk = worker(stop_word='中文停用词.txt')
seg <-wk[gsub("\\d","",df[1,])] # 去除数字,后分词
注:gsub("\\d","",df[1,])用替换把数字删掉
#词频
table(seg)



降序排序,并提取出现次数最多的前100个词语

seg100 <- sort(table(seg), decreasing = TRUE)[1:100] 



词云

install.packages("wordcloud2")
library(wordcloud2)
#设置图片形成效果
bmp("comment_cloud.bmp", width = 500, height = 500)
par(bg = "black")
#画云图
wordcloud2(seg100,size=0.5,shape='star')



词性标注

install.packages("pacman")
library(pacman)
tag_worker = worker(type = "tag") 
tag_result = tagging(df[1,],tag_worker) 



版权声明:本文为weixin_43917150原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。