qq怎么弄关键字云图
发布网友
发布时间:2023-03-04 11:00
我来回答
共2个回答
热心网友
时间:2024-12-14 15:59
qq怎么弄关键字云图
第三方词云工具固然方便,但是使用起来也是各种问题(如中文乱码、词云形状、字体颜色调整等等)。我和大家分享一下如何使用 R 语言的 jiebaR 和 wordcloud2 扩展包来完成中文文本(英文当然不在话下)的分词,并且绘制关键词词云。
0.前期准备
准备1:安装 R ,你可以前往 The Comprehensive R Archive Network 下载并安装程序。
准备2:把你需要分词的文本放在一个 txt 文件中(强调:务必是 txt 格式!)。(你可以使用爬虫获取这部分文本,或者手动复制粘贴得到文本信息)
1.中文分词
分词是绘制词云的基础,说得简单一点就是将中文文本分割成一个个词汇。举个例子,我们现在按照XX算法对句子“ 对公司相关运营数据进行提取、*度分析和整理”进行分词,得到如下结果:
对、公司、相关、运营数据、进行提取、*度、分析、和、整理
只有进行了分词,才可以进行词云的绘制;如果你已经完成了这一步,并且统计出了每一个词汇的频数,可以直接略过这一步。
我们用 R语言的 jiebaR 包实现上述操作,如下:
1)安装并加载 jiebaR 包
install.packages("jiebaR") library(jiebaR)
2)导入原始文本
f<-scan('/Users/XXX/Desktop/数据运营JD.txt',sep='\n',what='',encoding="UTF-8")
需要注意的是 /Users/XXX/Desktop/数据运营JD.txt 应该是你的txt文件的路径,不要直接copy。
3)开始分词
分词有很多种算法,其原理不是我们要关注的重点
seg<-qseg[f]
4)分词处理
因为分词出来可能会有很多常见的词汇,但是没啥用的,比如“的”、“是”、“什么”一类的。我们需要将这个词汇屏蔽掉。同时特别长的词汇这里我们也不要。
我的做法是将字符数控制在3-16之间,也就是最多4个汉字(1个汉字=4个字符),最少3个英文。
seg<-seg[nchar(seg)>2]
seg<-seg[nchar(seg)<17]
seg
这个时候分词结果,也就是 seg 可以显示在你的R程序上,如下图所示:
5)对分词进行转置
为了方便后面的处理,我们需要对 seg 进行一次转置(把横着放变成竖着放)
m1<-data.frame(seg)
2.统计词频
完成分词后,你需要统计每一个词出现的频数,比如“ 数据分析 10 ”这样的。
1)加载 sqldf 包
install.packages("sqldf")
library(sqldf)
2)统计词频
热心网友
时间:2024-12-14 15:59
方法/步骤
1/5 分步阅读
首先我们点击打开手机上的QQ
2/5
进入后点击登录帐号后点击左上方的头像按钮
3/5
然后我们再点击左下方的“设置”按钮
4/5
接着在设置中我们点击“隐私”然后点击“权限设置”按钮再点击“好友动态权限设置”
查看剩余2张图
5/5
最后点击“权限与安全”在里面就可以开启“关键词智能配图”了