qq怎么弄关键字云图

发布网友发布时间：2023-03-04 11:00

共2个回答

热心网友时间：2024-12-14 15:59

qq怎么弄关键字云图
第三方词云工具固然方便，但是使用起来也是各种问题（如中文乱码、词云形状、字体颜色调整等等）。我和大家分享一下如何使用 R 语言的 jiebaR 和 wordcloud2 扩展包来完成中文文本（英文当然不在话下）的分词，并且绘制关键词词云。

0.前期准备

准备1：安装 R ，你可以前往 The Comprehensive R Archive Network 下载并安装程序。

准备2：把你需要分词的文本放在一个 txt 文件中（强调：务必是 txt 格式！）。（你可以使用爬虫获取这部分文本，或者手动复制粘贴得到文本信息）

1.中文分词

分词是绘制词云的基础，说得简单一点就是将中文文本分割成一个个词汇。举个例子，我们现在按照XX算法对句子“ 对公司相关运营数据进行提取、*度分析和整理”进行分词，得到如下结果：

对、公司、相关、运营数据、进行提取、*度、分析、和、整理
只有进行了分词，才可以进行词云的绘制；如果你已经完成了这一步，并且统计出了每一个词汇的频数，可以直接略过这一步。

我们用 R语言的 jiebaR 包实现上述操作，如下：

1）安装并加载 jiebaR 包

install.packages（"jiebaR") library(jiebaR)
2）导入原始文本

f<-scan('/Users/XXX/Desktop/数据运营JD.txt',sep='\n',what='',encoding="UTF-8")
需要注意的是 /Users/XXX/Desktop/数据运营JD.txt 应该是你的txt文件的路径，不要直接copy。

3）开始分词

分词有很多种算法，其原理不是我们要关注的重点

seg<-qseg[f]
4）分词处理

因为分词出来可能会有很多常见的词汇，但是没啥用的，比如“的”、“是”、“什么”一类的。我们需要将这个词汇屏蔽掉。同时特别长的词汇这里我们也不要。

我的做法是将字符数控制在3-16之间，也就是最多4个汉字(1个汉字=4个字符)，最少3个英文。

seg<-seg[nchar(seg)>2]
seg<-seg[nchar(seg)<17]
seg
这个时候分词结果，也就是 seg 可以显示在你的R程序上，如下图所示：

5）对分词进行转置

为了方便后面的处理，我们需要对 seg 进行一次转置（把横着放变成竖着放）

m1<-data.frame(seg)
2.统计词频

完成分词后，你需要统计每一个词出现的频数，比如“ 数据分析 10 ”这样的。

1）加载 sqldf 包

install.packages("sqldf")
library(sqldf)
2）统计词频

热心网友时间：2024-12-14 15:59

方法/步骤
1/5 分步阅读
首先我们点击打开手机上的QQ

2/5
进入后点击登录帐号后点击左上方的头像按钮

3/5
然后我们再点击左下方的“设置”按钮

4/5
接着在设置中我们点击“隐私”然后点击“权限设置”按钮再点击“好友动态权限设置”

查看剩余2张图
5/5
最后点击“权限与安全”在里面就可以开启“关键词智能配图”了