问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

如何对用户进行聚类分析

发布网友 发布时间:2022-04-25 14:21

我来回答

1个回答

热心网友 时间:2022-06-11 10:00

需要搜集用户的哪些特征?

聚类分析变量选择的原则是:在哪些变量组合的前提,使得类别内部的差异尽可能的小,即同质性高,类别间的差异尽可能的大,即同质性低,并且变量之间不能存在高度相关。

常用的用户特征变量有:

①  
人口学变量:如年龄、性别、婚姻、教育程度、职业、收入等。通过人口学变量进行分类,了解每类人口的需求有何差异。

②  
用户目标:如用户为什么使用这个产品?为什么选择线上购买?了解不同使用目的的用户的各自特征,从而查看各类目标用户的需求。

③  
用户使用场景:用户在什么时候,什么情况下使用这个产品?了解用户在各类场景下的偏好/行为差异。

④  
用户行为数据:如使用频率,使用时长,客单价等。划分用户活跃等级,用户价值等级等。

⑤  
态度倾向量表:如消费偏好,价值观等,看不同价值观、不同生活方式的群体在消费取向或行为上的差异。

需要多少样本量?

没有*,通常情况下与实际应用有关,如果非要加一个理论的*,通常认为,样本的个数要大于聚类个数的平方。

①如果需要聚类的数据量较少(<100),那么三种方法(层次聚类法,K-均值聚类法,两步聚类法)都可以考虑使用。优先考虑层次聚类法,因为层次聚类法产生的树状图更加直观形象,易于解释,并且,层次聚类法提供方法、距离计算方式、标准化方式的丰富程度也是其他两种方法所无法比拟的。

②如果需要聚类的数据量较大(>1000),应该考虑选择快速聚类别法或者两步聚类法进行。

③如果数据量在100~1000之间,理论上现在的计算条件是可能满足任何聚类方法的要求的,但是结果的展示会比较困难,例如不可能再去直接观察树状图了。

应用定量方法还是定性方法?

聚类分析是一种定量分析方法,但对聚类分析结果的解释还需要结合定性资料讨论。

1.聚类分析的定义与用途

聚类分析(Cluster Analysis)是一种探索性的数据分析方法,根据指标/变量的数据结构特征,对数据进行分类,使得类别内部的差异尽可能的小,即同质性高,类别间的差异尽可能的大,即同质性低。

2.聚类分析的方法

①层次聚类法(Hierarchical),也叫系统聚类法。既可处理分类变量,也可处理连续变量,但不能同时处理两种变量类型,不需要指定类别数。聚类结果间存在着嵌套,或者说层次的关系。

②K-均值聚类法(K-Means Cluster),也叫快速聚类法。针对连续变量,也可处理有序分类变量,运算很快,但需要指定类别数。K-均值聚类法不会自动对数据进行标准化处理,需要先自己手动进行标准化分析。

③两步聚类法(Two-Step Cluster):可以同时处理分类变量和连续变量,能自动识别最佳的类别数,结果比较稳定。如果只对连续变量进行聚类,描述记录之间的距离性时可以使用欧氏(Euclidean)距离,也可以使用对数似然值(Log-likelihood),如果使用前者,则该方法和传统的聚类方法并无太大区别;但是若进行聚类的还有离散变量,那么就只能使用对数似然值来表述记录间的差异性。当聚类指标为有序类别变量时,Two-Step Cluster出来的分类结果没有K-means cluster的明晰,这是因为K-means算法假定聚类指标变量为连续变量。

3.聚类分析的步骤

①确定研究目的:研究问题关注点有哪些、是否有先验分类数…

②问卷编制:态度语句李克特项目、有序类别…

③确定分析变量:问卷变量的类型,连续or分类,有序类别or无序类别、是否纳入后台数据,变量间相关性低…

④聚类分析:聚类分析方法选择、数据标准化方法、聚类类别数确定…

⑤结果检验:类别间差异分析、是否符合常理…

⑥聚类结果解释:类别的命名、类别间的差异、结合定性资料解释…

声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
八月中国最凉快的地方 八月份哪里最凉快,去哪旅游好?美丽的地方 乱字同韵字是什么意思 华硕笔记本电脑触摸板怎么开笔记本电脑触摸板怎么开启和关闭_百度知 ... 陕西职务侵占案立案准则 结婚后我的恋情维系了十年,怎么做到的? 玉米仁子饭产自哪里 中国期货交易所的交易品种有哪些? 历史要怎么读,有啥诀窍 高中历史诀窍 宫腔镜是人流手术最好的手术吗 一个网友跟我借钱,能借吗? 为什么有的 OPPO R9没有HD图标? 聚类分析的基本步骤 宫腔镜手术人流宫腔镜手术人流? 网友和你借钱,你会借给他吗? 什么是系统聚类分析?系统聚类方法有几种 宫腔镜人流手术费用? oppo r9s打开了hd为什么右上角不显示? 网友借钱不还,后面直接拉黑,微信实名也不是本人,该怎么办? 聚类分析法 有宫腔镜下人流手术吗 网友借钱怎么办? 系统聚类分析方法 是什么 我用的oppor9s 但是我打开了hd为什么右上角不显示 做宫腔镜人流手术好吗 网友借钱不还,怎么办? oppo r9s上边不显示hd怎么办 有个网友找我借钱,怎么办,我能借他吗 遇到一个刚认识不久的网友向你借钱怎么办 网友向你借钱你会借吗? 宫腔镜人流的宫腔镜人流的价钱 spss聚类分析系统聚类得出的聚类表解读是什么? 宫腔镜人流的宫腔镜人流的优势 OPPO r9s右上角的那个电话HD怎样去掉? 宫腔镜人流的宫腔镜人流后注意事项 被没见过面的网友借了6万块钱,现在电话不接,微信不回的,怎么办? spss聚类分析系统聚类得出的聚类表解读 宫腔镜人流手术多少钱 我的oppor9s开通了volte高清通话功能但是右上角没有HD图标是怎么回事?希望能解决 SPSS聚类分析 系统聚类分析 网友问我借钱?怎么办? 宫腔镜人流的宫腔镜人流前注意事项 网友借钱不还属于诈骗吗 oppo r9s手机右上方出现的HD是什么,如何关闭,谢谢~ 无痛人流:宫腔镜人流的过程痛不痛 K均值聚类法和系统聚类法有什么区别,这两种聚类方法的适用条件都是什么... 宫腔镜人流的宫腔镜人流术的最佳时间 什么是聚类分析?说说它在地理学中的应用。 做宫腔镜人流手术,术后有残留的几率大么