AI学习站
首页
AI热点
AI教程
标准会员
会员时间
积分
0
历史
通知(
0
)
退出登录
首页
AI动态
技术前沿
工具与教程
大模型
AI投资分析
AI落地
AI政策法规
登录账号
邮箱
密码
记住我
忘记密码?
登录
还没有账号?
立即注册
邮箱
设置密码
验证码
我已阅读并同意
用户协议
和
隐私政策
注册
已有账号?
立即登录
内容创作策略,内容创作工具,内容创作能力
学习教程
聚类分析 | 步骤与分类
3月前
228 阅读
开始学习
收藏教程
分享
4.8
(1280评分)
15,328人已学习
聚类分析是一种数据归纳技术,旨在揭露一个数据集中观测值的子集。“类”为若干个观测值组成的群组。如抑郁症亚型、消费者人群聚类等都是聚类分析应用实例。
一、分类
常用的聚类方法有
层次聚类
和
划分聚类
。
(一)
层次聚类
中,每一个观测值自成一类,这些类每次两两合并,直到所有的类被聚成一类为止。常用的聚类算法有:单联动、全联动、平均联动、质心、Ward方法。
(二)
划分聚类
中,首先指定类的个数K,然后观测值被随机分为K类,再重新形成聚合的类。最常用的算法为K均值、围绕中心点的划分(PAM)。
二、步骤
有效的聚类分析是一个多步骤的过程,每一次决策都可能影响结果的质量和有效性。一个全面的聚类分析通常包括11个典型步骤。
(一)选
择合适的变量
:选择可能对识别和理解数据中不同观测数值分组有重要影响的变量,
这一步非常重要
,高级的聚类方法也不能弥补聚类变量选不好的问题。
(二)缩放数据
:最常用的方法是将每个变量标准化为均值为0和标准差为1的变量。
(三)寻找异常点
:可以通过outliers包中的函数筛选(和删除)异常单变量离群点。
(四)计算距离
:两个观测值之间最常用的距离亮度是欧几里得距离。
(五)选择聚类算法
:层次聚类对于小样本(如150个观测值或更少)很实用;大数据量的聚类选用划分聚类更好。
(六)使用步骤(五)选择方法
,获得一种或多种聚类方法。
(七)确定类的数目
。常用方法是尝试不同的类属(2~K)并比较解的质量。
(八)获得最终的聚类解决方案
:一旦类的个数确定下来,就可以提取出子群,形成最终的聚类方案。
(九)结果可视化
。层次聚类的结果通常表示为一个树状图,划分聚类的结果通常利用可视化双变量聚类图来表示。
(十)解读类
:一旦聚类方案确定,必须命名并解释类。
(十一)验证结果:
fpc、clv和clvalid包包含了评估聚类解的稳定性的函数。
教程评分
4.8
(
1280
人评分)
提交评分
学习讨论 (42)
发布评论
初学者
2天前
非常棒的教程!
32
回复
AI导师李明
作者
1天前
多谢
18
回复
文章章节
1. GPT-4简介与注册指南
1.1 账号注册步骤
推荐文章
玩转「超级用户计划」8文档体系:分类、明细与要点指南
5天前
•
学习教程
职场卡壳?沟通不畅?掌握这8把钥匙,让沟通如呼吸般自然顺畅!
1周前
•
学习教程
谁说35岁必定被淘汰?这是我30岁的实操,给你一份提前预案
3周前
•
学习教程
cursor+augment无限续杯包会版
1月前
•
学习教程
别把AI当助理了,5个日常场景让它当你的“助理教练”
2月前
•
学习教程
零基础学会电影级运镜手法,你也能用AI做出电影感短片
2月前
•
学习教程
速抢(2核2G)77元/年香港免备案服务器
0秒前
•
学习教程
交付能力的不足是制约AI在企业落地应用的最大障碍
2月前
•
学习教程
热门标签
内容翻译能力
小红书账号
DISS
新媒体文化
股票交易
OpenAISora
685B参数模型
训推一体
钉钉 AI 助理
版权材料
热门作者
AI前沿
2.4k 粉丝
关注
机器学习实验室
1.8k 粉丝
关注
AI创业圈
3.1k 粉丝
关注