模块三 · 人工智能核心方法与典型任务

单元8 聚类算法

围绕“当数据没有现成标签时,如何让系统自动发现内部结构和相似群体”展开,帮助学生理解聚类算法的基本思想、典型应用和结果解释方式,建立从无标签数据中发现模式的认知。

所属模块
模块三:人工智能核心方法与典型任务
建议学时
2 学时
教学定位
智能方法单元
1

学习目标

知识目标

理解聚类算法“按相似性自动分组”的基本思想,认识无监督学习、样本相似性、簇中心等核心概念,了解聚类在用户分群、市场分析和异常发现中的典型应用。

能力目标

能够从实际场景判断何时需要使用聚类方法,能够初步分析数据为什么会被划分为不同群体,并能对聚类结果作出基本解释。

素养目标

培养学生从杂乱数据中主动发现规律和结构的意识,理解人工智能并不只是“识别已有类别”,还可以“发现潜在类别”,提升数据洞察能力。

2

教学内容

2.1 聚类算法的基本思想

通过用户消费习惯分组、商品特征归类、城市类型划分等案例,引导学生理解聚类算法的核心任务:在没有人工标签的前提下,根据样本之间的相似程度自动形成若干组。帮助学生认识聚类与分类的差别,即分类是“按已知标签判断”,聚类是“从数据中发现结构”。

视频讲解说明

本视频建议作为导入内容,重点说明什么是无监督学习、什么是样本相似性,以及为什么系统可以在没有标签的情况下自动把数据分成若干群体。

当前为占位视频地址,后续可直接替换成你的课程视频链接。

2.2 聚类结果与特征解释

重点讲解聚类结果并不是最终目的,更重要的是解释每一类的特征差异和实际意义。帮助学生理解:同样的数据被分成若干类之后,还需要进一步分析这些类分别代表什么样的人群、区域或模式,才能真正服务于决策和应用。

视频讲解说明

本视频建议结合散点图、用户画像或分组结果表进行讲解,重点说明聚类不仅是“分出来”,还要“讲清楚每一类意味着什么”。

你也可以将这里替换成超星、B站、腾讯视频或本地服务器的视频链接。

2.3 聚类算法的典型应用

结合客户分群、区域类型划分、异常样本识别、图像分割等应用,说明聚类算法在电商、金融、地理信息、数据分析等领域中的广泛价值。帮助学生理解聚类算法的意义在于“从无序数据中发现结构,从结构中支持决策”。

3

案例一:用户消费行为分群

用户消费行为示意图

此处可放入用户消费散点图、聚类结果图或不同用户群体画像示意图。

用户消费行为分群是聚类算法最常见的应用之一。平台会根据用户的消费金额、购买频率、偏好品类等特征,把大量用户自动划分为若干群体,例如高价值用户、价格敏感用户、活跃用户和潜在流失用户等。

这个案例可以帮助学生理解:即使系统事先并不知道“应该分成几类”,也可以通过数据之间的相似性自动发现潜在群体结构。聚类的价值就在于把原本混杂的大量用户数据,转化为更容易理解和运营的若干类型。

通过这个案例,学生还能进一步认识到,聚类结果本身只是第一步,真正重要的是对每一类的特征进行解释,并根据这些特征制定后续策略。

课堂讲解提示

① 为什么用户没有标签时也能被分成若干群体?

② 平台通常会根据哪些特征进行用户分群?

③ 聚类结果出来后,为什么还要进一步解释每一类?

④ 用户分群结果如何帮助精准营销和服务优化?

4

案例二:城市类型自动划分

城市类型自动划分示意图

此处可放入城市特征散点图、区域分类图或不同城市群体的特征对比图。

在区域分析中,可以根据人口规模、产业结构、交通条件、消费水平等多种指标,对城市进行自动分组。例如,有些城市会被划为制造业主导型,有些属于服务业集聚型,还有些则可能表现为综合发展型。

这个案例特别适合说明聚类算法不仅能处理商业数据,也可以服务于地理分析、区域规划和政策研究。它帮助人们从大量复杂指标中提炼出相似城市群体,为后续比较和决策提供依据。

通过这个案例,学生可以进一步体会聚类算法的应用价值:它不是简单“贴标签”,而是帮助我们在复杂系统中发现结构、形成认知框架,并支持更有针对性的分析和管理。

课堂讲解提示

① 为什么城市类型划分适合用聚类方法?

② 哪些指标可能影响城市之间的相似性?

③ 聚类结果如何帮助区域发展分析?

④ 为什么聚类算法特别适合处理多指标、多维度的数据问题?

5

教学重点与难点

教学重点:聚类算法的基本思想、无监督学习特点、聚类结果的解释方式,以及其在用户分群和区域划分中的典型应用。

教学难点:帮助学生理解聚类结果并不是固定答案,而是基于样本相似性形成的结构表达,需要结合实际场景和特征分析来解释其意义。

6

教学方式

采用“真实场景导入 + 视频讲解 + 聚类结果分析 + 应用讨论”的方式组织教学。

通过用户分群、城市分型等场景,引导学生从无标签数据的混杂状态出发,逐步理解聚类算法如何帮助系统发现潜在结构。

7

课堂活动设计

活动一:观察散点图分群

给出一张带有若干点分布的二维散点图,让学生直观判断这些点大致可以分成几类,并说明划分依据,从而体会“相似样本会自然聚在一起”的思想。

活动二:分群结果命名解释

给出若干用户群或城市群的特征描述,让学生尝试为每一类命名,并解释其主要特征,训练学生从“分出来”走向“讲清楚”的能力。

8

课后任务

任务1:用自己的语言解释聚类算法与分类算法的根本区别。

任务2:列举两个现实中的聚类应用场景,并说明其中“相似性”可能由哪些特征决定。

任务3:思考为什么聚类结果必须结合实际背景进行解释,而不能只看算法输出的类别编号。