数据挖掘与机器学习-第七章 关联规则和协同过滤
1 | 关联规则最早用于购物篮分析 |
1 | 一些常见概念:数据库D,事务T,项集I,支持度Confidence,置信度Support |
推荐算法
推荐算法目的
如何进行推荐

关联规则挖掘
啤酒尿布案例

关联规则的引言
关联规则定义

关联规则度量
支持度

置信度


1 | 如果满足最小支持度阈值和最小置信度阈值,则我们认为关联规则是有效的。这些阈值可以认为设定。 |
关联规则挖掘的步骤




1 | 关联规则的挖掘过程主要包含两个阶段:第一个阶段从资料集合中找出所有的高频项目组(Frequent Item),第二阶段从这些高频项目组产生关联规则(Association Rule)。 |
1 | 第一阶段高频的含义是是指某一项目组出现的频率相对于所有记录而言,必须达到某一水平。也就是支持度。 |
1 | 第二阶段:从高频项目组产生关联规则,这是利用前一步骤的高频k-项目组来产生规则,在最小置信度的条件门槛下,若一规则所求得的置信度满足最小置信度,称此规则为关联规则。 |
Apriori算法
apriori定律


apriori算法



apriori算法核心思想

apriori算法的缺点
1 | 1.对数据库的扫描次数过多 |
1 | 主要改进方向: |
apriori算法实现
协同过滤(基于用户)
协同过滤(基于用户)

协同过滤(基于物品)




实验八 协同过滤算法
1 | 【实验原理】 |
1 | 题目:使用协同过滤(基于用户)构建简单的电影推荐系统 |
1 | # A dictionary of movie critics and their ratings of a small# |
1 | STEP2:编写函数依据欧式距离大小以及协同过滤算法(用户)实现电影的推荐。 |
1 | # Gets recommendations for a person by using a weighted average |
