析易科研教你数据挖掘(二)——FP-growth算法理解和实现

FP-growth(Frequent Pattern Growth)是一种用于挖掘频繁项集的算法,它通过构建一个紧凑的数据结构来存储项集信息,避免了传统Apriori算法中的多次扫描数据库。FP-growth算法通过构建FP-tree(Frequent Pattern Tree)来压缩数据库,然后使用深度优先搜索策略来挖掘频繁项集。该算法能够有效减少数据的扫描次数和项集的候选项,提高挖掘效率。

优点:减少了对数据库的扫描次数,降低了挖掘过程中的计算复杂度;使用FP-tree结构压缩数据,减少了存储空间的需求;挖掘频繁项集时,候选项的生成更加高效。

缺点:对于包含大量项的数据集,FP-tree的构建和存储可能会占用较多的内存资源;在某些情况下,可能不如Apriori算法直观易懂。

实战练习

推荐工具:析易数据分析平台(http://data.easyaier.com/sci/index)

案例:对患者的饮食组合进行,找出患者最长见的食物组合,选择105名患者每人10天的食物表,进行频繁级挖掘。

操作流程

步骤1:选择算法,fp-growth算法,并选择“患者饮食” 数据集。

步骤2:选择待分析变量

步骤3:调整其他参数,可点击查看参数说明

步骤4:支持度写90,置信度0.3.点击计算后生成分析报告

步骤5:结论分析

原文链接:,转发请注明来源!