python中如何进行数据关联挖掘

 时间:2024-10-25 14:25:20

1、经过分析,我决定使用Oranges进行关联规则的实现,原因如下:FP-growth算法比Apriori算法时间复杂度低Orange3是一整套数据挖掘工具包,学习后可以熟悉相关操作,进行其他的数据挖掘算法的研究

python中如何进行数据关联挖掘

2、pymining不再维护,Orange3仍然是一个非常活跃的包,更新频繁Orange3实现的结果比较多,除了规则外,还能够计算出评价结果的相关数据

python中如何进行数据关联挖掘

3、数据输入对于使用函数包来说,我们不用管函数实现的方法,只有研究数据输入的格式即可。Orange3的关联规则输入支持两种形式:布尔类型字符串类型

python中如何进行数据关联挖掘

4、对于布尔类型每一个行向量代表一个属性是否存在的数据结构>>> X array([[False, True, ..., True, False], [False, True, ..., True, False], [ True, False, ..., False, False], ..., [False, True, ..., True, False], [ True, False, ..., False, False], [ True, False, ..., False, False]], dtype=bool)

python中如何进行数据关联挖掘

5、比如上面的数据X,注意这个array(属于numpy里面的多维数组)。类型一定是bool才行。这个二维数组每一个行的维度都是一样的,这样得到的规则结果就是纯粹数组直接的关联规则,我们要自己讲对于规则的数字和属性名称对于起来。

python中如何进行数据关联挖掘

6、比如结果可能是这样:>> rules [(frozenset({17, 2, 19, 20, 7}), frozenset({41}), 41, 1.0), (frozenset({17, 2, 19, 7}), frozenset({41}), 41, 1.0), ... (frozenset({20, 7}), frozenset({41}), 41, 1.0), (frozenset({7}), frozenset({41}), 41, 1.0)]1

python中如何进行数据关联挖掘
  • 如何在pycharm中创建python项目
  • 地址线寻址范围怎么算?
  • VS如何开启解决方案资源管理器
  • pycharm调整背景颜色步骤
  • 如何编写数据字典
  • 热门搜索
    戈谢病是什么病 普洱茶是什么茶 债权人是什么意思 喉咙有痰是什么原因造成的 股票st是什么意思 跳槽是什么意思 平行志愿什么意思 什么的礼物填空 6月5日是什么星座 朱砂是什么