资源说明:阿普里里
从头开始快速高效地实现Apriori算法的内存
使用的数据集
当前,假设输入数据来自GroceryStoreData的kaggle数据集,该代码是结构化的,该数据集可从获得。
但是,这是一个非常小的数据集,仅包含20个购物篮和11种独特的商品
当必须为超过10万个独特产品运行算法时,与python库“ apyori”相比,此代码有用且快速
但是,此实现方式仅限于两种产品的每种组合的计算支持,置信度和提升,但是可以根据要求扩展使用相同的概念
好处
使用稀疏矩阵对每种产品组合的支撑度,置信度和提升度进行度量计算,从而使算法快速且存储效率高
结果结构
结果返回三个Numpy Matrcies:
Order_of_products:这是一维数组,具有按特定顺序显示的唯一商品
Top_N_for_each_product:这是一个2D数组(产品数量,前N个产品),其中每行是上述数组“
本源码包内暂不包含可直接显示的源代码文件,请下载源码包。
English
