用Excel做数据挖掘之购物篮分析

star2017 1年前 ⋅ 5173 阅读

打开示例数据:

03020640-1b3bfee050bf479999b64cbb323899d6

这里直接选择最后一个Associate and Shopping Basket。关联规则和购物篮。

03020645-cc4bf2673c0741a6ad69d697c9da86b5

然后会跳转到Associate标签里面的样本数据。这个工具就是根据样本数据,利用关联规则模型的算法,来发现里面的购买规律。

其中Order Number是订单编号,往后依次是产品分类,产品名称和产品价格。

留意一下安装了Data Mining Add-ins for Office之后的Excel的Ribbon工具栏:

03020647-08c5c99cf4d2489cbc978d14ea329ca5

多了一项Table Tools,这里我们要用到里面的Shopping Basket Analysis。

首先留意一下右边的Connection工具,Excel的这个数据挖掘插件是需要SQL Server Analysis Services支持的,点击它连接一个分析服务。

03020648-a0cc8f1fbb7c4a10b7bc470f63dd28f8

点击New新建连接。

03020648-613decb9280d4c198aa9d59993456f31

添写要连接到的分析服务,Catalog name直接选default就可以。Test Connection没问题后点OK完成设置。

然后点击Shopping Basket Analysis按钮。

03020649-ff3a05dd454948f9b7a658e26bc88f6c

接下来会弹出如图的工具,需要根据模型算法的特点指定一些列的信息。

Transation ID直接对应订单编码Order Number,Item在演示中为了降低项的个数这里直接选择Category,Item Value选择Product Price产品价格。

直接点击Run开始处理数据:

03020649-95da993d658941f084931654d49517fc

处理完毕后,会自动生成两个标签页记录模型分析的结果:

03020650-68b7c15ddcf74ecb994e0729d6b54799

在第一个标签页中,会给我们一些销售捆绑建议。

03020653-de5545721d0b49628a77bb06bac7ccc9

结果是按照最后一列的捆绑总销售额,挖掘结果根据这一列进行了排序。前面几列对应的信息分别是绑定包的大小,比如一个咖啡和伴侣,那么这个包的大小就是2,第二列跟支持度差不多,也就是在样本数据中,有多少是用户是同时买了这几样产品的,后面一列是这个捆绑包的总价是多少。

比如第一行,Road Bikesh和Helmets这个捆绑建议,它的包大小是2,在样本数据,也就是历史数据中,有805个订单里同时包括这两样产品,这个捆绑包的价格是1570.228025,样本数据中这样的产品在一起一共卖了1264033.56。

通过这个报告,我们就可以知道哪些捆绑商品值得创建。

在另外一个标签页中,可以看到商品推荐建议信息:

03020655-810d6b7b00334f759d7ea64cfcff02dd

这里会列出最值得推荐的几个组合建议,后两列信息跟前一个报告一样。前两列信息依次是给定的一个商品和根据这个给定产品最值得推荐的产品。

往后列依次是,有多少个订单包含了给定的产品,接下来一列是在包含给定产品的订单中,有多少又同时包含了推荐的产品。后面的百分比就是这个比例。

 

 

以上报告中提供的统计信息都是我们在做销售捆绑决策时很重要的参考信息,而不同人做的决策肯定会有所差别。

比如,一个保守点的老板觉得Helmets跟Tires and Tubes这样的组合很多,而且Helmets购买量也足够大,为了让不太好卖的产品更好卖些,比如Bike Racks卖的很少,但明显Tires and Tubes卖的比较多,那么我就可以推行Bike Racks和Tires and Tubes这样的搭配方案来促进销售。

而另外一个老板可能认为目前的销售应该趁热打铁,什么好卖卖什么,于是肯定会大力推行Helmets和Tires and Tubes这样的搭配方案,因为Helmets已经卖得够好了,那么更希望能带动Tires and Tubes的销量。

总之,根据不同的销售策略和特点,根据这些统计信息可以为用户提供不同的决策数据依据。

 

原创文章,作者:xsmile,如若转载,请注明出处:http://www.17bigdata.com/%e7%94%a8excel%e5%81%9a%e6%95%b0%e6%8d%ae%e6%8c%96%e6%8e%98%e4%b9%8b%e8%b4%ad%e7%89%a9%e7%af%ae%e5%88%86%e6%9e%90/

更多内容请访问:IT源点

全部评论: 0

    我有话说: