一张图看懂MADlib能干什么

star2017 1年前 ⋅ 7873 阅读
作者 德哥@Digoal  原文 http://blog.163.com/digoal@126/blog/static/163877040201510119148173/
MADlib最初是由pivotal的一些数据科学家贡献的开源数据挖掘库,现已加入阿帕奇孵化器项目。
MADlib能干什么呢?看一张图就明白了,以下取自
1467814772-2360-E5-7o65CX5PuARDsnpzsIw
回归分析,决策树,随机森林,贝叶斯分类,向量机,风险模型,KMEAN聚集,文本挖掘,数据校验,。。。等。

一个线性回归的例子,对应上图

supervised learning -> generalized linear models -> linear regression
1467814772-3130-Q8OApfoNwE4hASiksAyazA

如果你是R的数据科学家,并且不习惯使用SQL的话,使用pivotalR的R包就可以了,左边是R的写法。右边对应的是SQL。

1467814772-5207-Jhn3MRP-KR11rmdZ73vUlQ

话说今天要预测每个时间点的11.11销售额,可以用到它了。

PostgreSQL用户来搞数据挖掘有天然优势。
1467814772-4725-yjZAZl-vSqClSV54-rddGw
madlib的使用手册:

pivotalR使用手册

原创文章,作者:xsmile,如若转载,请注明出处:http://www.17bigdata.com/%e4%b8%80%e5%bc%a0%e5%9b%be%e7%9c%8b%e6%87%82madlib%e8%83%bd%e5%b9%b2%e4%bb%80%e4%b9%88/

更多内容请访问:IT源点

相关文章推荐

全部评论: 0

    我有话说: