×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 大数据 共 539 个结果.
案例干货:数据到底如何搞定电影票房预测?
来自 http://www.tmtpost.com/88163.html 怎样利用微博数据从股市中掘金?气象台怎样预报天气并发布预警?Google如何通过搜索行为预报流感爆发?这些…
star2017
1年前
6810
0
大数据时代下的化妆品O2O
来源:雷锋网 线上线下O2O 线上电商的分销体系,像当年的化妆品黑马芳草集品牌,搭建一个自营旗舰电商官网,依托官网的数据作为基础,向淘宝、天猫、京东、1号店、亚马逊等平台进行分销,…
star2017
1年前
5071
0
大数据分析之——k-means聚类中的坑
来自 http://blog.sciencenet.cn/blog-556556-860647.html 使用k-means进行聚类,常常被假定为数据是球状的,似乎是非球状数据就不…
star2017
1年前
8584
0
面试干货!21个必知数据科学面试题和答案
最近KDnuggets上发的“20个问题来分辨真假数据科学家”这篇文章非常热门,获得了一月的阅读量排行首位。 但是这些问题并没有提供答案,所以KDnuggets的小编们聚在一起写出…
star2017
1年前
6447
0
大数据产品-腾讯信鸽之手游流失预测
背景 随着游戏市场竞争的日趋激烈,越来越多的游戏运营服务选择借助大数据挖掘出更多更细的用户群来进行精细化,个性化运营,从而更好的抓住用户,获得更大的…
star2017
1年前
6156
0
四两拨千斤:借助SparkGraphX将QQ千亿关系链计算提速20倍
腾讯QQ有着国内最大的关系链,而共同好友数,属于社交网络分析的基本指标之一,是其它复杂指标的基础。借助Spark GraphX,我们用寥寥100行核心代码,在高配置的TDW-Spa…
star2017
1年前
5777
0
一张图看懂MADlib能干什么
作者 德哥@Digoal 原文 http://blog.163.com/digoal@126/blog/static/163877040201510119148173/ MADl…
star2017
1年前
7877
0
利用In-DatabaseAnalytics技术在大规模数据上实现机器学习的SGD算法
作者 梁堰波 徐伟辰 随着应用数据的增长,在大规模数据集上进行统计分析和机器学习越来越成为一个巨大的挑战。目前,适用于统计分析/机器学习的语言/库有很多,如专为数据分析用途而设计的…
star2017
1年前
7260
0
你不得不知道的6个用好大数据的秘诀
来自: 36大数据 译注:这篇文章里,有三位来自不同公司的大数据运营人员各自分享了他们运用大数据的经验。这三位是来自维亚康姆(Viacom)的Luzzi、Globys…
star2017
1年前
4718
0
大数据应用:精准化营销其实是在消费用户隐私
from http://www.tmtpost.com/228472.html 每个人都应该过了这样一种经历,当你曾经在自己的电脑上搜索过某件事或某件物后,很长一段时间里,你登陆所…
star2017
1年前
4836
0
大数据面试可能遇到的问题
1、你处理过的最大的数据量?你是如何处理他们的?处理的结果。 2、告诉我二个分析或者计算机科学相关项目?你是如何对其结果进行衡量的? 3、什么是:提升值、关键绩效指标、强壮性、模型…
star2017
1年前
5470
0
别被忽悠了,6个问题揭露谁是大数据伪砖家
作者| 克里斯托弗·苏达克 译者| 李红喜 大数据文摘(微信ID:BigDataDigest) 生火这一技术的由来在过去的一百万年间都很有趣,但是黑夜的结束,冬季的…
star2017
1年前
3494
0
大数据挖掘学生个性互联网+能否破解“上学难”
走进生活的互联网+ 一个毫无教学经验的美国人萨尔曼·可汗录制的数学教学视频,让美国2万多所学校的数学老师和学生们为之倾倒。课堂上,学生们观看这些视频,老师不再讲课,只负责答疑…
star2017
1年前
5140
0
TensorFlow深度学习,一篇文章就够了
作者: 陈迪豪,就职小米科技,深度学习工程师,TensorFlow代码提交者。 TensorFlow深度学习框架 Google不仅是大数据和云计算的领导者,在机器学习和深度学习上也…
star2017
1年前
8032
0
用于大数据的存储层DeltaLake
Delta Lake 是一个存储层,为 Apache Spark 和大数据 workloads 提供 ACID 事务能力,其通过写和快照隔离之间的乐观并发控制(optimistic…
star2017
1年前
5450
0
数据仓库实践杂谈-(五)-ETL
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:…
star2017
1年前
5835
0
20分钟自动搭建大数据平台
下载镜像 docker pull cloudera/quickstart // 或者在 cloudera 官网下载文件后使用 `docker import` 命令导入 // htt…
star2017
1年前
6974
0
数据仓库实践杂谈(六)-数据校验
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:…
star2017
1年前
5865
0
数据仓库实践杂谈-(四)-元数据
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:…
star2017
1年前
5554
0
数据仓库实践杂谈-(三)-整体实现框架
[目录] 第一章:概述 第二章:整体数据分层 第三章:整体实现框架 第四章:元数据 第五章:ETL 第六章:数据校验 第七章:数据标准化 第八章:去重 第九章:增量/全量 第十章:…
star2017
1年前
5811
0
1
...
22
23
24
...
27
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
onlyoffice 20并发限制处理,up to 20 maximum
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
中文版onlyoffice/documentserver镜像制作
6.
onlyoffice6.x高版本使用参考(主要破解20连接限制)
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
mysql通过.idb文件恢复数据
2.
idea本地模式调试spark代码
3.
ubuntu更换阿里云或清华镜像源
4.
centos 配置静态IP
5.
poi-tl实现按模板生成word
6.
ES max_compilations_rate 参数设置问题导致的查询bug
最新评论
签到
?
签到
签到
签到,学习
签到