×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 大数据技术 共 150 个结果.
李昊:谈谈数据仓库建设心得(下)
分享记录: 下面是具体的模型设计,一般在数据仓库行业,业务模型有两类,一类是企业自有的数据模型,一类是行业模型,比如金融业:天睿,银行业、保险业、制造业、医疗生命科学行业,这些一般是实施顾问团队总结的。但这些行业模型在中国市场运行的不太好,除了金融和电信稍好点,其他行业因发展较快、业务变化较快,迭代较国外快很多。我不建议以自上而下的方式、预先用一个模型将自己…
star2017
1年前
3021
0
终于有人把网络爬虫讲明白了
人们正在以前所未有的速度转向互联网,我们在互联网上所做的很多行为产生了大量的“用户数据”,比如微博、购买记录等。
star2017
1年前
3312
0
大数据,从打好分布式系统的基础开始
分布式系统是大数据的基础,大数据是分布式系统的最佳实践。本文将介绍分布式系统对数据的基本处理方法,包括数据的分布方式和对数据副本进行控制的协议和算法。这些算法也是大数据各类组件技术的基础。 分布式系统定义 分布式系统是若干独立计算机的集合,但这些计算机系统集合从用户的使用角度来说,则是一个单一的应用系统。组建一个分布式系统具备五个关键目标: 资源的可访问性:…
star2017
1年前
2791
0
生活中的大数据技术:Map-Reduce的直观解释
在谷歌之前,人们就不知不觉地用了映射-归约技术,如机场分发登机牌,银行取号排队,流水作业阅卷,不过,要说清楚“映射向何方,归约在何处”,还有一点挑战,Let me try。
star2017
1年前
3059
0
从0到1:微信后台系统的演进之路
摘要:2个月的开发时间,微信后台系统经历了从0到1的过程。从小步慢跑到快速成长,经历了平台化到走出国门,微信交出的这份优异答卷,解题思路是怎样的 从无到有 2011.1.21 微信正式发布。这一天距离微信项目启动日约为2个月。就在这2个月里,微信从无到有,大家可能会好奇这期间微信后台做的最重要的事情是什么 我想应该是以下三件事: 1、确定了微信的消息模型 微…
star2017
1年前
2490
0
从底层到应用,那些数据人的必备技能
谨以此文献给对数据有热情,想长期从事此行业的年轻人,希望对你们有所启发,并快速调整思路和方向,让自己的职业生涯有更好的发展。
star2017
1年前
6585
0
使用Tensorflow训练线性回归模型并进行预测
Tensorflow是Google开发的开源机器学习库。本篇文章我们将使用Tensorflow对线性回归模型进行训练,并使用模型对数据进行预测。
star2017
1年前
6398
0
那些“中漂”的欧洲科学家们
就近几年的科技发展水平来看,中国已逐步向科技大国迈进,这在提升中国在全球的科研影响力之余,也在一定程度上改变了全球科学人才流动背后的格局。
star2017
1年前
2855
0
面向高维度的机器学习的计算框架-Angel
简介 为支持超大维度机器学习模型运算,腾讯数据平台部与香港科技大学合作开发了面向机器学习的分布式计算框架——Angel 1.0。 Angel是使用Java语言开发的专有机器学习计算系统,用户可以像用Spark, MapReduce一样,用它来完成机器学习的模型训练。Angel已经支持了SGD、ADMM优化算法,同时我们也提供了一些常用的机器学习模型;但是如果…
star2017
1年前
6598
0
李昊:谈谈数据仓库建设心得(上)
分享记录: 数据仓库在业界的定义,是数据仓库之前BILL最早提出的。数据仓库的建设需要一个过程,是一个方法论。数据仓库建设是把企业中所有的数据整合,加工,分析的过程。用于解决数据经营,管理问题。他不像一个产品或者数据库一样,可直接购买。 OLTP就是我们通常说的所谓业务系统。它和数据仓库是有明显差异,业务系统重在当前数据,重在是插入,比如我们一个电商交易数据…
star2017
1年前
3250
0
“数据可视化”下的社会化营销,即将带来哪些改变
未来,不管社会化媒体营销如何发展,但始终会有一点不变,回到商业本质:精准,精准化营销才是未来的主流
star2017
1年前
4152
0
硅谷资深工程师带你聊聊数据库那些事
作为两大主流开源数据库,MySQL 和 Postgres 的 “战争” 从来没有停止过,虽然硝烟不似程序语言之间的斗争那么浓烈。
star2017
1年前
7923
0
大数据与美团外卖的精细化运营
本文选自美团外卖商业分析与策略负责人马宏彬和美团技术架构负责人夏华夏于2016年6月2日在清华大数据“应用·创新”系列讲座上所做的题为《大数据与美团外卖的精细化运营》的演讲。
star2017
1年前
6847
0
京东618:大数据技术如何全面提升买买买的用户体验?
今年618,京东技术部门的最大变化,京东集团CTO张晨的总结是:“从技术上,去年重点在保障,今年重点是大数据驱动业务效率提高,和用户体验的提高”。
star2017
1年前
7721
0
大数据知识图谱实战经验总结
作为数据科学家,我想把行业新的知识图谱总结并分享给技术专家们,让大数据知识真正转化为互联网生产力!
star2017
1年前
6769
0
ApacheKafka快速入门指南
Kafka是基于发布订阅的消息系统。最初起源于LinkedIn,于2011年成为开源Apache项目,然后于2012年成为Apache顶级项目。Kafka用Scala和Java编写,因其分布式可扩展架构及可持久化、高吞吐率特征而被广泛使用。
star2017
1年前
2527
0
从Hadoop到Spark和Flink,大数据处理框架十年激荡发展史
本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流行技术。
star2017
1年前
7214
0
京东618智能卖场:个性化技术在大促会场上的实践
大家好,我是来自京东搜索与大数据平台部的王超,很高兴和大家介绍京东在这次618大促中在技术方面做的较大的一个尝试,那就是在京东各大平台的主会场和首页的重要位置上,实现了“智能卖场”。
star2017
1年前
3408
0
大数据到底是不是“算命”?技术大牛们这样说
BAT虽然在数据量上占据优势,但却在丰富性上受到局限,甚至并不具备垂直领域UGC所具备的大数据能力。中小企业则可以充分利用自己在垂直领域里深耕的优势,将数据的丰富性提升上来,从而获得差异性的优势。
star2017
1年前
7856
0
技术|Hadoop面试,有它就够了
本文介绍了google推广的一个编程模型MapReduce,以及下一代mapreduce框架,简称MRv2。从各个方面对比了传统的MR框架和新一代的区别,以及它们的优缺点。一起来看看吧~
star2017
1年前
2775
0
1
2
3
4
...
8
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
中文版onlyoffice/documentserver镜像制作
6.
史上最全的“大数据”学习资源(上)
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
MongoDB报错:InvalidMongoDbApiUsageException之重复的字段条件
2.
mysql 8.0.34升级8.4.2升级完成后连接不上 Plugin 'mysql_native_password' is not loaded
3.
mysql 8二级等保设置
4.
mysql通过.idb文件恢复数据
5.
idea本地模式调试spark代码
6.
ubuntu更换阿里云或清华镜像源
最新评论
签到
?
签到
签到
签到,学习
签到