×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 大数据技术 共 150 个结果.
终于有人把网络爬虫讲明白了
人们正在以前所未有的速度转向互联网,我们在互联网上所做的很多行为产生了大量的“用户数据”,比如微博、购买记录等。
star2017
1年前
3812
0
李昊:谈谈数据仓库建设心得(下)
分享记录: 下面是具体的模型设计,一般在数据仓库行业,业务模型有两类,一类是企业自有的数据模型,一类是行业模型,比如金融业:天睿,银行业、保险业、制造业、医疗生命科学行业,这些一般是实施顾问团队总结的。但这些行业模型在中国市场运行的不太好,除了金融和电信稍好点,其他行业因发展较快、业务变化较快,迭代较国外快很多。我不建议以自上而下的方式、预先用一个模型将自己…
star2017
1年前
3329
0
LinkedIn文本分析平台:主题挖掘的四大技术步骤
LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节。LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题、用户的热点话题和痛点,能够做出改善产品、提高用户体验等重要的商业决定。下面是整理后的技术要点。
star2017
1年前
6344
0
技术|Hadoop面试,有它就够了
本文介绍了google推广的一个编程模型MapReduce,以及下一代mapreduce框架,简称MRv2。从各个方面对比了传统的MR框架和新一代的区别,以及它们的优缺点。一起来看看吧~
star2017
1年前
3108
0
大数据到底是不是“算命”?技术大牛们这样说
BAT虽然在数据量上占据优势,但却在丰富性上受到局限,甚至并不具备垂直领域UGC所具备的大数据能力。中小企业则可以充分利用自己在垂直领域里深耕的优势,将数据的丰富性提升上来,从而获得差异性的优势。
star2017
1年前
8438
0
京东618智能卖场:个性化技术在大促会场上的实践
大家好,我是来自京东搜索与大数据平台部的王超,很高兴和大家介绍京东在这次618大促中在技术方面做的较大的一个尝试,那就是在京东各大平台的主会场和首页的重要位置上,实现了“智能卖场”。
star2017
1年前
3775
0
从Hadoop到Spark和Flink,大数据处理框架十年激荡发展史
本文将从大数据的基础特性开始,进而解释分而治之的处理思想,最后介绍一些流行的大数据技术和组件,读者能够通过本文了解大数据的概念、处理方法和流行技术。
star2017
1年前
7687
0
ApacheKafka快速入门指南
Kafka是基于发布订阅的消息系统。最初起源于LinkedIn,于2011年成为开源Apache项目,然后于2012年成为Apache顶级项目。Kafka用Scala和Java编写,因其分布式可扩展架构及可持久化、高吞吐率特征而被广泛使用。
star2017
1年前
2785
0
大数据知识图谱实战经验总结
作为数据科学家,我想把行业新的知识图谱总结并分享给技术专家们,让大数据知识真正转化为互联网生产力!
star2017
1年前
7308
0
京东618:大数据技术如何全面提升买买买的用户体验?
今年618,京东技术部门的最大变化,京东集团CTO张晨的总结是:“从技术上,去年重点在保障,今年重点是大数据驱动业务效率提高,和用户体验的提高”。
star2017
1年前
8475
0
大数据与美团外卖的精细化运营
本文选自美团外卖商业分析与策略负责人马宏彬和美团技术架构负责人夏华夏于2016年6月2日在清华大数据“应用·创新”系列讲座上所做的题为《大数据与美团外卖的精细化运营》的演讲。
star2017
1年前
7412
0
硅谷资深工程师带你聊聊数据库那些事
作为两大主流开源数据库,MySQL 和 Postgres 的 “战争” 从来没有停止过,虽然硝烟不似程序语言之间的斗争那么浓烈。
star2017
1年前
8674
0
“数据可视化”下的社会化营销,即将带来哪些改变
未来,不管社会化媒体营销如何发展,但始终会有一点不变,回到商业本质:精准,精准化营销才是未来的主流
star2017
1年前
4531
0
李昊:谈谈数据仓库建设心得(上)
分享记录: 数据仓库在业界的定义,是数据仓库之前BILL最早提出的。数据仓库的建设需要一个过程,是一个方法论。数据仓库建设是把企业中所有的数据整合,加工,分析的过程。用于解决数据经营,管理问题。他不像一个产品或者数据库一样,可直接购买。 OLTP就是我们通常说的所谓业务系统。它和数据仓库是有明显差异,业务系统重在当前数据,重在是插入,比如我们一个电商交易数据…
star2017
1年前
3553
0
面向高维度的机器学习的计算框架-Angel
简介 为支持超大维度机器学习模型运算,腾讯数据平台部与香港科技大学合作开发了面向机器学习的分布式计算框架——Angel 1.0。 Angel是使用Java语言开发的专有机器学习计算系统,用户可以像用Spark, MapReduce一样,用它来完成机器学习的模型训练。Angel已经支持了SGD、ADMM优化算法,同时我们也提供了一些常用的机器学习模型;但是如果…
star2017
1年前
7238
0
那些“中漂”的欧洲科学家们
就近几年的科技发展水平来看,中国已逐步向科技大国迈进,这在提升中国在全球的科研影响力之余,也在一定程度上改变了全球科学人才流动背后的格局。
star2017
1年前
3159
0
使用Tensorflow训练线性回归模型并进行预测
Tensorflow是Google开发的开源机器学习库。本篇文章我们将使用Tensorflow对线性回归模型进行训练,并使用模型对数据进行预测。
star2017
1年前
7100
0
从底层到应用,那些数据人的必备技能
谨以此文献给对数据有热情,想长期从事此行业的年轻人,希望对你们有所启发,并快速调整思路和方向,让自己的职业生涯有更好的发展。
star2017
1年前
7123
0
从0到1:微信后台系统的演进之路
摘要:2个月的开发时间,微信后台系统经历了从0到1的过程。从小步慢跑到快速成长,经历了平台化到走出国门,微信交出的这份优异答卷,解题思路是怎样的 从无到有 2011.1.21 微信正式发布。这一天距离微信项目启动日约为2个月。就在这2个月里,微信从无到有,大家可能会好奇这期间微信后台做的最重要的事情是什么 我想应该是以下三件事: 1、确定了微信的消息模型 微…
star2017
1年前
2799
0
生活中的大数据技术:Map-Reduce的直观解释
在谷歌之前,人们就不知不觉地用了映射-归约技术,如机场分发登机牌,银行取号排队,流水作业阅卷,不过,要说清楚“映射向何方,归约在何处”,还有一点挑战,Let me try。
star2017
1年前
3433
0
1
2
3
4
...
8
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到