×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 大数据技术 共 150 个结果.
LinkedIn文本分析平台:主题挖掘的四大技术步骤
LinkedIn前不久发布两篇文章分享了自主研发的文本分析平台Voices的概览和技术细节。LinkedIn认为倾听用户意见回馈很重要,发现反馈的主要话题、用户的热点话题和痛点,能够做出改善产品、提高用户体验等重要的商业决定。下面是整理后的技术要点。
star2017
1年前
6173
0
分析之上,大数据项目部署的五大愿景
如果你正在尝试构建大数据应用或分析系统,你可能会清楚的意识到该领域缺少哪些功能。笔者将人们对大数据的愿景归纳为五大需求,分别是SQL(或SQL-like)分析、快速部署、高级分析、实时分析和网络分析选件。 好消息是人们正在努力应对这些问题,SQL分析选件就是其中之一。大批数据管理和数据分析专家们对SQL非常熟悉,自然想要利用SQL知识搞清楚Hadoop集群和…
star2017
1年前
3543
0
高效报表开发人员常用的五件武器
五件武器 做数据的人,如果没做过报表,数据生涯是不完整的,但如果仅仅做报表,不经常思考进而革命,就会陷入骡子般的生活,每天转啊转,很辛苦,但很难获得认可,如果你是公司内一名报表开发人员,如果你已经干了很多年,你已经有点经验了,但你可能已经有点抱怨,每天被业人员的事务性工作持续打扰的时候,但如果你希望进一步证明自己,有颗奋发向前的心,那你应该停下来,看看我这篇…
star2017
1年前
6717
0
从日志统计到大数据分析(六)——三国鼎立
根据数据源的流向不同,我们可以将互联网公司常用的数据分析方法分为三种: 1,通过嵌入SDK直接将数据发送到第三方平台,如使用友盟、百度统计、TalkingData等;2,直接基于业务数据库,通过写SQL的方式进行数据分析;3,在应用服务器端打印日志,基于日志写脚本进行分析,在百度的早期主要是这一种。 我们这篇文章逐一来分析这三种方法的优势和不足。 1 第三方…
star2017
1年前
3483
0
从日志统计到大数据分析(七)——魏晋
前面讲了这么多篇,可能你有疑问那什么是大数据分析?它和传统的数据分析有何不同?我们要从大数据的概念开始讲起。 因为从事这一方向,这几年不断会有人问我什么是大数据?我一直都回答不好。在最近的几个月,我对这一概念思考的更多一些,结合看过的一些资料(如《大数据时代》、《数学之美》第二版、《硅谷之谜》、吴军的演讲材料等)和实际的经历,算是有了一些认识。与其说认识,还…
star2017
1年前
3521
0
数据挖掘,想说爱你并不容易
基于大数据技术能带来哪些新的应用类型,进而为客户带来新的价值增长点?要回答这个问题,有关数据挖掘方面的讨论是一个不可回避的,但是数据挖掘,在应用层面引起的争议也是非常大的。
star2017
1年前
4785
0
关于推荐算法的一些思考
最近做了一个交叉销售的项目,梳理了一些关键点,分享出来希望对大家有所启发
star2017
1年前
5434
0
大数据漫谈(三)——数据技术
大数据技术的战略意义不在于掌握庞大的数据信息,而在于对这些含有意义的数据进行专业化处理。
star2017
1年前
6545
0
科大讯飞谭昶:大数据的实践与思考
科大讯飞 谭昶:大数据的实践与思考。2016中国大数据技术大会中,上来自科大讯飞大数据研究院副院长谭昶,他带来了《讯飞大数据的实践与思考》的……
star2017
1年前
6631
0
基于统计思想下的推荐系统
基于威尔逊区间法的排序方法
star2017
1年前
5136
0
如何快速全面建立自己的大数据知识体系?
很多人都看过不同类型的书,也接触过很多有关大数据方面的文章,但都是很零散不成系统,对自己也没有起到多大的作用,所以作者第一时间,带大家从整体体系思路上,了解大数据产品设计架构和技术策略。
star2017
1年前
7173
0
硅谷资深工程师带你聊聊数据库那些事
作为两大主流开源数据库,MySQL 和 Postgres 的 “战争” 从来没有停止过,虽然硝烟不似程序语言之间的斗争那么浓烈。
star2017
1年前
8522
0
无处不在的人工智能:Gartner发布2017年度新兴技术成熟度曲线
2017年7月,Gartner公司发布了年度新兴技术成熟度曲线。Gartner认为,2017年技术成熟度曲线揭示了未来5-10年的三方面技术趋势,一是无处不在的人工智能、二是身临其境的体验、三是数字化平台,这三个方面的汇聚会带来有竞争力的商业生态。
star2017
1年前
5518
0
部署大数据时应思考的一些技术问题
对于企业用户来说,需要更好的了解大数据的含义,理解大数据实际上能做什么及其局限性是什么。
star2017
1年前
2144
0
Gephi的实战又美观的运用—用社会关系图谱筛选作弊用户
社会网络,由许多节点(node)构成,节点通常是指个人或组织,节点之间发生着社会关系 。
star2017
1年前
2300
0
T级数据量下的划分聚类方法CLARANS+
如何在大量数据量下,简单快速的寻找到最优中心点的过程
star2017
1年前
4483
0
嫌弃Hadoop可能是你的打开方式有问题
关于 Hadoop 所谓的消亡,以及它跌落神坛的报道数不胜数。有很多人放马后炮说,Hadoop 从一开始就没有意义。还有人说“Hadoop 对于小型,临时的工作来说很慢”、“ Hadoop 很难”、“ Hadoop 已经死了,Spark 才是胜者”等等。那么事实真的如此吗?
star2017
1年前
5500
0
解密Uber数据科学团队路径选择算法的优化之路
一键用车现在已经烂大街,但是 Uber 简单的界面下又隐藏着怎样复杂的后端架构和服务呢?这些复杂的路径规划和订单匹配算法又是如何让车找到人,将人送到目的地的呢?现在让我们揭开Uber App这神秘的面纱。
star2017
1年前
2356
0
从内部机理的角度,详细分析Hadoop的核心架构
通过对Hadoop分布式计算平台最核心的分布式文件系统HDFS、MapReduce处理过程,以及数据仓库工具Hive和分布式数据库Hbase的介绍,基本涵盖了Hadoop分布式平台的所有技术核心。 通过这一阶段的调研总结,从内部机理的角度详细分析,HDFS、MapReduce、Hbase、Hive是如何运行,以及基于Hadoop数据仓库的构建和分布式数据库内…
star2017
1年前
2776
0
企业数据质量管理核心要素和技术原则
数据质量管理的三个要素数据质量管理的技术关键点数据质量管理实战
star2017
1年前
2917
0
1
...
3
4
5
...
8
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
中文版onlyoffice/documentserver镜像制作
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
沙尔克04挑战汉堡:锋利的攻势能否撬动防线?
2.
PG赏金女王热血来袭!化身女海盗,踏上海上传奇之路
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到