×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
3年从200个数据用户发展到6000人,eBay的大数据平台是如何做到的?
增强分析在 eBay 的实践
star2017
博客
1年前
8533
0
2015年阿里巴巴数据分析师笔试试题
一、问答题 1、你理解中的分析师是什么样的?你觉得自己目前应聘分析师职位的优势是什么?并说明理由。 2、淘宝和天猫上每天都有大量的用户在线上购买,作为分析师可以从哪些角度对用户进行分析,同时说明清楚选取这个角度做分析的目的。 3、某银行信用卡模型建设过程中,申请评分卡模型训练过程出现过拟合的现象,请阐述一下什么是过拟合现象?如何解决过拟合现象? 4、影响网店…
star2017
博客
1年前
3849
0
趣味数据挖掘系列3:一篇“它引”上万的大牛论文与数据血统论
本文先通俗地介绍快速挖掘关联规则的Apriori算法,然后介绍发表这一算法的论文(它被引用了11480+次),最后关注此文的实际影响 与 传统影响因子的差距。
star2017
博客
1年前
5718
0
数据挖掘化功大法(18)——什么是数据挖掘(上)
什么是数据挖掘 前两天看到群里有人问,什么是数据挖掘,现在就数据挖掘的概念做一下分析,并且尽量用大白话说一下数据挖掘到底是个啥东西,为啥大数据来了数据挖掘也火了(其实原来就挺火)。 先看一上概念: 数据挖掘(英语:Data mining),又译为资料探勘、数据采矿。它是数据库知识发现(英语:Knowledge-Discovery in Databases,简…
star2017
博客
1年前
6291
0
做竞品分析时,几个容易犯的错误
在几年的产品工作过程中,写过一些竞品分析报告,总结了几个曾经犯过的错误,与大家分享。 一、没有结论的功能点介绍 最常见的竞品分析方法就是对市场上的领先产品进行一次浏览,逐个写出竞品的功能点及流程,不管使用了整齐的表格或者详实的文字描述,又或者是使用了漂亮的图形和截图,没有结论的统计是没有意义的,分析就一定要有结果。 竞品分析的目的就是为自身产品的战略、节奏、…
star2017
博客
1年前
1405
0
纸上得来终觉浅!70%大数据初学者做错的事情
企业数据科学仍然是一个新领域。许多学者还没有为真正的企业解决实际问题。因此,他们以与数据和业务环境分离的方式教授教科书算法。这可以在智力上很有趣。但是,如果学生认为这些课程能够很好地为数据科学家工作,那么他们就错了。
star2017
博客
1年前
11064
0
看看亚马逊是如何收集、应用用户行为数据的
亚马逊(Amazon.com)在利用户数据实现精准营销的方面有很多值得学习的地方。用户在使用亚马逊网站的过程中,很多行为都会被记录。亚马逊根据这些数据,不断勾画出每个用户的特征轮廓和需求,并以此为依据进行精准营销。
star2017
博客
1年前
7777
0
数据嗨客|第2期:线性回归
简单来讲,回归就是通过数据学习数量关系,然后利用这个数量关系去做预测。
star2017
博客
1年前
6926
0
趣味数据挖掘系列4:巧挖科学博客之均击量公式,兼谈干预规则
为消除疲劳,现来一段有趣的、与博友的自尊心和荣誉感相关的博文,议题是:挖掘科学博客的平均点击量公式,以及提高平均点击量的方法。
star2017
博客
1年前
5774
0
数据挖掘化功大法(19)——什么是数据挖掘(下)
什么是数据仓库 数据仓库是一个面向主题的( Subject Oriented) 、集成的( Integrate) 、相对稳定的(NonVolatile) 、反映历史变化( Time Variant)的数据集合,用于支持管理决策。对于数据仓库的概念我们可以从两个层次予以理: ①数据仓库用于支持决策,面向分析型数据处理,它不同于企业现有的操作型数据库; ②数据仓…
star2017
博客
1年前
4898
0
8个提高数据分析工作效率的技巧
前言 我刚和一位老友恢复了联系。她一直对数据科学很感兴趣,但10个月前才涉足这一领域——作为一个数据科学家加入了一个组织。我明显感觉到她已经在新的岗位上学到了很多东西。然而,我们聊天时,她提到了一个至今在我脑海里都挥之不去的事实或者说是问题。她说,不论她表现如何,每一个项目或分析任务在令经理满意之前都要做好多次。她还提到,往往事后发现原本不需要花这么多时间!…
star2017
博客
1年前
7884
0
大数据如何解决电子商务个性化的挑战?
随着千禧一代和10后获得更多的购买力,以及年轻人变得更懂科技,电子商务的业务将会得到更大的增长,因为人们喜欢网上购物的便利。
star2017
博客
1年前
7838
0
教你怎么看聚类分析的树状图
之前有群友问,用聚类分析得到的树状图,怎么看? 简单讲一下: 有下面这样的一个树状图 继续往左走,在出现第三条横线的时候,竖着切一刀 这样我们就把样本划分为3类 第一类:中国 第二类:日本和菲律宾 第三类:其他 你可以一直往左分,一直到1个样本一个群,看你自己的需求,分多少类,你自己做主,最主要是类的特征显著、具备可解释性。
star2017
博客
1年前
1242
0
漫画:什么是机器学习?
通过这篇漫画,希望没有从过IT行业,或者不了解机器学习的朋友们能够对机器学习有一些初步的认知。
star2017
博客
1年前
9754
0
资深分析师教你竞品分析
本文以天猫流行男鞋TOP商家为实例,教你做竞品分析
star2017
博客
1年前
8793
0
金融大数据信用评分模型解析
大数据征信:芝麻信用、腾讯信用和51信用卡等信用评分模型解析。
star2017
博客
1年前
7967
0
数据挖掘化功大法(20)——网站日志挖掘
收集web日志的目的 Web日志挖掘是指采用数据挖掘技术,对站点用户访问Web服务器过程中产生的日志数据进行分析处理,从而发现Web用户的访问模式和兴趣爱好等,这些信息对站点建设潜在有用的可理解的未知信息和知识,用于分析站点的被访问情况,辅助站点管理和决策支持等。 1、以改进web站点设计为目标,通过挖掘用户聚类和用户的频繁访问路径,修改站点的页面之间的链接…
star2017
博客
1年前
6728
0
如何利用数据来支撑设计?
摘要:一线设计师对于数据和目标的敏感程度非常的低,所以设计没有说服力、自认为设计很好的东西别人看不明白,推进很困难。 我最早的时候认为设计就是如何去做出各种新奇的图形、质感和界面,追逐潮流和创意。可是后来发现设计最难的是平衡各方面的因素,在条条框框的限制中找到方案还要推进下去,并被人看到价值。前者很容易满足,而后者要做好却非常的难,PM不给力、沟通不顺畅、开…
star2017
博客
1年前
6171
0
大数据在营销中的7大优势
大数据在营销中的7大优势。
star2017
博客
1年前
6345
0
如何通过数据指标来分辨真假用户?
文/罗曼罗(友盟产品经理) 运营人员可能会遇到的事情:做渠道投放的时候,每个渠道都投放了,点击量特别高,但是激活量却只有个位数。点击量和激活数量都很高,但是留存率却很低。花了大量费用在渠道投放上,但是效果却并不好。 其实,在移动互联网生态中存在很多不为人知的渠道“刷量”工作室,这些工作室以非常低廉的价格贡献质量同样低廉的用户数据,这给 App 生态圈带来了很…
star2017
博客
1年前
1538
0
1
...
308
309
310
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到