×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
数据嗨客|第6期:不平衡数据处理
对于不平衡数据集,一般的分类算法都倾向于将样本划分到多数类,体现在模型整体的准确率很高。
star2017
博客
1年前
7102
0
数据分析的5个坑,你踩过几个?
产品数据是产品经理量化产品的重要方面,数据的客观性,让数据变成了发掘问题本质,寻找事物规律所需要用到的最有利的手段之一,但在与数据打交道的过程中,我们可能经常会犯一些错误,导致分析的结论出现较大的偏颇,本文罗列数据分析过程中5个常见误区。
star2017
博客
1年前
1250
0
趣味数据挖掘系列8:农村中学并迁选址、K-平均聚类及蛋鸡悖论
本文从农村中学并迁选址问题出发,介绍了数据挖掘十大算法中位居第二的K-平均聚类,后又借用牛顿迭代原理,议论蛋鸡悖论。
star2017
博客
1年前
6228
0
那些“中漂”的欧洲科学家们
就近几年的科技发展水平来看,中国已逐步向科技大国迈进,这在提升中国在全球的科研影响力之余,也在一定程度上改变了全球科学人才流动背后的格局。
star2017
博客
1年前
3680
0
数据科学家面试常见的77个问题
随着大数据概念的火热,数据科学家这一职位应时而出,那么成为数据科学家要满足什么条件?或许我们可以从国外的数据科学家面试问题中得到一些参考,下面是中国统计网翻译的数据科学家面试常见的77个问题。
star2017
博客
1年前
3626
0
数据嗨客|第7期:机器学习中的过拟合问题
“预测”就是根据已知的输入和输出进行学习,并依照给定的新输入给出我们自己的判断。
star2017
博客
1年前
8532
0
数据科学在各行各业中的差异
在雇佣数据科学家最多的十大行业中,有六个行业的研究型数据科学家数量超过了其他类型的数据科学家。
star2017
博客
1年前
8127
0
大嘴巴漫谈数据挖掘:聚类分析后安排,细分群组有特征
如前所述,用户细分包括前后两部分,即前一部分因子分析完成后,还要对获得的公共因子进行随后的聚类分析。 聚类分析按照相似度进行划分类别,相似度一般由数据对象间的距离远近来衡量。基于确定的业务需求和分析目标,可以从用户基本属性、用户使用行为两个方面选择变量,随后便要进一步明确样本数据的形式。 样本数据中性别、年龄及收入是离散变量,而使用频度和价值贡献是连续变量,…
star2017
博客
1年前
5947
0
无需大量算力训练,通过“读”解说员的评论,AI也能学会国际象棋
20世纪90年代后期,IBM深蓝(Deep Blue)研究了一系列的国际象棋算法,期望于打败当时的世界冠军加里•卡斯帕罗夫(Garry Kasparov)。
star2017
博客
1年前
6124
0
数据分析过程中最有效的七种降维方法
近来由于数据记录和属性规模的急剧增长,大数据处理平台和并行数据分析算法也随之出现。于此同时,这也推动了数据降维处理的应用。实际上,数据量有时过犹不及。有时在数据分析应用中大量的数据反而会产生更坏的性能。 最新的一个例子是采用 2009 KDD Challenge 大数据集来预测客户流失量。 该数据集维度达到 15000 维。 大多数数据挖掘算法都直接对数据逐…
star2017
博客
1年前
11416
0
数据嗨客|第8期:主成分分析
主成分分析是一种经典的降维方法,但如果你只把主成分分析作为一种降维手段,那么你就太OUT了。
star2017
博客
1年前
7021
0
数据分析在过去25年的回顾:大数据的下个转折点
这篇文章是一个投资者对数据分析在过去25年的回顾。作者西蒙迪斯从投资者的角度讨论了数据分析的变革,认知应用的价值,以及最受风投关注的大数据核心领域。
star2017
博客
1年前
7958
0
哈佛学霸教你用Python分析相亲网站数据,在两万异性中找到真爱
这是一次数学家独创的完美约会经验贴
star2017
博客
1年前
8665
0
如何全面掌握别人家的APP数据?
大部分数据都是模拟趋势数据,要获得一个产品的绝对历史下载量是一件很难的事情,你要知道每个App都是分版本向App store或者安卓应用商店提交的,所以理论上我们需要看的是这个版本的下载量和活跃度。
star2017
博客
1年前
8075
0
数据嗨客|第9期:k-means
聚类作为一种数据挖掘工具,在生物学,商务智能以及Web搜索等方面有着广泛的应用。
star2017
博客
1年前
10370
0
数据分析,你真的准备好了吗?
谨以此文,献给在路上的年轻朋友们!
star2017
博客
1年前
9507
0
如何从一个好的数据科学家成长为优秀的数据科学家
数据科学就业市场正在迅速变化。能够建立机器学习模型曾经是只有少数杰出科学家才具备的一项精英技能。
star2017
博客
1年前
3647
0
数据分析入门7:数据分析葵花宝典
在了解了什么是数据分析师、数据分析师的基本素质,那么接下来需要学习什么,有什么好的学习资料呢?
star2017
博客
1年前
1019
0
数据嗨客|第10期:模型选择与评价
机器学习中存在各种不同的分类模型,如逻辑回归、决策树、朴素贝叶斯和支持向量机等。评估不同分类模型性能的方法是相通的。
star2017
博客
1年前
6992
0
数据科学家如何玩台球?–策略篇
准度提高没有那么快,在准度相对固定的情况下,要赢得比赛,需要怎么样的策略?
star2017
博客
1年前
8412
0
1
...
310
311
312
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到