×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 数据集 共 30 个结果.
R语言不平衡数据分类指南
在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。
star2017
1年前
4978
0
43种机器学习开源数据集(附地址/调用方法)
开源数据集!
star2017
1年前
4335
0
Python数据分析,学习路径拆解及资源推荐
关于Python数据分析,其实网上能够找到的学习资源很多,主要分为两类:一类是提供各种资源的推荐,比如书单、教程、以及学习的先后顺序;另一类是提供具体的学习内容,知识点或实际案例。
star2017
1年前
5065
0
开源时间序列数据集整理
UCR时间序列数据集是时序领域的“Imagnet”,涵盖医疗/电力/地理等诸多领域,目前全量数据有128种。该项目提供了一个非常全面的数据获取渠道,包含各个细分领域的数据库资源,自然科学和社会科学的覆盖都很全…
star2017
1年前
1144
0
降维,是数据科学家的必由之路!
本文为大家介绍了降维的概念及降维技术主成分分析(PCA)在特征工程中的应用。
star2017
1年前
5591
0
盘点数据处理工具,手把手教你做数据清洗和转换
原始数据本身没有用。为了使它实际有用,你需要准备它。
star2017
1年前
730
0
14个超有趣的数据分析项目,数据集都给你整理好啦(建议收藏)
最容易上手的就是数据可视化, 以下3个数据集可以用于创建一些有意思的的可视化效果并加到你的简历中。 分析此数据集,找到任何确实影响员工满意度的变量,另外,还可以看看是否可以对变量进行重要程度排名…
star2017
1年前
5217
0
机器学习模型训练全流程
发现一个很有趣的开源项目,作者用手绘图的方式讲解了机器学习模型构建的全流程,逻辑清晰、生动形象。
star2017
1年前
7083
0
关于如何解释机器学习的一些方法
在这篇文章中出现的每一个技巧里,『可解释性』都被解构为几个更基本的方面:模型复杂程度,特征尺度,理解,信任 —— 接下来我首先就来简单对这几点做个介绍。
star2017
1年前
6259
0
基于深度学习的目标检测算法综述:常见问题及解决方案
基于深度学习的目标检测算法综述分为三部分:1. Two/One stage 算法改进。2. 解决方案。3. 扩展应用、综述。
star2017
1年前
3443
0
随机之美——机器学习中的随机森林模型
摘要:随机森林和决策树相比,能更好的防止过拟合。虽然每个基分类器很弱,但最后组合的结果通常很强,这也类似于:“三个臭皮匠顶个诸葛亮”的思想。对比发现Random Forest(随机森林)和SVM(支持向量机)名列第一、第二名。 01 树与森林 在构建决策树的时候,可以让树进行完全生长,也可以通过参数控制树的深度或者叶子节点的数量,通常完全生长的树会带来过拟合…
star2017
1年前
7318
0
如何对应用程序的用户数据进行定量分析
摘要:本文讨论一些实用的定量分析技术,帮读者面对移动用户数据“大胆假设,谨慎求证”,达到增加用户数量并获取市场份额的目的。第一篇文章(https://www.afenxi.com/8767.html)介绍了掌握用户数据的基础理念。 数据科学关注查找噪声中隐藏的信号。这一点说起来容易做起来难,但无需依靠众多数据专家即可实现。本文介绍的定量分析技术是非常实用的入…
star2017
1年前
8441
0
数据可视化入门:六种基本图表的特点和适用场合
摘要:”数据可视化”可以帮助用户理解数据,一直是热门方向。 图表是”数据可视化”的常用手段,其中又以基本图表—-柱状图、折线图、饼图等等—-最为常用。 用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合(数据集)?恐怕答得上来的人就不多了。 本文是电子书《Data V…
star2017
1年前
2998
0
乳腺癌预测模型只有白人女性数据,MIT刚刚把它扩展到了所有族裔
乳腺癌预测模型只有白人女性数据,MIT刚刚把它扩展到了所有族裔。
star2017
1年前
7718
0
你真的对你构建的ML模型足够了解么?
我们真的了解在我们构建的ML模型中发生了什么吗?让我们来探索吧。
star2017
1年前
6464
0
TensorFlow 中最大的 30 个机器学习数据集
作者:Limarc Ambalina 编译:ronghuaiyang 导读: 包括图像,视频,音频,文本,非常的全。 [图片] 由谷歌 Brain 的研究人员创建的 TensorFlow 是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台,适用于初学者和有经验的数据科学家。Tenso ....
star2017
1年前
2419
0
20万、50万、100万的算法工程师,到底有什么区别?
作者:北冥乘海生 来自:https://zhuanlan.zhihu.com/p/27072134 公元七世纪,在车迟国国家气象局组织的一次求雨活动中,虎力、鹿力、羊力三位大仙成功地祈下甘霖,于水火中救了黎民。老国王虽然不明就里,却从此尊他们为国师,奉道教为圭臬。 本世纪,算法工程师们的境遇也差不多:早些年,信奉糙快猛主义的大佬们觉得他们饱食终日、无所用心,…
star2017
1年前
6777
0
趣味数据挖掘系列5:听妈妈讲过去的故事,分房与分类
故事中没有月亮、云朵和晚风,却有关于数据挖掘中的分类技术的启示;虽然,现在不再分福利房了,但此故事既回顾历史,也解释了分类技术若干要点,有参考价值。
star2017
1年前
5837
0
最流行的4个机器学习数据集
机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。
star2017
1年前
6474
0
Word2Vec揭秘: 这是深度学习中的一小步,却是NLP中的巨大跨越
Word2Vec模型用于学习被称为“词嵌入”的词的向量表示。这通常是作为预处理步骤来完成的,在此之后,学习到的向量被输入判别模型(通常是RNN)来生成预测,完成各种各样有趣的事情。
star2017
1年前
7603
0
1
2
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
SpringBoot2实践系列(六):集成监控模块Actuator详解
5.
史上最全的“大数据”学习资源(上)
6.
一篇文章,带你了解美国大数据产业
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
新技术名词
2.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
3.
centos docker 安装opensearch
4.
centos docker安装redis
5.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
6.
paddlenlp实现关系抽取
最新评论
签到
?
签到
签到
签到,学习
签到