×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 数据集 共 30 个结果.
硅谷王川:深度学习有多深?经历的回放(23)
本文是 硅谷王川:深度学习有多深?发散的大脑(22) 的续篇。
star2017
1年前
4452
0
43种机器学习开源数据集(附地址/调用方法)
开源数据集!
star2017
1年前
3611
0
如何对应用程序的用户数据进行定量分析
摘要:本文讨论一些实用的定量分析技术,帮读者面对移动用户数据“大胆假设,谨慎求证”,达到增加用户数量并获取市场份额的目的。第一篇文章(https://www.afenxi.com/8767.html)介绍了掌握用户数据的基础理念。 数据科学关注查找噪声中隐藏的信号。这一点说起来容易做起来难,但无需依靠众多数据专家即可实现。本文介绍的定量分析技术是非常实用的入…
star2017
1年前
7482
0
数据可视化入门:六种基本图表的特点和适用场合
摘要:”数据可视化”可以帮助用户理解数据,一直是热门方向。 图表是”数据可视化”的常用手段,其中又以基本图表—-柱状图、折线图、饼图等等—-最为常用。 用户非常熟悉这些图表,但如果被问道,它们的特点是什么,最适用怎样的场合(数据集)?恐怕答得上来的人就不多了。 本文是电子书《Data V…
star2017
1年前
2690
0
乳腺癌预测模型只有白人女性数据,MIT刚刚把它扩展到了所有族裔
乳腺癌预测模型只有白人女性数据,MIT刚刚把它扩展到了所有族裔。
star2017
1年前
6376
0
你真的对你构建的ML模型足够了解么?
我们真的了解在我们构建的ML模型中发生了什么吗?让我们来探索吧。
star2017
1年前
5469
0
R语言不平衡数据分类指南
在对不平衡的分类数据集进行建模时,机器学习算法可能并不稳定,其预测结果甚至可能是有偏的,而预测精度此时也变得带有误导性。
star2017
1年前
4289
0
20万、50万、100万的算法工程师,到底有什么区别?
作者:北冥乘海生 来自:https://zhuanlan.zhihu.com/p/27072134 公元七世纪,在车迟国国家气象局组织的一次求雨活动中,虎力、鹿力、羊力三位大仙成功地祈下甘霖,于水火中救了黎民。老国王虽然不明就里,却从此尊他们为国师,奉道教为圭臬。 本世纪,算法工程师们的境遇也差不多:早些年,信奉糙快猛主义的大佬们觉得他们饱食终日、无所用心,…
star2017
1年前
6003
0
趣味数据挖掘系列5:听妈妈讲过去的故事,分房与分类
故事中没有月亮、云朵和晚风,却有关于数据挖掘中的分类技术的启示;虽然,现在不再分福利房了,但此故事既回顾历史,也解释了分类技术若干要点,有参考价值。
star2017
1年前
5301
0
最流行的4个机器学习数据集
机器学习算法需要作用于数据,而数据的本质则决定了应用的机器学习算法是否合适,而数据的质量也会决定算法表现的好坏程度。所以会研究数据,会分析数据很重要。
star2017
1年前
5666
0
Word2Vec揭秘: 这是深度学习中的一小步,却是NLP中的巨大跨越
Word2Vec模型用于学习被称为“词嵌入”的词的向量表示。这通常是作为预处理步骤来完成的,在此之后,学习到的向量被输入判别模型(通常是RNN)来生成预测,完成各种各样有趣的事情。
star2017
1年前
6766
0
TensorFlow 中最大的 30 个机器学习数据集
作者:Limarc Ambalina 编译:ronghuaiyang 导读: 包括图像,视频,音频,文本,非常的全。 [图片] 由谷歌 Brain 的研究人员创建的 TensorFlow 是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台,适用于初学者和有经验的数据科学家。Tenso ....
star2017
1年前
2229
0
数据平台维度模型设计十个技巧
这是一篇讲述维度数据模型设计的文章,偏向于数据平台而非数据分析,请读者根据自己的兴趣爱好阅读。
star2017
1年前
6843
0
深度学习在视觉上的局限性以及我们如何对付它们
深度学习在视觉领域取得了巨大的成功,即便如此,深度学习在视觉上仍然有很多的局限性,这篇文章从深度学习的历史开始说起,阐述了深度学习在视觉上的局限性,并给出了一些可能的方案。
star2017
1年前
3949
0
【R】如何确定最适合数据集的机器学习算法
摘要:抽查(Spot checking)机器学习算法是指如何找出最适合于给定数据集的算法模型。本文中我将介绍八个常用于抽查的机器学习算法,文中还包括各个算法的 R 语言代码,你可以将其保存并运用到下一个机器学习项目中。 适用于你的数据集的最佳算法 你无法在建模前就知道哪个算法最适用于你的数据集。你必须通过反复试验的方法来寻找出可以解决你的问题的最佳算法,我称…
star2017
1年前
6098
0
数据科学与机器学习的数据集
现在,我们面临着5-10年前的相反问题。那时,实际上很难找到数据科学和机器学习项目的数据集。从那时起,我们就被大量的数据集和列表淹没了。今天,问题不是寻找数据集,而是筛选数据集来保存相关数据集。好吧,...
star2017
1年前
9863
0
IBM开放源码Python工具包,用于检测和消除偏倚(30个度量,9个算法)
概述IBM已经开发了一套工具包来处理数据集和算法中的偏倚。该工具包包含30个公平性度量和9个最新的算法。Python代码和详细文档以及详细的安装说明可在GITHUB上获得。介绍偏倚是机器学习模型中的一...
star2017
1年前
7357
0
数据标注平台分析与使用经验
最近在做语音类的深度学习项目,手上有1000小时的数据需要标注,公司内部雇人标注是不太现实的,人员管理起来太麻烦,再加上项目比较紧急,所以找了几家数据标注平台,下面简单介绍一下吧。什么是数据标注平台众...
star2017
1年前
11360
0
构建谷歌数据集搜索,培育开放的数据生态系统
九月早些时候,谷歌启动了GoogleDatasetSearch,这个工具旨在让研究人员更容易发现可以帮助他们工作的数据集。我们俗称之为“GoogleScholarfordata”,GoogleData...
star2017
1年前
860
0
深度学习必备的几款流行网络与数据集
一。 常用网络 深度学习相关的几个比较著名的网络,AlexNet、VGG、GoogleNet、ResNet。 [图片] 从整体趋势来看,准确度越来越高,同时网络层数也越来越多,可以认为网络结构的复杂性带来效果的提高,而模型参数的数量并非越多越好,合适就好,参数数量太多可能会一定程度上导致过拟合问题。 ....
star2017
1年前
8425
0
1
2
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
中文版onlyoffice/documentserver镜像制作
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
沙尔克04挑战汉堡:锋利的攻势能否撬动防线?
2.
PG赏金女王热血来袭!化身女海盗,踏上海上传奇之路
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到