×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
如何正确拆分数据集?常见的三种方法总结
将数据集分解为训练集,可以帮助我们了解模型,这对于模型如何推广到新的看不见数据非常重要。 如果模型过度拟合可能无法很好地概括新的看不见的数据。因此也无法做出良好的预测。 拥有适当的…
star2017
博客
1年前
245
0
Elasticseach:从微服务架构演变到大宽表思维的架构转变
序言 [图片] 图示:Elasticsearch 在DB-Engine综合排名第8 Elasticsearch 简称'ES”, 在DB-Engine 综合排名第8,已经持续了相当长的时间,按照当下热度应该会继续保持或者上升一个名次;ES在多数工程师印象中最深刻可能是ELK三件套或者全文检索领域,但在 ....
star2017
博客
1年前
306
0
阿里技术 | 深度解读 RocketMQ 存储机制
[图片] 作 者 | 斜阳 来 源 | 阿里巴巴中间件团队 RocketMQ 实现了灵活的多分区和多副本机制,有效的避免了集群内单点故障对于整体服务可用性的影响。存储机制和高可用策略是 RocketMQ 稳定性的核心,社区上关于 RocketMQ 目前存储实现的分析与讨论一直是一个热议的话题。本文想 ....
star2017
博客
1年前
694
0
达观数据 | 王文广:FMEA 知识图谱的构建与应用实践
[图片] 分享嘉宾:王文广 达观数据 副总裁 编辑整理:王吉东 昆仑数据 出品平台:DataFunTalk 导读: 知识图谱是认知智能的核心技术,是企业获得持续竞争优势的关键技术。而产品质量和生成可靠性是智能制造的生命线,FMEA是质量和可靠性工程的关键方法。知识图谱和 FMEA 的融合所爆发的能量 ....
star2017
博客
1年前
1256
0
热度排行榜:时间衰减模型之牛顿冷却定律
对于新业务,通常由于样本有限或资源有限,无法构建复杂的模型。这个阶段最好的解决办法就是基于先前的经验或对有限样本进行数据分析提出一些简单的冷启动策略。 热门排行榜是最常见的冷启动策…
star2017
博客
1年前
210
0
数据分析必备的统计学知识大梳理!
我经常在文章中讲,做数据分析离不开统计学知识,它为我们的数据分析提供理论基础,然而很多数据分析师在学习统计学知识时感到头疼,看了很多统计学的书籍,里面讲了很多复杂的数学公式和推导,…
star2017
博客
1年前
349
0
数据分析之ABTESTING实战(附PYTHON代码)
目录 1、增长黑客 1)前言 2)运用分析指标框架,驱动互联网产品和运营 3)增长黑客大致分为如下几个步骤 2、AB testing介绍 1)AB testing对比方案图示展示 …
star2017
博客
1年前
352
0
【商业分析】为产品找一个完美指标
本文约1200字,阅读时间3分钟。本文转载自“米妮老师”公众号文章。欢迎转载,请注明出处。 引用某管理学大师的名言:如果你不能衡量它,那么你就不能有效增长它。 商业分析师在面试中经…
star2017
博客
1年前
98
0
【面试套路】如何回答商业分析师CaseInterview
大家好,我是Minnie。在商业分析师(Business Analyst,简称BA)这个行业我干了不少年,认识了不少相似背景的同行,也认识了许多不同背景的同学。 米妮 Linked…
star2017
博客
1年前
218
0
一文读懂推荐系统负采样
作者简介:潘星宇,中国人民大学信息学院硕士一年级在读,研究方向为推荐系统。 引言:推荐系统负采样作为推荐模型训练的重要一环,对模型的训练效果有着重要影响,也是推荐系统领域的一个重要…
star2017
博客
1年前
2015
0
推荐系统之SVD:奇异值分解
概述 奇异值分解 (Singular Value Decomposition),是一种矩阵分解技术,经常用于机器学习降维处理。它通过将空间维度从 N 维减少到 K 维(其中 K&l…
star2017
博客
1年前
262
0
功能强大的python包(四):OpenCV
1. OpenCV简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上…
star2017
博客
1年前
166
0
功能强大的python包(五):sklearn
1. sklearn简介 sklearn是基于python语言的机器学习工具包,是目前做机器学习项目当之无愧的第一工具。 sklearn自带了大量的数据集,可供我们练习各种机器学习…
star2017
博客
1年前
223
0
聊聊样本采样技术
作者 大可 华东理工大学 计算机应用技术博士 本人在腾讯/微信从事推荐系统相关工作,会将平时遇到的业务问题和相应的解决方案总结成公众号文章,感兴趣的可以关注本人公众号:泛函的范 在…
star2017
博客
1年前
163
0
机器学习建模工具PyCaret详讲
机器学习建模工具 PYCARET 1 PyCaret 1.0.0简介 2 PyCaret入门 3 获取数据 4 搭建环境 4.1 预处理介绍 4.2 采样与拆分 4.2.1 训练/…
star2017
博客
1年前
391
0
用Minitab进行田口分析案例:晶体外延层生长实验
当前的设置造成的偏差超过了指定的1.0微米,于是试验人员需要找出可以设置的过程因子使得外延层的不均匀性达到最小,同时确保平均厚度尽可能接近目标值。
star2017
博客
1年前
644
0
网易云音乐模型预估系统建设与实践
作者:大人物 1. 什么是预估系统? 预估系统的核心任务是完成模型计算,可以认为模型就是一个函数( **举例:f(x1, x2)= ax1 + bx2 +c** )。其中参数a、b、c是通过模型训练得出的权重值,自变量x1与x2就是特征,模型计算就是使用自变量x1与x2求解的过程。 因此预估框架需要 ....
star2017
博客
1年前
2292
0
钱大妈基于 Flink 的实时风控实践
摘要: 本文作者彭明德,介绍了钱大妈与阿里云 Flink 实时计算团队共建实时风控规则引擎,精确识别羊毛党以防营销预算流失 一、项目背景 目前钱大妈基于云原生大数据组件(DataWorks、MaxCompute、Flink、Hologres)构建了离线和实时数据一体化的全渠道数据中台,为各业务线提供 ....
star2017
博客
1年前
827
0
算法如何高效表达图计算?亚马逊云科技 DGL 图学习平台介绍
[图片] 分享嘉宾:王敏捷博士 亚马逊云科技 编辑整理:宋佳林 中国人民公安大学 出品平台:DataFunTalk 导读: 本次分享题目为高效、易用、开放的图深度学习平台DGL介绍及展望,主要内容包括以下几大方面: 图数据和图神经网络 DGL的优势 未来规划 01图数据和图神经网络 1. 图数据无处 ....
star2017
博客
1年前
1213
0
于晓路:贯穿事前事中事后,图计算在信贷反欺诈的探索和实践
[图片] 分享嘉宾:于晓路 蚂蚁集团 编辑整理:吴建华 电子科技大学 出品平台:DataFunTalk 导读: 近年来,大数据等新技术快速发展,推动金融信贷业迈向智能化、数字化时代。以AI为技术支撑,构建信贷“智慧大脑”,实现了信贷业务全流程管控和授信客户评级模型优化,降低信贷管理风险,增强了风险防 ....
star2017
博客
1年前
1221
0
1
...
48
49
50
...
472
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
史上最全的“大数据”学习资源(上)
5.
onlyoffice 20并发限制处理,up to 20 maximum
6.
SpringBoot2实践系列(六):集成监控模块Actuator详解
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
PG赏金女王热血来袭!化身女海盗,踏上海上传奇之路
2.
沙尔克04挑战汉堡:锋利的攻势能否撬动防线?
3.
《辐射76》全新钓鱼玩法上线,看看这款bbin免费内容到底有多好玩
4.
体验经典麻将魅力,尽在PG《麻将胡了》现代转轴!
5.
真正的“走路模拟器”来了!《一步一脚印》9/9上线,bbin要你慢下来玩游戏
6.
祝福不只嘴上说!爆款CQ9《寿星大发》用奖金说话
最新评论
签到
?
签到
签到
签到,学习
签到