×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
古文赏析
标签
毒鸡汤
登录
注册
vivo 技术|Elasticsearch 在地理信息空间索引的探索和演进
vivo 互联网服务器团队- Shuai Guangying 本文梳理了Elasticsearch对于数值索引实现方案的升级和优化思考,从2015年至今数值索引的方案经历了多个版本的迭代,实现思路从最初的字符串模拟到KD-Tree,技术越来越复杂,能力越来越强大,应用场景也越来越丰富。从地理位置信息 ....
star2017
博客
1年前
825
0
Java数字转化为单位为万或亿
public static String formatNumberWithUnit(String needFormatNumber) { final String noNumDefaultValue = "0"; if (!NumberUtils...
wylc123
随笔
1年前
626
0
如何正确拆分数据集?常见的三种方法总结
将数据集分解为训练集,可以帮助我们了解模型,这对于模型如何推广到新的看不见数据非常重要。 如果模型过度拟合可能无法很好地概括新的看不见的数据。因此也无法做出良好的预测。 拥有适当的…
star2017
博客
1年前
292
0
Elasticseach:从微服务架构演变到大宽表思维的架构转变
序言 [图片] 图示:Elasticsearch 在DB-Engine综合排名第8 Elasticsearch 简称'ES”, 在DB-Engine 综合排名第8,已经持续了相当长的时间,按照当下热度应该会继续保持或者上升一个名次;ES在多数工程师印象中最深刻可能是ELK三件套或者全文检索领域,但在 ....
star2017
博客
1年前
356
0
阿里技术 | 深度解读 RocketMQ 存储机制
[图片] 作 者 | 斜阳 来 源 | 阿里巴巴中间件团队 RocketMQ 实现了灵活的多分区和多副本机制,有效的避免了集群内单点故障对于整体服务可用性的影响。存储机制和高可用策略是 RocketMQ 稳定性的核心,社区上关于 RocketMQ 目前存储实现的分析与讨论一直是一个热议的话题。本文想 ....
star2017
博客
1年前
877
0
达观数据 | 王文广:FMEA 知识图谱的构建与应用实践
[图片] 分享嘉宾:王文广 达观数据 副总裁 编辑整理:王吉东 昆仑数据 出品平台:DataFunTalk 导读: 知识图谱是认知智能的核心技术,是企业获得持续竞争优势的关键技术。而产品质量和生成可靠性是智能制造的生命线,FMEA是质量和可靠性工程的关键方法。知识图谱和 FMEA 的融合所爆发的能量 ....
star2017
博客
1年前
1584
0
热度排行榜:时间衰减模型之牛顿冷却定律
对于新业务,通常由于样本有限或资源有限,无法构建复杂的模型。这个阶段最好的解决办法就是基于先前的经验或对有限样本进行数据分析提出一些简单的冷启动策略。 热门排行榜是最常见的冷启动策…
star2017
博客
1年前
257
0
数据分析必备的统计学知识大梳理!
我经常在文章中讲,做数据分析离不开统计学知识,它为我们的数据分析提供理论基础,然而很多数据分析师在学习统计学知识时感到头疼,看了很多统计学的书籍,里面讲了很多复杂的数学公式和推导,…
star2017
博客
1年前
418
0
数据分析之ABTESTING实战(附PYTHON代码)
目录 1、增长黑客 1)前言 2)运用分析指标框架,驱动互联网产品和运营 3)增长黑客大致分为如下几个步骤 2、AB testing介绍 1)AB testing对比方案图示展示 …
star2017
博客
1年前
411
0
【商业分析】为产品找一个完美指标
本文约1200字,阅读时间3分钟。本文转载自“米妮老师”公众号文章。欢迎转载,请注明出处。 引用某管理学大师的名言:如果你不能衡量它,那么你就不能有效增长它。 商业分析师在面试中经…
star2017
博客
1年前
127
0
【面试套路】如何回答商业分析师CaseInterview
大家好,我是Minnie。在商业分析师(Business Analyst,简称BA)这个行业我干了不少年,认识了不少相似背景的同行,也认识了许多不同背景的同学。 米妮 Linked…
star2017
博客
1年前
277
0
一文读懂推荐系统负采样
作者简介:潘星宇,中国人民大学信息学院硕士一年级在读,研究方向为推荐系统。 引言:推荐系统负采样作为推荐模型训练的重要一环,对模型的训练效果有着重要影响,也是推荐系统领域的一个重要…
star2017
博客
1年前
2640
0
推荐系统之SVD:奇异值分解
概述 奇异值分解 (Singular Value Decomposition),是一种矩阵分解技术,经常用于机器学习降维处理。它通过将空间维度从 N 维减少到 K 维(其中 K&l…
star2017
博客
1年前
317
0
功能强大的python包(四):OpenCV
1. OpenCV简介 OpenCV是一个基于BSD许可(开源)发行的跨平台计算机视觉和机器学习软件库,可以运行在Linux、Windows、Android和Mac OS操作系统上…
star2017
博客
1年前
207
0
功能强大的python包(五):sklearn
1. sklearn简介 sklearn是基于python语言的机器学习工具包,是目前做机器学习项目当之无愧的第一工具。 sklearn自带了大量的数据集,可供我们练习各种机器学习…
star2017
博客
1年前
271
0
聊聊样本采样技术
作者 大可 华东理工大学 计算机应用技术博士 本人在腾讯/微信从事推荐系统相关工作,会将平时遇到的业务问题和相应的解决方案总结成公众号文章,感兴趣的可以关注本人公众号:泛函的范 在…
star2017
博客
1年前
206
0
机器学习建模工具PyCaret详讲
机器学习建模工具 PYCARET 1 PyCaret 1.0.0简介 2 PyCaret入门 3 获取数据 4 搭建环境 4.1 预处理介绍 4.2 采样与拆分 4.2.1 训练/…
star2017
博客
1年前
442
0
用Minitab进行田口分析案例:晶体外延层生长实验
当前的设置造成的偏差超过了指定的1.0微米,于是试验人员需要找出可以设置的过程因子使得外延层的不均匀性达到最小,同时确保平均厚度尽可能接近目标值。
star2017
博客
1年前
789
0
网易云音乐模型预估系统建设与实践
作者:大人物 1. 什么是预估系统? 预估系统的核心任务是完成模型计算,可以认为模型就是一个函数( **举例:f(x1, x2)= ax1 + bx2 +c** )。其中参数a、b、c是通过模型训练得出的权重值,自变量x1与x2就是特征,模型计算就是使用自变量x1与x2求解的过程。 因此预估框架需要 ....
star2017
博客
1年前
2974
0
钱大妈基于 Flink 的实时风控实践
摘要: 本文作者彭明德,介绍了钱大妈与阿里云 Flink 实时计算团队共建实时风控规则引擎,精确识别羊毛党以防营销预算流失 一、项目背景 目前钱大妈基于云原生大数据组件(DataWorks、MaxCompute、Flink、Hologres)构建了离线和实时数据一体化的全渠道数据中台,为各业务线提供 ....
star2017
博客
1年前
1071
0
1
...
48
49
50
...
472
本文目录
热门标签
广告位
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
远程调试工具charles
2.
mysql json类型字段使用记录
3.
基于Dockerfile生成镜像相关命令
4.
本地部署MineRu解析pdf、docx、excel等文档
5.
新技术名词
6.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
最新评论
签到
?
签到
签到
签到,学习
签到