×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
零基础入门数据挖掘——数据分析实战
作者:王瑞楠,Datawhale 优秀学习者 转载地址 摘要:对于数据挖掘项目,本文将学习应该从哪些角度分析数据?如何对数据进行整体把握,如何处理异常值与缺失值,从哪些维度进行特征及预测值分析? 探索性数据分析(Exploratory Data Analysis,EDA)是指对已有数据在尽量少的先验 ....
star2017
博客
1年前
11445
0
黑盒模型实际上比逻辑回归更具可解释性
作者:Samuele Mazzanti 编译:ronghuaiyang 导读: 如何让复杂的模型具备可解释性,SHAP 值是一个很好的工具,但是 SHAP 值不是很好理解,如果能将 SHAP 值转化为对概率的影响,看起来就很舒服了。 [图片] 在可解释性和高性能之间的永恒的争斗 从事数据科学工作的人 ....
star2017
博客
1年前
8299
0
TP-LINK 提前批(图像算法岗)6 月 7 日 -6 月 8 日 面试题 6 道
[图片] [图片]
star2017
博客
1年前
11345
0
58 同城 | 深度召回在招聘推荐系统中的挑战和实践
[图片] 分享嘉宾:李祖定 58 同城 算法架构师 编辑整理:郭嘉伟 内容来源:58 推荐系统技术沙龙 出品平台:DataFunTalk 导读: 招聘业务是多行为场景,用户需求和交互周期短、行为稀疏。本次分享基于业务挑战,将介绍代价敏感、向量检索等技术在招聘深度召回中的应用,最后总结实践中的教训与心 ....
star2017
博客
1年前
5731
0
AIQ - 干货 | Elasticsearch 趋势科技实战分享笔记
少啰嗦,直接看东西。 1、Elasticsearch 索引的设计 1.1 单一索引还是基于时间的索引? [图片] 单一索引的问题: 1)不能更新 Mapping。 比如:主分片数不可以修改(除非 reindex)。 2)无法灵活、快速地扩展。 3)更适合固定、小型数据集。 基于时间的索引面临的问题: ....
star2017
博客
1年前
1463
0
IJCAI 2019 | 为推荐系统生成高质量的文本解释:基于互注意力机制的多任务学习模型
转自: 微软研究院 AI 头条 编者按:在个性化推荐系统中,如果能在提高推荐准确性的同时生成高质量的文本解释,将更容易获得用户的“芳心”。然而,现有方法通常将两者分开优化,或只优化其中一个目标。为了同时兼顾二者,微软亚洲研究院社会计算组结合认知科学的相关理论,提出了基于互注意力的多任务模型,并用充分 ....
star2017
博客
1年前
5452
0
阿里广告 CTR 预估中用户行为学习和记忆建模
[图片] 分享嘉宾:擎苍 阿里巴巴 算法专家 编辑整理:陈晟 内容来源:大鱼技术沙龙 出品平台:DataFun 导读: CTR 预估是计算广告的底层通用技术,在 CPC/OCPC 营销模式下,预估准确性对广告主流量采买成本和平台变现效率有着非常重要的作用。我们在业界常用解法基础上,纳入时间维度和空间 ....
star2017
博客
1年前
7633
0
零基础入门数据挖掘——特征工程实战
作者:吴忠强,Datawhale 优秀学习者 转载地址 系列文章: https://www.6aiq.com/article/1586105589491 摘要:对于数据挖掘项目,本文将学习应该从哪些角度做特征工程?从哪些角度做数据清洗,如何对特征进行增删,如何使用 PCA 降维技术等。 特征工程(F ....
star2017
博客
1年前
6972
0
Lucene 源码系列—— PackedInts
原文地址: https://www.amazingkoala.com.cn/Lucene/yasuocunchu/2019/1217/118.html 为了能节省空间,Lucene 使用 PackedInts 类对 long 类型的数据进行压缩存储,基于内存使用率(memory-efficien ....
star2017
博客
1年前
1558
0
SHAP 值的解释,以一种你期望的方式解释给你听
作者:Samuele Mazzanti 编译:ronghuaiyang 正文共:3096 字 13 图 英文原文:https://towardsdatascience.com/shap-explained-the-way-i-wish-someone-explained-it-to-me-ab81c ....
star2017
博客
1年前
8272
0
邀请函 |7 月 10 日,九章云极 DataCanvas 邀您相约世界人工智能大会
2021 年世界人工智能大会(WAIC)将于 7 月 7 日-10 日在上海举办,本届大会继续秉持「智联世界」的理念,以「众智成城」为主题,促进全球人工智能创新思想、技术、应用、人才和资本的集聚和交流,推动全球科技的创新协同,助力打造人工智能世界级产业集群。 [图片] 7 月 10 日,由世界人工智 ....
star2017
博客
1年前
5510
0
6 个你应该用用看的用于文本分类的最新开源预训练模型
作者:PURVA HUILGOL 编译:ronghuaiyang 英文原文:https://www.analyticsvidhya.com/blog/2020/03/6-pretrained-models-text-classification/ 导读: 文本分类是 NLP 的基础任务之一,今天给大 ....
star2017
博客
1年前
9499
0
零基础入门数据挖掘——建模调参
作者:徐韬 ,Datawhale 优秀学习者 系列文章: https://www.6aiq.com/article/1586106887770 https://www.6aiq.com/article/1586105589491 摘要:对于数据挖掘项目,本文将学习如何建模调参?从简单的模型开始,如何 ....
star2017
博客
1年前
6790
0
Lucene 源码系列——DirectWriter&&DirectReader
原文:https://www.amazingkoala.com.cn/Lucene/2019/1205/115.html 阅读本篇文章需要前置内容:BulkOperationPacked,下文中会列出在文章 BulkOperationPacked 中涉及的代码,但是不会展开介绍。 DirectW ....
star2017
博客
1年前
998
0
灵魂匹配:陌生社交 Soul 的增长机制
[图片] 文章作者:姚凯飞 内容来源:阅读以明智 导读: Soul 作为“灵魂社交”的先行者,这两年发展稳健,不管是用户规模还是产品 ROI 都有非常不错的表现。一直以来,人类底层的社交需求并没有太大变化,但是时代发展,代际更迭为新的产品带来了新机遇。作为非常受 95 后欢迎的产品, Soul 抓住 ....
star2017
博客
1年前
6923
0
百度搜索稳定性问题分析的故事(上)
[图片] 导读: 百度搜索系统是百度历史最悠久、规模最大并且对其的使用已经植根在大家日常生活中的系统。坊间有一种有趣的做法:很多人通过打开百度搜索来验证自己的网络是不是通畅的。这种做法说明百度搜索系统在大家心目中是“稳定”的代表,且事实确是如此。百度搜索系统为什么具有如此高的可用性?背后使用了哪些技 ....
star2017
博客
1年前
2890
0
塔勒布《反脆弱》读后感
关于作者 作者纳西姆·尼古拉斯·塔勒布的两部超级畅销书《随机漫步的傻瓜》和《黑天鹅》,已经成为华尔街投资人士必读的经典著作。其本人也曾因成功预测金融危机,做空美股而名声大噪。他一生专注于研究运气、不确定性、概率和知识。之前在樊登一个演讲中,听他给了《反脆弱》这本书极高的评价,只好百忙之中拜读一番。 ....
star2017
博客
1年前
4121
0
互联网智能广告系统简易流程与架构 |
很多朋友估计没有做过这一块,争取最简洁的语言描述清楚。 一、业务简述 [图片] 从业务上看 整个智能广告系统,主要分为: 1)业务端:广告主的广告后台 2)展现端:用户实际访问的页面 业务端,广告主主要有两类行为: 1)广告设置行为:例如设置投放计划,设置地域,类别,关键字,竞价等 2)效果查看行为 ....
star2017
博客
1年前
9752
0
解密商业化广告投放平台技术架构
转载自 DataFunTalk 社区 大家可以关注他们的公众号, 内容很干货 导读: 互联网广告是流量商业变现的重要途径之一,涉及服务平台、检索引擎、算法策略、数据工程等多个方向。本次分享的主题为商业化广告投放平台技术架构,分享的内容集中在工程领域,结合业界广告投放平台的通用技术范式,分享智能营销平 ....
star2017
博客
1年前
7554
0
用户画像——标签聚类
作者:超人赵,人工智能爱好者社区专栏作者 知乎: https://www.zhihu.com/people/chao-ji-sai-ya-ren/posts 链接推送: 如何构建用户画像—打用户行为标签 用户画像——数据质量管理 这次想继续和大家聊聊用户画像。用户画像是个体系性比较强的内容模块,分一 ....
star2017
博客
1年前
10338
0
1
...
419
420
421
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到