×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
干货篇 | 58 同城:向量化召回上的深度学习实践
分享嘉宾: 彭小钰,58 同城 TEG 搜索推荐部高级算法工程师 整理出品: AICUG 人工智能社区 PPT 下载:http://www.aicug.cn/#/docs https://img.6aiq.com/0b78mmaaqaaae4akpakuyvqfay6dbbrqacaa.f10002 ....
star2017
博客
1年前
11036
0
机器学习中如何处理不平衡数据?
准确率高达 96.2% 的模型跑在真实数据上却可能完全无法使用。一个可能的原因是:你所使用的训练数据是不平衡数据集。本文介绍了解决不平衡类分类问题的多种方法。 假设老板让你创建一个模型——基于可用的各种测量手段来预测产品是否有缺陷。你使用自己喜欢的分类器在数据上进行训练后,准确率达到了 96.2%! ....
star2017
博客
1年前
9937
0
我们该如何学习机器学习中的数学
数学在机器学习中非常重要,不论是在算法上理解模型代码,还是在工程上构建系统,数学都必不可少。通常离开学校后很难有机会静下心学习数学知识,因此我们最好能通过阅读小组或读书会等形式营造环境,并专注学习那些在实践中常常需要用到的数学知识。 数学达到什么水平才可以开始机器学习?人们并不清楚,尤其是那些在校期 ....
star2017
博客
1年前
9621
0
Lucene 源码系列——索引文件的生成(十一)之 dim&&dii(Lucene 8.4.0)
本文承接索引文件的生成(十),继续介绍剩余的内容,为了便于下文的介绍,先给出生成索引文件.dim&&.dii 的流程图以及流程点 构建BKD树的节点值(node value) 的流程图: 图 1: [图片] 图 2: [图片] 第一次更新 parentSplits 数组 图 3: ....
star2017
博客
1年前
976
0
爱奇艺数据中台的建设实践
分享嘉宾:马金韬 爱奇艺 数据中台负责人 编辑整理:陈国梅 出品平台:DataFunTalk 导读: 随着市场对数据价值的认可,促进了数据在各行各业的爆发式增长,以及大数据设施的快速演化,同时也带来了不少新的数据问题;解决这些问题,发挥更大的数据价值,成为了各大公司的重点工作。爱奇艺通过数据中台的建 ....
star2017
博客
1年前
8580
0
深度长文:中文分词的十年回顾
[图片] _本文作者:上海交通大学赵海、蔡登,清华大学黄昌宁,香港城市大学揭春雨 _ 转载请联系原作者 本文回顾了中文分词在 2007-2017 十年间的技术进展,尤其是自深度学习渗透到自然语言处理以来的主要工作。我们的基本结论是,中文分词的监督机器学习方法在从非神经网络方法到神经网络方法的迁移中尚 ....
star2017
博客
1年前
9176
0
AIQ | NLP 算法工程师的学习、成长和实战经验
我们本次分享主要分为六个小节,分别为: 1.NLP 解决什么问题; 2.NLP 算法发展简史; 3.检索式问答系统的语义匹配模型; 4.任务型对话系统背后的算法实例; 5.创业公司 NLP 工程师的工作职责; 6.NLP 算法工程师面试注意事项; 其中前两个小节主要大概讲述一下 NLP 这个学科它解 ....
star2017
博客
1年前
9008
0
BERT, ELMo, & GPT-2: 这些上下文相关的表示到底有多上下文化?
作者:Kawin Ethayarajh 编译:ronghuaiyang 原文: 英文原文:https://kawine.github.io/blog/nlp/2020/02/03/contextual.html 导读: 具有上下文信息的词表示到底有多大程度的上下文化?这里给出了定量的分析。 将上下文 ....
star2017
博客
1年前
11318
0
棚改 - 三四线楼市再无未来
作者:三个火枪手 来源:格隆汇 APP 格隆汇 APP 原创首发,十档行情 Level-2 免费送! “我不种田了!” 2016 年初的一天,十八线的老舅在电话里说,“村里搞棚户区改造,搬到镇上住了,离庄稼地太远了,你表哥叫我别种了。” 我盯着熔断的上证 K 线,强作开心地跟老舅说,“那很好啊!” ....
star2017
博客
1年前
3944
0
Lucene 源码系列——多个 MUST 的 Query 的倒排求交集
这种 Query 组合的文档号合并的代码是在 ConjunctionDISI 类中实现。本文通过一个例子来介绍文档号合并逻辑,这篇文章中对于每个关键字如何获得包含它的文档号,不作详细描述,大家可以去看我添加了详细注释的 ConjunctionDISI 类,相信能一目了然。GitHub 地址是: ....
star2017
博客
1年前
964
0
干货篇 | 观远数据:可解释机器学习原理及应用
分享嘉宾: 周远,观远数据联合创始人,首席科学家 整理出品: 张劲,AICUG 人工智能社区 PPT 下载:http://www.aicug.cn/#/docs https://img.6aiq.com/0b78puaawaaadaaasz2335qfa7odbn6qacya.f10002.mp4 ....
star2017
博客
1年前
9732
0
推荐系统系列(二):FFM 算法理论与实践
背景 在 CTR/CVR 预估任务中,除了 FM 模型[2] 之外,后起之秀 FFM(Field-aware Factorization Machine)模型同样表现亮眼。FFM 可以看作是 FM 的升级版,Yuchi Juan 于 2016 年提出该模型,但其诞生是受启于 Rendle 在 201 ....
star2017
博客
1年前
8995
0
Elasticsearch 的查询毛刺问题原因分析
如果业务对查询延迟很敏感,Elasticsearch 查询延迟中的毛刺现象就是比较困扰的一类问题,由于出现毛刺的时间点已经过去,无法稳定复现,对于根因的分析比较困难,无法用系统化调试的思想,从现象出发逐步推理,定位问题,能做的通常就是看一下监控系统对应时间点的指标情况,而在 es 中,导致查询延迟发 ....
star2017
博客
1年前
1248
0
项目经理: 在家远程办公如何提高工作效率?
为了减少人群聚集、防止交叉感染,很多企业延迟复工并响应国家“停工不停业、停课不停学“的号召,通过在家办公的方式陆续复工。在家,是帮助疫情平复;办公,是维护经济稳定。在特殊时期,远程办公成为企业保障日常经营的首选方式。今天与大家分享一下,在家办公,怎么高效完成远程工作。 在家办公最大的挑战,是远程之下 ....
star2017
博客
1年前
3165
0
Lucene 源码系列——多个 SHOULD 的 Query 的倒排求并集
文档号合并 本篇文章通过一个例子介绍如何对满足搜索要求的文档进行合并(筛选),详细的合并过程可以看我的源码注释,GitHub 地址是:https://github.com/luxugang/Lucene-7.5.0/blob/master/solr-7.5.0/lucene/core/src/jav ....
star2017
博客
1年前
835
0
推荐系统召回全能模型之:FM 模型
在推荐领域 CTR(click-through rate)预估任务中,最常用到的 baseline 模型就是 LR(Logistic Regression)。 对数据进行特征工程,构造出大量单特征,编码之后送入模型。这种线性模型的优势在于,运算速度快可解释性强,在特征挖掘完备且训练数据充分的前提下能 ....
star2017
博客
1年前
10462
0
AIQ - 从损失函数的角度详解机器学习算法之逻辑回归
源 | 机器学习算法全栈工程师 ID:Jeemy110 作者:章华燕 逻辑回归详解 分类是监督学习的一个核心问题,在监督学习中,当输出变量 Y 取有限个离散值时,预测问题便成为分类问题。这时,输入变量 X 可以是离散的,也可以是连续的。监督学习从数据中学习一个分类模型或分类决策函数,称为分类器(cl ....
star2017
博客
1年前
9129
0
爱奇艺短视频软色情识别技术解析
原文: 爱奇艺产品技术团队 随着 UGC 内容爆发式增长,信息流产品占领越来越多的用户时间。爱奇艺作为国内领先的互联网视频媒体,承担了正确引导用户价值观的社会责任。所以识别和屏蔽低俗内容、做好风险内容控制、净化短视频生态是一项非常值得重视的工作。下面我们从技术的角度,以“软色情识别”为例,介绍爱奇艺 ....
star2017
博客
1年前
9303
0
Lucene 源码系列——LRUQueryCache
原文地址: https://www.amazingkoala.com.cn/Lucene/Search/2019/0506/57.html LRUQueryCache 用来对一个 Query 查询的结果进行缓存,缓存的内容仅仅是文档号集,由于不会缓存文档的打分(Score),所以只有不需要打分 ....
star2017
博客
1年前
1066
0
贝壳找房一站式大数据开发平台实践
分享嘉宾:仰宗强 编辑整理:刘春龙 出品平台:DataFunTalk 导读: 本次分享嘉宾是来自贝壳大数据部门的仰宗强,详细介绍了针对贝壳的业务数据与需求的增长,逐步升级数据开发平台的探索实践过程,包括三次数据开发平台架构升级的细节。 本次主题分享,主要从下面 4 个方面进行介绍: 背景介绍 探索历 ....
star2017
博客
1年前
9185
0
1
...
399
400
401
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到