×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
算法工程师必须要知道的面试技能雷达图
原文地址: https://zhuanlan.zhihu.com/p/54089811 今年是我作为算法工程师工作的第七个年头,期间拿到过 hulu,阿里巴巴,腾讯,美团以及一些 startup 的算法工程师 offer,也作为面试官面试过清北,海外,北邮,以及一些二本学校等不同背景的百余位 can ....
star2017
博客
1年前
9306
0
详解 Embeddings at Alibaba(KDD 2018)
文章转载自知乎: https://zhuanlan.zhihu.com/p/56119617 论文发表在 KDD 2018 上,链接为 Learning and Transferring IDs Representation in E-commerce,文章属于实际应用,有些 insight,值得读 ....
star2017
博客
1年前
11128
0
论文|Airbnb Embedding 的实践和思考
以下文章来源于搜索与推荐 Wiki ,作者 Thinkgamer 其实在 19 年初的时候大概看了一下这篇论文,但当时其实理解的并不深,今天再读的时候发现这里边其实包含了很多东西,不仅是学术性的目标函数优化,也包括工程性的取舍和特征的构造。 本文分为两部分,第一部分主要介绍论文,第二部分谈从中的收获 ....
star2017
博客
1年前
994
0
构造 IndexWriter 对象(八)
构造 IndexWriter 对象(七) 构造 IndexWriter 对象(六) 构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 IndexWriter 对象(一) 本 ....
star2017
博客
1年前
1091
0
Lucene 解析 - 基本概念
前言 Apache Lucene 是一个开源的高性能、可扩展的信息检索引擎,提供了强大的数据检索能力。Lucene 已经发展了很多年,其功能越来越强大,架构也越来越精细。它目前不仅仅能支持全文索引,也能够提供多种其他类型的索引方式,来满足不同类型的查询需求。 基于 Lucene 的开源项目有很多,最 ....
star2017
博客
1年前
3277
0
百度事件知识图谱技术与应用
[图片] 分享嘉宾:陈玉光 百度 资深研发工程师 编辑整理:叶祺 出品平台:DataFunTalk 导读: 目前百度事件图谱已构建了千万级规模的事件图谱,在收录时效上达到分钟级。事件图谱技术已应用到搜索、信息流等百度内部的产品中,相关能力也对外输出到媒体等多个行业。另外,事件图谱的前沿推理技术在金融 ....
star2017
博客
1年前
8971
0
构造 IndexWriter 对象(九)
构造 IndexWriter 对象(八) 构造 IndexWriter 对象(七) 构造 IndexWriter 对象(六) 构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 IndexWriter 对象(二) 构造 ....
star2017
博客
1年前
1336
0
Lucene 查询原理
本文转载自 阿里云栖社区 前言 Lucene 是一个基于 Java 的全文信息检索工具包,目前主流的搜索系统 Elasticsearch 和 Solr 都是基于 lucene 的索引和搜索能力进行。想要理解搜索系统的实现原理,就需要深入 lucene 这一层,看看 lucene 是如何存储需要检索的 ....
star2017
博客
1年前
6328
0
58 同城 | 商业数据仓库建设实践
[图片] 分享嘉宾:钟云云 58 同城 数据架构师 编辑整理:李凯凯 出品平台:DataFunTalk、AI 启蒙者 导读: 早在多年以前在 Hadoop 系列分布式计算与存储、消息中间件还没有成熟的时候,数据仓库主要基于 Oracle 的数仓建设。但随着时间的推移,传统数据仓库的数据计算与存储,已 ....
star2017
博客
1年前
2005
0
汽车之家如何构建用户画像
谈到用户画像,大体可以用俩个词概述'persona' 和 'profile'。两者区别在于使用者的差异。Persona 也叫做用户角色,是描绘抽象一个自然人的属性,主要是讨论产品、需求、场景、用户体验的时候使用。Profile 是和数据挖掘、大数据息息相关的应用,通过数据建立描绘用户的标签,主要是运 ....
star2017
博客
1年前
7795
0
构造 IndexWriter 对象(十)
构造 IndexWriter 对象(九) 构造 IndexWriter 对象(八) 构造 IndexWriter 对象(七) 构造 IndexWriter 对象(六) 构造 IndexWriter 对象(五) 构造 IndexWriter 对象(四) 构造 IndexWriter 对象(三) 构造 ....
star2017
博客
1年前
1359
0
超参数搜索不够高效?这几大策略了解一下
作者:Alessio Gozzoli 机器之心编译 参与:朱乾树、张倩 整天 babysitting 深度学习模型是不是很心累?这篇文章或许能帮到你。本文讨论了高效搜索深度学习模型最佳超参数集的动机和策略。作者在 FloydHub 上演示了如何完成这项工作以及研究的导向。读完这篇文章后,你的数据科学 ....
star2017
博客
1年前
10565
0
用户画像实践:神策数据标签生产引擎架构
[图片] 分享嘉宾:王琛@神策数据 编辑整理:冯露 出品平台:DataFunTalk 导读: 用户画像是建立在数据基础之上的用户模型,是产品改进、精准营销等业务场景中不可或缺的重要基础。而构建用户画像的过程就是要给用户打上各种维度的标签,并基于标签进行定性或定量分析。这其中,建设灵活、全面、高效的标 ....
star2017
博客
1年前
1655
0
贝壳找房—【图数据库系列】之 JanusGraph VS Dgraph:贝壳分布式图数据库技术选型之路
一、背景 贝壳找房的核心业务场景主要是围绕人、房、客三者的属性与关系展开,是一个典型的图数据库应用场景。而基于此挖掘出的房产领域行业图谱已达到 500 亿三元组的量级。面对如此海量的数据,应该如何存储才能支持业务的高效查询?我们迫切需要一个高性能、高可用、可扩展的分布式图数据库平台。 二、图数据库简 ....
star2017
博客
1年前
1591
0
深入浅出词嵌入技术
本文概览: [图片] 本文又名《Distributed Representation: From Static Embedding to Contextualized Embedding》 [图片] 1. Classical Representation: One-hot Encoding 独热编码 ....
star2017
博客
1年前
8174
0
腾讯微信 | 看一看实时相关推荐,满足你对同主题文章的“意犹未尽”
作者: 微信 AI 团队 谢若冰等 导语 在推荐系统中,用户在一个时间段经常会关注同一个主题。当用户读完一篇文章时,他往往会想要继续阅读和这篇文章相关的拓展文章。然而,传统的推荐系统 feed 流难以提供这种深度的拓展阅读(相关阅读)功能。这是由于考虑到推荐系统多样性和兴趣试探的要求,主推荐流中的文 ....
star2017
博客
1年前
4224
0
贝壳找房【语言模型系列】实践篇:ALBERT 在房产领域的实践
贝壳找房【语言模型系列】原理篇一:从 one-hot 到 Word2vec 贝壳找房【语言模型系列】原理篇二:从 ELMo 到 ALBERT 随着预训练模型在各大榜单的不断屠榜,学术界和工业界对于预训练模型的研究也愈加狂热。预训练语言模型一般基于海量语料,消耗大量的硬件资源以及时间成本,利用无监督的 ....
star2017
博客
1年前
9179
0
Lucene 源码系列——BooleanQuery 介绍
阅读原文: https://www.amazingkoala.com.cn/Lucene/Search/2018/1211/25.html BooleanQuery 常用来对实现多个 Query 子类对象的进行组合,这些 Query 子类对象会组成一个 Cluase 实现组合查询。每一个 Query ....
star2017
博客
1年前
1389
0
阿里巴巴为什么选择 Apache Flink?Flink——下一代大数据处理系统
[图片] 阿里妹导读:伴随着海量增长的数据,数字化时代的未来感扑面而至。不论是结绳记事的小数据时代,还是我们正在经历的大数据时代,计算的边界正在被无限拓宽,而数据的价值再也难以被计算。时下,谈及大数据,不得不提到热门的下一代大数据计算引擎 Apache Flink(以下简称 Flink)。本文将结合 ....
star2017
博客
1年前
8073
0
深度学习之表示学习(理论结合实践的思考)
作者:美丽联合集团 算法工程师 琦琦 ,公众号关注:诗品算法 阅读原文:https://zhuanlan.zhihu.com/p/234224652 本文经作者授权转载,转载请联系原作者 第一篇: 蘑菇街首页推荐视频流——增量学习与 wide&deepFM 实践(工程 + 算法) 楔子 你们 ....
star2017
博客
1年前
3739
0
1
...
455
456
457
...
471
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
史上最全的“大数据”学习资源(上)
5.
onlyoffice 20并发限制处理,up to 20 maximum
6.
SpringBoot2实践系列(六):集成监控模块Actuator详解
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
paddlenlp实现关系抽取
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到