×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
大数据凉了?No,流式计算浪潮才刚刚开始!
大数据凉了?No,流式计算浪潮才刚刚开始! 原创: AI 前线小组 译 AI 前线 1 周前 [图片] 策划编辑 | Natalie 翻译 |巴真 编辑 |Debra **AI 前线导读:**本文重点讨论了大数据系统发展的历史轨迹,行文轻松活泼,内容通俗易懂,是一篇茶余饭后用来作为大数据谈资的不严肃 ....
star2017
博客
1年前
2878
0
AIQ | 面试经验·机器学习、深度学习、算法工程师(校招)
咦~又是校招季了、下大雨闲的无聊、就写一下去年(2016)校招的经验吧、本人是硕士、而且是北京的、所以视野有限、仅供参考哈! 时间节点 6 月-->8、9 月,内推、提前批:此时竞争小、可以拜托师兄师姐们帮内推、要把握住这次机会啊!(ps:去年我第一次参加校招、认识不足、就错过了很多机会... ....
star2017
博客
1年前
10918
0
字节跳动 Flink 单点恢复功能实践
字节跳动技术团队 背景 在字节跳动的实时计算场景中,我们有很多任务(数量 2k+)会直接服务于线上,其输出时延和稳定性会直接影响线上产品的用户体验,这类任务通常具有如下特点: 流量大,并发高(最大的任务并行度超过 1w) 拓扑类似于多流 Join,将各个数据源做整合输出给下游,不依赖 Checkpo ....
star2017
博客
1年前
1975
0
一个关于项目管理者与程序猿之间的笑话
在网上看见有一个笑话是这样的: 程序员写出自认为没有 Bug 的代码。 软件测试,发现了 20 个 Bug。 程序员修改了 10 个 Bug,并告诉测试组另外 10 个不是 Bug。 测试组发现其中 5 个改动根本无法工作,同时又发现了 15 个新 Bug。 重复 3 次步骤 3 和步骤 4。 鉴于 ....
star2017
博客
1年前
3557
0
医疗搜索中的 query 词权重算法探索
来源: 丁香园大数据 前言 计算 query 词权重(术语权重,也称作 Term Necessity,Query Term Weight)是 IR 研究中的一个基本问题,属于 Query 解析的一部分。熟悉倒排索引的同学都知道,文档通常以词的粒度建立索引。所以对于词的解析,在 Query 解析中属于 ....
star2017
博客
1年前
3415
0
细粒度实体分类论文综述:(二)
作者: 龚俊民(昵称: 除夕) 学校: 新南威尔士大学 单位:Vivo AI LAB 算法实习生 方向: 自然语言处理和可解释学习 知乎: https://www.zhihu.com/people/gong-jun-min-74 前言:把分类粒度变细是亚里士多德在《形而上学》中的“给世间万物的存在基 ....
star2017
博客
1年前
1520
0
苏宁 11.11:仓库内多 AGV 协作的全局路径规划算法研究
物流仓库如何更好的规划智能叉车? 董效成 2018 年 11 月 1 日 话题:AI 算法物联网 [图片] 本文为『InfoQ x 苏宁 2018 双十一』技术特别策划系列文章之一。 1. 背景 随着物联网和人工智能的发展,越来越多的任务渐渐的被机器人取代,机器人逐渐在发展中慢慢进入物流领域,“智能 ....
star2017
博客
1年前
9395
0
聊聊阿里社招面试,谈谈“野生”Java 程序员学习的道路
引言 很尴尬的是,这个类型的文章其实之前笔者就写过,原文章里,笔者自称 LZ(也就是楼主,有人说是老子的简写,笔者只想说,这位同学你站出来,保证不打死你,-_-),原文章名称叫做《[链接]》,首发于笔者的博客园博客,这里也郑重声明一下,所有内容类似文章均属转载或抄袭。 之前看过的朋友可能会有疑问,为 ....
star2017
博客
1年前
5763
0
【干货】Kafka 数据可靠性深度解读
我们先看一组评论再进入正文,我只想说厮大牛逼! [图片] 作者:朱忠华 原文:https://blog.csdn.net/u013256816/article/details/71091774 1 概述 Kakfa 起初是由 LinkedIn 公司开发的一个分布式的消息系统,后成为 Apache 的 ....
star2017
博客
1年前
6839
0
干货! 搜索系统中的深度匹配模型
辛俊波 腾讯 | 高级研究员 导读: 在上一篇文章'推荐系统中的深度匹配模型'中介绍的推荐系统里的模型,大部分是对于各种神经网络的结构改造,基本不太涉及文本本身。而在本文接下来要介绍的搜索引擎中的模型里,可以发现由于 query 和 doc 本身都是由文本组成,模型的扩展性上有了大大的提升,在文本领 ....
star2017
博客
1年前
9140
0
深度学习在 58 同城租房搜索排序中的实践
分享嘉宾: 崔凌云,58 同城 TEG 搜索排序部算法架构师 整理出品: 张劲,AICUG 人工智能社区 深度语义模型 BERT 在 58 同城搜索的实践 导读: 本次分享主要以 58 租房搜索排序为背景,介绍深度学习在排序阶段的探索和实践,主要包括:单目标优化、多目标优化、DeepFM、DIN、D ....
star2017
博客
1年前
10509
0
推荐系统遇上深度学习 (五)--Deep&Cross Network 模型理论和实践
原文发布于微信公众号 - 小小挖掘机(wAIsjwj) 原文发表时间:2018.04.22 16:14 1、原理 Deep&Cross Network 模型我们下面将简称 DCN 模型: 一个 DCN 模型从嵌入和堆积层开始,接着是一个交叉网络和一个与之平行的深度网络,之后是最后的组合层,它 ....
star2017
博客
1年前
9424
0
深度时空网络、记忆网络与特征表达学习在 CTR 预估中的应用
[图片] 分享嘉宾:秀武 阿里 高级算法专家 编辑整理:Jane Zhang 内容来源:DataFunTalk 导读: 在 CTR 预估中,能不能有效地利用用户历史行为,页面同屏竞争广告信息,以及用户—广告,广告—广告关系等辅助信息来提升模型效果?本文介绍在这方面的探索工作,主要包括: 深度时空网络 ....
star2017
博客
1年前
5605
0
AI 在爱奇艺视频广告中的探索
分享嘉宾:刘祁跃 爱奇艺科学家 编辑整理:李婷婷 内容来源:爱奇艺技术沙龙 出品社区:DataFun 导读: 本次分享的主题为 AI 在爱奇艺视频广告中的探索。AI 可以对视频内容、广告素材进行理解和加工,并应用于视频广告,尤其在广告的点位挖掘和生成、点位分析、素材创作等方面已产生价值,进而有益于广 ....
star2017
博客
1年前
8864
0
Lucene 源码系列——LZ4
原文地址:https://www.amazingkoala.com.cn/Lucene/yasuocunchu/2019/0226/37.html LZ4 是一种无损数据压缩算法,着重于压缩和解压的速度,并且应用广泛。在 Hadoop、Linux 内核、文件系统都有应用,而在 Lucene 中,则是 ....
star2017
博客
1年前
1391
0
58 沈剑 - 分布式事务,原来可以这么玩?
多个数据要同时操作,如何保证数据的完整性,以及一致性? 答:事务,是常见的做法。 举个栗子: 用户下了一个订单,需要修改余额表,订单表,流水表,于是会有类似的伪代码: start transaction; CURD table t_account; any Exception ....
star2017
博客
1年前
1866
0
Kafka 设计解析(一):Kafka 背景及架构介绍
原文链接 : https://www.infoq.cn/article/kafka-analysis-part-1 Kafka 是由 LinkedIn 开发的一个分布式的消息系统,使用 Scala 编写,它以可水平扩展和高吞吐率而被广泛使用。目前越来越多的开源分布式处理系统如 Cloudera、Ap ....
star2017
博客
1年前
1690
0
理解计算 从根号 2 到 AlphaGo 第 3 季神经网络的数学模型
1910 年,英国哲学家伯特兰·罗素(Bertrand Russell )和其老师怀特海(Alfred North Whitehead)合著的《数学原理》一书问世,这本书是如此的深奥,尤其对中国人而言,因为直到 100 多年后的今天,仍然没有完整而权威的中译本(能看懂的人确实很少)。不过想想现在连一 ....
star2017
博客
1年前
9329
0
向量召回在阿里躺平 APP 的实践
作者:陈雷慧(豆苗) 背景 躺平 APP 是“躺平”这个大生态中生活记录社区,记录生活记录家。 [图片] 该业务场景中,个性化推荐在充分利用流量实现精细化运营、促进信息流动方面有着不可或缺的地位。在业务成长初期,其内容推荐也面临着如下两个问题: 用户冷启动: 对于无任何行为或行为稀疏的用户,难以有效 ....
star2017
博客
1年前
10135
0
机器学习中的隐私保护
[图片] 分享嘉宾:郭夏玮 第四范式 资深研究员 编辑整理:蒋瑞尧 内容来源:第四范式 | 先荐 出品平台:DataFun 导读: 近年来,随着 GDPR 通用数据保护条例出台以及一些互联网公司数据隐私泄漏等事件的发生,数据隐私的保护问题在行业应用中备受关注。与数据密切相关的机器学习算法的安全性成为 ....
star2017
博客
1年前
10587
0
1
...
459
460
461
...
471
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
史上最全的“大数据”学习资源(上)
5.
onlyoffice 20并发限制处理,up to 20 maximum
6.
SpringBoot2实践系列(六):集成监控模块Actuator详解
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
paddlenlp实现关系抽取
2.
docker 查看容器分配的内部ip
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到