×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
Elasticsearch 搜索性能优化实践,单机 QPS 提升 120%
作者: 韦子扬 录信数软 随着互联网的快速发展,网络上的数据也在不断增多,各类文章、图片、视频都充斥于各类网站和应用程序之中,用户如果想要在这些海量的信息中寻找和获取自身所喜爱的内容,就会需要使用搜索的功能。而面对这样海量复杂的数据,传统数据库搜索无法实现 快速的响应和模糊搜索,一般针对这种情况都会 ....
star2017
博客
1年前
1489
0
阿里 | 信息流推荐的用户增长机制
[图片] 分享嘉宾:天师 阿里巴巴 高级算法专家 编辑整理:王洪达 出品平台:DataFunTalk 导读: 本文主要从偏向底层的推荐算法角度来阐述信息流推荐系统升级如何助力用户增长。我们知道,内容信息流实际上已经算是信息流中比较小的概念,其中包含图文信息流、短视频信息流和内容 + 电商信息流,而对 ....
star2017
博客
1年前
3798
0
字节跳动自研万亿级图数据库 & 图计算实践
本文选自“字节跳动基础架构实践”系列文章。 “字节跳动基础架构实践”系列文章是由字节跳动基础架构部门各技术团队及专家倾力打造的技术干货内容,和大家分享团队在基础架构发展和演进过程中的实践经验与教训,与各位技术同学一起交流成长。 2019 年,Gartner 将图列为 2019 年十大数据和分析趋势之 ....
star2017
博客
1年前
8021
0
搭建企业级 AB/Testing 平台实践
什么是 AB 测试? 在现实的产品迭代场景中,我们经常会遇到多个方案的选择的问题,在这里迭代的可以是 UI 界面,可以是算法策略。简单来说就是为同一个产品目标制定两个方案,一部分用户走 A 方案,另一部分走 B 方案,然后通过日志记录用户的使用情况,并通过结构化的日志数据分析相关指标,如点击率、转化 ....
star2017
博客
1年前
1298
0
到底该不该去创业公司?
[图片] 本文经授权转载自公众号 Spenser 的二次学习日记(ID:spenserandhk),作者:Spenser 最近身边朋友换工作的越来越多了,有的已经从体制内辞职,有的在传统高大上公司递交辞呈的路上。他们想出来创业,或是加入创业公司。 我不知道这到底是好事还是坏事,但这就是中国这些年的现 ....
star2017
博客
1年前
3820
0
深度神经网络(DNN)损失函数和激活函数的选择
深度神经网络(DNN)反向传播算法(BP)中,我们对 DNN 的前向反向传播算法的使用做了总结。里面使用的损失函数是均方差,而激活函数是 Sigmoid。实际上 DNN 可以使用的损失函数和激活函数不少。这些损失函数和激活函数如何选择呢?下面我们就对 DNN 损失函数和激活函数的选择做一个总结。 [ ....
star2017
博客
1年前
6227
0
系统架构系列(四):业务架构实战下篇
在上一篇文章中主要讲了业务架构的基础部分,整体的业务架构还有一些其它点要考虑,如业务之间的彼此隔离、业务与技术 (平台) 的隔离、业务能力地图的可视化、业务 mock 能力、业务监控等,本篇文章主要讲述这些内容。 [图片] 一、业务彼此隔离 在较小的公司可能要体现这个没有对应的业务场景,但在大公司中 ....
star2017
博客
1年前
3074
0
腾讯企业微信万亿级日志检索系统
作者:datonli,腾讯 WXG 后台开发工程师 背景 开发在定位问题时需要查找日志,但企业微信业务模块日志存储在本机磁盘,这会造成以下问题: 日志查找效率低下:一次用户请求涉及近十个模块,几十台机器,查找日志需要登录机器 grep 日志文件。这一过程通常需要耗费 10 分钟以上,非常低效; 日志 ....
star2017
博客
1年前
2790
0
网易严选用户画像建设实践
[图片] 文章作者:卢若浩 网易严选 内容来源:作者授权 出品平台:DataFunTalk 导读: 在数字化转型的浪潮下,企业越来越重视自身数据资产的沉淀和应用。画像作为一种重要的数据资产形式,受到了越来越多的关注。网易严选作为一家自营电商,业务链路长、场景多,所涉及的核心业务实体也多,如用户、商品 ....
star2017
博客
1年前
2130
0
程序员面试最常见问题 TOP 48
同学,你会手写二叉树吗?近来正值秋招季节,很多编程面试都要求手写数据结构手推机器学习算法。各位同学为了面试也会刷各种编程题,其中数据结构与排序搜索算法又是最为基础的内容。在本文中,我们为各位读者准备了 48 道基础面试题,它可以帮助我们更深地理解数据结构。本文所有面试题都提供了 Java 解决方案, ....
star2017
博客
1年前
2028
0
微服务高可用利器——Hystrix 熔断降级原理 & 实践总结
[图片] 前言 最近在工作中参与组内服务稳定性建设,梳理我们目前服务现状并接入公司自研稳定性保障平台。对公司内自研组件以及业界流行的 Hystrix 做了学习,Netflix Hystrix 里面大量 RxJava 响应式实现,实在看着有点绕。所以在这里梳理一些实践以及 Hystrix 知识点。 为 ....
star2017
博客
1年前
387
0
构造 IndexWriter 对象(一)
来源: https://www.amazingkoala.com.cn/Lucene/Index/2019/1111/106.html 该系列文章将会介绍构造一个 IndexWriter 对象的流程,该流程总体分为下面三个部分: 设置索引目录 Directory 设置 IndexWriter 的配置 ....
star2017
博客
1年前
1104
0
Flink Checkpoint 原理流程以及常见失败原因分析
[图片] 作者:沈磊 团队:大数据 前言 目前有赞实时任务主要以 Flink 为主,为了保证实时任务的容错恢复以及停止重启时的状态恢复,几乎所有的实时任务都会开启 Checkpoint 或者触发 Savepoint 进行状态保存。由于 Savepoint 底层原理的实现和 Checkpoint 几乎 ....
star2017
博客
1年前
1868
0
2021 年 5 月滴滴算法岗:三面拿下 offer,面试题分享
添加客服微信:julyedufu77,回复 “ 7 ”,领取最新升级版《名企 AI 面试 100 题》电子书! [图片] 添加客服微信:julyedufu77,回复 “ 7 ”,领取最新升级版《名企 AI 面试 100 题》电子书!
star2017
博客
1年前
8053
0
微信看一看:推荐系统用户画像构建指南
导语 | 推荐系统无论在工业界还是学术界都被广泛研究,有不少关于召回和排序的工作,但是对于用户画像的研究少之又少。下文将就微信看一看推荐系统中如何构建用户兴趣标签展开讨论,希望与大家一同交流。文章作者:闫肃,微信搜索应用部研发工程师。 一、背景 用户画像是推荐系统中非常重要的一环,用户画像刻画的是否 ....
star2017
博客
1年前
5702
0
让 AI“读懂”短视频,爱奇艺内容标签技术解析
来源: 爱奇艺技术产品团队 前言 随着短视频的兴起,每天有大量的短视频被生产并上传到各大视频平台,面对海量的短视频,如何提升这些短视频的智能分发效率是各大短视频平台面临的重要课题。 视频的标签技术是内容理解的一种重要手段,已经在业界被广泛应用于推荐系统的各个环节:用户画像、召回、排序等。标签一般分为 ....
star2017
博客
1年前
6261
0
【干货】搜索引擎技术资料整理
这篇博客意图是收集市面上质量不错的搜索引擎技术资料,内容来源包括开源项目官网(Lucene、Solr、Elastic)、综合技术网站(infoQ、Stackoverflow、GitHub 等)、专业技术网站(我爱自然语言处理等)、国内外知名互联网公司技术博客(阿里中间件团队博客、美团技术博客等)、知 ....
star2017
博客
1年前
10193
0
基于机器学习的文本分类!
作者:李露,西北工业大学 据不完全统计,网民们平均每人每周收到的垃圾邮件高达 10 封左右。垃圾邮件浪费网络资源的同时,还消耗了我们大量的时间。大家对此深恶痛绝,于是识别垃圾邮件并对其进行过滤成为各邮件服务商的重要工作之一。 垃圾邮件识别问题本质上是一个文本分类问题,给定文档 p(可能含有标题 t) ....
star2017
博客
1年前
7786
0
雷军,黄峥,王兴,互联网 2018 年的夏天
[图片] 2009 年冬天,北京风雪夜,雷军请一帮朋友和旧部吃饭,他一瓶接一瓶地灌下啤酒,所有人都能看出他的沮丧和伤感。直到接近凌晨,雷军才说当天是他 40 岁的生日。整晚,雷军都在反思人生,黎万强拍了拍桌子安慰他说:才 40 岁,好日子还在后头。 2009 年中,开心网将海内网碾压而过,王兴的创业 ....
star2017
博客
1年前
4368
0
分布式追踪系统概述及主流开源系统对比
搜狐技术产品 导 读 分布式追踪系列文章来了! 本周推送为该系列的上篇,主要介绍了分布式追踪系统的原理、“可观察性” 的三大支柱、OpenTracing 标准,同时对当前主流的开源分布式追踪系统进行简单对比。 [图片] 图片来源: Dapper, a Large-Scale Distributed ....
star2017
博客
1年前
3006
0
1
...
424
425
426
...
465
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到