×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
一文带你了解关于数据清洗的三大问题
数据清洗是指重复。多余的数据筛选和清除,完整地补充丢失的数据,纠正或删除错误的数据,最后整理成我们可以进一步处理和使用的数据。
star2017
博客
1年前
796
0
手把手教你用ECharts画柱状图
柱状图主要用于表示离散数据的频数,也是一种基础可视化图。
star2017
博客
1年前
2315
0
如何构建一个反电信网络诈骗基础模型?
本文通过对目前社会上关于网络电信诈骗新闻进行提取,从中分析当前网络诈骗发展趋势和关键因素,进而构建合理的反诈骗模型。
star2017
博客
1年前
1358
0
百度|图谱相关技术在风控反作弊中的应用和探索
[图片] 百度安全策略团队 稿 导读:互联网黑产不断发展壮大,作弊模式逐渐变得规模化、产业化,团伙作弊行为日益猖獗。为了进一步提升百度账号的安全和用户体验,维护公司核心利益,百度账号安全策略团队结合自身在账号安全领域的优势,构建了可以处理海量数据、具备丰富扩展性的关联图谱黑产团伙挖掘能力,充分实践应 ....
star2017
博客
1年前
1871
0
美团 | 广告深度预估技术在美团到店场景下的突破与畅想
胡可 坚强 张博等 美团技术团队 稿 背景与简介 1. 背景 点击率/转化率/交易额预估问题,是广告/推荐领域的核心,预估值准确性与广告/推荐平台的营收和发展直接相关。因此,该方向吸引了学术界与工业界的广泛研究,成为机器学习/深度学习技术应用最成功的领域之一。 得益于大规模深度学习框架的推广以及在图 ....
star2017
博客
1年前
6562
0
线上广告:用户营销触达的重要渠道与手段(移动端)
“ 互联网广告,大家都耳熟能详。今天看看移动端广告全景图。 ” 关于用户增长,我们之前有分享过《京东GOAL模型增长策略》、《阿里AIPL模型》等等文章,都是着重在用户洞察或者用户增长策略的层面。要真正实现用户增长、生意增长,是需要在洞察与策略的基础上进行具体行动的。这就是用户的营销与触达。 关于用 ....
star2017
博客
1年前
934
0
广告分析:常用的广告效果评估指标大全(广告主 + 媒体)
“ 今天分享一下广告投放后,常见的效果评估指标及逻辑。” 关于广告投放,上次发表了《线上广告:营销触达的重要渠道》。文中我们详细分享了关于线上广告的基础知识,包括广告平台、CPC等广告结算方式等。相信各位对广告也有了基本认识。 今天,在上次分享的基础上,聚焦一下广告效果评估相关的指标。 01 概述 ....
star2017
博客
1年前
6962
0
网易云音乐实时数仓 2.0 进阶之路
导读:本篇文章是[2021年网易云音乐实时计算平台发展和挑战]的姊妹篇,由网易云音乐数据平台开发专家大愚分享,为大家介绍云音乐实时数仓技术改造以及未来的一些规划。 云音乐从2018年开始搭建实时计算平台,经过两年的发展实时计算已经渗透到云音乐的各个业务当中: 运营需要实时的统计报表做精细化的运营 算 ....
star2017
博客
1年前
1802
0
推荐广告模型的降本提效:压缩策略
背景 从全局看,深度学习模型规模在过去数年持续的指数膨胀。在模型效果提升的同时,为训练和推理的性能和成本都带来了严峻的挑战。作为应对,出现了大量的模型压缩策略,比如Zero系列的训练时策略。推理时量化、剪枝策略。以及训练推理协同策略,比如蒸馏等等。 [图片] 广告、推荐的深度学习模型的体积也非常庞大 ....
star2017
博客
1年前
1336
0
阿里 | 流计算引擎数据一致性的本质
[图片] 作者 | 齐光 阿里云云栖号 微信号 yunqiinsight 流计算的应用与实践在大数据领域越来越常见,其重要性不言而喻,常见的流计算引擎有 Google DataFlow、Apache Flink,Apache Kafka Streams,Apache Spark Streaming ....
star2017
博客
1年前
1563
0
推荐系统中粗排扮演的角色和算法发展历程
以下文章来源于搜索与推荐Wiki ,作者Thinkgamer 1.推荐系统经典的级联架构 其实这里本来写的是「传统」的级联架构,后来思索万千,觉得不太合适,就改为了「经典」。因为级联架构目前依旧在各大互联网公司被应用,其扮演的角色也很重要。一般情况下我们常见级联架构主要是由四部分组成,但依据具体的业 ....
star2017
博客
1年前
3318
0
腾讯 | 智能批改技术实践与探索
[图片] 分享嘉宾:李超 腾讯 高级研究员 编辑整理:席建文 西南民族大学 出品平台:DataFunSummit 导读: 这次我们主要介绍智能批改相关的技术探索与实践,更多的分享实际场景、问题和解决方案。在作业和试卷的批改技术部分会重点讲解,其他地方会相对的简略介绍。主要内容包括:① 背景介绍;② ....
star2017
博客
1年前
7155
0
蜻蜓 FM 实时推荐系统的发展和演进
[图片] 分享嘉宾:雷鸣 蜻蜓FM 算法专家 内容来源:作者原创投稿 出品平台:DataFunTalk 导读: 本⽂主要是分享蜻蜓FM最近⼏年在推荐系统中的发展和演进,从离线推荐逐步过渡到实时推荐后,作者在实际开发⼯作中,⾯对⼀些痛点和难点时,是如何进⾏思考和解决的,如何更好的将⾃⼰的业务场景特点和 ....
star2017
博客
1年前
7270
0
Java用SitemapGen4j产生Sitemap网站地图
sitemap 是什么?对应没有接触过网站 SEO 的同学可能不知道,这里引用一下百度站长的一段解释。 Sitemap(即站点地图)就是您网站上各网页的列表。创建并提交Sitemap有助于百度发现并了解您网站上的所有网页。您还可以使用Sitem...
wylc123
建站
1年前
805
0
国内静态资源公共库大全,在CDN 读取失败的时候从自己服务器加载
问:这东西有啥用?答:自己网站加载静态资源(js、css),提高加载速度,减少机器负荷~=========国内静态资源公共库==========七牛云存储https://www.staticfile.org/又拍云http://jscdn.upa...
wylc123
随笔
1年前
1700
0
数据分析的三重境界,你在哪个阶段?
本文主要围绕工作业务场景进行梳理,以做学问的三重境界为切入,梳理数据应用分析的过程和方法。
star2017
博客
1年前
6480
0
centos下设置svn开机自动启动
作法很简单: 1、vi /lib/systemd/system/svnserve.service 2、vi /etc/sysconfig/svnserve将OPTIONS="-r /var/svn" /var/svn改为 svn 版本库存放...
wylc123
随笔
1年前
609
0
CentOS服务器里通过Nginx的access.log日志查看搜索引擎蜘蛛爬虫的行为
摘要 做好网站SEO优化的第一步就是首先让蜘蛛爬虫经常来你的网站进行光顾,下面的Linux命令可以让你清楚的知道蜘蛛的爬行情况。下面我们针对nginx服务器进行分析,日志文件所在目录:/usr/local/nginx/logs/access.lo...
wylc123
建站
1年前
835
0
有赞数据治理之提质降本
有赞数据治理的精髓就是九个字:大质量、全成本、重运营,其中涉及的质量分、成本账单都有可借鉴之处!
star2017
博客
1年前
1349
0
BI是什么?BI≠报表≠数据大屏≠花架子
BI,仅仅是个花架子么?
star2017
博客
1年前
1249
0
1
...
224
225
226
...
472
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
SpringBoot2实践系列(六):集成监控模块Actuator详解
3.
31个与大数据有关的非常不错的资源和文章(附全链接)
4.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
5.
史上最全的“大数据”学习资源(上)
6.
微服务应用(十五):一台服务器重启导致Redis集群宕机所有业务不可用问题分析
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
本地部署MineRu解析pdf、docx、excel等文档
2.
新技术名词
3.
查看mysql数据库中前缀位sys_data_的表,并生成删表语句
4.
centos docker 安装opensearch
5.
centos docker安装redis
6.
Linux使用命令记录:查看端口及开放端口(netstat、iptables)
最新评论
签到
?
签到
签到
签到,学习
签到