×
请登录
账号
密码
登录 Use it
博客
随笔
网盘
建站
资源
标签
毒鸡汤
程序员导航
登录
注册
标签: 百度 共 20 个结果.
百度用户产品流批一体的实时数仓实践
百度技术 稿 导读: 本文主要介绍如何基于流批一体的技术架构构建实时数仓,在严格的资源成本限制下,满足业务对于数据时效性、准确性的需求。文章整体包含4个部分,首先会介绍下大数据架构演进,从经典架构到Lambda架构再到Kappa架构;然后会介绍下我们做流批一体实时数仓的背景,旧架构面临的主要问题;第 ....
star2017
1年前
566
0
百度质量评估模型助力风险决策水平提升
作者 | 黄佳鑫 导读: 基于风险驱动的交付是百度实践智能测试--感知智能阶段非常重要的研究方向,基于风险驱动的交付,源于三个现状: 一、不是所有的项目都有风险,80%以上的项目无任何的关联bug和线上问题; 二、不是所有的测试任务都能够揭错,无效的质量行为(有bug发现的质量行为/所有质量行为)占 ....
star2017
1年前
2175
0
百度合约广告平台架构演进实践
作者 | 王悦凯 百度技术 稿 导读: 从事B端业务系统研发多年,不免会有这样的思考:B端系统的技术挑战是什么?什么样的业务架构算好架构?本文结合百度合约广告业务的发展历程,介绍广告投放平台从单体架构到微服务架构演进过程中碰到的问题和思考。希望通过本文的介绍,让大家更全面的理解B端系统的技术挑战。 ....
star2017
1年前
810
0
PaddleBox:百度基于 GPU 的超大规模离散 DNN 模型训练解决方案
作者 | 焦学武、李淼 导读 本文介绍百度基于GPU的超大规模离散DNN训练框架PaddleBox。PaddleBox 打造了业界首个层次化GPU稀疏参数服务器,结合高效的流水线调度架构,以及多机多卡的分布式架构,支持单机10TB级/多机数十TB模型训练,具备低成本、高性能、高稳定、灵活易用的多重优 ....
star2017
1年前
386
0
百度技术|聊聊机器如何 "写" 好广告文案?
作者 | 张超 百度技术 稿 “除非你的广告建立在伟大的创意之上,否则它就像夜航的船,不为人所注意。” —— 大卫·奥格威,现代广告业奠基人 01 引子 创意作为一种信息载体,将广告主的营销内容呈现给用户,辅助用户消费决策,乃至激发潜在需求。通常,创意可表现为文本、图片及视频物料的单一或组合形式,而 ....
star2017
1年前
2393
0
百度大模型与小模型联动及落地
[图片] 分享嘉宾:刘佳祥 百度 资深研发工程师 编辑整理:孙蒙新 厦门大学 出品平台:DataFunTalk 导读: 近年来,NLP 领域模型发展迅猛,尽管这些模型在效果上带来了显著提升,但它们通常拥有数亿到千亿,乃至万亿的参数,导致训练模型需要较高的计算成本,阻碍了模型在公司实际落地。举个例子, ....
star2017
1年前
2163
0
百度搜索业务交付无人值守实践与探索
作者 | 刘道伟 百度技术 稿 导读 基于风险驱动的交付是百度实践智能测试——感知智能阶段非常重要的研究方向,基于风险驱动的交付,源于三个现状: 一、不是所有的项目都有风险,80%以上的项目无任何的关联bug和线上问题。 二、不是所有的测试任务都能够揭错,无效的质量行为(有bug发现的质量行为/所有 ....
star2017
1年前
1160
0
超大模型工程化实践打磨,百度智能云发布云原生 AI 2.0 方案
百度异构计算团队 稿 人工智能开发领域的发展呈现出数据量和模型规模越来越大、模型训练速度要求越来越快的特点。然而训练和推理任务速度慢、资源利用率、应用成本高等工程化问题阻碍了人工智能应用的落地。 据 Gartner 预测,到 2023 年 70% 的 AI 应用会基于容器和 Serverless 技 ....
star2017
1年前
389
0
百度技术|Louvain 算法在反作弊上的应用
作者 | ANTI 一、概述 随着互联网技术的发展,人们享受互联网带来的红利的同时,也面临着黑产对整个互联网健康发展带来的危害,例如薅羊毛、刷单、刷流量/粉丝、品控、诈骗、快排等等,反作弊作为打击黑产的中坚力量,持续跟黑产对抗着,保证搜索/feed效果的客观公正,保证广告主的合法权益。近年来反作弊算 ....
star2017
1年前
2430
0
百度技术|超大模型工程化实践打磨,百度智能云发布云原生 AI 2.0 方案
[图片] 异构计算团队 稿 人工智能开发领域的发展呈现出数据量和模型规模越来越大、模型训练速度要求越来越快的特点。然而训练和推理任务速度慢、资源利用率、应用成本高等工程化问题阻碍了人工智能应用的落地。 据 Gartner 预测,到 2023 年 70% 的 AI 应用会基于容器和 Serverles ....
star2017
1年前
412
0
资本的钩子
作者:董指导 来源:饭统戴老板(ID:worldofboss) 数据支持:远川研究 有人说找配偶是世界上最难的信息检索。这点对李彦宏而言,丝毫不是问题。 [图片] 当年在聚会上互留电话时,李彦宏把自己的电话号码按照按键上对应的字母,写成了 331talk。拿到纸条的马东敏立刻就看懂了,两个人会心一笑 ....
star2017
1年前
4549
0
百度技术|品牌广告投放平台的中台化应用与实践
导读:随着业务和团队规模的增长,原来单体应用的技术架构无论从研发效率还是系统性能来看,都出现了瓶颈。微服务化的技术架构改造(遵循领域模型将现有单体应用按照业务边界拆分为多个微服务)提上议程。本文主要分两块,首先介绍品牌广告投放平台的架构演进;其次,结合实际业务,介绍在践行中台化理念和微服务化改造过程 ....
star2017
1年前
733
0
百度评论中台的设计与探索
导读: 百度评论中台为百度系产品提供便利接入、持续稳定的评论能力,是百度社区氛围体系内最重要的基础能力之一,日均流量达到百亿规模,在业务不断发展过程中,百度评论中台实现了功能快速迭代、性能稳步提升,本文将从整体介绍百度评论中台的架构设计,同时结合具体案例讲述如何构建高可用、高性能的分布式服务。 一、 ....
star2017
1年前
1447
0
卞东海:百度基于异构互联知识图谱的多模内容创作技术
[图片] 分享嘉宾:卞东海 百度 高级研发工程师 编辑整理:蒋郭鑫 河海大学 出品平台:DataFunTalk 导读: 由于大数据时代的发展,知识呈指数级增长,而知识图谱技术又在近年来逐步火热,因此诞生了利用知识图谱技术进行智能创作的新想法。本文将分享基于知识图谱的多模内容创作技术及应用。主要包括以 ....
star2017
1年前
1327
0
初窥门径,百度搜索流式体验新形态
[图片] 导读:迄今为止,关于搜索未来形态的探索从未停止。2021年,尝试搜索流式体验新形态时,我们发现,在热点场景下提供更多视频、热议、资讯等富媒体内容,会带来更高的搜索分发。但是由于当前搜索架构贴着搜索搭建,留给富媒体内容混排的时间和空间非常有限,强制插入混排队列对当前搜索系统侵入性太强。因此, ....
star2017
1年前
1769
0
互联网+大数据选址的三个免费应用
摘要:传统的新店选址无外乎是通过人肉观察和统计网站拉数据等方法,但是这些方法费时费力费钱,最后数据可能还不精准。互联网+时代当然要用大数据的方法解决这些问题。今天推荐三种利用互联网选址的方法。 先给各位看官一张图: 这是百度的定位数据图,很牛B的一张图。数据来源于2015年除夕,这个图没有加任何地图元素,仅仅依靠百度地图的定位数据就完整的展示了上海地图轮廓,…
star2017
1年前
7588
0
从BAT了解数据化运营体系
摘要:从BAT了解数据化运营体系 过去的运营体系弊端: 过去运营的方式存在几个比较严重的问题:1)运营模式比较单一,很难适应互联网快速变化的节奏,不能及时根据市场和用户的变化作出调整。比如双十一、828、双12、黑色星期五等;2)摸不清自己的用户,不清楚自己产品的老用户是谁、什么习惯,也没有针对的运营来拉动新用户,导致最后很难挽留住用户。比如我做移动电台,我…
star2017
1年前
6479
0
数据可视化6大技巧,帮你轻松优化数据!
摘要:数据可视化的热度有增无减,而关于它的讨论也逐渐从技术层面发展到了学术层面。最新学术研究就提出了这六大技巧,帮你轻松优化数据。 越来越多的媒体开始接受网络数据,数据可视化便成为不可或缺的一部分。用一个个有效且有逻辑关联性的图形来显示数据、传递信息,能够让人们更加了解事物的本质。虽然现在已经有很多关于数据可视化的教程,但有关数据可视化的学术研究仍然较少。新…
star2017
1年前
2627
0
从机器学习谈起
摘要:在本篇文章中,将对机器学习做个概要的介绍。本文的目的是能让即便完全不了解机器学习的人也能了解机器学习,并且上手相关的实践。当然,本文也面对一般读者,不会对阅读有相关的前提要求。 在进入正题前,我想读者心中可能会有一个疑惑:机器学习有什么重要性,以至于要阅读完这篇非常长的文章呢? 我并不直接回答这个问题前。相反,我想请大家看两张图,下图是图一: 图1 机…
star2017
1年前
11225
0
Java C#实现百度链接实时推送
怎么实现百度sitemap实时推送,首先,得拥有自己的网站,然后在百度站长上验证通过之后,才有资格推送百度sitemap。 如何选择链接提交方式,当然是选择最快的推送方式,主动推送,...
wylc123
1年前
640
0
1
本文目录
热门标签
程序员导航
热门文章
1.
如何学习Python数据科学(2018)
2.
31个与大数据有关的非常不错的资源和文章(附全链接)
3.
这可能是人工智能、机器学习和大数据领域覆盖最全的一份速查表
4.
onlyoffice 20并发限制处理,up to 20 maximum
5.
史上最全的“大数据”学习资源(上)
6.
中文版onlyoffice/documentserver镜像制作
阿里云新老用户最新优惠
阿里云新老用户最新优惠
最新发布
1.
沙尔克04挑战汉堡:锋利的攻势能否撬动防线?
2.
PG赏金女王热血来袭!化身女海盗,踏上海上传奇之路
3.
简单Dify调用MCP服务笔记
4.
主流向量数据库一览
5.
docker 镜像没安装vi可以使用命令修改~/.bashrc
6.
Dify大模型集成工具本地部署运行笔记
最新评论
签到
?
签到
签到
签到,学习
签到