转载自 美团点评技术团队 一。 背景 效果广告的主要特点之一是可量化,即广告系统的所有业务指标都是可以计算并通过数字进行展示的。因此,可以通过业务指标来表示广告系统的迭代效果。那如何在全量上线前确认迭代的结果呢?通用的方法是采用 AB 实验(如图 1)。所谓 AB 实验,是指单个变量具有两个版本 A ....
Conference Paper · May 2018 The Anatomy of a Large-Scale Online Experimentation Platform。 因为工作负责和 ABTest 相关的事情,所以对 ABTest 系统理论与工程落地情况一直在调研,根据上面这篇论文,我们 ....
Introduction Google 是一个数据驱动型公司,这意味着所有对用户的改动的发布,都要决策者以相应的经验数据作为依据。这些数据大部分是由在线流量上的实验产生的。在 Web 的语境下,一个实验是由一股流量(比如,用户的请求)和在这股流量上进行的相对对比实验的修改组成的。修改包括用户可见的修 ....
王喆 今天我们关注模型的评估和线上测试。有经验的算法工程师肯定非常清楚,在一个模型的开发周期中,占工作量大头的其实是特征工程和模型评估及上线的过程。在机器学习平台已经非常成熟的现在,模型结构的实现和调整反而仅仅是几行代码的事情。所以如果能够将模型评估和线上 AB Test 的效率提高,那一定是大大解 ....
什么是 AB 测试? 在现实的产品迭代场景中,我们经常会遇到多个方案的选择的问题,在这里迭代的可以是 UI 界面,可以是算法策略。简单来说就是为同一个产品目标制定两个方案,一部分用户走 A 方案,另一部分走 B 方案,然后通过日志记录用户的使用情况,并通过结构化的日志数据分析相关指标,如点击率、转化 ....