FTRL 公式推导

star2017 1年前 ⋅ 8908 阅读

作者：苏克 1900

写在前面：

本文主要参考 Online Learning 算法理论与实践，但该文和网上找到的资料都没有很好的给出关于模型参数 w 的解析解的推导过程，甚至原论文 http://www.eecs.tufts.edu/~dsculley/papers/ad-click-prediction.pdf还有一些符号错误。所以特此写个博文记录一下自己的推导过程。

一。什么是 FTRL

首先介绍一下 FTL，FTL 的思想是每次找到让之前所有样本的损失函数之和最小的参数。流程如下：

初始化 w

for t = 1...n

损失函数

更新

FTRL 算法就是在 FTL 的优化目标的基础上，加入了正则化，防止过拟合：

其中 R(w)是正则项。

二。代理损失函数

FTRL 的损失函数一般也不容易求解，这种情况下，一般需要找一个代理的损失函数。

代理损失函数需要满足以下条件：

代理损失函数比较容易求解，最好是有解析解。
代理损失函数求得的解，和原函数的解的差距越小越好

为了衡量条件 2 中的两个解的差距，引入 regret 的概念。

假设每一步用的代理函数是

每次取：

而是原函数的最优解，则：

表示代理函数求出来的解离真正损失函数求出来的解的损失差距。

这个损失需要满足一定的条件，Online learning 才可以有效，即：

即随着训练样本的增加，代理损失函数和原损失函数求出来的参数的实际损失值差距越来越小。

三。代理损失函数怎么选

如果是凸函数，我们可以用下面的代理损失函数：

其中是的次梯度（如果是可导的，次梯度就是梯度）。满足：

为了产生稀疏的解，我们可以加入 L1 正则项：

只要是凸函数，上面的代理函数一定满足：

四。怎么得出 w 的解析解

取只和 w 相关的部分：

1.当求得的 w 是大于等于 0 的时候：

本文地址：FTRL 公式推导
本文版权归作者和AIQ共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出

其中，另上述偏导数等于 0，可得：

所以：

因为我们现在是讨论 w>=0 的解，而大于 0（大于 0），所以当：

时，才符合我们的要求

而大于 0。
令：

当 $z_t$ >=0 时， $z_t+\lambda_1$ 是肯定大于 0 的，即不符合我们的要求。
：

当 <0 时，要满足，即，即，

所以有：

因为此时

2.当求得的 w 是小于 0 的时候：

令偏导数等于 0，可得：

因为我们现在是讨论 w<0 的解，而大于 0（大于 0），所以当：

时，才符合我们的要求

而大于 0。

令：

当 $z_t$ <=0 时，是肯定小于 0 的，即不符合我们的要求。

当 $z_t$ >0 时，要满足，即，即，

所以有：

因为此时

五。为什么选择这个代理损失函数

参考在线学习算法 FTRL-Proximal 原理 - 雪伦的专栏 - CSDN 博客

重点是为什么说第一项是对损失函数的一个估计呢：

本人暂时说一个牵强的解释(g 是 f 的梯度)：

根据泰勒展开公式：，如果，则：

就有了上述截图中类似的表达式子。

六。遗留问题

如果不是凸函数，我们怎么选代理损失函数？
什么是次梯度
为什么只要是凸函数，上面的代理函数一定满足：

未完待续。。。。

参考链接：

Online Learning 算法理论与实践

在线学习算法 FTRL-Proximal 原理 - 雪伦的专栏 - CSDN 博客

本文地址：https://www.6aiq.com/article/1557331817840
本文版权归作者和AIQ共有，欢迎转载，但未经作者同意必须保留此段声明，且在文章页面明显位置给出

更多内容请访问：IT源点

注意：本文归作者所有，未经作者允许，不得转载

#FTRL #机器学习 #算法 #人工智能

相关文章推荐

* 打卡—> 什么是云数据库 && 沙箱实验如何用 python 和数据库来爬虫？【华为云至简致远】 0 点赞 ⋅ 0 回复 ⋅ 1年前
1.1 机器学习概述——机器学习的发展 0 点赞 ⋅ 0 回复 ⋅ 1年前
10个商业活动中需要的数据分析工具(收藏) 0 点赞 ⋅ 0 回复 ⋅ 1年前
10个必备的机器学习开源工具 0 点赞 ⋅ 0 回复 ⋅ 1年前
10个预训练模型开始你的深度学习（计算机视觉部分） 0 点赞 ⋅ 0 回复 ⋅ 1年前
11款开放中文分词引擎大比拼 0 点赞 ⋅ 0 回复 ⋅ 1年前
12个关键词，告诉你到底什么是机器学习 0 点赞 ⋅ 0 回复 ⋅ 1年前
15个开源的顶级人工智能工具 0 点赞 ⋅ 0 回复 ⋅ 1年前
18大经典数据挖掘算法小结 0 点赞 ⋅ 0 回复 ⋅ 1年前
200多个最好的机器学习、NLP和Python教程 0 点赞 ⋅ 0 回复 ⋅ 1年前
2015年中国企业商业智能的发展趋势有哪些 0 点赞 ⋅ 0 回复 ⋅ 1年前
2015年商业智能BI市场需求新转变 0 点赞 ⋅ 0 回复 ⋅ 1年前
2015年商业智能与大数据分析市场的发展趋势 0 点赞 ⋅ 0 回复 ⋅ 1年前
2015年商业智能分析以及大数据发展趋势 0 点赞 ⋅ 0 回复 ⋅ 1年前
2015年机器学习/数据挖掘面试总结 0 点赞 ⋅ 0 回复 ⋅ 1年前
2015，商业智能的五个发展方向 0 点赞 ⋅ 0 回复 ⋅ 1年前
2016美国大选，来自人工智能和大数据的预测 0 点赞 ⋅ 0 回复 ⋅ 1年前
2017年GitHub中Top 30开源机器学习项目 0 点赞 ⋅ 0 回复 ⋅ 1年前
2017年值得关注的八大技术创业趋势 0 点赞 ⋅ 0 回复 ⋅ 1年前
2018年全球AI十大突破性技术速读 0 点赞 ⋅ 0 回复 ⋅ 1年前

1
2
3
4
...
90

全部评论: 0 条

我有话说:

star2017
- 1298发布
- 0评论
收藏 0