对于新业务,通常由于样本有限或资源有限,无法构建复杂的模型。这个阶段最好的解决办法就是基于先前的经验或对有限样本进行数据分析提出一些简单的冷启动策略。
热门排行榜是最常见的冷启动策略。例如热门新闻,我们可以按照浏览量、评论数、转发数等等,赋予每个影响因素不同的权重,计算每天文章的热度,根据热度值降序排列。但我们还要考虑时间因素,让文章的热度随时间随时变化。否则,热度高的文章会一直在霸榜。我们可以使用物理学的牛顿冷却公式,建立”温度”与”时间”之间的函数关系,构建一个“指数式衰减”的过程。
著名的物理学家牛顿,在17世纪提出了牛顿冷却定律。简单来说,牛顿冷却定律就是温度高于周围环境的物体向周围媒质传递热量逐渐冷却时所遵循的规律。用公式表示:

其中 T(t)代表物体在t时的温度、H代表室温、 代表冷却系数、 T'(t)是T(t)的导数,代表温度变化速率。
接下来求导 T(t)的函数表达式:

第二步,根据lnx的导数为1/x,得出:

第三步,求解常数C,假定在时刻t0,该物体的温度是T(t0),简写为T0。将初始温度代入上面的方程,得到:

第四步,将常数C代入第二步的方程:

最后,整理下公式,得到最终结果:

热门排行榜模型就可以参考这一公式,调节不同的冷却系数,让热度随时间冷却。假设所有新闻最终热度都会降为0(H = 0),其中一篇新闻的初始热度为10,调整不同冷却系数,可以得到不同的冷却速度。

本文来自zhihu,观点不代表一起大数据-技术文章心得立场,如若转载,请注明出处:https://zhuanlan.zhihu.com/p/400233862
更多内容请访问:IT源点
注意:本文归作者所有,未经作者允许,不得转载