新闻中心

您的位置:首页 > 新闻中心

给大家科普以下什么是ctr预估技术
来源:www.cdwanxin.com/news/1537.html日期:2019-04-24

我们在刷微信和微博的时候,有时候会惊叹广告非常精准——“就是我想要的!”,有时候又会感觉广告极其不靠谱——“我怎么可能点呢?”,所有的这些背后,广告的工程师们已经做了他们最大的努力——



即便在我们看来并不精准,但在所有定向给你的广告中,他们已经挑出机器认为你最可能点的广告,而这背后依赖的就是ctr预估技术。

ctr预估是竞价广告核心的逻辑之一,很多人认为ctr预估非常高深,根本搞不清其中的逻辑,的确,ctr预估作为一个纯技术的模块,要做一个简单的科普并不容易。

致力于用简洁语言描述复杂问题的卫夕今天尝试用人话来解释ctr预估的来龙去脉,放心,本文不会涉及到任何高深难懂的公式和技术逻辑,看得懂中文的同学都能明白其中的逻辑。

一、ctr在竞价广告系统中起神马作用?
ctr(click-through-rate)为点击率,它是互联网广告中最基本的概念,我们先来看看点击率对于一个竞价广告系统而言意味着神马?

我们先来做一道简单的题目——

阿迪和耐克作为广告主来竞价,阿迪出 2 块钱一个点击,耐克出 1 块钱一个点击,假如微信广告平台有 100 次曝光,它应该给谁?阿迪还是耐克?有人说,当然是给阿迪啊,它出的价钱高。

这个答案是不对的,如果阿迪的点击率为1%,耐克的点击率为5%,那么给阿迪能产生 1 个点击,每个点击 1 块钱,微信能赚 2 块;给耐克则产生 5 个点击,每个点击 1 块,微信能赚 5 块,广告平台不傻,当然要给耐克!

好,从这个简单的案例中,我们可以看出几点:

广告平台关心自己的流量价值——即自己的流量曝光卖的贵还是便宜,一般用ecpm(earning cost per mille)这个指标来衡量,即每 1000 次曝光带来收入。

广告主一般按点击进行扣费,即广告主通常关心结果,出价原则就看一个点击需要花多少钱。

广告平台需要把点击出价转化成ecpm进行扣费和排序。

ctr架起了从点击到曝光的一座桥梁,为排序提供基础。

总结起来就是一个简单的公式——ecpm=1000*ctr*点击出价,在上面这个案例中阿迪的ecpm=1000*1%*2=20,而耐克的ecpm=1000*5%*1=50,显然耐克的ecpm大于阿迪的,因此耐克会在这次竞价中胜出。

从这个案例中我们可以看到ctr是为广告排序用的,而排序本身就是竞价广告的核心,因此ctr预估也是竞价广告的核心技术之一。

不仅广告系统需要ctr预估来排序,推荐系统也需要ctr预估来排序,因此ctr预估应用其实比我们想象的要更加广泛:

youtube、亚马逊、今日头条等等涉及到个性化推荐的系统都会应用到ctr预估,即他们要把你最可能点的内容推荐给你。

而广告系统的ctr预估在具体的数值上比推荐系统要求更高,比如推荐系统可能只需要知道a的ctr比b大就可以排序了,而广告由于不是直接用ctr进行排序,还加上了出价,因此广告系统不仅要知道a的ctr比b大,而且还需要知道a的ctr比b的ctr大多少。

二、为什么要进行ctr预估?
到这里大家已经明白ctr的重要性了,即ctr是广告排序的前提,它连接了点击和曝光,这时候大家又会有一个新的问题:那ctr为什么要预估呢?多少投放一点不就知道了它的ctr了吗?

“多少投放一点不就知道了它的ctr了吗?”这句话大体上没错,但事情远没有这么简单,我举一个例子你就知道了。

假如广告平台有四个广告主来投广告,这个广告平台总共有 4000 个用户,这四个广告主分别为卖布娃娃的、卖游戏机的、卖西装的和卖高跟鞋的,出价都是 1 块钱一个点击。

这时候我们不知道ctr的情况下,我们应该怎么办,于是我们试投了一下,每个广告投了 100 个曝光,最后发现他们的ctr都是25%,出价一样、ctr一样。

按照我们上面的公式,ecpm就一样,而我们按ecpm来排序,因此我们就没办法排序——每个人ecpm都相同,因此最终就只能在广告平台随机出这四个广告了。



ecpm=1000*ctr*点击出价

但我们回去看一看实际情况,这个25%的点击率是如何发生的我们就能明白总体ctr是不靠谱的,真相是平台总共有 4000 个用户,而他们均匀分成了四组:

分别是 1000 为成熟男人; 1000 成熟女人、 1000 少女、 1000 少男,这四个人群只点击他们喜欢的东西,如成熟男人只点击西装,他们对自己喜欢的东西的点击率为100%,对自己不喜欢的点击率为0%,当我们随机投放的时候,每个人的点击率都是25%。




好,现在你看到了,直接拿试投这个点击率去预估导致的结果就是用群体数据代表了个体差异,即当一位成熟男人来请求广告的时候,我们会认为投给他一个布娃娃和投给他一套西装没有任何区别。

因为在试投阶段布娃娃和西装的整体点击率都是25%,尽管实际上他们的点击率有天壤之别,一个是100%、另一个是0%。

因此,当我们通过特征差异能正确地个性化预估ctr的时候,我们才能正确地排序,当一位成熟男人来请求广告的时候,西装这个广告主就会在竞价中胜出,因为我们知道它的ctr100%高于布娃娃、高跟鞋、游戏机的0%。

所以从这个案例中我们就能明白,不能直接笼统地看试投的点击率,而应该有针对性地针对个体单独预估,试投这个阶段依然存在,但我们会通过某个模型用交叉特征地看每一个个体的点击率,从而下一个拥有该特征的人群来访问的时候,我们就能相对更加准确地预估了。

同时,我们也从上面的案例中发现,正确预估提升了ctr,从原来的25%提升到了100%,同样广告平台的收入也会提升,这就是ctr预估的意义。