登录注册写文章

AUC和线上点击率指标不一致

AUC和线上点击率指标不一致

问题：

深度模型相比LR模型，离线auc高于基线，线上ctr也高于，但是线上深度模型AUC低于基线。
一般，线上样本存在bias，新模型去测试基线流量和实验流量，实验流量auc会高。

分析：

1 可能是auc失真，不同用户排序结果不可比
使用gauc衡量

2 用户auc分布
实验曝光未点击较多
分析2 去掉只曝光行为用户
结论：auc在高分段实验更有优势
3 浏览长度和双用户样本分布差异

结论

1 深度模型分布更均匀，召回差异小，auc不可比，gauc只能参考。
2 模型分布发生变化，深度模型召回后排序难度更高。线上AB实验样本不一致，auc无可比性。
3 新模型展示商品质量上升，用户点击数有限，导致分数高的样本加入负样本，auc降低。

参考：

https://zhuanlan.zhihu.com/p/42521586

©著作权归作者所有,转载或内容合作请联系作者
平台声明：文章内容（如有图片或视频亦包括在内）由作者上传并发布，文章内容仅代表作者本人观点，简书系信息发布平台，仅提供信息存储服务。

推荐阅读更多精彩内容

关于点击率模型，你知道这三点就够了
说到计算广告，或者个性化推荐，甚至一般的互联网产品，无论是运营、产品还是技术，最为关注的指标，就是点击率。业界也经...
问题小哥哥阅读 5,924评论 0赞 4
搜狗深度学习技术在广告推荐领域的应用
内容来源：2017年4月17日，搜狗移动搜索广告策略研究组负责人舒鹏在七牛云和QCon联合主办的深度学习论坛“深度...
IT大咖说阅读 4,447评论 0赞 0
机器学习之分类性能度量指标 : ROC曲线、AUC值、正确率、召回率
同见博客：http://zhwhong.cn/2017/04/14/ROC-AUC-Precision-Recal...
zhwhong阅读 139,000评论 16赞 186
笔记：刘润五分钟商学院
管理是一个系统，我的思维里面一直以为管理就是处理好上下级的关系，有时候自己吃点亏也可以，不能让别人不高兴了，但是在...
yoga丽阅读 2,515评论 0赞 0
养儿防老？养儿催老
家里有俩娃，分分钟就可以把分贝飙到180。也曾想好好沟通，但是作用貌似不大。第一个叛逆期到来了。在我还觉得他是个...
温木暖晴阅读 819评论 0赞 1

赞1赞

赞赏

手机看全文