背景
点赞点踩是互联网上收集用户反馈的一个非常重要的手段,这些后验特征对于结果的排序是非常有用的;但是,我们经常会遇到这样的问题,
一个结果有5条1分的评价, 0条0分的评价,一个结果有480个1分的评价,20个0分的评价,如果直接按照good / all来算,第一个结果是1.0,第二个结果
是4.8;可是显然,第二条结果是大概率好于第一条结果的。由此,我们引入威尔逊区间的概念。
实现代码
1 | from math import sqrt |
输出结果:1
2
3
40.565508505248
0.719681485028
0.801411699243
0.823690598226
总结
涉及到所有比例置信度的问题都可以用威尔逊区间来优化