什么是推荐系统

推荐系统让用户能够发现对自己有价值的信息，另一方面，能够让信息展现在对它感兴趣的用户面前。实现消费者和生产者的双赢。

几个理论

来自市场营销上的说法。即传统认为，厂商80%的收入很可能来自20%热门商品。但在互联网条件下，由于铺货成本极其低廉，那些不热门的商品销售数量可能极其庞大，使得其销售收入与热门商品相当甚至更多。推荐系统就是基于长尾理论, 将长尾商品推荐给用户, 实现收益增加

一种分布，曲线如下。长尾理论就是幂律分布的通俗体现。常见幂律分布：英文单词、个人收入等

即两极分化效应，强者越强，弱者越弱

出自《新约·马太福音》： “凡有的，还要加倍给他叫他多余；没有的，连他所有的也要夺过来”

合格的满足如下三点

好的推荐系统还满足一点

注意，准确性并不能完全决定推荐算法的好坏。比如预测太阳从东方升起，这是100%准确的预测，但是也是一个毫无意义的预测。

上面三个处于推荐系统的不同开发阶段。先离线测试，OK后做用户调查，OK后上线实验

用户满意度
预测准确度
覆盖率：即对长尾物品的发掘能力。如果所有物品都出现在推荐列表中，并且出现次数差不多，则长尾发掘能力就好很多

两个指标定义覆盖率
- 信息熵：https://www.cnblogs.com/IamJiangXiaoKun/p/9455689.html。简单说，信息熵就是对一个不确定事件发生所可能产生的信息量的期望。而信息量和该时间发生概率的对数的倒数有关。即一个事件发生概率越高，则产生的信息量越小；概率越低，产生的信息量越大。
- 基尼系数：用于衡量收入分配是否均匀之类的问题。计算方法是A/B。当A为0时，基尼系数为0.说明绝对平等了。当A很大时，说明非常不平衡。
多样性：推荐多种多样的商品
新颖性：推荐用户没听说过的商品
惊喜度：相比新颖性，还能让用户感觉使用之后很惊喜
信任度：涉及推荐的方式，要让用户新人所推荐的内容，愿意购买商品
实时性：比如用户新买了一个iphone，及时给他推荐手机壳之类的
健壮性：抗击作弊