完美的推荐系统存在吗?

只要输入自己看过的电影或是书,并对它们进行评分,系统就能用各种方法为你找出可能会喜欢的下一部。现行的推荐系统对于大多数人都是有效的,尽管还有许多局限。那么它离完美还有多远?


  我的朋友H 近期在博客上发了一通牢骚,大意是自己不知道应该如何看电影了。具体来说,他进入了看碟的疲倦期,已经有点看不动了。他说:“新片往往无趣,老片容易犯困,大师总有不懂,新锐有几个真比前人好?”
  在这个信息爆炸、选择众多的年代,这样的烦恼当然并非这位朋友独有。刚认识H 的时候,我们共同经历了影像的启蒙时代。那个时候仍有人从北京将一盘VCD 拷贝后带到上海分发,稍微进步一些以后,又压缩上传到各个大学的ftp 上。出一部,看一部;看一部,聊一部。那个时候,rmvb 这种媒体格式甚至还没有诞生,看一些香港电影时左右音箱分别发出国语和粤语的对白。H 在好几个大学的BBS 上定期撰文介绍和推荐最近新出现的电影,名为“文艺小酒周周有”。再往后一点,文艺小酒变成了“天天有”,到了现在,H 说自己已经完全看不动了。
  H 在那篇博客里说,为了给自己找到看电影的新方向,他尝试使用了豆瓣。这是一个以“发现”为卖点的网站,号称你告诉它越多,就能得到越多。豆瓣使用的这套用户推荐系统源于亚马逊,它根据用户提供的信息进行比对,将有共同兴趣的人集合在一起,将他们的喜好推荐给彼此。在大多数时候,这个推荐系统是行之有效的,它也是“长尾理论”最有力的例证之一——处于小众的那些(娱乐)产品拥有自己的特定用户群,这些小众用户群往往又是重合的。
  但很明显的是,H 证明了这个推荐系统的局限。他花了半个多小时点击了100 多部自己看过的华语电影,推荐名单里出现的仍然是无穷无尽的已经看过的影片。也许等到他点完自己看过的所有华语片,就能得到正确的推荐?他搜索了一下自己觉得最好的中国纪录片《幸福生活》,在豆瓣上只有一个人看过。以这样的数据库为基础的系统,能为他推荐什么?
  H 当然放弃了。我跟他的讨论结果是,作为一个引导别人看电影的人(作为电影编辑,阅片是H 的工作内容之一),他其实并不属于豆瓣主要服务的人群。同时,他倘若继续记录和评分,那么即使不能做什么,至少也为很多新用户作出了贡献。我没说的话是,如果每一个像你这样的影痴都如实记录自己的片单以及评分,那这个系统对你终究是会有用的吧。因为记录了对自己没意义,所以不记录,而不记录所以不可能得到系统的帮助,于是这个推荐系统出现了一个死结。
  但是,假设我们发动所有影痴都老老实实来记录,他们就能获得足够靠谱的推荐吗?现在最流行的这个推荐系统的算法是最完美的吗?对于电脑来说, “大概”和“也许”这种词就意味着失败吧?
  两年前,美国线上视频租赁网站Netflix 曾经举办过一个推荐系统大赛,鼓励参赛者提出最完美的推荐系统。最终赛果亮点不多,无非是个性化推荐(根据用户以往的行为进行推荐)、社会化推荐(根据相似用户以往的行为进行推荐)和物件推荐(基于事物间相似性进行推荐),或是以上三者的综合体。人对文化和娱乐产品复杂而微妙的感受,可能是数学暂时无法解决的。在大多数推荐系统里,系统通常不是根据用户看过的电影片单,而是根据他们喜欢的电影来给出推荐,问题的难度再次升级,毕竟1000 个人心里有1000 个哈姆雷特。
  《连线》杂志曾对当年Netflix 比赛中的一个方案大加赞扬,但不是因为它真的解决了什么。昵称为“车库里的人”的参赛者叙述了一种常见的心理活动:别人推荐的电影,常常因为期待过高或是逆反心理而觉得不好看,从而对推荐人产生怀疑;喜欢上了别人认为不好的电影,却不怎么会因此不信任别人的下一次推荐。所以,“车库里的人”的建议是,网站不要告诉用户他们可能会喜欢什么,而是帮助用户过滤掉他们多半不会喜欢的内容。也许两者的结果是一样的,而且早晚都会出错,但后一个方案导致的沮丧和失望要小得多。比起如何做出完美、准确的推荐,这套心理学花招省力且实用得多。至于用户能从系统里获得多少帮助,其实反而不必太在乎,因为反正他们本来就不知道自己想要的是什么。
淘宝热门商品:

0 评论: