第129章 个性化推荐是天使还是恶魔(第2/5 页)
时,系统对物品信息也会做进一步的数据挖掘工作,从而形成物品画像。在构建好用户画像和物品画像之后,个性化推荐系统会利用所有收集到的数据去联系“人”和”物品“。个性化推荐主要分成召回和排序两部分,召回的主要作用就是尽可能地找到用户可能感兴趣的物品,其中最经典的算法便是协同过滤算法。
协同过滤算法,顾名思义,协同过滤就是协同大家的反馈、评价和意见一起对海量的信息进行过滤,筛选出用户可能感兴趣的物品的过程。根据技术实现不同,协同过滤算法又可分为基于用户相似度的UsercF、基于物品相似度的ItemcF和基于隐向量表达的矩阵分解cF。
基于用户相似度的协同过滤UsercF的主要思想是兴趣相似的人喜欢相似的物品,简单来说,就是推荐给你和你浏览行为相似的用户所喜欢的物品。
基于物品相似度的协同过滤ItemcF则是从用户有过行为的物品下手,推荐给你与你喜欢的物品相似的物品。例如你今天看了一部《蜡笔小新》,那么就推荐给你算法认为的与《蜡笔小新》比较相似的《哆啦A梦》等动漫。
基于矩阵分解的协同过滤,矩阵分解cF的思想更为直接。它把用户与商品的交互行为表示为一个矩阵,其中矩阵的行和列代表用户与商品,矩阵的元素代表用户对商品的交互行为(如点击与评分等)。矩阵分解cF希望将交互矩阵近似地分解为一个用户隐含表示矩阵和一个商品隐含表示矩阵的乘积,从而填补交互矩阵中未知的元素。在协同过滤算法之后,还出现了很多更复杂的召回算法,例如基于内容的算法等,究其本质还是基于相似度的推荐。同时,为了更全面地覆盖用户的多样兴趣,推荐系统往往会采用多路召回的机制,使得生成的候选商品更加全面多样。
在做完召回之后,个性化推荐系统已经获取了其认为用户可能感兴趣的物品,但一般召回阶段获取的物品数量会相当多,此时便需要多个排序模块对召回的物品进行多级排序,最后将精挑细选的少量物品展示给用户。
排序算法的原理,排序阶段一般会整合现阶段能收集到的所有信息预测用户对物品发生某种行为(点击、加购、收藏等)的可能性。排序过程可以理解成将用户定位到某一类人群,再根据现有的信息给出这一类人群对于当前物品的偏好,当然个性化推荐系统对人群的分类会更细致,甚至是无法用语言来解释其对人群的分组,但本质上还是一回事。
后处理,在经过上述过程之后,个性化推荐有时候还会经过后处理。一方面,为了保证用户看到的信息具有一定的多样性,平台往往会对排序结果进行打散,使得用户看到的推荐结果不会过度同质化。另外,针对平台运营的机制与策略,可能会对排序结果进行调整。比如,假设《蜡笔小新》和《哆啦A梦》与给二次元人群的相关度近似,但假如由于《哆啦A梦》的提供商出钱比较多,也可能会导致《哆啦A梦》的排序在《蜡笔小新》之前。
这么看来,好像个性化推荐完全是为了便利人们生活需求所产生的新事物,但是个性化推荐真的只有好处没有坏处吗?恐怕不尽然。
现在社会上对个性化推荐的批判主要有两点考量,一是批判个性化推荐会导致信息茧房,二是觉得个性化推荐侵犯了自己的隐私。
一是信息茧房,信息茧房指人们关注的信息领域会习惯性地被自己的兴趣所引导,从而将自己的生活桎梏于像茧一般的“茧房”中的现象,简单来说就是我们每天只会关心同质化的内容。但对于个性化推荐系统本身来说也不希望用户陷于信息茧房,从平台角度出发挖掘出用户更多的兴趣点也就意味着更多的盈利点,比如一个二次元用户本来只会买二次元产品,如果个性化推荐系统推荐其热门运动类物品并使
本章未完,点击下一页继续。