第1822章 你是说,个性化过度了?(1/2)
方案定下来了。
接下来一个月,团队投入个性化排序的开发。
技术上比分布式索引更复杂,需要建立用户行为模型,需要实时计算偏好,还要保证不影响搜索速度。
但团队热情很高。
这是前沿技术,国內外都还没成熟產品。
如果能做成,百度將在技术上领先一大步。
开发过程中,贾瀞雯每周和陈浩通话匯报进展。
“匿名化处理做得怎么样”陈浩在电话里问。
“技术团队设计了双重加密方案。”贾瀞雯说,“用户行为数据先脱敏,再加密。
存储伺服器和业务伺服器物理隔离,访问需要多重授权。”
“用户教育呢”
“我们做了详细的帮助页面,解释个性化功能是什么,需要什么数据,用户有什么权利。
还做了示意图,很直观。”
“好。”陈浩说,“记住,透明是关键。
用户不怕你收集数据,怕的是你偷偷收集。”
一个月后,个性化排序功能进入內测。
选了五千名用户参与,都是自愿报名的。
陈浩也加入了內测名单。
贾瀞雯给他开了个测试帐號。
內测开始一周后,陈浩打来电话。
“功能我试了。”他说,“確实更相关了。
我搜了几次电影,再搜『导演』,结果里电影导演的內容就排前面。”
“有什么问题吗”贾瀞雯问。
“有。”陈浩顿了顿,“推荐太狭窄了。
比如我搜了几次武侠片,结果后来搜『电影』,出来的全是武侠片。
可我可能也想看看其他类型,只是还没搜过。”
贾瀞雯记下来:“你是说,个性化过度了”
“对。”陈浩说,“算法太依赖歷史行为了,会把用户限制在已有的兴趣里。
但人是有探索欲的,有时候想看看新东西。
所以我们需要一个平衡——既要基於已知兴趣推荐,也要偶尔推荐未知但可能感兴趣的內容。”
“技术上怎么做”
“可以加一个『探索性推荐』模块。”陈浩说,“比如用户搜『电影』,大部分结果按他的歷史偏好排序,但可以插一两条其他类型的优质內容。
或者定期给用户推送『猜你可能还喜欢』的推荐,这些推荐不完全基於歷史,而是基於相似用户的行为。”
贾瀞雯飞快地记著。
陈浩的想法总是很超前。
“这个模块要控制比例。”陈浩继续说,“探索性推荐不能太多,否则就失去了个性化的意义。
但也不能没有,否则用户会困在信息茧房里。”
本章未完,点击下一页继续阅读。