为了积累足够的数据,新百视达不但使用了百视达之前的所有DVD电影租售数据,还推出了一个电影评分系统。
根据正面或者负面评价的重合度来给用户进行聚类,进而通过用户喜欢的电影来进行推荐。
为了让这套系统发挥作用,李睿和张铭采取了游戏化设计,用户收藏、观赏、评价电影之后都会获得各种不同的成就奖励,当用户浏览新百视达网站的时候,系统会利用各种方式吸引或者是诱惑他们给电影评分,只要有足够多的用户提供更多的评价,就能为数据库提供最准确的数据支持,构建一个可以预测用户电影偏好的协同过滤流程,在权衡众多关键因素后向用户推荐电影。
目前这个算法还比较稚嫩,未来需要经过不断的进化。
为了让这个进化的过程加快一点,李睿推出了重金悬赏。
百视达大奖!
这是一个面向机器学习和数据挖掘的奖项,旨在提升协同过滤算法的预测能力,凡是能够将算法准确率提升10%的团队,将会获得百视达颁发的一百万镁元奖金!
具体量化指标为RMSE--预测的评分与真实评分相差的均方根(root mean squared error),张铭的算法目前的RMSE得分是0.9525,谁能将这个得分降低到0.8572或更低,就能拿到一百万!
李睿确实没有为新百视达的上线做任何宣传,但他在推特、脸书、Reddit和其他各种网络媒体上同时发布了百视达大奖的消息,立刻引发了全世界科学家、数学家和算法研究者的关注。
……
新泽西,弗伦翰公园,这里距离曼哈顿有九十分钟的火车车程,看不到大城市的繁华和华尔街的行色匆匆,有的只是一大片绿色的原野和郁郁葱葱的大树。
镁国电话电报公司香农实验室就座落在这里,一大片简洁的建筑之中,到处摆满了早期的电话机和各种已经可以称之为古董的电子设备。
克里斯·沃林斯基是实验室的执行董事,他正坐在二层的休息室里摆弄着手机,以便放松一下被各种数据占据的大脑,刚刚刷新出来的Reddit页面上,忽然蹦出了一个吸引眼球的标题。
【想拿百万镁元大奖吗?百视达大奖等待着你!】
百万镁元?
百视达?