博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
推荐系统实验方法
阅读量:6220 次
发布时间:2019-06-21

本文共 598 字,大约阅读时间需要 1 分钟。

  hot3.png

1.离线实验2.用户调查3.在线实验

离线实验:(这也是我现在的工作)

步骤:1)通过日志系统获得用户行为数据,并按照一定格式生成一个标准的数据集。

2)将数据集按照一定的规则分成训练及和测试集。

3)在训练集上训练用户兴趣模型,在测试集上进行预测。

4)通过事先定义的离线指标评测算法在测试集上的预测结果。

优缺点:

优点:1.不需要有对实际系统的控制权。(确实哭泣的脸)2.不需要用户参与实验。3.速度快,可以测试大量算法。

缺点:1.无法计算商业上关心的指标(点击率,转化率等,日志分析是另一个帅气的小伙在干,好感兴趣~~)2.离线实验的指标和商业指标存在差距。

用户调查

高准确率不等于高用户满意度。

最好的方法是将算法上线测试,直接上线有风险,需经过用户调查测试。

用户调查需要有一些真实用户。测试用户要与真实用户的分布相同,比如男女,年龄,活跃度等等。用户调查要尽量满足“双盲”,即实验人员和用户都不知道测试目的。

优点:可以获得很多用户主观感受的指标,比在线实验风险低,错误容易弥补。

缺点:成本高,如果测试人员不够多,很可能数据无意义,双盲实验设计很困难,测试环境下的数据和真实有一定不同。

在线实验

完成上述两个,可以上线做AB测试,与旧算法比较。AB算法见 。

这个离我还很远,先搁置,不浪费时间。

转载于:https://my.oschina.net/luan/blog/76430

你可能感兴趣的文章
从DevOps到ContainerOps
查看>>
版本控制:Git、Github 和 SVN的使用
查看>>
可变参数范例
查看>>
内核必须懂(三): 重编Ubuntu18.04LTS内核4.15.0
查看>>
遍历对象实例的属性和方法
查看>>
React组件
查看>>
论战,交易挖矿模式,能走多远?
查看>>
Vue中axios的封装
查看>>
实现一个简单版本的Vue及源码解析(一)
查看>>
GCD(二) dispatch_barrier
查看>>
Android 复杂的列表视图新写法 MultiType (v3.1.0 修订版)
查看>>
【前端记-1】你不知道的前端缓存
查看>>
AJAX发送请求、同源策略与CORS跨域
查看>>
顶尖AI无法识别简单图案?因为人类已经无法理解它们了
查看>>
用 Node.js 写一个多人游戏服务器引擎
查看>>
java版spring cloud+spring boot+redis多租户社交电子商务平台 (六)分布式配置中心(Spring Cloud Config)...
查看>>
Android CTS V2 最全命令行解释和使用示例
查看>>
算法初探--递归算法
查看>>
JavaScript引擎是如何工作的?从调用栈到Promise你需要知道的一切
查看>>
Http中header与body的区别
查看>>