博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
【学习笔记】读项亮的《推荐系统实践》_第六章利用社交网络数据
阅读量:5875 次
发布时间:2019-06-19

本文共 902 字,大约阅读时间需要 3 分钟。

这一章更多的介绍的也是思想,而非具体的算法。看得也快,不到30分钟,浏览完。

6.1 获得社交网络数据的途径

没想到email是一个很好的途径,能获得挺多信息,如:名字、公司等。

其他的几个,用户注册、用户位置、讨论组等,都需要相关的资源,现实中能有一种就不错了。

facebook的社交网络被称为“社交图谱”,因为需要双向认证,都是认识的人。

twitter的社交网络被称为“兴趣图谱”,因为仅仅需要单向认证,不一定非要认识对方,仅仅感兴趣而已。

6.2 社交网络数据简介

长尾分布而已。

6.3 基于社交网络的推荐

6.3.1 基于邻域的社会化推荐算法

类似于从前的UserCF,只不过用户之间的关系被替换成了社交网络中的好友关系。而如何综合各个好友之间的关系,以及好友与item之间的关系,则成了算法特色(或者说与UserCF不同的地方,或者说需要特殊考虑的地方等等)。

6.3.2 基于图的社会化推荐算法

哪里都离不开图。总之,还能转换成从前熟悉的图算法。

6.3.3 实际系统中的社会化算法

上面哪个系统不实际?基于图那个最不实际,所以在这一节里面提都没有提。基于邻域那个,相对靠谱,但还不实际,原因是需要访问用户所有的历史信息,复杂度太高。那怎么变得实际?两个方法:1. 考虑用户邻域的时候,不考虑所有邻域,而只考虑一部分有限的邻域;2. 考虑好友历史的时候,不考虑所有历史,而只考虑一段时间的历史。这不废话么。

6.3.4 社会化推荐系统和协同过滤推荐系统

没看见这一部分内容多详细的比较了这两个东西,不过有句话说的挺好:社会化推荐的优势不在于增加预测准确率,而在于通过好友的推荐,增加了对推荐结果的信任度。

6.3.5 信息流推荐

微博里面那些帖子怎么排列,如果不是严格按照时间来排列,则就是用到了信息流推荐了。提到了facebook的EdgeRank算法,只提到了名字,因为这个算法不公开。哦,更详细的,与三个因素有关:1. 用户的好友;2. 当前信息所对应的动作(例如:原创、或者转发)的权重;3. 时间衰减。

6.4 个用户推荐好友

基于社交网络的推荐,计算图的入度、出度等。

完。

 

转载地址:http://wkkix.baihongyu.com/

你可能感兴趣的文章
HTML5通信机制与html5地理信息定位(gps)
查看>>
Mind_Manager_2
查看>>
手动升级 Confluence - 规划你的升级
查看>>
汽车常识全面介绍 - 悬挂系统
查看>>
电子政务方向:We7.Cloud政府云门户
查看>>
虚拟机Centos7连接Internet
查看>>
ansible 基本操作(初试)
查看>>
更改tomcat的根目录路径
查看>>
51nod 1292 字符串中的最大值V2(后缀自动机)
查看>>
加快ALTER TABLE 操作速度
查看>>
学习笔记之软考数据库系统工程师教程(第一版)
查看>>
基本网络概念
查看>>
将 ASP.NET Core 2.0 项目升级至 ASP.NET Core 2.1 RC 1
查看>>
js提交图片转换为base64
查看>>
学习CodeIgniter框架之旅(二)继承自定义类
查看>>
Y2161 Hibernate第三次考试 2016年8月18日 试卷分析
查看>>
Angular CLI 使用教程指南参考
查看>>
PHP 程序员的技术成长规划
查看>>
用于守护进程的出错处理函数
查看>>
AppCan可以视为Rexsee的存活版
查看>>