最后这篇文章写得很不错的，也基本讲清楚了Feed系统的方方面面的考虑了，基本涉及到了一个Feed系统从小发展到大的全过程了！还没有完全领会到它为用Cassandra替换Redis的理由，或者他还是考虑把Casandra的作为半缓存的结构来替换的，加大Cassandr的内存，可以缓存大量的热数据，当然它的好处是冷热数据都可以完美的持久化，但是数据的一致性处理起来有些麻烦，毫无疑问他会是采用R+W>N的模式，但是无论写多份还是读多份都是有些难于取舍的，Feed系统的写入量本来就很大，如果写入多份的话会大大降低写入的性能，另外，存在Feed的系统，无一例外的是 Feed都会是全系统的核心，提高读的性能会大大提高用户的体验，如果读取的时候读多份数据会相对降低性能，到底取舍哪一个呢？我这里光是凭空想象，无法取舍，具体还可以看性能测试来说法，如果有同学做过这方面的压测，还望留言告知下！

腾讯微博主要使用拉模型，只有未读的微博数是使用推得模式实现的！拉模型的问题在于一个人跟随了几百或者上千的人的时候，去看关注的人所发的消息要进行多个层次的Map/Reduce才能得到结果，需要非常高效的获取最新Feed的方式以及快速的聚合算法，只用Memcache\Redis之类的从性能上是比较难于实现的，需要从数据层面或者是缓存的层面都进行聚合，再在应用层面进行聚合，技术难度比较大！这个模式属于知易行难，绝大多数公司不具备构建基础设施的能力！

新浪微博使用推拉结合的方式，大号不推送，小号则推送，看Feeds的时候，需要将推过来的Feeds索引数据与关注的大号的Feed进行聚合，小小的牺牲下拉的性能一下子就将大号的推送问题解决掉了！

对于稍微小些的网站，比如Pinterest和花瓣都使用推的方式来实现，PInterest的直接在Redis中保存500个最新的索引信息，使用Python脚本定时来扫描，保证缓存的索引信息始终只保存最新的500个，老的信息则直接丢弃掉，花瓣则将老索引存储到LevelDBA中去了！

Pinterest网站的内容信息缓存在memcache中，关系信息则缓存到Redis中，持久化方式保存！对于那种大号的粉丝，亦或是关注的人数太多则需要将关系数据拆分之后再缓存起来，对于动态变化的部分则需要独立存放，在使用的时候需要将两部分数据聚合，在可变部分达到一定长度的时候，需要与不变的部分进行合并！

当然推送的时候，所有的网站都使用异步的方式来实现！

猜你喜欢

Linux上的开发分支之旅（linux的分支）
Mysql8.0以上重置初始密码的方法[通俗易懂]
SpringBoot 属性名首字母小写第二个字母大写导致无法解析参数
和发展Linux的分支与发展：一段旅程（linux的分支）
WSDM'23 推荐系统论文梳理
ORA-39090: Cannot add devices to file oriented job. ORACLE 报错故障修复远程处理
Linux镜像安装：简单快捷的系统部署方式（linux 镜像安装）
Java开发者必知：开发中常见的危险信号详解编程语言
MySQL数据锁定如何解除？（mysql如何解锁）
给Linux系统关闭防火墙吧！（关闭linux的防火墙）
基于mysql的论坛（6）
ORA-09280: sllfcf: error closing file ORACLE 报错故障修复远程处理
pychram安装教程
数据在Oracle中删除年月数据的方法（oracle中删除年月）
Efficient Data Management: Streamline Your Database with MSSQL Shrink（mssql收缩）
ubuntu下的虚拟环境中安装Django的操作方法
列MySQL查看自动增量列的方法（mysql查看自增）
Linux的分支之旅：深入了解各个版本（linux的分支）
后台管理系统界面_用户界面管理系统
FreeBuf周报 | WordPress插件曝高危漏洞；特斯拉陷入信息泄露丑闻

相关主题

HBase 系统架构
2.k8s的架构
kubernetes架构
BS架构与CS架构
架构收藏2017
zabbix架构
RPC架构
Serverless架构

zl程序教程

当前栏目

Feed系统架构资料收集（转）

相关文章