问答文章1 问答文章501 问答文章1001 问答文章1501 问答文章2001 问答文章2501 问答文章3001 问答文章3501 问答文章4001 问答文章4501 问答文章5001 问答文章5501 问答文章6001 问答文章6501 问答文章7001 问答文章7501 问答文章8001 问答文章8501 问答文章9001 问答文章9501

“分布式缓存” 是什么概念,怎么理解

发布网友 发布时间:2022-05-02 08:58

我来回答

2个回答

懂视网 时间:2022-05-06 11:39

背景说明 分布式缓存中为了可用性及高性能的考虑,可以使用如下一种master/slave设计模式。 图中的proxy是逻辑的概念,可以是基于client的包装实现,也可以是独立的proxy服务,但本文大部分是指独立的服务。几个主要的问题说明如下。 为什么cache要使用两个

背景说明

分布式缓存中为了可用性及高性能的考虑,可以使用如下一种master/slave设计模式。

图中的proxy是逻辑的概念,可以是基于client的包装实现,也可以是独立的proxy服务,但本文大部分是指独立的服务。几个主要的问题说明如下。

为什么cache要使用两个集群((master/slave)来存放?

主要出于可用性及高性能的考虑。传统的架构使用基于一致性哈希的分布式缓存,数据只存在一份副本,在出现cache节点单点故障时,虽然可以由一致性哈希算法将请求均匀落到其他节点,但由于穿透的请求较多,仍然给数据库带来较大的访问压力。为了避免对数据穿透带来的冲击,数据使用两份副本可以避免穿透的问题。同时在数据访问较大时候,也可以更好的分担流量,避免峰值单份数据跑满对系统带来的冲击。

为什么两份副本要使用master/slave结构?

由于大型系统中通常存在多个client同时操作同一份数据,需要确保所有client对数据修改时数据的一致性。为了避免两cluster两份副本数据不一致带来的困扰,使用了一个简单的做法,在配置中人为指定一个cluster为master,所有的数据以master为准。

为什么一些场景需要使用CAS?

CAS在计算机并发领域通常指Compare-and-swap,在memcached中,也称为Check And Set.?在分布式系统中,一份数据可能同时被多个调用修改,比如微博中的@箱,一个用户同时收到多个@的情况还是比较常见,比如当原来@箱里面记录是{1,2,3}时,4和5由不同的调用来源同时到达,如果没有同步的保护,系统的数据有可能最终被写成{1,2,3,4}或{1,2,3,5},由于memcached没有原生的list结构,list都是一个自定义的value, 则很容易出现client A覆盖了同时在写的client B的数据。因此假如两个调用方同时读到{1,2,3}时,第一个写入{1,2,3,4}会成功,后续的{1,2,3,5}CAS写入就会失败,因为此时服务器已经不是{1,2,3}了,失败的调用向服务端取回{1,2,3,4},最终写入{1,2,3,4,5}

在master/slave场景,比起普通的memcache CAS有什么区别?

目前的做法是master cas成功之后,直接修改slave,并不同时在slave执行cas操作。由于数据存在两份副本,当数据不一致时,无法自动处理数据的不一致冲突。因此在实践上只以master操作为准。

为什么使用proxy?

使用proxy主要是出于可用性、命中率以及可运维方面的考虑
可用性与可运维:当进行服务器增容或缩容时,如果client的数量较大,如果未使用proxy模式,client所在服务器通常需要修改配置并且逐个重启。重启(系统维护)一方面带来可用性方面的问题,运维方面也较为繁琐。
命中率:如果业务场景需要较高的命中率(比如>90%),则增容或缩容就变得较为复杂,需要client配合做一些策略,比如扩容后仍然访问扩容前旧的节点的数据以保证命中率。如果用proxy模式则极大降低client的访问复杂性,将相关逻辑都封装在proxy之后。

分布式缓存的一起问题

最近某业务有一起master单点故障,导致在问题的时间段内,用户看不到最近发生变更的数据。由于在上述场景中,实现cas时候的流程如下
1) master.cas(k,v)
2) 如果1成功,slave.set(k,v)
3) 如果1失败,不执行slave.set(),直接return;

由于第三步在失败时,并不会set slave,导致数据出现一致性问题,即使slave依然可用,新的数据不会写入cache。

首先看在master failure时,为什么不切换到slave cas?
先说自动切换的问题
上文也提过,两份数据副本在出现数据不一致后,并不能自动仲裁达到最终一致性,但是指定master角色可以达到最终一致性。如果master角色可以由调用方自动切换,则会带来数据的混乱。调用方存在多个节点,至少需要统一的config server来保证切换的一致性。另外,自动切换发生后,无法达到两份数据的最终一致性。
再说由运维手工切换
由于不牵涉到代码的逻辑判断,虽然切换也会带来一些数据一致性问题,在具体场景下(比如master长久宕机)切换可以接受。

在出现上述问题后,其他一些解决方案如下。
1. proxy在master cas失败时候delete slave data
2. client在master cas失败时set slave, 并且将数据过期时间设成5分钟

上述方案很难完美,一些明显存在的问题如下
方案1:
命中率的问题。由于delete导致修改的数据迅速失效,会导致读取量的增加,在读写均密集的业务场景,可能会导致数据访问出现波动。
接口职责单一性的问题。proxy在cas调用中隐藏了删除数据的逻辑,这是一个未在正常期望范围内的额外操作,在特殊情况下,可能会导致不可预料的情况出现。(尽管在实际操作中proxy提供配置开关选项)

方案2:
依然是命中率的问题,5分钟过期延缓了过期的访问数据库的压力,但相关压力仍然会传递到数据库。

希望通过上面说明读者能理解这个场景的问题。在这个场景下,完美的方案应当如何设计?

热心网友 时间:2022-05-06 08:47

我的理解,分布式缓存系统是为了解决数据库服务器和web服务器之间的瓶颈。
如果一个网站的流量很大,这个瓶颈将会非常明显,每次数据库查询耗费的时间将会非常可观。
对于更新速度不是很快的网站,我们可以用静态化来避免过多的数据库查询。
对于更新速度以秒计的网站,静态化也不会太理想,可以用缓存系统来构建。
如果只是单台服务器用作缓存,问题不会太复杂,如果有多台服务器用作缓存,就要考虑缓存服务器的负载均衡。
声明声明:本网页内容为用户发布,旨在传播知识,不代表本网认同其观点,若有侵权等问题请及时与本网联系,我们将在第一时间删除处理。E-MAIL:11247931@qq.com
羊被土谷蛇咬伤过了两天没管能治好吗 被蛇咬了的羊肉怎么去毒 拘留时间与刑期有什么关系? 邛崃美食有哪些 南宁口奶汤面怎么样 奶汤面的熬制过程需要哪些步骤? 老码头奶汤面怎么样 求助,邛崃哪里的奶汤面最好吃 奶汤面的介绍 邛崃奶汤面是什么意思? 分布式缓存的主要作用? 分布式缓存是什么 什么是分布式缓存 电脑如何实现一机三屏 什么是分布式缓存? 实现一机三屏的方法有哪些? 分布式缓存是什么? 一机三屏用双显卡,要进行什么设置? 现在有个显卡支持双屏的,如果实现三... 分期乐借钱后怎么还款 苹果笔记本电脑有没有必要 大学马上开学,有必要买一台笔记本电脑吗? 股票区间震荡什么意思? 为什么股价在一个区间来回振荡 股市中3个全天的整体价格区间是什么意思? 股票里什么叫中价位区? 区间在股票中是什么意思 一只股票的低价区,高价区怎样判定? 在股票中低价位区是什么意思? 股票交易价格区间 股票中对应价格区间是什么意思? 单显卡如何设置三屏输出? 分布式缓存主要用于什么环境下? 哪位大神,帮忙解决下,联想笔记本小新5000如何实现三屏扩展,谢谢 缓存的分布缓存 一机三屏只有两屏显示咋回事 JAVA目前比较常用的缓存有哪些? 集中式缓存与分布式缓存有何区别? 它们应用场景是? 三个显示器一个用dvi的,两个用vga的可以实现一机三屏吗? 什么是远程分布式缓存 什么是远程缓存 如何通过分布式缓存来解决可扩展性瓶颈 一个大型、稳健、成熟的分布式系统的背后,往往会涉及众多的支撑系统基础... 什么是分布式缓存框架以及分布式缓存框架的 mybatis为什么需要分布式缓存 襄阳市公积金贷款后还可以提取个人公积金吗 2012两次降息的原因 1996-2002年8次降息的原因,从理论上分析降息的作用,在我国本次降息产生的效果,分析产生效果的原因 贵州事业单位人事管理信息系统里面的岗位名称怎么修改 求《事业单位人事管理制度》,最好是文博系统的,急! 昭化区事业单位人事信息管理系统 WIN7系统,建了一个虚拟的无线网络连接,本来是用来发射WIFI信号,用命令开启之后变成了电脑本地连接? 亚洲人一定指中国人吗?