202409-10 Redis 架构原理02:深入理解redis cluster的failover机制 基础概念 redis cluster是无中心节点P2P的集群架构,内部采用gossip协议传递维护集群的拓扑结构和集群元数据。社区文档地址: https://redis.io/topics/cluster-tutorial failover是redis cluster.... Read More >
202409-06 【原创】MySQL远程长连接很短时间就超时夯(hang)住 现象说明 研发说有一台线上服务器(此处称为A服务器)需要远程连接数据库服务器,A服务器上配置了连接池,需要每小时跑一次任务,连接池设置的超时时间是1小时,但是发现如果没有数据传输,不到半小时数据库上的连接就消失了,而A服务器上面的已建立的连接却夯住不动了,无法继续执行sql命令,需要运维查看.... Read More >
202409-05 Centos6.5 升级glibc解决“libc.so.6: version GLIBC_2.14 not found”“/usr/lib64/libstdc++.so.6: version `GLIBCXX_3.4.14' not found“ 写在前面: 研发发来邮件说线上有台服务器跑程序报错,信息如下: ./agent: /lib64/libc.so.6: version `GLIBC_2.14' not found (required by./agent) 从上面报错可以看出,程序运行时候,没有找到“GLIBC_2.... Read More >
202409-05 【原创】缩减大数据量Redis集群主从数据同步时间的解决方案 问题描述 随着公司业务量得大幅增长,还有某些业务系统将redis当成数据库使用,不设置key过期时间,导致现在生产环境的一些redis集群容量越来越大,最大的集群目前已经使用1T+的内存空间,集群中单节点数据大小更是达到40G+,如此大的数据量对日常的运维工作产生以下影响: 单节点数.... Read More >
202409-03 性能指标:TPS、QPS、并发数、RT概念详解 性能测试行业常用的性能指标表示法: 响应时间(RT) 响应时间是指系统对请求作出响应的时间。直观上看,这个指标与人对软件性能的主观感受是非常一致的,因为它完整地记录了整个计算机系统处理请求的时间。由于一个系统通常会提供许多功能,而不同功能的处理逻辑也千差万别,因而不.... Read More >
202409-02 异地多活实践与设计思考点归纳 一、指导事项归纳 1.多活原因归纳 推动多活的原因大体可归纳为以下三种。 高可用架构部署 业务整体的容灾 单机房容量限制 2.多活指导归纳 多活牵扯公司业务方方面面,整体来讲业务改造和基础设施中间件改造两大块。 核心链路自包含可逻辑分片 .... Read More >
202408-27 Redis集群迁移槽点报错:[WARNING] Node xx.xx.xx.xx:6379 has slots in importing state 306 1、现象 Redis集群迁移数据,分配槽点时遇到以下报错:[root@sink ~]# redis-cli --cluster rebalance --cluster-use-empty-masters 172.0.1.1:6379 Performing Cluster Check (.... Read More >
202407-31 密码保护:运维面试题汇总 消息队列 一、Kafka 1、 ISR、OSR、AR代表什么? kafka中与leader副本保持一定同步程度的副本(包括leader)组成ISR。与leader滞后太多的副本组成OSR。分区中所有的副本通称为AR。 ISR : 速率和leader相差低于10秒的fol.... Read More >
202407-05 Nginx 添加配置网站维护页面 背景说明 我们经常会遇到网站升级停服的情况,这时候就需要准备维护页面,有时候只是一个404维护页面也是不够的,我们需要配置不管用户访问域名得什么页面,都要强制跳转到维护页面。 创建维护页面 首先,创建一个 HTML 文件作为维护页面: # cat /opt/web_html.... Read More >
202407-05 RabbitMQ 测试方案及结果 RabbitMQ测试方案 Qos:举例说明:Qos=2 如果消费者A 有2个消息没有回应,则MQ不会再往消费者A中发消息,直到收到消息确认后才会再次发送。 Ack:消息确认。 方案1:启动一个生产者,无消费者。 测试结果:每秒生产大约6250条消息,磁盘写入是6250/s,.... Read More >