Percona XtraDB Cluster之流量控制

scofield 菜鸟运维杂谈

什么是流量控制?


Percona XtraDB Cluster具有一种称为流控制的自调节机制。该机制有助于避免集群中最弱/最慢的成员明显落后于集群中其他成员的情况。
当集群成员在写数据很慢(同时又继续从群集组通道接收写集)时,传入/接收队列的大小会增加。如果此队列超过设置的阈值(gcs.fc_limit),则该节点将发出FLOW_CONTROL消息,要求其他成员放慢或暂停处理。

gcs.fc_limit


此设置控制何时启用流量控制。简而言之,如果wsrep_local_recv_queue在给定节点上超过此大小,则将发送暂停的流控制消息。
fc_limit默认为16个事务。这实际上意味着,这可以使给定节点位于从集群提交事务的后面。

gcs.fc_master_slave


如果禁用了fc_master_slave(默认情况下),则会动态修改fc_limit。该模式实际上是根据集群中节点的数量动态调整fc_limit的。群集中的节点越多,计算出的fc_limit越大。其背后的理论是,集群获得的规模越大(并且可能来自更多节点的写操作越忙),每个节点的应用空间就越远。

如果仅写入PXC中的单个节点,则建议您通过设置fc_master_slave = YES来禁用此功能。无论是否动态调整fc_limit的大小,此设置实际上只不过是要更改。它没有任何其他能力可以帮助PXC中的单节点提高更好的写能力。

gcs.fc_factor


如果fc_limit控制何时启用流控制,则fc_factor在释放时进行寻址。该系数是介于0.0到1.0之间的数字,该数字乘以当前的fc_limit(如果fc_master_slave = NO,则通过上述计算进行调整)。这样就产生了在节点发出另一条流控制消息之前,recv队列必须降至低于事务级别的事务数,该消息向群集授予了继续复制的权限。
fc_factor默认为0.5,这意味着在恢复复制之前,队列必须降至fc_limit的50%以下。在这种情况下,较大的fc_limit可能意味着要等待很长时间才能再次放松流量控制。但是,最近将此值修改为默认值1.0,以允许复制尽快恢复。

对于最终用户来说,流控是透明的,但是对于集群管理员而言,重要的是要知道节点是否在使用流控制。如果是这样,它将影响整个群集的生产率。

查找节点是否处于流控制中


FLOW_CONTROL不是持久状态。队列大小超过设置的阈值后,节点将进入FLOW_CONTROL。一旦队列大小回到低端水印以下,它将再次释放。

如何看待较高和较低的阈值

从Percona XtraDB Cluster 5.7.17-29.20开始,现在可以通过SHOW STATUS来查看较低和较高阈值:

mysql> show status like 'wsrep_flow_control_interval';+-----------------------------+----------------+| Variable_name               | Value          |+-----------------------------+----------------+| wsrep_flow_control_interval | [ 3547, 3547 ] |+-----------------------------+----------------+1 row in set (0.01 sec)

如您所见,wsrep_flow_control_interval状态变量发出一个范围,该范围代表较低和较高的水平。值集(3547, 3547)表示如果传入队列大小大于3547,则启用FLOW_CONTROL。如果大小小于3547,则释放FLOW_CONTROL。

尽管如此,这仍无法显示节点在任何给定时刻是否正在使用FLOW_CONTROL。

为了解决这个问题,PXC在版本中同时引入了wsrep_flow_control_status状态变量。此布尔值状态变量告诉用户该节点是否在FLOW_CONTROL中。一旦节点处于流控制之外,则当节点采用流控制时,变量将切换为OFF,反之则为ON:

mysql> show status like '%flow%';+-------------------------------------------------------+----------------+| Variable_name                                         | Value          |+-------------------------------------------------------+----------------+| Innodb_scrub_background_page_split_failures_underflow | 0              || Ssl_session_cache_overflows                           | 370780         || Table_open_cache_overflows                            | 0              || wsrep_flow_control_paused_ns                          | 7056357841773  || wsrep_flow_control_paused                             | 0.000901       || wsrep_flow_control_sent                               | 0              || wsrep_flow_control_recv                               | 176            || wsrep_flow_control_interval                           | [ 3547, 3547 ] || wsrep_flow_control_interval_low                       | 3547           || wsrep_flow_control_interval_high                      | 3547           || wsrep_flow_control_status                             | OFF            |+-------------------------------------------------------+----------------+

最后,wsrep_flow_control_sent / recv计数器可用于跟踪FLOW_CONTROL状态。这显示了流控制启动的总次数。您可以使用FLUSH STATUS清除它们。

mysql> show global status like 'wsrep_flow%';+----------------------------------+----------------+| Variable_name                    | Value          |+----------------------------------+----------------+| wsrep_flow_control_paused_ns     | 6893631531679  || wsrep_flow_control_paused        | 0.000413       || wsrep_flow_control_sent          | 5366           || wsrep_flow_control_recv          | 5369           || wsrep_flow_control_interval      | [ 3547, 3547 ] || wsrep_flow_control_interval_low  | 3547           || wsrep_flow_control_interval_high | 3547           || wsrep_flow_control_status        | OFF            |+----------------------------------+----------------+mysql> flush statusmysql> show global status like 'wsrep_flow%';+----------------------------------+----------------+| Variable_name                    | Value          |+----------------------------------+----------------+| wsrep_flow_control_paused_ns     | 6893631531679  || wsrep_flow_control_paused        | 0.000413       || wsrep_flow_control_sent          | 0           || wsrep_flow_control_recv          | 0           || wsrep_flow_control_interval      | [ 3547, 3547 ] || wsrep_flow_control_interval_low  | 3547           || wsrep_flow_control_interval_high | 3547           || wsrep_flow_control_status        | OFF            |+----------------------------------+----------------+

PS:文章会同步到dev.kubeops.net

©著作权归作者所有:来自51CTO博客作者mb5fdb131956bf3的原创作品,如需转载,请注明出处,否则将追究法律责任

更多相关文章

  1. MVC控制器类的访问、参数解析、api接口数据获取并渲染
  2. KubeNode:阿里巴巴云原生容器基础设施运维实践
  3. redis 哨兵模式集群搭建
  4. MGR集群搭建(单主模式)
  5. 运算符、流程控制、循环与文件包含
  6. openGauss集群搭建
  7. k8s1.18高可用集群安装-超详细中文官方文档
  8. kubernetes概述-介绍、组件、架构
  9. k8s1.18多master节点高可用集群安装-超详细中文官方文档

随机推荐

  1. c语言关键字是什么
  2. c语言源程序文件的后缀是什么?
  3. i++和++i的区别及举例说明
  4. C#中DataSet的用法
  5. c语言注释符号是什么?
  6. c语言字符串定义的方法是什么
  7. c语言除法如何运算
  8. c语言二进制输出的方法
  9. c语言简单小游戏-扫雷游戏
  10. c语言程序的调试方法