SberService adalah perusahaan layanan terbesar dengan kepentingan federal, menyediakan layanan pemeliharaan komprehensif untuk berbagai peralatan informasi dan telekomunikasi, workstation, peralatan kantor, server, dan telepon. Perusahaan ini adalah satu-satunya mitra premium Zabbix di CIS; perusahaan ini mempekerjakan tim terbesar di Rusia di bidang pemantauan TI, mengembangkan solusi teknis unik di bidang penerapan sistem pemantauan terintegrasi untuk organisasi dengan infrastruktur TI beban tinggi. Fakta ini menjelaskan mengapa SberService memilih Zabbix sebagai platform pemantauan utama.
Tentang apa artikel ini?
Seperti namanya, artikel ini mengusulkan konsep untuk mengatur pemantauan dengan ketersediaan tinggi. Zabbix Server bertindak sebagai "eksperimental", Corosync dan Pacemaker digunakan untuk mengatur cluster Active-Active, dan semua ini berfungsi di Linux. Perangkat lunak ini adalah OpenSource, jadi solusi seperti itu tersedia untuk semua orang.
Selama pengoperasian Zabbix untuk memantau infrastruktur TI yang sangat dimuat (peningkatan jumlah item data, peningkatan jumlah host, kedalaman penyimpanan data mentah yang besar, kebutuhan pengguna yang terus meningkat), banyak yang menghadapi masalah kinerja server Zabbix selama startup atau restart. Di bawah kondisi Beban Tinggi (> 60k NVPS), boot ulang server Zabbix normal berubah menjadi prosedur yang agak panjang, meskipun biasa. Waktu dari dimulainya pelayanan hingga data muncul di pantauan bisa mencapai 15-20 menit.
Menghadapi hal ini, dan setelah menganalisis situasinya, tim pemantau menemukan solusi yang akan membantu pengelompokan menurut prinsip Aktif-Aktif. Selain itu, tujuannya adalah untuk mencapai Pemulihan Bencana dengan mentransfernya ke berbagai pusat data.
Sebuah tugas
, Zabbix-, Active-Active , , .
. Zabbix , -, . OpenSource-, Pacemaker Corosync.
:
ZabbixServer , . ., ;
ZabbixServer , .
Active-Passive Pacemaker Corosync ( Corosync cman, ).
, Zabbix , « », ZabbixServer , , , – . , .
, Active-Active (LoadBalancer), .
:
High Available ZabbixServer Active-Active LoadBalancer :
« » (Cluster resource) . .
2 . stonith quorum — .
quorum 3 . , 2 , «» .
stonith , . , . . , , .
:
ocf::heartbeat:ZBX-IPaddress ocf::heartbeat:ZBX-Instance
, . ZBX-IPaddress ip- (IPaddr2). ZBX-Instance — zabbix-server . Zabbix- , , Zabbix- Read/Write, ReadOnly, zabbix-server (, Active-Active).
. ZBX-IP-address IP- , ZBX-Instance zabbix- Read/Write, zabbix- ReadOnly, . . ZabbixProxy. , .
— master slave ZabbixServer- .
High Available ZabbixServer Active-Active LoadBalancer
:
« » . , « », , LoadBalancer - . , , « ».
Pacemaker :
ocf::heartbeat:ZBX-Cluster-Socket ocf::heartbeat:ZBX-Instance
ZBX-Cluster-Socket — « » — LoadBalancer-.
ZBX-Instance zabbix-server- .
« », .
ZBX-Cluster-Socket Pacemaker (). « » — , , LoadBalancer. «» ZBX-Cluster-Socket ZBX-Instance (constraint) , «» . Corosync, ZBX-Cluster-Socket, 101 Master-node 201 Slave-node. LoadBalancer / : 101 — 201 — , , , .
Master-node Slave-node :
Master-node, 101 , LoadBalancer 201 Slave-node. Corosync, , Master-node , ZBX-Instance ZBX-Cluster-Socket Slave-node, «resource_movement», Pacemaker ZBX-Instance User_A User_B , .
?
: 2- Master-node ( User_A) Slave-node (User_B), Master-node .
, , . Master-node , . Slave-node . LoadBalancer , Master-node Slave-node ZabbixServer , LoadBalancer .
— ? - Read/Write, ReadOnly, :
Slave-node , Slave-node : User_A ReadOnly, User_B Read/Write.
Slave-node , Slave-node .
«» Master-node, LoadBalancer , Master-node .
( 2- ), . , , «How to».
Sebagai kesimpulan, perlu ditambahkan bahwa dalam dunia teknologi modern, hampir tidak ada yang mustahil. Yang Anda butuhkan hanyalah keinginan dan sumber daya.