"Efek Domino", atau Cara kami memperbarui perangkat lunak cloud di pusat data





Praktik mendukung dan mengembangkan cloud di pusat data Linxdatacenter memberikan kami kasus yang menarik. Operasi yang agak rutin untuk memperbarui hanya satu elemen dari platform cloud menyebabkan peningkatan dalam skala besar. 



Kami akan memberi tahu Anda bagaimana semuanya dimulai dan bagaimana cloud “digital twin” membantu kami. 




Anda tidak bisa begitu saja mengambil dan memperbarui vCloud Director



Komponen utama cloud Linxdatacenter adalah tumpukan teknologi VMware, yang mengimplementasikan panel kontrol infrastruktur virtual vCloud Director. Ini digunakan atas dasar komponen Cisco dan infrastruktur layanan seperti Windows Active Directory.



Di beberapa titik di akhir tahun 2020, kami mengalami masalah: vCloud Director 9.5 mulai tertinggal di belakang spesifikasi tugas saat ini, dan kami tidak mendapatkan peningkatan ke versi 10.1 atau 10.2. 



Tidak ada yang mengerikan dalam hal ini, tetapi di awal tahun 2021, dukungan Flash di browser berhenti.



Sejujurnya, kami tidak berharap pembuat Flash dan browser melakukan kekejaman ini. Artinya, semua orang telah lama mendengar tentang berakhirnya dukungan, tetapi berita bahwa dukungan akan dihapus secara fisik dari sistem operasi dan diblokir sepenuhnya di browser mulai 12 Januari, menjadi kejutan yang sangat tidak menyenangkan.



Faktanya adalah vCloud Director memiliki akses melalui dua portal. Yang pertama ada di Flash, itu yang utama dan, katakanlah, yang asli, dengan fungsionalitas yang sangat luas dan banyak kemungkinan. 



Pengembangan portal HTML dimulai dengan versi 8.20, hanya dalam perspektif meninggalkan Flash, secara bertahap menambahkan fungsionalitas baru ke dalamnya. Versi vCloud Director 9.5, yang sekarang disajikan di tiga situs kami, memenuhi sebagian besar permintaan pelanggan dalam hal fungsi, tetapi dari sudut pandang administrasi, masalah yang cukup signifikan mulai muncul.



Sebagai solusi perantara, kami berhasil menemukan konfigurasi browser yang masih memiliki akses Flash. Dan dari sudut pandang manajemen, kami terus mengontrol situasi, tidak ada masalah. 



Namun, bagi pengguna, fungsionalitas versi 9.5 tidak ideal. Pengguna sudah terbiasa bekerja di Flash, dan ketidakhadirannya menyebabkan ketidaknyamanan, mereka mengajukan pertanyaan, "tapi sebelum inimemang begitu, tapi bagaimana kita bisa melakukannya sekarang? " Dalam 10 versi, fungsinya terasa lebih baik dan sedekat mungkin dengan Flash. Oleh karena itu, diputuskan bahwa memperbarui vCloud Director adalah tugas # 1.



Warisan yang berat



Situasi ini diperumit oleh fakta bahwa platform awan di pusat data kami di St. Petersburg dan di situs mitra di Warsawa adalah "warisan" kami dari integrator sistem yang menerapkannya pada tahun 2013. Hingga 2017, perusahaan yang sama melakukan pemeliharaan dan peningkatan secara penuh, dan kemudian kami meningkatkan keahlian kami dalam jumlah yang cukup untuk mengambil kendali sepenuhnya ke tangan kami sendiri. 



Analisis awal dari situasi tersebut menunjukkan bahwa Anda tidak bisa begitu saja mengambil dan meningkatkan dari versi 9.5 ke 10.2. Menyusun rencana pembaruan langkah demi langkah untuk semua versi perangkat lunak untuk elemen awan yang berbeda dengan matriks kompatibilitas memerlukan tanggung jawab arsitek untuk tugas lebih dari 2 minggu. 



Hal ini disebabkan oleh struktur kompleks dependensi versi perangkat lunak, yang logikanya memerlukan transisi bertahap dan berurutan ke versi baru untuk menjaga kelancaran pengoperasian cloud secara keseluruhan.  



Perlunya peningkatan versi vCloud Director yang tidak bersalah memaksa kami untuk meluncurkan peningkatan platform lengkap, dimulai dengan server Windows dengan Active Directory dan diakhiri dengan semua komponen tambahan. Untuk menyelesaikan peningkatan terencana ke versi target di vCloud Director, Anda perlu memutakhirkan seluruh sistem empat kali: peningkatan platform cloud akan dilakukan dalam tiga putaran penuh atau antrian. 



Kami akan mulai dengan cloud kami sendiri di Warsawa, diikuti dengan situs di St. Petersburg dan Moskow. Tanggal penyelesaian yang direncanakan untuk pekerjaan ini adalah Mei 2021. 



Tapi pertama-tama, mari berlatih di "kembaran digital" cloud. 



Kembaran digital untuk cloud



Rencana kerja hanya untuk satu situs sangat kolosal, dengan mempertimbangkan sumber daya tim proyek yang terdiri dari tiga spesialis. 



Batasan ini, serta waktu, jumlah langkah perantara, dan kompleksitas infrastruktur mengharuskan kami untuk menguji implementasi praktis proyek secara menyeluruh pada mock-up virtual - kembaran digital cloud di laboratorium virtual. 



Kembaran digital cloud memberi kami keyakinan pada kualitas perubahan sistem yang dipicu dan dalam mencapai hasil yang diharapkan. Selain itu, sangat mudah untuk mengerjakan berbagai skenario untuk mengoperasikan platform pada kembar tersebut, dan jika terjadi kesalahan atau kegagalan, kami akan selalu memiliki kesempatan untuk memutar kembali ke snapshot mesin virtual dengan koreksi kesalahan. Ini mempercepat proses pembaruan dan memungkinkannya dilakukan tanpa kehilangan kualitas sistem secara keseluruhan.



Semua pembaruan akan dilakukan awal pada kembar digital, dan kemudian, jika proses transisi bertahap ke versi baru dari semua elemen platform berhasil, rencana kerja terperinci untuk infrastruktur target sebenarnya akan disesuaikan. 



Kembar digital sepenuhnya mereplikasi infrastruktur platform hingga ke komponen terbaru dari semua sistem. Semua perubahan pada infrastruktur nyata - pengaturan, konfigurasi, pembaruan perangkat lunak - diproses terlebih dahulu. 



Kami melihat bagaimana semua elemen menambahkan hingga satu gambar, menentukan risikonya, menghitung waktu yang dibutuhkan untuk tahap ini atau itu pembaruan, yang menjadi dasar pembuatan rencana kerja terperinci. 



Kembarannya dibuat menggunakan teknologi virtualisasi bersarang - Virtualisasi Bersarang. VMware memungkinkan Anda untuk meningkatkan hypervisor secara internal, dan Anda juga dapat menjalankan mesin virtual di hypervisor ini. 



Dalam kerangka kerja awan Warsawa kami, sumber daya dialokasikan untuk pembuatan "kembar" dan hypervisor, mesin virtual, dan jaringan diterapkan padanya - kami "membangun kembali" awan dari awal sesuai dengan semua versi OS, paket, perangkat lunak dan arsitektur yang menghubungkan mereka menjadi satu solusi.



Ini bukan "Ctrl + C / Ctrl + V", yaitu, kami tidak hanya menyalin sistem yang ada: hanya komponen utama sistem dan logika interaksinya yang direproduksi, hingga bandwidth saluran komunikasi, NGINX sebagai proxy terbalik dan "konfigurasi" untuk pendaftaran lalu lintas.



Si kembar "memakan" sumber daya situs dalam jumlah $ 650 per bulan - misalnya, kami membayar VMware sebagai penyedia layanan untuk RAM yang dikonsumsi oleh "ganda", dan ada lebih dari 20 mesin virtual yang ditempatkan di atasnya .



Ini adalah biaya yang signifikan, tetapi di sisi lain, menjalankan skrip pemutakhiran dengan aman selangkah demi selangkah menjamin perlindungan 100% terhadap kegagalan dan momen tak terduga saat meningkatkan infrastruktur nyata. Kerugian yang mungkin terjadi karena kerusakan sistem adalah lipat lebih tinggi daripada biaya pemeliharaan "kembaran". 



Harapan kami



Menurut perhitungan awal, sumber daya sistem setelah pembaruan akan cukup bagi platform untuk bekerja pada tingkat yang tepat tanpa perlu perubahan apa pun, belum lagi restrukturisasi global, setidaknya hingga akhir 2021. 



Sebagai bagian dari persiapan saat ini untuk pembaruan untuk sebagian besar versi perangkat lunak utama dari sistem utama, indikator End-of-support sudah ada sejak akhir tahun 2023. Selain itu, untuk sejumlah besar sistem, waktu penghentian dukungan untuk versi perangkat lunak masih belum diumumkan sejauh ini. 



Artinya, margin keselamatan keseluruhan harus cukup untuk 1-2 tahun, dan jika kita berbicara tentang pembaruan global yang sebanding dengan pembaruan saat ini, maka hari ini kita meletakkan fondasi untuk periode yang lebih lama. 



Siklus hidup platform cloud menyiratkan kebutuhan untuk selalu memiliki versi perangkat lunak terbaru dari elemen sistem utama. 



Berbicara secara umum tentang bidang pekerjaan ini, dapat dicatat bahwa keseluruhan kompleksitas dan rasa sakit dari restrukturisasi semacam itu akan selalu bergantung pada seberapa sulit untuk meluncurkannya, setelah berhenti melacak kompatibilitas versi, serta pada betapa beragamnya "kebun binatang" dari berbagai elemen, teknologi, protokol, dan perangkat lunak tempat cloud dibangun.



Apa yang harus kita perjuangkan di sini? Menuju unifikasi: pembaruan global yang diluncurkan pada akhirnya akan sangat menyederhanakan hidup kita dan meningkatkan keandalan cloud secara keseluruhan. 



Kami akan dapat sepenuhnya melepaskan diri dari warisan integrator yang menerapkan semua infrastruktur ini. Kami tidak akan memiliki titik buta dan potensi tautan lemah dalam rantai nilai cloud dalam bentuk ketersediaannya, fleksibilitas pengaturan, keandalan, dan parameter lain yang memengaruhi SLA. 



Segera setelah semua komponen cloud beroperasi pada versi perangkat lunak yang sama di semua situs, setiap peningkatan, ekstensi, dan integrasi berikutnya akan menjadi masalah manajemen yang kompeten dari komponen teknis, rutin, dan bukan proyek administratif dan teknis global. 



Kami berencana untuk menggunakan kembaran digital cloud di masa mendatang. Ini adalah alat praktis yang membantu membuat proses peningkatan infrastruktur lebih aman dan lebih cepat.



All Articles