Mode GKE baru lebih mahal dan kurang fleksibel, tetapi lebih sederhana dan lebih aman
GKE Autopilot Mengelola Pod untuk Anda
Dua hal yang terkenal tentang cluster Kubernetes. Yang pertama adalah bahwa ini benar-benar alat terbaik untuk tugas penting orkestrasi kontainer. Dan kedua, kompleksitasnya merupakan penghalang implementasi dan penyebab umum kesalahan. Bahkan Google, penemu dan promotor utama Kubernetes, mengakui hal ini.
Untuk menyederhanakan penerapan dan pengelolaan cluster, perusahaan telah memberi semua pelanggan GKE akses ke layanan Autopilot , yang telah lama digunakan Google di cluster Borg-nya sendiri . Ini adalah konfigurasi sumber daya otomatis berdasarkan pembelajaran mesin.
“Terlepas dari 6 tahun kemajuan, Kubernetes masih sangat kompleks, ” Drew Bradstock, kepala produk untuk Google Kubernetes Engine (GKE), mengatakan kepada The Register. "Dalam beberapa tahun terakhir, kami telah melihat banyak perusahaan mengadopsi Kubernetes, tetapi kemudian mengalami kesulitan."
GKE adalah platform Kubernetes yang dijalankan terutama di Google Cloud Platform (GCP). Ini juga tersedia di awan lain atau secara lokal sebagai bagian dari Anthos .
Autopilot - mode operasi baruGKE, lebih otomatis dan dikonfigurasi sebelumnya untuk mengurangi biaya operasi untuk manajemen cluster, mengoptimalkan cluster untuk produksi dan ketersediaan tinggi.
Menggunakan Autopilot di infrastruktur Google sendiri,
Kubernetes sumber memiliki konsep cluster (kumpulan server fisik atau virtual), node (server individu), pod (blok kontrol yang mewakili satu atau beberapa container di node), dan container itu sendiri. GKE sepenuhnya dikelola di tingkat cluster. Autopilot memperluas ini ke node dan pod.
Cara termudah untuk memahami fitur dan batasan Autopilot adalah dari deskripsi sistem.... Perhatikan parameter "pra-konfigurasi" yang tidak dapat diubah.
Perbandingan mode Autopilot dan Standar
Pada dasarnya, ini adalah cara lain untuk memesan dan mengelola sumber daya GKE yang mengorbankan fleksibilitas demi kenyamanan. Karena Google mengelola sebagian besar konfigurasi, Google menjamin waktu operasional yang lebih tinggi sebesar 99,9% untuk pod Autopilot dengan banyak zona (lihat SLA ).
Di awan Google, wilayah terdiri dari tiga zona atau lebih. Menempatkan semua sumber daya dalam satu zona kurang dapat diandalkan dibandingkan di beberapa zona, dan perluasan ke beberapa wilayah memberikan toleransi kesalahan maksimum. Kluster di Autopilot selalu didistribusikan berdasarkan wilayah, bukan zona: lebih andal, tetapi lebih mahal.
Batasan lain dari Autopilot adalah sistem operasi Linux yang sudah diinstal sebelumnya dengan Containerd, "dioptimalkan untuk penampung". Tidak ada cara untuk menggunakan Linux dengan Docker atau Windows Server. Jumlah maksimum pod per node adalah 32, bukan 110 seperti pada GKE standar.
Tidak ada akses SSH ke node, node Autopilot diblokir. Dukungan GPU dan TPU (Tensor Processing Unit) tidak tersedia, meskipun direncanakan untuk masa mendatang. “Membuang SSH adalah keputusan yang sulit,” kata Bradstock. Tentu saja, ini membatasi opsi kontrol. Tapi Bradstock mengatakan keputusan itu didasarkan pada penelitian yang menunjukkan tingkat kesalahan kritis yang tinggi dalam konfigurasi klaster.
Uang
Model penetapan harga juga berbeda di sini. Anda tidak dikenai biaya untuk instance komputasi (mesin virtual), tetapi untuk penggunaan aktual CPU, memori, dan penyimpanan oleh semua pod. Ditambah $ 0,10 per jam per cluster di Autopilot, seperti GKE standar.
Pertanyaan yang jelas adalah mana yang akan lebih mahal, cluster standar atau Autopilot. Jawabannya tidak mudah. Karena dalam beberapa hal ini merupakan layanan premium, Autopilot lebih mahal daripada penerapan GKE standar yang dioptimalkan dengan cermat. "Ada premium di atas GKE biasa," kata Bradstock, "karena kami tidak hanya menyediakan fungsionalitas, tetapi juga dukungan penuh SRE (Site Reliability Engineering) dan jaminan SLA."
Namun, Autopilot bisa lebih murah daripada penerapan GKE yang tidak dikonfigurasi dengan benar yang tidak dimuat sepenuhnya karena sulit untuk mengevaluasi spesifikasi yang benar untuk instance komputasi. Fungsi alokasi kumulatif (CDF) dari memori yang tidak digunakan dan mesin yang ditempati untuk 5000 tugas setelah mengaktifkan Autopilot di infrastruktur Google sendiri, sumber Mengurangi kesalahan memori (OOM) dan berbagi memori yang tidak digunakan untuk 500 tugas setelah mengaktifkan Autopilot di infrastruktur Google, sumber
Mengapa tidak menggunakan Cloud Run, yang menjalankan beban kerja container tanpa cluster, node, atau konfigurasi pod, bahkan di GKE? “Cloud Run adalah lingkungan yang bagus untuk pengembang, satu aplikasi dapat berubah dari nol menjadi 1000 instans dan kembali ke nol, itulah gunanya cloud,” jelas Bradstock. "Autopilot membuat hidup lebih mudah bagi orang yang ingin menggunakan Kubernetes, ingin melihat dan mengontrol segalanya, ingin menggunakan skrip pihak ketiga, ingin membangun platform mereka sendiri."
Masalah yang pasti adalah kompatibilitas dengan add-on yang ada dengan alat pihak ketiga untuk Kubernetes. Beberapa di antaranya belum kompatibel dengan Autopilot, tetapi yang lain sudah berfungsi, seperti pemantauan Datadog. DaemonSets juga didukung - fitur ini digunakan oleh banyak alat untuk menjalankan daemon di semua node.
Konfigurasi untuk penyimpanan, komputasi, dan jaringan telah memaksa beberapa tingkat fleksibilitas dan beberapa integrasi turun: "Tapi kami pasti ingin ekosistem pihak ketiga berjalan di [Autopilot]," kata Bradstock.
Dengan diluncurkannya Autopilot, berbagai opsi untuk menjalankan Kubernetes di Google cloud semakin luas. Kompromi tidak hanya biaya yang lebih tinggi dan fleksibilitas yang lebih sedikit, tetapi juga potensi disorientasi Devops di pabrik. Namun, logika utamanya adalah bahwa bisnis lebih baik berfokus pada bisnis inti mereka daripada layanan yang dilakukan oleh kontraktor.
Teknik Google memiliki reputasi yang jauh lebih baik daripada layanan pelanggan. Pengembang Kevin Lin baru-baru ini menggambarkan seperti apa AWS dan skema bonus startup Google.
Google terbukti sebagai organisasi yang lambat dan tidak efektif yang akhirnya merujuk klien ke mitra pihak ketiga. “Percakapan pertama adalah tentang berapa banyak uang yang saya rencanakan untuk dibelanjakan di Google (dibandingkan dengan menelepon Amazon di tempat yang mereka inginkan untuk membantu saya mengaktifkan dan menjalankan layanan). Google Cloud memiliki ergonomi yang sangat bagus dan insinyur kelas dunia, tetapi memiliki reputasi yang buruk untuk layanan pelanggan, ”katanya.
Ini adalah bukti lebih lanjut bahwa insinyur yang baik bukan satu-satunya faktor penting dalam memilih cloud.