Sistem penyimpanan yang tidak kedaluwarsa. Tidak pernah

gambar



Pada awalnya, ceritanya terdengar cukup sederhana: sistem penyimpanan bekerja dengan baik selama tiga tahun dengan garansi yang diperpanjang, yang keempat relatif normal, dan yang baru dibeli, bukan yang usang pada yang kelima. Vendor memeras uang dari Anda dengan meningkatkan biaya dukungan dan semua jenis fitur berbayar seperti dukungan VDI. Bisakah skema ini dipatahkan? Mungkin ya.



Perusahaan memasuki pasar dengan proposal yang menarik: perangkat keras selalu berfungsi, selalu bekerja dengan cepat, biaya dukungan sama setiap tahun, semua fitur segera tersedia. Artinya, mereka hanya mengambil kotaknya dan dari waktu ke waktu mereka mengganti komponen di dalamnya sehingga menjadi usang dengan kecepatan penggantian. Pengontrol diperbarui setiap tiga tahun, dimungkinkan untuk mengganti disk lama dengan yang lebih modern, yaitu, ruang yang ditempati oleh sistem penyimpanan di rak tidak hanya dapat bertambah, tetapi juga berkurang, sementara volume dan kinerja meningkat.



Sebenarnya, hal pertama yang Anda lihat di rak adalah pegangan dengan nama model, yang dengannya Anda dapat dan harus menarik pengontrol dari array.



gambar



Ini dilakukan tanpa mematikan, menghasilkan uang, dan margin produktivitas sedemikian rupa sehingga sistem perbankan tidak melambat selama penggantian. Untuk melakukan ini, Anda harus menulis sistem file Anda sendiri (lebih tepatnya, analog dari RAID), merakit cluster di dalam dan membuat beberapa perbaikan, pada saat yang sama membuang overhead yang diwarisi dari hard drive.



Mari kita lihat apa yang terjadi dan bagaimana hasilnya. Mari kita mulai dengan arsitektur.



Sebagai permulaan, prosedur untuk bekerja dengan array tidak termasuk tombol daya. Benar. Tidak perlu. Untuk mematikan, cukup tarik kabel dari PDU.



gambar



Arsitektur penyimpanan murni



Perusahaan mulai dari fakta bahwa ia mengembangkan dari awal arsitektur yang sangat bagus, dipertajam untuk flash (sejak 2017 - NVMe), dan algoritme yang efektif untuk deduplikasi dan kompresi data. Perhitungannya adalah sebagai berikut: lalu ada array hard drive, solusi hybrid, dan SSD all-flash di pasaran. Flash drive mahal, dan drive disk lambat. Karenanya, mereka masuk ke lingkungan kompetitif dengan array flash dengan biaya memiliki array disk.



gambar



Kami melakukan ini:



  1. Kami membuat sistem operasi kami sendiri untuk disk. Fitur utamanya adalah kompresi data yang cepat sebelum merekam, dan kemudian pasca-pemrosesan dengan dedup yang kuat, yang memungkinkan Anda untuk memadatkannya lebih padat dan lebih akurat.
  2. Kami hanya mengambil flash drive (sekarang umumnya hanya menggunakan NVMe) dan perangkat keras yang kuat untuk komputasi.


Implementasi pertama adalah untuk lingkungan VDI, karena data di sana dikompresi dengan sangat baik. Algoritma deduplikasi dan kompresi memberikan keuntungan enam hingga sembilan kali lipat dalam ruang yang digunakan, yaitu, dengan semua keunggulan all-flash, mereka menurunkan harga sekitar urutan besarnya. Plus, model ekonomi menyuap saya: biaya tetap untuk dukungan dan kemampuan untuk tidak mengubah perangkat keras. Kemudian saya melihat penggantian pertama dari dua rak dengan versi tiga atau enam unit, tetapi saya masih tidak percaya bahwa besi ini akan digunakan di suatu tempat di luar VDI.



Dan kemudian LinkedIn mulai menyimpan potongan-potongan besi ini. AT&T terhubung. Bank dan telekomunikasi papan atas di Amerika Serikat juga membeli produk.



Ternyata algoritma kompresi cukup cocok untuk lingkungan pengembangan dan pengujian. Setelah mengganti SSD dengan NVME, persaingan tiba-tiba dimulai pada database transaksional konvensional di segmen perbankan. Karena larik tersebut ternyata cepat dan andal karena arsitekturnya "setiap saat kami dapat kehilangan dua modul flash". Kemudian flash array pada chip yang lebih murah (QLC) keluar dengan waktu respons 2-4 ms, dan bukan 1 ms seperti pada model teratas, dan saya mulai mengamati penghapusan VNX dan Compellent yang sama. Jelaslah bahwa sepotong besi cukup kompetitif.



Biasanya, biaya TB akan terus tinggi jika ada data yang tidak dapat dimampatkan: enkripsi, pengarsipan, streaming video (pengawasan video), dan pustaka gambar, tetapi terkadang penerapan semacam itu juga terjadi ketika klien membutuhkan kinerja tinggi. Saya mengetahui kasus ketika video dikompresi (tampaknya data terkompresi) dengan tambahan 10%.



Tetapi bahkan untuk database konvensional, ternyata cukup bisa diterapkan dengan harga per gigabyte.



Dan di sinilah model sistem penyimpanan "evergreen" mulai menyuap.



Peningkatan konstan



Selama lima tahun, hanya sasis dan catu daya yang tetap berada di bagian besi dari yang lama. Anda dapat bergerak secara tersentak dengan transfer, atau Anda dapat mengubah komponen seperti dalam sebuah cluster. Sebenarnya ini cluster, hanya dirakit dalam satu box tiga unit (atau enam unit). Besi dibuat dari awal untuk diri mereka sendiri. Mari kita lihat arsitekturnya terlebih dahulu, lalu lanjutkan ke mengapa nyaman untuk mengubahnya satu per satu.



gambar



Solusi yang menarik adalah:



  • Daya komputasi selalu dua kali lebih banyak: pengontrol perlu diganti tanpa menurunkan kinerja. Pada saat yang sama, kedua pengontrol bekerja di bagian depan, dan satu pengontrol digunakan di bagian belakang untuk menulis ke modul flash.
  • RAID- , N + 2, . , — , . .
  • N + 2, , . , . RAID, , , , ( ) , .
  • ! , , . , - .
  • , ! , , ( ), - . , , , . . , RAID 10.
  • — NVMe-, — NVRAM. Optane. — , ( SCM-), .
  • . - , , . , .
  • 3:1, . 512 , 8 . — , . . HDD, .
  • ( ). , .


gambar



Tetapi itu tidak cukup bagi perusahaan untuk merakit arsitekturnya dan menulis OS server virtual untuknya. Mereka sendiri masuk ke tingkat rendah dari chip flash dan merilis chip mereka sendiri. Tetapi pada saat yang sama mereka kompatibel dengan standar. Di atas adalah antarmuka NVMe, di dalamnya ada chip desain kami sendiri.



gambar



Biola mengambil jalan ini, yang pernah memberi mereka susunan yang cepat secara kosmis. Hanya mereka yang membuat standar sendiri, tetapi di sini mereka menggunakan standar yang terbuka dan tersedia untuk umum. Untuk apa ini? Firmware chip adalah bagian dari firmware pengontrol, dan oleh karena itu sistem penyimpanan tahu persis apa yang terjadi pada setiap bata.



gambar



Jika di rak disk biasa setiap modul SSD atau NVMe adalah kotak hitam kecil untuk pengontrol, maka di sini dia melihat semuanya. Itu diperlukan ketika menyelesaikan masalah volume besar yang dapat dialamatkan, karena masalah array flash adalah sama: manajemen keausan, pengumpulan sampah, dll. Ini dilakukan oleh firmware pengontrol.



gambar



gambar



Artinya, seperti yang bisa Anda lihat, teka-teki itu adalah sebagai berikut: tempat yang murah dicapai dengan menukar kinerja. Kinerja tinggi berarti redundansi CPU dan RAID yang konstan. Jumlah prosesor yang berlebihan berarti pasca-pemrosesan kompresi yang kuat dan kemampuan untuk kehilangan bagian apa pun tanpa kehilangan kinerja. RAID cocok dengan ide ini. Artinya, semua keuntungan ini memberikan chip hampir gratis untuk mengambil bagian dari "keuntungan".



Berikutnya adalah pemasaran dan menawarkan pernyataan keras "penyimpanan awet muda". Tag harga dukungan tetap, termasuk semua perangkat lunak, tidak ada bundel tambahan. Karena tingkat layanan terpisah, Anda dapat mengganti pengontrol secara gratis setiap tiga tahun (tingkat EMAS Evergreen). Ada peningkatan seiring peningkatan persyaratan: Saya melihat bagaimana XR2 berubah menjadi XR3. Saya bekerja selama setahun, kemudian sebuah bisnis masuk dan mengatakan kami membutuhkan yang baru. Vendor memiliki opsi untuk memperdagangkan pengontrol lama dan mendapatkan yang baru sebelumnya. Peningkatan yang bagus. Pengontrol hanya berubah satu per satu.



Mengupgrade disk lebih menarik. Rak layanan tambahan dengan disk berasal dari pabrik. Data dimigrasi ke rak tanpa henti - semua data dari media tersebut harus diganti. Rak bekerja dengan pengontrol utama (memiliki sendiri). Sebenarnya, ini adalah paket data unit, penyimpanan sementara. Saat migrasi selesai, disk ditandai sebagai OK, dan teknisi menghapusnya dari sasis. Di tempat yang lama, itu memasukkan yang baru dan memulai migrasi balik. Dibutuhkan satu hari atau lebih, tetapi aplikasi dan server tidak diperhatikan. Karena sistem penyimpanan ini sering kali tersedia dari penyedia layanan, ada kemungkinan penggantian dan peningkatan secara bersamaan: dalam kerangka Evergreen GOLD, Anda dapat mengganti disk lama dengan beberapa yang baru dan cepat, plus membeli yang sama.



Jadi, ada baiknya untuk diisi, titik lemahnya selalu kompresi!



Kami terbiasa mendengar ini dari pengguna penyimpanan disk. Di sana, ceritanya standar - fungsinya tidak disediakan selama pengembangan arsitektur - mereka mengaktifkan kompresi, aplikasi berhenti, lalu menghabiskan banyak waktu untuk mencoba memulihkan semuanya lagi di bawah penyalahgunaan manajemen. Seperti yang telah disebutkan, Penyimpanan Murni telah mengambil jalur yang berbeda - deduplikasi dengan kompresi telah dijadikan fungsi dasar yang tidak dapat diputuskan. Hasilnya adalah Pure Storage sekarang bernilai lebih dari 15.000 instalasi. Selama inisialisasi, Anda dapat mencentang kotak "berikan statistik anonim", dan kemudian sistem penyimpanan Anda akan mengirim ke sistem pemantauan Pure 1. Jaminan untuk database, misalnya, adalah 3.5: 1. Ada fitur khusus - VDI yang sama dari 7: 1 dan lebih tinggi. Array dijual tidak di tempat yang lembab, tetapi dalam wadah yang berguna dengan jaminan pengiriman tambahan,yaitu, jika selama migrasi tingkat kompresi Anda ternyata lebih rendah dari yang dijamin, vendor menyediakan lebih banyak disk fisik secara gratis. Vendor mengatakan drive dikirim dalam sekitar 9-10% kasus, dan kesalahan jarang melebihi beberapa drive. Di Rusia, saya belum pernah melihat ini sebelumnya, koefisiennya sama pada semua instalasi, kecuali untuk kasus ketika data terenkripsi "terungkap", yang pelanggan tidak mengatakan bahwa itu dienkripsi.



Karena sifat snapshot, lingkungan pengujian sangat efisien. Ada contoh klien yang membuat ukuran 7: 1 dalam perhitungan, dan menerima 14 kopek berbanding satu.



Vendor menyatakan berikut ini:



  • 3.5: 1 database (Oracle, MS SQL).
  • 4.2: 1 virtualisasi server (VMware, Hyper-V).
  • 7.1: 1 VDI (Citrix, VMware).
  • Rasio rata-rata 5: 1 di seluruh pangkalan yang dipasang.


Juga dari fungsionalitas yang menarik: otomatisasi dan integrasi dengan pakaian anak muda yang modis seperti Kubernetes, serta dukungan penuh untuk VMware vvol. Semuanya sederhana di sini - sebagian besar klien barat Pure Storage adalah penyedia cloud seperti ServiceNow, yang, omong-omong, diposting di situs web. Mereka terbiasa mengotomatiskan semuanya sebanyak mungkin.



Total



Ternyata menjadi hal yang menarik, yang pada awalnya terlihat aneh, dan kemudian semakin menyenangkan dan menyenangkan. Lima tahun di Gartner:



gambar



Tentu saja, model ekonomis Evergreen tidak begitu murah dan murah, tetapi menghemat dari sejumlah wasir dan terlihat cukup kompetitif saat menghitung biaya kepemilikan selama beberapa tahun.



PS Pertemuan online tersedia di bawah ini: "Sistem penyimpanan data dengan berlangganan: kebenaran atau fiksi."






All Articles