-Ads Here-

TurboQuant adalah teknologi baru yang sedang dikembangkan oleh Google. Teknologi ini terdiri dari algoritma kompresi memori berbasis kecerdasan buatan (AI), yang diharapkan dapat berfungsi sebagai "obat" untuk mengatasi krisis memori yang sedang melanda industri saat ini. Di tengah lonjakan harga RAM yang disebabkan oleh tingginya kebutuhan komputasi AI, inovasi ini dianggap dapat meredakan tekanan dengan cara yang tidak biasa: membuat AI membutuhkan lebih sedikit memori. TurboQuant dikembangkan oleh Google Research, divisi riset perusahaan. Fokus utama TurboQuant adalah efisiensi penggunaan memori selama proses inferensi—saat model AI dijalankan, bukan dilatih.
Teknologi ini bertujuan untuk mengatasi salah satu kendala (bottleneck) utama dalam sistem AI kontemporer, yaitu keterbatasan "memory kerja". Ini terutama berlaku untuk komponen yang dikenal sebagai KV cache, yang merupakan memori sementara yang digunakan model untuk memproses dan mengingat konteks data.
Cara TurboQuant bekerja: Teknik vector quantization adalah cara untuk membuat representasi data numerik lebih sederhana tanpa menghilangkan informasi penting. Metode ini memungkinkan pengkompresian data yang signifikan meskipun mempertahankan akurasi model AI.
PolarQuant dan Quantization-aware Joint Learning (QJL) adalah dua metode utama yang digunakan TurboQuant secara teknis. PolarQuant mengubah representasi data sehingga lebih efisien saat disimpan di memori tanpa mengurangi kualitas hasil komputasi. Pada saat yang sama, QJL mengajarkan model AI untuk "sadar" bahwa data yang diproses akan dikompresi. Ini memungkinkan model untuk beradaptasi dan menghasilkan output yang akurat meskipun bekerja dengan data yang telah dipadatkan.

Peneliti menemukan bahwa TurboQuant dapat menghemat penggunaan memori hingga enam kali lipat jika digunakan dengan kombinasi kedua pendekatan tersebut. Dengan kata lain, model AI memiliki kemampuan untuk "mengingat" lebih banyak informasi dalam jumlah ruang yang lebih kecil, sehingga mengurangi kendala kinerja yang disebabkan oleh memori yang terbatas.
TurboQuant dianggap sebagai solusi potensial untuk krisis RAM saat ini karena kemampuan ini. Karena peningkatan permintaan AI, harga memori, terutama DDR5, melonjak tajam dalam beberapa waktu terakhir. Karena produsen memori memprioritaskan pasokan untuk pusat data skala besar, atau hyperscaler, ketersediaan di pasar konsumen seperti komputer pribadi dan laptop menjadi terbatas.
Akibatnya, harga RAM telah melonjak hingga empat hingga lima kali lipat dibandingkan dengan tingkat normal sebelumnya. Harga tersebut masih tergolong tinggi dan fluktuatif meskipun sempat menurun di beberapa daerah seperti China pada akhir April. TurboQuant menawarkan metode yang berbeda untuk situasi ini. Teknologi ini justru mengurangi kebutuhan akan memori, bukan menambahnya.
Jika AI dapat beroperasi dengan RAM yang lebih sedikit, tekanan permintaan memori dapat berkurang, yang dapat membantu menstabilkan harga di pasar. Namun, TurboQuant belum digunakan secara industri dan masih dalam tahap penelitian.
Selain itu, teknologi ini hanya berfokus pada efisiensi dalam inferensi daripada pelatihan model AI, yang merupakan fase yang paling menghabiskan sumber daya. Sebagaimana dikutip KompasTekno dari Tech Crunch, TurboQuant masih belum dapat menyelesaikan masalah kelangkaan dan RAM yang mahal dalam ekosistem AI, meskipun penampilannya menjanjikan.
Karena penimbun RAM panik, efek psikologis dari kemunculan teknologi ini sudah mulai terasa di pasar meskipun belum dirilis secara komersial. Perilaku distributor memori, terutama di China, yang sebelumnya menimbun stok dalam jumlah besar saat harga sedang tinggi, merupakan salah satu buktinya. Dilaporkan bahwa para penimbun ini mulai melakukan "cuci gudang" atau melepaskan stok RAM mereka ke pasar setelah pengumuman TurboQuant.
Mereka paling khawatir tentang kemungkinan penurunan permintaan untuk hyperscaler jika teknologi kompresi seperti TurboQuant digunakan secara luas, yang dapat menurunkan harga memori. Meskipun tidak merata di seluruh dunia, langkah tersebut juga menyebabkan harga RAM turun di beberapa tempat.
TurboQuant dapat menekan biaya operasional AI dan membantu mengembangkan sistem yang lebih hemat sumber daya jika digunakan secara luas di masa depan. Dalam jangka panjang, teknologi ini dapat memainkan peran penting dalam membuat AI lebih terjangkau dan berkelanjutan, sekaligus mengurangi tekanan pada industri memori di seluruh dunia.
-Ads Here-