-Ads Here-
Pelatihan model kecerdasan buatan (AI) yang lebih besar semakin mahal dan membutuhkan banyak energi. Dengan membuat proses pelatihan model AI lebih stabil dan dapat diprediksi, penelitian terbaru DeepSeek menawarkan cara baru untuk mengurangi pemborosan tersebut. DeepSeek memperkenalkan teknik yang disebut manifold-constrained hyperconnection (mHC) dalam makalah penelitian terbarunya. Sebagaimana dikutip oleh Gizmochina pada hari Minggu (4/1/2026), metode ini tidak berkonsentrasi pada peningkatan kinerja mentah; sebaliknya, itu berfokus pada mempertahankan pelatihan model AI berskala besar, yang selama ini sering menjadi masalah bagi industri.
DeepSeek menekankan bahwa banyak model AI yang lebih canggih gagal dalam proses pelatihan. Ketika terjadi kegagalan, organisasi harus mengulang pelatihan dari awal, yang berarti menghabiskan minggu-minggu, menghabiskan banyak listrik, dan menghabiskan ribuan jam komputasi GPU. Kondisi ini meningkatkan biaya pengembangan AI.
Selama proses pelatihan, DeepSeek berusaha menjaga perilaku model dalam batas yang lebih terkontrol melalui mHC. Dengan stabilitas yang lebih baik, pelatihan model lebih mungkin menyelesaikan tugas tanpa perlu melakukannya lagi.
Metode ini dianggap masuk akal karena pelatihan AI membutuhkan lebih banyak daya pusat data. Meskipun mHC tidak membuat GPU lebih hemat daya secara langsung, metode ini mungkin mengurangi jumlah daya yang terbuang karena pelatihan yang gagal. Dengan kata lain, daripada mengubah perangkat keras, efisiensi dicapai dengan mengurangi jumlah sumber daya yang dibuang.
Selain itu, DeepSeek mengevaluasi stabilitas pelatihan, yang berpotensi mengurangi ketergantungan industri pada metode "brute force", seperti meningkatkan jumlah GPU, meningkatkan kapasitas memori, atau memperpanjang waktu pelatihan hanya untuk memastikan model tetap berjalan. Pelatihan yang lebih stabil dapat mengurangi kebutuhan akan sumber daya berlebih.
Menurut DeepSeek, mHC tidak akan langsung menyelesaikan masalah kelangkaan perangkat keras atau peningkatan konsumsi energi di seluruh dunia. Namun demikian, penelitian ini dianggap sebagai langkah penting untuk meningkatkan pemanfaatan infrastruktur yang sudah ada.
Pendekatan seperti mHC dianggap dapat membantu pengembang membangun model AI yang lebih kuat yang lebih terkendali dari segi biaya dan konsumsi energi. Hal ini seiring dengan perkembangan model AI. Efisiensi seperti ini semakin penting bagi industri AI di tengah tekanan ekonomi dan lingkungan yang meningkat.
-Ads Here-