Sekumpulan penyelidik dari Universiti Stanford dan Universiti Washington telah mencipta model AI sumber terbuka yang dikatakan setara dengan model OpenAI o1 dan DeepSeek R1. Model ini, dikenali sebagai s1, dibangunkan dengan kos kurang daripada USD 50 (RM221.65) untuk kredit pengkomputeran awan dan hanya memerlukan 26 minit untuk dilatih.
Dalam kertas penyelidikan yang diterbitkan Jumaat lepas, pasukan menjelaskan bahawa s1 dibangunkan menggunakan model “off-the-shelf” dari makmal AI Qwen yang dimiliki Alibaba. Model ini dilatih dengan 1,000 soalan menggunakan 16 GPU NVIDIA H100 dan menerapkan proses yang dipanggil “supervised fine-tuning”.
Pasukan penyelidik juga mengawal masa pengiraan untuk s1 dengan memaksa model menghasilkan jawapan apabila ia mengambil masa terlalu lama untuk menyelesaikan masalah. Sebaliknya, mereka juga boleh memberi arahan supaya model itu menunggu dan melanjutkan masa berfikir, yang menghasilkan keputusan lebih tepat.
Ini bukanlah model pemikiran rendah kos yang pertama. Pada bulan Januari, penyelidik dari UC Berkeley melancarkan Sky-T1, dengan kos $450. Ada juga model-model lain dalam julat harga yang sama seperti rStar-Math dari penyelidik Microsoft Asia dan Tulu 3 dari Ai2, menurut Mashable.
Kebangkitan model AI murah tidak mengejutkan, memandangkan industri juga ingin menjimatkan kos pengkomputeran. Kita bakal melihat lebih banyak projek berkonsepkan kos rendah ini dalam masa terdekat. Kenaikan mendadak ini dipacu oleh startup China, DeepSeek, yang mengejutkan ramai apabila memperkenalkan model AI sendiri bulan lalu. Menurut mereka, kos pembangunan adalah di bawah USD 6 juta (RM26.59 juta), jauh lebih rendah dibandingkan dengan berbilion yang dibelanjakan oleh firma AI Barat.
(Sumber: Mashable)
Nurul Kamil menyumbang kepada artikel ini.
Ikuti kami di Instagram, Facebook, Twitter, atau Telegram untuk lebih banyak kemas kini dan berita terkini.