Dalam sesi AMA di Reddit, CEO OpenAI Sam Altman mengakui bahawa kekurangan kapasiti pengiraan adalah salah satu faktor utama yang menghalang syarikat daripada mengeluarkan produk seperti yang diinginkan.
“Semua model ini menjadi semakin kompleks,” kata Altman sebagai jawapan kepada soalan kenapa model AI seterusnya dari OpenAI mengambil masa yang lama untuk dilancarkan. “Kami juga menghadapi banyak batasan dan keputusan sukar tentang bagaimana kami memperuntukkan kapasiti pengiraan untuk banyak idea hebat.”
Banyak laporan menunjukkan bahawa OpenAI mengalami kesukaran untuk mendapatkan infrastruktur pengiraan yang mencukupi untuk menjalankan dan melatih model generatifnya. Baru-baru ini, Reuters melaporkan bahawa OpenAI telah bekerja dengan Broadcom untuk mencipta cip AI bagi menjalankan model, yang dijangka tersedia seawal tahun 2026.
Akibat daripada kapasiti yang terhad, Altman menyatakan bahawa ciri perbualan maju ChatGPT, Advanced Voice Mode, tidak akan menerima kemampuan visual yang pertama kali diumumkan pada bulan April dalam masa terdekat. Pada acara tersebut, OpenAI menunjukkan aplikasi ChatGPT berfungsi di telefon pintar dan bertindak balas terhadap isyarat visual, seperti pakaian yang dipakai seseorang, di depan kamera telefon.
Laporan dari Fortune kemudiannya mendedahkan bahawa demo tersebut dipercepatkan untuk menarik perhatian daripada persidangan pembangun Google I/O yang berlangsung pada minggu yang sama. Banyak dalam OpenAI berpendapat bahawa GPT-4o belum bersedia untuk didedahkan — yang jelasnya, versi hanya suara Advanced Voice Mode ditunda selama berbulan-bulan.
Dalam AMA, Altman menyatakan bahawa pelancaran seterusnya bagi penjana imej OpenAI, DALL-E, masih tiada jangka masa. (“Kami tidak mempunyai pelan pelepasan lagi,” katanya.) Sementara itu, Sora, alat penjana video OpenAI, terhalang oleh “keperluan untuk memperbaiki model, memastikan keselamatan serta isu pemalsuan, dan juga skala pengiraan,” tulis Kevin Weil, pegawai produk utama OpenAI yang turut hadir dalam AMA.
Sora dilaporkan mengalami masalah teknikal yang menjadikannya kurang kompetitif berbanding sistem pesaing seperti Luma, Runway, dan lain-lain. Menurut The Information, sistem asal yang diperkenalkan pada Februari mengambil lebih dari 10 minit untuk memproses satu klip video berdurasi 1 minit.
Pada bulan Oktober, salah seorang pemimpin Sora, Tim Brooks, telah berpindah ke Google.
Kemudian dalam AMA, Altman menyatakan bahawa OpenAI masih mempertimbangkan untuk membenarkan kandungan “NSFW” dalam ChatGPT “suatu hari nanti” (“kami benar-benar percaya dalam memperlakukan pengguna dewasa seperti orang dewasa,” tulisnya), dan keutamaan utama syarikat adalah untuk meningkatkan siri model “reasoning” o1 dan penggantinya. OpenAI telah memberikan gambaran pelbagai ciri yang akan datang kepada o1 di persidangan DevDay yang diadakan di London minggu ini, termasuk pemahaman imej.
“Kami mempunyai beberapa pelepasan yang sangat baik akan datang akhir tahun ini,” tulis Altman. “Tiada apa yang akan kami panggil sebagai GPT-5, walau bagaimanapun.”