Vidu, sebuah model generasi video yang besar, dikembangkan oleh syarikat AI China ShengShu Technology dan Universiti Tsinghua, yang menampilkan generasi teks kepada video dan imej ke video, baru-baru ini menjadi tersedia untuk kegunaan global.
Pernyataan yang dikeluarkan mengatakan, Vidu mampu mencipta klip 4 saat dalam masa 30 saat dan boleh menghasilkan video sehingga 32 saat panjang dalam satu insiden.
“Vidu boleh mensimulasikan dunia fizikal sebenar, mencipta scene terperinci yang mematuhi undang-undang fizikal, seperti kesan pencahayaan semulajadi dan bayangan, serta ekspresi wajah yang rumit. Selain itu, ia boleh menghasilkan kandungan surrealistik dengan kedalaman dan kompleksiti,” kata Zhu Jun, pengarah timbalan Institut Kecerdasan Buatan Tsinghua.
Zhu menambah bahawa untuk genre yang berbeza seperti sains-fiksyen, romantis, dan animasi, Vidu boleh menghasilkan scene yang menangkap intipati setiap gaya, dan ia juga boleh mencipta kesan sinematik berkualiti tinggi, seperti asap dan kilauan lensa.
Model AI ini boleh menguruskan pelbagai jenis tembakan, termasuk tembakan panjang, dekat dan sederhana, dan boleh dengan mudah menghasilkan kesan seperti rakaman panjang, penarikan fokus dan peralihan scene yang lancar.
Pengguna boleh muat naik potret atau imej watak yang disesuaikan dan menggunakan huraian teks untuk mengarahkan watak-watak untuk melakukan sebarang tindakan dalam mana-mana scene. Ciri ini menyederhanakan proses pengeluaran video dan meningkatkan kebebasan kreatif.
Syarikat tersebut berkata bahawa senibina utama Vidu dicadangkan pada awal tahun 2022.