Mostly AI, sebuah pelopor dalam data sintetik terstruktur, telah melancarkan fungsi teks sintetik. Ini membolehkan syarikat Fortune 500 seperti Databricks dan Amazon Web Services (AMZN) untuk mengakses “banyak teks proprietari” bagi melatih dan menyempurnakan model bahasa besar, atau LLMs — tanpa mengorbankan privasi pengguna.
Di platform Mostly AI, pengguna boleh memuat naik data teks asli seperti emel dan transkrip panggilan sokongan pelanggan. Mereka juga boleh memilih model bahasa sumber terbuka dari Hugging Face untuk menghasilkan data sintetik. Data asli digunakan untuk menyempurnakan LLM di platform Mostly AI, yang seterusnya menghasilkan teks sintetik yang boleh dimuat turun atau disimpan dalam pangkalan data.
“Hari ini, pembelajaran AI berada di tahap terhad kerana model kehabisan sumber data awam dan memperoleh pulangan yang semakin berkurang,” kata Tobias Hann, CEO Mostly AI, dalam kenyataan. “Untuk memanfaatkan data proprietari yang berkualiti tinggi, yang menawarkan nilai dan potensi jauh lebih besar berbanding data awam yang tinggal, syarikat-syarikat global perlu mengambil langkah dan menggunakan kedua-dua data sintetik terstruktur dan tidak terstruktur untuk melatih dan melancarkan penyelesaian AI generatif yang akan datang.”