Model pengenalan suara automatik ini boleh mengesan dan menyembunyikan butiran penting semasa proses transkripsi audio, yang amat meningkatkan privasi dan keselamatan data.
TEL AVIV, Israel, 25 Nov 2024 /PRNewswire/ — aiOla, peneraju dalam teknologi AI suara, hari ini mengumumkan pelancaran model AI pertama seumpamanya untuk pengenalan suara automatik, yang dilengkapi dengan kemampuan pengenalan entiti bernama. Model aiOla ini menyelesaikan pelbagai cabaran penting bagi syarikat, termasuk pengesanan automatik dan penyembunyian maklumat sensitif seperti nama, nombor telefon, dan alamat dalam satu langkah semasa transkripsi audio.
Suara adalah cara paling mudah untuk berinteraksi dengan teknologi, menjadikan transkripsi audio sesuatu yang penting untuk aplikasi berasaskan suara. Salah satu cabaran utama dalam pengenalan suara automatik adalah memastikan privasi dan keselamatan, kerana percakapan pengguna sering mengandungi data sensitif. Risiko ini ditekankan pada tahun 2023 apabila sebuah syarikat yang menawarkan perkhidmatan transkripsi kepada organisasi penjagaan kesihatan mengalami pelanggaran data, mengakibatkan kecurian data daripada lebih 9 juta pesakit. Biasanya, syarikat memproses teks transkripsi untuk membuang maklumat sensitif. Namun, pendekatan berbilang langkah ini menjadikan data terdedah semasa disimpan dan dipindahkan sebelum proses tersebut, sekali gus mencipta isu regulasi dan pematuhan.
Model Whisper-NER aiOla mengesan dan menyembunyikan maklumat sensitif semasa transkripsi. Pengguna hanya perlu memuat naik fail audio dan menyenaraikan nama entiti yang ingin dikenal pasti, seperti “Nama Pesakit”, “Alamat Pesakit” atau “Nombor Telefon”. Model ini kemudian akan mtranskripsi audio sambil menyembunyikan entiti tersebut, memastikan maklumat peribadi sensitif tidak disimpan, bukan hanya secara sementara, tetapi juga meningkatkan privasi, keselamatan, dan pematuhan. Suatu lagi kelebihan adalah, untuk kes di mana privasi tidak menjadi isu, model ini menawarkan pilihan output yang fleksibel dan boleh dikonfigurasikan untuk mengenal pasti dan menandakan entiti tanpa menyembunyikannya. Ini menjadikan model sangat fleksibel dan sesuai untuk pelbagai aplikasi, termasuk pengurusan inventori, kawalan kualiti, pematuhan, dan pemeriksaan.
“Whisper-NER adalah model AI sumber terbuka pertama yang bukan sahaja mengesan dan menyembunyikan data sensitif, tetapi juga memastikan bahawa maklumat sensitif tidak dihasilkan dari awal,” ujar Gill Hetz, VP Penyelidikan di aiOla. “Pendekatan kami membolehkan kami menyusun transkripsi tidak tersusun tanpa bergantung pada model generik seperti ChatGPT, dan tanpa memerlukan proses ASR dan NER yang berasingan, yang boleh merosakkan privasi dan keselamatan. Whisper-NER beroperasi sebagai penyelesaian zero-shot, menggabungkan kedua-dua tugas dalam satu langkah yang cekap, yang secara signifikan meningkatkan produktiviti tanpa mengorbankan ketepatan. Inovasi ini bukan sahaja meningkatkan prestasi tetapi juga mengukuhkan amalan AI yang beretika, membina kepercayaan dalam pengumpulan data suara yang selamat dan bertanggungjawab.”
Whisper-NER dibina berasaskan Whisper daripada OpenAI, dan telah dilatih menggunakan dataset sintetik yang menggabungkan banyak data suara sintetik dengan dataset teks NER terbuka. Pendekatan ini membolehkan model mempelajari transkripsi dan pengenalan entiti secara serentak. aiOla akan melancarkan Whisper-NER sebagai model sumber terbuka di GitHub dan Hugging Face, menjadikan penyelesaian canggih ini boleh diakses oleh masyarakat, dan demo tersedia di sini untuk pengguna meneroka.
Info tentang aiOla:
Teknologi terpatentai aiOla memahami lebih daripada 100 bahasa dan dapat mengenali jargons, singkatan, serta akronim, menunjukkan kadar ralat yang rendah bahkan di persekitaran yang bising. Teknologi aiOla menukarkan proses manual dalam industri kritikal kepada aliran kerja berasaskan data, tanpa kertas, yang didorong oleh AI melalui pengenalan suara terkini.
Hubungi:
Gavriel Cohen
Concrete Media untuk aiOla
[email protected]
SOURCE aiOla
INGIN BERITA SYARIKAT ANDA DIMEGAH DI PRNEWSWIRE.COM?
440k+
Kamar Berita &
Influencer
9k+
Media Digital
Outlet
270k+
Wartawan
Berdaftar