Jumat, 1 Agustus 2025
Selular.ID -

Meta Hadirkan Penerjemah Multimodal Untuk Bicara Dalam 100 Bahasa

BACA JUGA

Selular.ID – Bagi anda yang tidak bisa berbahasa Inggris atau bahasa asing lainnya, tidak perlu khawatir lagi. Meta kabarnya akan memberikan penerjemah yang bisa dalam 100 bahasa.

Tidak lain dan tidak bukan, Meta dibantu oleh Artificial Intelligence (AI), yang mana metode penerjemahan AI modern ini terbukti lebih dari cukup dalam mengubah secara akurat sekitar 6.500 sistem komunikasi lisan dan tulisan umat manusia antara satu sama lain.

Masalahnya adalah masing-masing model ini cenderung hanya melakukan satu atau dua tugas dengan sangat baik, menerjemahkan dan mengubah teks menjadi ucapan, ucapan menjadi teks, atau antara salah satu dari dua rangkaian tersebut.

Itu adalah proses komputasi yang intensif, jadi Meta mengembangkan satu model yang dapat melakukan semuanya.

Ia adalah SeamlessM4T, yaitu model multibahasa dan multitasking dasar yang menerjemahkan dan menyalin ucapan dan teks dengan lancar.

Kemampuannya ini dapat menerjemahkan antara hampir 100 bahasa untuk fungsi ucapan-ke-teks dan teks-ke-teks, ucapan-ke-ucapan dan teks-ke-ucapan mendukung bahasa yang sama sebagai input dan mengeluarkannya dalam 36 bahasa lainnya, termasuk bahasa Inggris.

Namun dalam laporannya tidak dijelaskan secara rinci bahasa apa saja yang sudah termasuk, jadi untuk menerjemahkan bahasa Indonesia belum jelas bisa atau tidaknya.

Tapi dalam postingan blog mereka, tim peneliti Meta mencatat bahwa SeamlessM4T secara signifikan meningkatkan kinerja untuk bahasa sumber daya rendah dan menengah yang kami dukung, sambil mempertahankan kinerja yang kuat pada bahasa sumber daya tinggi, seperti Inggris, Spanyol, dan Jerman.

Meta membangun SeamlessM4T dari arsitektur model UnitY multitask berbasis PyTorch yang sudah ada, yang secara asli telah melakukan berbagai terjemahan modal serta pengenalan ucapan otomatis.

Meta juga telah mengkurasi ucapan-ke-ucapan dan ucapan-ke-teks sumber terbuka yang besar, yang dijuluki SeamlessAlign.

Perusahaan ini mengumpulkan puluhan miliar kalimat dan empat juta jam pidato dari repositori yang tersedia untuk umum agar secara otomatis menyelaraskan lebih dari 443.000 jam pidato dengan teks, dan menciptakan sekitar 29.000 jam penyelarasan ucapan-ke-ucapan per blog.

Saat diuji ketangguhannya, SeamlessM4T dilaporkan mengungguli pendahulunya terhadap kebisingan latar belakang dan variasi gaya pembicara masing-masing sebesar 37 persen dan 48 persen.

Baca juga : Meta Siapkan Threads Versi Web

- Advertisement 1-

BERITA TERKAIT

BERITA PILIHAN

BERITA TERBARU