Smaug: Model Bahasa NLP yang Bersaing dengan GPT-4 Turbo

Selular.ID – Model bahasa open source natural language processing (NLP) baru, Smaug-70b mengklaim tahta terbaik yang hampir bersanding dengan GPT 4 Turbo.

Di dunia Natural Language Processing (NLP), model bahasa terus berkembang dengan pesat, menawarkan kemampuan baru dan canggih untuk memahami dan menghasilkan bahasa manusia.

Salah satu model terbaru yang menarik perhatian adalah Smaug, yang telah menunjukkan hasil yang menjanjikan dalam benchmark MT-Bench, bersaing dengan model terkemuka seperti GPT-4 Turbo.

MT-Bench adalah benchmark yang menguji kemampuan model bahasa untuk menerjemahkan teks antar bahasa.

Dalam dua pengujian MT-Bench, Smaug-70b, versi 70 miliar parameter dari Smaug, mencapai skor rata-rata 9.2, hanya sedikit di bawah GPT-4 Turbo dengan skor 9.18.

Uji pertama
smaug-70b skor 9.4
llama3-70b skor 9.2
gpt-4-turbo skor 9.37

Tonton juga:

Video Rekomendasi Untuk Anda

Uji kedua
smaug-70b skor 9.0
llama3-70b skor 8..8
gpt-4-turbo skor 9.0

Meskipun Smaug menunjukkan performa yang setara dengan GPT-4 Turbo dalam MT-Bench, penting untuk dicatat bahwa benchmark ini hanya berfokus pada tugas penerjemahan.

Model bahasa digunakan untuk berbagai macam aplikasi lain, seperti menjawab pertanyaan, meringkas teks, dan menghasilkan teks kreatif.

Diperlukan evaluasi lebih lanjut untuk menentukan bagaimana Smaug dibandingkan dengan GPT-4 Turbo dalam tugas-tugas ini.

Selain MT-Bench, Smaug juga dievaluasi melalui evaluasi manusia. Evaluasi ini menunjukkan bahwa Smaug mampu menjawab pertanyaan sederhana dengan baik, namun masih ada ruang untuk perbaikan dalam memahami pertanyaan yang lebih kompleks dan menghasilkan jawaban yang lebih informatif.

Secara keseluruhan, Smaug menunjukkan potensi besar sebagai model bahasa NLP yang mampu bersaing dengan model terdepan seperti GPT-4 Turbo.

Hasil MT-Bench yang menjanjikan dan evaluasi manusia yang positif menunjukkan bahwa Smaug memiliki potensi untuk digunakan dalam berbagai aplikasi NLP.

Namun, diperlukan penelitian lebih lanjut untuk meningkatkan kemampuan Smaug dalam memahami dan menghasilkan bahasa manusia yang kompleks.

Di dunia nyata, tugas ini memerlukan penalaran dan perencanaan yang kompleks. Arena Hard adalah tolok ukur baru yang mengukur kemampuan LLM dalam menyelesaikan tugas-tugas kompleks.

Pada benchmark ini, Smaug memperoleh keuntungan signifikan atas Llama-3 dan mendapat skor 56,7 dibandingkan skor Llama-3 sebesar 41,1

Penting untuk diingat bahwa perkembangan model bahasa NLP masih dalam tahap awal. Model-model ini terus belajar dan berkembang, dan kemampuannya akan terus meningkat seiring waktu.

Smaug adalah salah satu contoh model bahasa yang menjanjikan yang memiliki potensi untuk merevolusi cara kita berinteraksi dengan komputer dan bahasa.

Smaug: Model Bahasa NLP yang Bersaing dengan GPT-4 Turbo

BACA JUGA

Rekomendasi Hp Redmi RAM 8GB Harga Rp2 dan 3 jutaan, Sudah 5G Jangan Salah Pilih

Beli Hisense RGB-MiniLED TV UR8S di Indonesia Berhadiah PS5

Oppo Reno16 Series Bundling Perdana IM3 dan Telkomsel, Gratis Spotify

Rekomendasi Tablet Xiaomi dan Poco Terbaru, Baterai Jumbo hingga 12.000mAh

DJI Osmo Pocket 4P dengan Kamera Gimbal Lensa Ganda Dijual Rp11 Jutaan

Rekomendasi Hp Realme Terbaru Rp2 Jutaan, Sudah AI dan IP69 Pro

BERITA TERKAIT

Malware MalTerminal Gunakan GPT-4 untuk Hasilkan Kode Berbahaya

Suara di GPT 4.o Dihentikan Setelah Kemiripannya Dengan Scarlett Johansson

Semenjak Dukungan GPT 4, Bing Laporkan Peningkatan Kunjungan

GOOGLE KETINGGALAN! ChatGPT makin canggih dengan GPT 4!

BERITA PILIHAN

Waze Tambah Fitur Gemini dan Mode Motor

Realme Narzo 100x 5G Segera Meluncur, Baterai 8.000mAh dan Layar 144Hz Jadi Senjata Andalan

Oppo Reno16 Series Bundling Perdana IM3 dan Telkomsel, Gratis Spotify

Modena Energy Dorong Adopsi Tenaga Surya Lebih Cerdas

Siapa Bisa Patahkan Dominasi TSMC?

Danamon Buka Akses Rp1,8 Triliun, Startup RI Diajak Tembus Pasar Global

BRI Peduli Bangun PLTS untuk Desa Bojong Bandung Barat

Investor RI Kini Bisa Tembus Wall Street Cuma Modal Rp11 Ribu

BERITA TERBARU

HP Infinix Harga Rp1 Jutaan yang Masih Diburu Bulan Juli 2026

Tips Membeli Tablet Multi Fungsi, Pengamat Jangan Terjebak Tawaran Menggiurkan

Komdigi Sahkan Pemenang Lelang Frekuensi 700 MHz dan 2,6 GHz Usai Tak Ada Sanggahan

Tak Banyak yang Tahu, Di Masa Jayanya Nokia Kerap Memanfaatkan Jasa Roy Suryo

BCA Tinggalkan Era Antre Bank, Nasabah Serbu myBCA di 2026

Daftar Handphone yang Dipakai Para Bintang Semifinalis Piala Dunia 2026, dari Mbappe hingga Messi