SELULAR.ID – Qwen Alibaba baru saja meluncurkan ‘penalaran’ model AI baru yang disebut QwQ-32B-Preview. Model ini disebut menjadi pesaing model penalaran dari o1 milik OpenAI.
QwQ-32B-Preview berisi 32,5 miliar parameter dan dapat mempertimbangkan perintah hingga ~32.000 kata. Berdasarkan pengujian Alibaba, QwQ-32B-Preview mengalahkan model o1-preview OpenAI pada pengujian AIME dan MATH.
AIME menggunakan model AI lain untuk mengevaluasi kinerja model, sedangkan MATH merupakan kumpulan soal cerita. Model milik Alibaba ini diklaim memiliki kerja lebih baik pada tolok ukur tertentu daripada o1-preview dan o1-mini, dua model penalaran yang telah dirilis OpenAI.
Dalam uji cobanya, QwQ-32B-Preview memiliki kemampuan memecah soal matematika yang rumit. Kekurangannya, Alibaba mencatat, bahwa model tersebut mungkin beralih bahasa secara tak terduga, terjebak dalam loop, dan berkinerja buruk pada tugas-tugas yang memerlukan ‘nalar yang masuk akal’.
Baca juga: Profil William Xiong yang Jabat CTO GOTO, Pernah di Alibaba
QwQ-32B-Preview dan model penalaran lainnya secara efektif memeriksa fakta sendiri. Hal ini membantu mereka menghindari beberapa jebakan yang biasanya menjegal model.
Sisi negatifnya adalah mereka seringkali membutuhkan waktu lebih lama untuk sampai pada solusi. Mirip dengan o1, QwQ-32B-Preview bernalar melalui tugas, merencanakan ke depan, dan melakukan serangkaian tindakan yang membantu model menemukan jawaban.
QwQ-32B-Preview tersedia secara ‘terbuka’ di bawah lisensi Apache 2.0, yang berarti dapat digunakan untuk aplikasi komersial. QwQ-32B-Preview dapat dijalankan dan diunduh dari platform pengembangan AI Hugging Face.
Model AI QwQ-32B-Preview milik Alibaba tersebut juga tunduk terhadap aturan di Tiongkok, yakni tidak menjawab seputar pertanyaan politik yang sensitif.
Ikuti informasi menarik lainnya dari Selular.id di Google News