Model bahasa Google dan OpenAI memenangkan medali emas di Olimpiade Matematika Internasional.

  • Google dan OpenAI mencapai tingkat keunggulan yang sama dengan siswa terbaik di Olimpiade Matematika Internasional bergengsi menggunakan model bahasa generalis.
  • Kedua sistem memecahkan lima dari enam masalah, memperoleh skor yang dibutuhkan untuk medali emas dalam kondisi seperti manusia.
  • Strategi evaluasi dan pengakuan resmi berbeda: Google disertifikasi oleh juri IOM; OpenAI mengandalkan mantan peraih medali untuk memvalidasi hasilnya.
  • Kemajuan ini menunjukkan bahwa AI semakin dekat dalam membantu memecahkan masalah matematika mutakhir dan bidang ilmiah rumit lainnya.

Model bahasa dalam kompetisi matematika

Sebuah pencapaian yang belum pernah terjadi sebelumnya dalam sejarah kecerdasan buatan Terobosan tahun ini hadir setelah dua model bahasa pemrograman terkemuka, satu dikembangkan oleh Google dan satu lagi oleh OpenAI, berpartisipasi dalam Olimpiade Matematika Internasional (IMO) yang sangat menantang. Kedua teknologi ini berhasil menempatkan diri di level talenta muda terbaik dunia, meraih hasil yang setara dengan medali emas dalam kompetisi bergengsi ini, yang dikenal karena tingkat kesulitan soal dan keunggulan para pesertanya.

IOM setiap tahunnya mempertemukan ratusan anak muda yang dipilih dari lebih dari seratus negaraSetiap edisi menjadi ajang unjuk kebolehan matematika, dan kali ini, kecerdasan buatan telah menorehkan prestasi dengan berkompetisi di bawah aturan ketat: tidak ada akses internet, tidak ada bantuan dari luar, dan diharuskan menjelaskan alasannya dalam bahasa alami, sama seperti kontestan manusia lainnya.

Model AI Umum: Strategi di Balik Kesuksesan

Prestasi tahun ini didasarkan pada penggunaan model bahasa tujuan umum, melampaui sistem matematika khusus edisi sebelumnya. Di sisi Google, versi lanjutan Gemini, yang dijuluki Deep Think, menggabungkan teknik penalaran paralel, yang memungkinkan beberapa baris solusi dieksplorasi secara bersamaan sebelum memberikan jawaban akhir. Pendekatan serbaguna ini memungkinkan AI untuk dengan mudah menghadapi lima dari enam tantangan yang diusulkan dan mencapainya total 35 poin dari 42, hanya tersedia untuk 10% dari hampir 630 siswa yang berpartisipasi.

Model eksperimental dari OpenAI —masih tanpa nama komersial— menerapkan taktik yang berbeda namun sama kuatnya: memperpanjang waktu refleksi dan menggunakan daya komputasi yang substansial untuk menganalisis beberapa solusi secara paralel. Meskipun evaluasinya bergantung pada komite mantan peraih medali, hasilnya sesuai dengan skor emas, menunjukkan bahwa AI dapat bersaing secara setara dengan manusia terbaik.

Penilaian, sertifikasi dan beberapa kontroversi setelah hasilnya

Aspek kunci setelah kompetisi adalah sertifikasi resmi hasilGoogle bekerja sama erat dengan juri IOM, yang memvalidasi dan mensertifikasi kinerjanya. Di sisi lain, OpenAI memilih validasi independen dengan menggunakan pakar eksternal. Perbedaan ini telah menimbulkan beberapa perdebatan. mengenai sifat resmi dari pencapaian tersebut, terutama setelah publikasi awal hasil oleh OpenAI, yang menurut penyelenggara, dapat mengalihkan perhatian dari para siswa.

Terobosan ini menandai titik balik dalam evolusi model bahasa.:AI tidak hanya memahami pernyataan kompleks dalam bahasa alami, tetapi juga mampu membangun bukti matematika yang dapat dipahami dan ketat, bahkan dalam lingkungan yang menuntut seperti IMO.

Perspektif baru untuk kolaborasi antara AI dan matematikawan

Keberhasilan kedua perusahaan menunjukkan bahwa Penerapan kecerdasan buatan dapat melampaui matematika kompetitif.Kombinasi penalaran logis dan ekspresi bahasa alami membuka pintu bagi kemajuan masa depan dalam bidang-bidang seperti fisika, penelitian ilmiah, dan pemecahan masalah terbuka yang, hingga saat ini, tampaknya tidak mungkin dicapai oleh mesin.

Sebagaimana ditunjukkan oleh para peneliti seperti Junehyuk Jung (Universitas Brown dan Google DeepMind), akan tiba saatnya manusia dan model AI dapat bekerja sama untuk memecahkan tantangan yang melampaui batasan saat ini. Pelatihan model-model ini dan kolaborasi resmi dengan penyelenggara kompetisi ilmiah besar memperkuat tren ini.

Pencapaian ini menunjukkan bahwa Penerapan kecerdasan buatan dapat melampaui matematika kompetitif.Kombinasi penalaran logis dan kemampuan bahasa alami membuka pintu bagi kemajuan di bidang-bidang seperti fisika, penelitian ilmiah, dan pemecahan masalah terbuka yang, hingga saat ini, tampaknya tidak mungkin dicapai oleh mesin.

model OpenAI baru
Artikel terkait:
Model baru OpenAI: merevolusi AI percakapan dan agen

Ikuti kami di Google Berita