Sebuah pencapaian yang belum pernah terjadi sebelumnya dalam sejarah kecerdasan buatan Terobosan tahun ini hadir setelah dua model bahasa pemrograman terkemuka, satu dikembangkan oleh Google dan satu lagi oleh OpenAI, berpartisipasi dalam Olimpiade Matematika Internasional (IMO) yang sangat menantang. Kedua teknologi ini berhasil menempatkan diri di level talenta muda terbaik dunia, meraih hasil yang setara dengan medali emas dalam kompetisi bergengsi ini, yang dikenal karena tingkat kesulitan soal dan keunggulan para pesertanya.
IOM setiap tahunnya mempertemukan ratusan anak muda yang dipilih dari lebih dari seratus negaraSetiap edisi menjadi ajang unjuk kebolehan matematika, dan kali ini, kecerdasan buatan telah menorehkan prestasi dengan berkompetisi di bawah aturan ketat: tidak ada akses internet, tidak ada bantuan dari luar, dan diharuskan menjelaskan alasannya dalam bahasa alami, sama seperti kontestan manusia lainnya.
Model AI Umum: Strategi di Balik Kesuksesan
Prestasi tahun ini didasarkan pada penggunaan model bahasa tujuan umum, melampaui sistem matematika khusus edisi sebelumnya. Di sisi Google, versi lanjutan Gemini, yang dijuluki Deep Think, menggabungkan teknik penalaran paralel, yang memungkinkan beberapa baris solusi dieksplorasi secara bersamaan sebelum memberikan jawaban akhir. Pendekatan serbaguna ini memungkinkan AI untuk dengan mudah menghadapi lima dari enam tantangan yang diusulkan dan mencapainya total 35 poin dari 42, hanya tersedia untuk 10% dari hampir 630 siswa yang berpartisipasi.
Model eksperimental dari OpenAI —masih tanpa nama komersial— menerapkan taktik yang berbeda namun sama kuatnya: memperpanjang waktu refleksi dan menggunakan daya komputasi yang substansial untuk menganalisis beberapa solusi secara paralel. Meskipun evaluasinya bergantung pada komite mantan peraih medali, hasilnya sesuai dengan skor emas, menunjukkan bahwa AI dapat bersaing secara setara dengan manusia terbaik.
Penilaian, sertifikasi dan beberapa kontroversi setelah hasilnya
Aspek kunci setelah kompetisi adalah sertifikasi resmi hasilGoogle bekerja sama erat dengan juri IOM, yang memvalidasi dan mensertifikasi kinerjanya. Di sisi lain, OpenAI memilih validasi independen dengan menggunakan pakar eksternal. Perbedaan ini telah menimbulkan beberapa perdebatan. mengenai sifat resmi dari pencapaian tersebut, terutama setelah publikasi awal hasil oleh OpenAI, yang menurut penyelenggara, dapat mengalihkan perhatian dari para siswa.
Terobosan ini menandai titik balik dalam evolusi model bahasa.:AI tidak hanya memahami pernyataan kompleks dalam bahasa alami, tetapi juga mampu membangun bukti matematika yang dapat dipahami dan ketat, bahkan dalam lingkungan yang menuntut seperti IMO.
Perspektif baru untuk kolaborasi antara AI dan matematikawan
Keberhasilan kedua perusahaan menunjukkan bahwa Penerapan kecerdasan buatan dapat melampaui matematika kompetitif.Kombinasi penalaran logis dan ekspresi bahasa alami membuka pintu bagi kemajuan masa depan dalam bidang-bidang seperti fisika, penelitian ilmiah, dan pemecahan masalah terbuka yang, hingga saat ini, tampaknya tidak mungkin dicapai oleh mesin.
Sebagaimana ditunjukkan oleh para peneliti seperti Junehyuk Jung (Universitas Brown dan Google DeepMind), akan tiba saatnya manusia dan model AI dapat bekerja sama untuk memecahkan tantangan yang melampaui batasan saat ini. Pelatihan model-model ini dan kolaborasi resmi dengan penyelenggara kompetisi ilmiah besar memperkuat tren ini.
Pencapaian ini menunjukkan bahwa Penerapan kecerdasan buatan dapat melampaui matematika kompetitif.Kombinasi penalaran logis dan kemampuan bahasa alami membuka pintu bagi kemajuan di bidang-bidang seperti fisika, penelitian ilmiah, dan pemecahan masalah terbuka yang, hingga saat ini, tampaknya tidak mungkin dicapai oleh mesin.