Gizli Matematik Zirvesi ve Şaşırtan Sonuçlar
Mayıs ayının ortasında, Kaliforniya‘da dünya çapında tanınan 30 matematikçi, kapalı kapılar ardında düzenlenen özel bir zirvede bir araya geldi. Bu seçkin grup, özel olarak geliştirilmiş yeni nesil bir yapay zeka “akıl yürütme” modelini, insan zekasının sınırlarını zorlayan problemlerle test etmek için toplandı.
İki gün süren bu yoğun test sürecinde, profesör düzeyindeki karmaşık sorularla karşı karşıya kalan o4-mini adlı sohbet botu, dünyanın en zorlu matematik problemlerinden bazılarını başarıyla çözerek katılımcıları hayrete düşürdü.
Zirvenin liderliğini üstlenen Virginia Üniversitesi’nden matematikçi Ken Ono, “Bazı meslektaşlarım bu modellerin neredeyse matematik dehası seviyesine yaklaştığını söylüyor” diyerek durumun ciddiyetini vurguladı.
o4-mini Nedir? Akıl Yürüten Yapay Zeka
Test edilen yapay zeka, OpenAI tarafından geliştirilen yeni nesil bir akıl yürütme (reasoning) modeli olan o4-mini idi. Bu model, standart dil modellerinden (LLM) önemli bir farkla ayrılıyor.
Standart LLM’lerden Farkı
Geleneksel LLM’ler genellikle mevcut verilere dayanarak tahminler yapar ve karmaşık problemlerde insan gibi adım adım mantık yürütme veya ispat geliştirme konusunda sınırlı kalır. Akıl yürütme özelliği ise yapay zekanın, ezberlenmiş bilgiyi tekrarlamak yerine bir mantık zinciri kurarak problemi çözmesine olanak tanır. Bu yetenek, özellikle matematik, bilim ve çok aşamalı planlama gerektiren alanlarda kritik bir üstünlük sağlamaktadır. Google’ın Gemini 2.5 Flash modeli de benzer yeteneklere sahiptir.
Gelişmiş Yeteneklerin Kaynağı
ChatGPT’nin önceki sürümleri gibi kelime tahmini üzerine eğitilen o4-mini, daha küçük ve çevik bir model olmasına rağmen, özel veri setleri ve insan destekli geri bildirimlerle çok daha derin akıl yürütme becerileri kazanmıştır. Bu sayede geleneksel LLM’lerin sınırlarını aşarak karmaşık matematik problemlerine çözüm üretebilmektedir.
“FrontierMath” Projesi ve Zorlu Test Süreci
OpenAI, o4-mini’nin gelişimini takip etmek amacıyla kar amacı gütmeyen Epoch AI kuruluşuyla işbirliği yaptı. Matematikçilerin katıldığı bu zirve de Epoch AI’ın “FrontierMath” adlı kıyaslama projesi kapsamında düzenlendi.
Gizlilik Anlaşmaları ve Özel Sorular
Epoch AI, projeye başlamadan önce yapay zekanın daha önce hiç görmediği 300 orijinal matematik sorusu hazırladı. Geleneksel LLM’ler bu yeni soruların yalnızca yüzde 2‘sinden azını çözebilirken, o4-mini çok daha üstün bir performans sergiledi. Projeye yakın zamanda doktorasını tamamlayan Elliot Glazer da dahil edildi ve lisans, yüksek lisans ve araştırma düzeyinde dört farklı zorluk seviyesinde sorular toplandı.
Dördüncü Seviye ve Yüz Yüze Oturum
Nisan 2025’e gelindiğinde o4-mini’nin soruların yaklaşık %20’sini çözebildiği görüldü ve “dördüncü seviye” başlatıldı. Bu seviye, sadece az sayıda uzmanın çözebileceği akademik düzeyde problemlerden oluşuyordu. Katılımcılar, LLM’lerin e-posta gibi kanalları tarayarak öğrenmesini engellemek için katı bir gizlilik sözleşmesi imzaladı ve yalnızca Signal üzerinden iletişim kurdu. Proje kapsamında, o4-mini’nin çözemediği her bir soruyu hazırlayan matematikçiye 7.500 dolar ödül vadedildi. Süreci hızlandırmak için 17-18 Mayıs tarihlerinde 30 akademisyenin katıldığı yüz yüze bir oturum gerçekleştirildi.
Bir Yapay Zeka Mucizesi: Ken Ono’nun Deneyimi
Zirveye katılan Ken Ono, yaşadığı şaşırtıcı anı şöyle anlattı: “Alanımdaki uzmanların bile açık soru olarak bildiği, iyi bir doktora düzeyi soru hazırladım. Botu denemek için sordum. On dakika içinde gerçek zamanlı olarak çözümü ekranımda yazmaya başladı.”
Scientific American dergisine konuşan Ono, botun önce ilgili literatürü taradığını, ardından sorunun basitleştirilmiş bir versiyonunu çözerek ilerlediğini ve kısa sürede asıl soruyu doğru yanıtladığını belirtti. Bot, çözümün sonuna şu notu eklemişti: “Atıf gerekmez çünkü gizemli sayıyı ben hesapladım!“
Ono, ertesi sabah diğer katılımcılara, “Bir bilim insanının yaptığı gibi akıl yürütüyordu. Bu gerçekten ürkütücü. Böyle bir LLM ile karşı karşıya kalacağımı hiç düşünmemiştim” mesajını gönderdi.
Geleceğe Bakış: Beşinci Seviye ve Bilim İnsanlarının Rolü
İki günlük yoğun çalışmanın sonunda, grup yapay zekayı alt edebilecek 10 soru bulmayı başardı. Ancak katılımcılar, yapay zekanın sadece bir yılda ulaştığı seviye karşısında derin bir şaşkınlık ve endişe içindeydi. o4-mini, bir matematikçinin haftalar sürecek hesaplamalarını dakikalar içinde yapabiliyor, bu da sonuçlara körü körüne güvenilmemesi gerektiği konusunda uyarıları beraberinde getiriyor.
Toplantının sonunda gözler, henüz kimsenin çözemediği problemlere, yani “beşinci seviye“ye çevrildi. Bu seviyeye ulaşıldığında, matematikçilerin rolünün kökten değişebileceği ve yapay zekayı yönlendiren danışmanlara dönüşebileceği öngörülüyor.
Ken Ono, durumu şu sözlerle özetledi: “Bu sadece bir bilgisayar değil. Panik yaratmak istemem ama bu LLM’ler, şimdiden dünyanın en iyi doktora öğrencilerinin çoğunu geride bırakıyor.”