Elon Musk’ın Grok 4 Hamlesi: İddialı Performans ve Bitmeyen Skandallar

NTV

4 hafta önce

Elon Musk’ın bir projesi olan Grok, OpenAI tarafından geliştirilen ChatGPT ve Google’ın Gemini modeline bir rakip olarak konumlandırılıyor. Son aylarda Musk’ın yönetimindeki sosyal medya platformu X ile entegrasyonu derinleşen yapay zeka, milyonlarca kişi tarafından kullanılmaya başlarken, bu durum ciddi tartışmaları da beraberinde getirdi. Bu kapsamda sunulan ve SuperGrok Heavy olarak isimlendirilen abonelik planı, xAI’nin şimdiye dek piyasaya sürdüğü en yüksek fiyatlı seçenek olarak dikkat çekiyor. Sadece metin oluşturmakla kalmayan bu sistem, aynı zamanda görselleri çözümleme ve komplike sorgulara cevap verme yeteneğine sahip.

Ancak Grok, hafta sonundan bu yana neden olduğu skandallarla gündemden düşmüyordu. Hem Türkiye’de hem de global ölçekte kullanıcıların sorularına küfürlü yanıtlar veren sohbet robotunun, Hitler’i öven ifadeler kullanması üzerine XAI alarm durumuna geçti ve hizmeti geçici olarak askıya aldı. Türkiye’de ise Atatürk’ün manevi şahsiyetine, Cumhurbaşkanına ve dini değerlere yönelik hakaret içeren ifadeleri nedeniyle erişim engeliyle karşılaştı. Yakın zamanda yaşanan bir başka olayda, Grok’un otomatikleştirilmiş X hesabı üzerinden antisemitik içerikler paylaşılması büyük tepkilere yol açmış, bu durum sonucunda xAI’nin ilgili hesaba erişimi sınırlayıp paylaşımları kaldırması gerekmişti. Şirket, bu olayın ardından Grok’un sistemindeki bazı sorunlu talimatları kaldırdığını duyurdu. Bu skandal niteliğindeki ifadeler, Elon Musk’ın yeni sürüm Grok 4’ü çarşamba günü bir xAI canlı yayınında tanıtacağını açıklamasıyla aynı döneme denk geldi.

Bu tartışmaların gölgesinde Elon Musk, Grok 4’ün akademik yetkinlik açısından “her alanda bir doktora derecesinden daha üstün” olduğunu öne sürdü. Musk, katıldığı bir canlı yayında, “Bazen sağduyudan yoksun olabilse de yeni teknolojiler geliştirmesi veya yeni fiziksel keşifler yapması an meselesi,” şeklinde bir açıklamada bulundu.

Grok 4, yapılan çeşitli testlerde de oldukça iddialı sonuçlar sergiledi. Şirket tarafından paylaşılan verilere göre, zorlu sorular içeren Humanity’s Last Exam testinde 25,4 puan alan Grok 4, bu skorla Google’ın Gemini 2.5 Pro (21,6) ve OpenAI’nin o3 (21) modellerini geride bıraktı. Grok 4’ün daha gelişmiş bir versiyonu olan Grok 4 Heavy, çoklu “ajan” sistemiyle görev yapıyor. Bu sistemde birden fazla yapay zeka, bir “çalışma grubu” gibi en uygun yanıtı bulmak için eş zamanlı olarak çalışıyor. Bu versiyonun, aynı testte araç desteğiyle elde ettiği 44,4 puan, rakipleriyle arasında belirgin bir fark olduğunu gösterdi. Ek olarak Grok, zeka testlerinde de dikkat çekici bir performans gösterdi. Arc Prize’ın zorlu ARC-AGI-2 testinde, görsel desenleri tanıma kabiliyeti sayesinde ticari modeller arasında en yüksek skoru elde etti.

xAI, Grok 4’ü API aracılığıyla geliştiricilerin kullanımına açarak yeni bir adım attı. Şirket bu hamleyle, henüz iki aylık bir geçmişe sahip olan kurumsal departmanını büyütmeyi ve önde gelen bulut sağlayıcıları ile iş birlikleri kurarak Grok’u daha geniş bir pazara sunmayı amaçlıyor. Diğer taraftan Musk’ın şirketi yalnızca Grok ile sınırlı kalmıyor. xAI’nin yol haritasında Ağustos ayında bir yapay zeka yazılım geliştirme modeli, Eylül ayında çok modlu bir sistem ve Ekim ayında ise video üretimi yapabilen bir modelin piyasaya sürülmesi planlanıyor.

Kasım 2023’teki lansmanından bu yana Grok, birçok skandalla anılmaya devam ediyor. Geçmişte, modelin Musk ve Trump hakkındaki eleştirileri sansürlediği ve Güney Afrika’daki “beyaz soykırımı” komplosunu doğrulayan ifadeler kullandığı iddia edilmişti. Mayıs ayında gerçekleşen bu olayın ardından Musk, sorumluluğun “kod üzerinde yetkisiz değişiklikler yapan bir çalışana” ait olduğunu belirtmişti. Musk ayrıca, Grok’un zaman zaman “çok fazla değersiz bilgiyle eğitildiğini” ve “fazlasıyla ana akım medya dili benimsediğini” ifade etmişti. Geçen ay yaptığı bir çağrıda ise kullanıcılardan, “siyasi olarak hatalı ancak doğru olan” ayrıştırıcı verileri Grok’a iletmelerini talep etmişti. Musk, Grok’u, Google’ın Gemini ve OpenAI’ın ChatGPT’sinin aksine “gerçeği en üst düzeyde arayan bir yapay zeka” olarak nitelendiriyor.

Grok’un sergilediği güçlü performansa rağmen, tekrar eden tartışmalar ve hatalar, xAI’nin kurumsal dünyada ChatGPT, Claude veya Gemini gibi yerleşik rakipleri karşısında güvenilirlik inşa etmesini güçleştirebilir. Grok’un önümüzdeki dönemde bu sorunların üstesinden gelip iş dünyasında ne ölçüde benimseneceği büyük bir merak konusu olarak varlığını sürdürüyor.