X’in Yapay Zekası Grok Neden Saldırganlaştı? Hakaret Skandalının Perde Arkası

Dünyanın en çok kullanılan sosyal medya ağlarından biri olan X’in yapay zeka asistanı Grok, geçtiğimiz akşam yaptığı paylaşımlarla büyük bir tartışma başlattı. Platform kullanıcıları, Grok’un bu beklenmedik davranışının sebebini sorgulamaya başladı. Peki, Grok’un herkese hakaret etmesinin altında yatan neden neydi?

ŞİRKETTEN AÇIKLAMA GECİKMEDİ
X, Grok kaynaklı paylaşımlar hakkında resmi bir bilgilendirme yayınladı ve şu noktalara değindi:
– “Grok tarafından oluşturulan son gönderilerin farkındayız ve yakışıksız içerikleri platformdan temizlemek üzere aktif bir şekilde müdahale ediyoruz.”
– “Durumun tespit edilmesinin hemen ardından xAI, Grok’un X üzerinde paylaşım yapmadan önce nefret söylemini önlemesine yönelik tedbirleri devreye sokmuştur.”
– “xAI olarak yalnızca gerçeği bulmayı hedefleyen bir yapay zeka geliştiriyoruz. X’teki milyonlarca kullanıcının sağladığı geri bildirimler sayesinde, modelin geliştirilmesi gereken alanları hızla saptayıp güncellemeler yapabiliyoruz.”

SKANDALIN KAYNAĞI NE?
2022 yılında Twitter’ı 44 milyar dolara bünyesine katan ve platformun adını X olarak değiştiren ünlü iş insanı Elon Musk, 4 Temmuz’da yaptığı bir paylaşımda Grok’a önemli bir güncelleme getirildiğini duyurmuştu. Musk, bu güncelleme sonrasında kullanıcıların “Grok’a soru sorduklarında aradaki farkı net bir şekilde göreceklerini” ifade etmişti.

Bu duyurunun ardından Grok’un, bazı kullanıcılara küfür ve argo içeren yanıtlar vermeye başladığı görüldü.

Hâlihazırda Grok’un üçüncü sürümü aktif olarak kullanılıyor ve şirketin çok yakında dördüncü versiyonu da piyasaya sürmesi bekleniyor.

Sorunların temelinde, 4 Temmuz’da yapılan güncellemedeki bir değişikliğin yattığı düşünülüyor. Söz konusu güncelleme ile Grok’a, kanıtlarla desteklendiği ve doğru olduğu sürece “politik doğrucu olmayan bir ifade biçimi” kullanma serbestisi tanınmıştı. Bu serbestliğin, yapay zekanın kontrolsüz ve saldırgan yanıtlar vermesine neden olduğu tahmin ediliyor.