OpenAI’dan Dev Adım: Tüketici Donanımlarında Çalışan Yeni Açık Ağırlıklı Yapay Zeka Modelleri

NTV

2 ay önce

OpenAI’dan Yapay Zeka Alanında Yeni Bir Hamle: Açık Ağırlıklı Modeller

Yapay zeka devi OpenAI, sektörü hareketlendiren bir duyuruyla iki yeni açık ağırlıklı (open-weight) dil modelini Apache 2.0 lisansı altında kullanıma sundu. “Açık ağırlıklı” terimi, bir modelin eğitim sürecinde öğrendiği parametrelerin, yani ağırlıklarının, kamuya açık olarak paylaşılması anlamına gelir. Bu gelişme sayesinde geliştiriciler ve kullanıcılar, bu güçlü modelleri kendi bilgisayarlarına kurarak yerel olarak çalıştırabilecek. Böylece, pahalı bulut tabanlı API hizmetlerine bağımlılık azalırken, sistemlere entegrasyon ve özelleştirme imkanları artıyor.

OpenAI’dan yapılan açıklamaya göre, yeni modeller yüksek performans sunmalarına rağmen, tüketici düzeyindeki donanımlarda dahi çalışabilecek şekilde optimize edildi. Özellikle 16 GB GPU’lu bir dizüstü bilgisayarda bile çalışabilen model, yapay zekanın daha geniş kitlelere ulaşması adına büyük bir potansiyel taşıyor. Grafik işlem birimi (GPU), yapay zeka uygulamalarının temelini oluşturan karmaşık matematiksel hesaplamaları hızla gerçekleştiren kritik bir donanım bileşenidir.

Yeni Modellerin Teknik Özellikleri ve Kapasiteleri

Şirketin kamuoyuyla paylaştığı açık ağırlıklı modeller ve öne çıkan özellikleri şunlardır:

gpt-oss-120b: Bu model, 117 milyar parametreye sahip olup, OpenAI’nin popüler o4-mini modeliyle benzer bir akıl yürütme performansı sergiliyor. Çalışması için 80 GB GPU yeterli oluyor.
gpt-oss-20b: 21 milyar parametrelik bu model ise o3-mini seviyesinde bir performans sunarken, sadece 16 GB GPU ile verimli bir şekilde çalışabiliyor.

Model parametreleri, bir yapay zeka modelinin karmaşıklığını ve bilgi işleme kapasitesini belirleyen temel ölçüttür. Parametre sayısı ne kadar yüksekse, modelin karmaşık dil yapılarını anlama ve görevleri yerine getirme yeteneği o kadar artar. Bu yeni modeller, geliştiricilerin yüksek maliyetli sunucu altyapılarına yatırım yapmadan güçlü yapay zeka uygulamaları oluşturmalarını sağlayabilir.

Gelişmiş Akıl Yürütme ve Araç Kullanımı

OpenAI, yeni modellerin aynı boyuttaki diğer açık kaynak alternatiflerine kıyasla daha üstün akıl yürütme ve araç kullanımı performansı sunduğunu vurguluyor. Modellerin, internette arama yapma ve Python kodlarını çalıştırma gibi görevlerde başarılı olduğu belirtiliyor. Ayrıca, verilen talimatları anlama ve görevin karmaşıklığına göre mantık yürütme seviyesini dinamik olarak ayarlama gibi gelişmiş yeteneklere sahip oldukları ifade ediliyor. OpenAI, bu modellerin Hugging Face, GitHub, vLLM, Ollama ve llama.cpp gibi popüler geliştirici platformlarıyla entegrasyonunu kolaylaştırmak için detaylı rehberler de yayınladı.

Güvenlik ve Şeffaflık Yaklaşımı

Güvenliğin ön planda tutulduğu geliştirme sürecinde, modellerin kötü niyetli kullanımlara karşı test edildiği belirtildi. Testler, modellerin biyolojik, kimyasal veya siber güvenlik riskleri oluşturacak tehlikeli seviyelere ulaşmadığını gösterdi. Şeffaflık adına ise, modellerin “düşünce zinciri” (chain-of-thought) çıktılarına herhangi bir filtre uygulanmadı. Bu teknik, yapay zekanın bir sonuca nasıl ulaştığını adım adım göstermesini sağlar.

Şirketin açıklamasında, “Düşünce zincirlerini bastırmak, modellerin zararlı düşüncelerini gizlemesine yol açabilir. Bu nedenle baskı uygulamaktan kaçındık. Geliştiricilerin bu çıktıları izleyerek modellerin davranışlarını denetleyebilmesini amaçlıyoruz” ifadelerine yer verildi.

Bu yaklaşım, modellerin zaman zaman gerçek dışı veya “halüsinatif” içerikler üretmesine neden olabilmektedir. Yapılan testler, yeni modellerin halüsinasyon konusunda o4-mini kadar başarılı olmadığını, bunun da daha küçük model boyutlarından kaynaklandığını ortaya koyuyor.

Açık Kaynak ile Açık Ağırlık Arasındaki Fark Nedir?

OpenAI’ın bu adımı, yapay zekanın “demokratikleşmesi” yolunda önemli bir gelişme olarak görülüyor. Ancak “açık ağırlıklı” ve “açık kaynaklı” terimlerinin farkını anlamak önemlidir. OpenAI’ın modelleri açık ağırlıklıdır, yani modelin parametreleri ve mimarisi herkes tarafından erişilebilirdir. Fakat bu, modelin açık kaynak kodlu olduğu anlamına gelmez. Açık kaynak, modelin eğitim verileri ve tüm kod tabanı dahil olmak üzere her bileşeninin kamuya açık olması demektir.