OpenAI’dan görsel akıl yürütme yeteneğine sahip yeni modeller: o3 ve o4-mini

OpenAI, yapay zeka alanında önemli bir sıçramaya işaret eden iki yeni modelini tanıttı: o3 ve o4-mini. Bu modeller, yalnızca metinle değil, aynı zamanda görsellerle “düşünebilen”, araçları kendi başına kullanabilen ve çok adımlı görevleri bağımsız şekilde tamamlayabilen yapay zeka sistemleri olarak öne çıkıyor. Şirket, bu yeni nesil modellerin hem zeka hem de pratiklik açısından bugüne kadar geliştirdikleri en yetkin sistemler olduğunu belirtiyor.

İnsan benzeri görsel akıl yürütme

OpenAI’ın “görselle düşünme” olarak tanımladığı özellik, o3 ve o4-mini’yi benzerlerinden ayıran temel unsur. Kullanıcılar artık bu modellere bir beyaz tahta fotoğrafı, PDF’ten alınmış bir grafik ya da elle çizilmiş bir diyagram yüklediğinde, modeller bu görseli analiz edip onun üzerinden akıl yürütebiliyor. Üstelik bu analiz, görüntü net olmasa bile mümkün.

OpenAI, bu yeteneği “sadece görüntüye bakmıyorlar; onunla düşünüyorlar” diyerek özetliyor. Bu da görsel ve metinsel akıl yürütmenin birleştiği yepyeni bir problem çözme sınıfının önünü açıyor. Modeller görsel üzerinde yakınlaştırma, döndürme, kırpma gibi işlemleri bağımsız şekilde gerçekleştirebiliyor.

Araçlarla entegre, çok adımlı görev yönetimi

OpenAI, o3 ve o4-mini’nin yalnızca gelişmiş modeller değil, tam teşekküllü yapay zeka sistemleri olduğunu vurguluyor. Modeller, ChatGPT’deki tüm araçları, web tarayıcı, Python kod yürütücüsü, dosya analizörü ve görsel üretici dahil, birbirine zincirleyerek çok adımlı görevleri baştan sona gerçekleştirebiliyor.

Bu özellik, modellerin kullanıcıdan sürekli yönlendirme almadan karmaşık görevleri çözebilmesini sağlıyor. Örneğin kullanıcı, “Kaliforniya’da bu yaz enerji tüketimi geçen yıla göre nasıl değişecek?” diye sorduğunda, model web’den veri arıyor, Python kodu yazıyor, grafik oluşturuyor ve bulgularını bir raporla açıklıyor.

Akademik başarılar ve yazılım geliştirme

OpenAI’ın o3 modeli, özellikle yazılım geliştirme alanında dikkat çekici bir performans sergiliyor. OpenAI Başkanı Greg Brockman, modelin kendi şirketlerinin kod tabanında bile kendisinden daha iyi yön bulduğunu söyledi. o3, Codeforces, SWE-bench ve MMMU gibi önde gelen testlerde yeni bir standart belirlerken, özellikle yazılım mühendisliği, bilimsel araştırma ve iş analitiği gibi alanlarda güçlü sonuçlar verdi.

Daha küçük ve maliyet odaklı bir model olan o4-mini ise hız ve verimlilik arasında başarılı bir denge kuruyor. 2025 AIME matematik yarışmasında yüzde 99.5 başarı sağlayan model, yüksek hacimli kullanımlar için ideal bir çözüm sunuyor.

Yeni araç: Codex CLI ve geliştiricilere destek programı

Modellerle birlikte tanıtılan bir diğer yenilik de Codex CLI adındaki hafif terminal tabanlı kodlama yardımcısı oldu. Geliştiriciler, bu aracı kullanarak ekran görüntüsü ya da kabataslak bir çizim gibi girdilerle modellerin kodlama yeteneklerinden faydalanabiliyor. Codex CLI açık kaynak olarak GitHub üzerinden yayınlandı. Ayrıca, bu aracı kullanan projelere destek vermek amacıyla OpenAI, toplam 1 milyon dolarlık bir hibe programı başlattı.

Güvenlik ve etik testler

OpenAI, o3 ve o4-mini’nin şimdiye kadar uyguladıkları en kapsamlı güvenlik testlerinden geçtiğini duyurdu. Özellikle biyolojik tehditler, kötü amaçlı yazılım üretimi ve jailbreak denemelerine karşı yeni reddetme protokolleri geliştirildi. Şirket, modellerin “yüksek risk” eşiğinin altında kaldığını ve tehlikeli komutlara karşı sistem seviyesinde güvenlik önlemleri bulunduğunu belirtiyor.

Kullanıma sunulma ve fiyatlandırma

o3 ve o4-mini modelleri, bugünden itibaren ChatGPT’nin Plus, Pro ve Team kullanıcıları tarafından erişilebilir durumda. Enterprise ve Education planları ise bir hafta içinde erişim sağlayacak. Ücretsiz kullanıcılar ise composer’daki “Think” seçeneğini kullanarak o4-mini’yi deneyimleyebilecek.

Geliştiriciler için de modeller, Chat Completions API ve Responses API üzerinden sunulmaya başlandı. o3’ün geliştirici kullanımında fiyatı milyon input token başına 10 dolar, output token başına ise 40 dolar olarak belirlendi. Daha küçük olan o4-mini için ise bu fiyatlar sırasıyla 1.10 ve 4.40 dolar.

OpenAI’ın geleceğe bakışı: GPT-5’e giden yol

OpenAI CEO’su Sam Altman, bu modellerin ChatGPT’deki son bağımsız akıl yürütme modelleri olabileceğini, çünkü GPT-5 ile birlikte akıl yürütme yetenekleri ve doğal diyalog anlayışının birleşeceğini açıkladı. Bu doğrultuda o3-pro modeli de yolda. GPT-4.1’in kodlama gücünü, o3’ün görsel ve mantıksal zekasıyla birleştiren bir yapı hedefleniyor.

Kaynak: webrazzi

Lionel

Yazıya tutkuyla bağlı olan Lionel, At gözlüklerini çıkarıp çevresine bakiyor ve gördüklerini Bikonu.com’da gündemi farklı bir bakış açısıyla ele alıyor. Analitik yaklaşımı, sade dili ve dikkat çekici yorumlarıyla okurların ilgisini çekmeyi başarıyor. İlgi alanları arasında güncel haberler, kültür, toplum ve insan hikâyeleri yer alıyor.

İlgili Yazılar

Siber güvenlik şirketi Endor Labs, 93 milyon dolar yatırım aldı
  • Nisan 24, 2025

Siber güvenlik şirketi Endor Labs, 93 milyon dolar yatırım aldı. Şirketin 93 milyon dolarlık B serisi yatırım turuna DFJ Growth liderlik etti. ABD merkezli Endor Labs’in yatırım turunda Salesforce Ventures, Lightspeed Venture Partners, Coatue, Dell Technologies Capital, Section 32 ve…

Devamı

Devamı
OpenAI, ChatGPT’nin görüntü oluşturma özelliğini geliştiricilerin kullanımına sundu
  • Nisan 24, 2025

ChatGPT‘nin geçtiğimiz haftalarda yayınlanan görüntü oluşturma özelliği ile bir haftada 700 milyondan fazla görsel üretildiğini sizlere aktarmıştık. OpenAI Çarşamba günü ChatGPT’deki yeni ve geliştirilmiş görüntü oluşturma özelliğini destekleyen teknolojiyi API’na getirdiğini açıkladı. Böylece geliştiriciler, bu özelliği uygulamalarına ve hizmetlerine…

Devamı

Devamı

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir