Gemini 3 Flash'ın görsel muhakeme ile kod yürütmeyi birleştiren yeni yeteneği: Agentic Vision

Google, Gemini 3 Flash İçin Agentic Vision Yeteneklerini Güncelledi

Google, Gemini 3 Flash modelindeki Agentic Vision yeteneklerini duyurdu. Şirket, daha önceki modellerin genellikle detaylarda zorlanabildiğini ve tahmin yapmak zorunda kaldığını belirtiyor. Ancak Gemini 3 Flash’ın Agentic Vision yeteneği, görüntü yorumlamayı daha doğru hale getiriyor.

Gemini 3 Flash modeli, Agentic Vision desteğiyle görsel muhakemeyi geliştirerek görüntüleri adım adım inceleme ve işleme kapasitesini arttırıyor. Bu sayede kod yürütme ile birleşen Agentic Vision, görme kalitesinde %5 ila 10 arasında artış sağlıyor.

Agentic Vision, özellikle “Düşün, Harekete Geç, Gözlemle” metodunu kullanıyor. Model, kullanıcı sorgusunu analiz ederek çok adımlı bir plan oluşturuyor, ardından görüntüleri işlemek için Python kodu oluşturuyor ve son olarak yeni verileri değerlendirerek nihai yanıtı veriyor.

Gemini 3 Flash, görüntülerdeki detayları algılayabilir ve Agentic Vision sayesinde görüntülerde zoom yapabilir, eldeki parmakları sayabilir ve aritmetik işlemler yapabilir. Agentic Vision yeteneği, Google AI Studio ve Vertex AI’daki Gemini API ile geliştiricilere erişilebilir durumda.