131K token bağlam penceresi pratikte neyi mümkün kılıyor?

Uzun görev tanımları, çevresel gözlemler ve geçmiş etkileşim kayıtları tek bir istem içinde işlenebilir. Bu, çok adımlı robotik senaryolarda durum takibi ve plan üretimi için önemli bir avantaj sağlar.

Modeli üretim ortamında kullanmak güvenli mi?

Preview etiketi, API davranışının ve yeteneklerinin değişebileceği anlamına gelir, bu nedenle kritik üretim sistemlerinde dikkatli olunması önerilir. Araştırma, prototip ve dahili pilot uygulamalar için daha uygundur.

Diğer Gemini modellerinden temel farkı nedir?

Standart Gemini modelleri geniş kapsamlı dil ve analiz görevlerine odaklanırken, Robotics-ER varyantı fiziksel ajanların ihtiyaçlarına göre uyarlanmıştır. Uzamsal akıl yürütme ve robotik kontrol için yapılandırılmış çıktılar bu sürümün öne çıkan yönleridir.

Hangi entegrasyon zorluklarıyla karşılaşabilirim?

Modelin çıktısını gerçek robotik kontrol katmanına bağlamak ek bir orkestrasyon ve güvenlik katmanı gerektirir. Ayrıca preview döneminde API yüzeyindeki değişikliklere karşı sürüm yönetimi planlamak önemlidir.

Seviye B — Üretim

Çalıştığı yer:USYapıldığı yer:United States

Google Gemini

Gemini Robotics-ER 1.6 Preview

Seviye B — Üretim · 131K token

Tokonomix Editöryel Ekibi·İnceleyen Mes Kalkan·Yayınlandı 22 Mayıs 2026·Son inceleme 26 Mayıs 2026

Gemini Robotics-ER 1.6 Preview, Google tarafından robotik ve bedenlenmiş muhakeme uygulamaları için geliştirilen özelleşmiş bir dil modelidir. Bu önizleme sürümü, Google'ın doğal dil anlayışını robotik sistemlerde fiziksel görev planlama ve yürütme ile birleştirme çabasını temsil ediyor. Model, talimatları işlemek, sensör verilerini yorumlamak ve gerçek dünya ortamlarında çalışan robotik ajanlar için uygulanabilir planlar üretmek üzere tasarlanmıştır. 131.000 token bağlam penceresiyle Gemini Robotics-ER 1.6 Preview; uzun görev tanımları, çevresel gözlemler ve geçmiş etkileşim verileri dahil olmak üzere önemli miktarda bağlamsal bilgiyi işleyebilir. Model, standart metin üretimi yeteneklerini destekleyerek robotik kontrol sistemlerine uygun yapılandırılmış çıktıların yanı sıra doğal dil yanıtları da üretebiliyor. Mimarisi; bedenlenmiş yapay zeka uygulamaları için kritik olan uzamsal muhakeme, zamansal planlama ve fiziksel kısıtlamaların entegrasyonunu öne çıkarıyor. Bu model, Google'ın Gemini ailesi içinde robotik araştırma ve geliştirmeye odaklanan özelleşmiş bir nişte yer alıyor. Geniş konuşma ve analitik görevler için optimize edilmiş genel amaçlı Gemini modellerinin aksine Robotics-ER varyantı; gerçek zamanlı karar verme ve fiziksel alanların çok modlu anlaşılması dahil fiziksel ajanların kendine özgü gereksinimlerini önceliklendiriyor. Önizleme sürümü olarak, geliştiricilere ve araştırmacılara Google'ın bedenlenmiş muhakemedeki en güncel yeteneklerine erken erişim sunuyor; ancak genel kullanıma ulaşmadan önce önemli değişikliklere uğrayabilir.

Gemini Robotics-ER 1.6 Preview, Google'ın dil modellerini fiziksel dünyaya bağlama girişiminin en somut adımlarından biri olarak öne çıkıyor.
— Tokonomix değerlendirme notu

Bölüm 01

Fiyat geçmişi

Milyon token başına doğrudan sağlayıcı tarifeleri, artı tipik bir konuşma maliyet tahmini.

💰

API tarifeleri — Gemini Robotics-ER 1.6 Preview

$1.00 1M giriş token başına

$5.00 1M çıkış token başına

≈ $0.0016 tipik konuşma başına (800 token)

Giriş vs çıkış fiyatı (1M token başına)

1M giriş token başına$1.00

1M çıkış token başına$5.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$5.00

output / 1M

— stable

2026-06-142026-06-142026-06-21

Input

Output

Price change

⟳ synced weekly

Bölüm 02

Güçlü & zayıf yönler

Benchmark sonuçları ve gerçek kullanım senaryolarına dair toplu topluluk geri bildirimine dayanır.

Güçlü yönler

Robotik görev planlaması için özelleşmişUzamsal ve zamansal akıl yürütme131K token geniş bağlam penceresiYapılandırılmış kontrol çıktıları üretebiliyorGerçek dünya kısıtlarını dikkate alıyorSensör verisi yorumlama yeteneğiEmbodied AI senaryolarına uyumluAraştırma ve prototipleme için erken erişim

Zayıf yönler

Preview sürümü, üretim için olgunlaşmamışGenel amaçlı sohbet için optimize değilYetenek ve fiyatlandırma detayları belirsizBölgesel erişim kısıtlamaları olabilir

Bölüm 03

Yetenekler

outputTokenLimit: 65536

Bölüm 04

Sık sorulan sorular

Gemini Robotics-ER 1.6 Preview, robotik görev planlama, sensör verisi yorumlama ve fiziksel ajanlar için karar verme gibi embodied AI senaryolarına yöneliktir. Genel sohbet veya içerik üretimi yerine robotik araştırma projeleri için tercih edilmelidir.

Robotik araştırma ekipleri için erken erişim değeri yüksek olsa da, üretim ortamlarına geçiş için olgunlaşmasını beklemek mantıklı bir tercih olacaktır.
— Tokonomix editöryal sonuç

Bölüm 05

Kullanılabilirlik

Henüz ölçüm verisi yok

Bu model için kullanılabilirlik istatistiklerini göstermek için yeterli API çağrısı henüz kaydedilmedi. Veri, model canlı trafik almaya başlayınca görünür.

Bölüm 06

Tokonomix kıyaslama kararları

⚖️

Endorsed by 1 judge

Independent LLM judges evaluated this model on our weekly intelligence tests

claude-sonnet-4-579/100 · 89 runs

65 correct9 partial15 wrong73% accuracy

● 2026-06-21

Severe quality degradation: 62-point drop with slower response times

Gemini Robotics-ER 1.6 Preview has experienced a catastrophic performance decline in this benchmark window. Overall quality plummeted from 98.9 to 37.3, representing a 62-point drop that signals fundamental issues with the current deployment. Reasoning capabilities collapsed from a perfect 100 to just 28, indicating severe regression in logical processing. Factual accuracy settled at 47, while previous top-tier categories like coding and multilingual support show no measurable performance in the current window, suggesting possible scope changes or system failures. Latency deteriorated significantly, increasing 37 percent from 3120ms to 4279ms at the median. This combination of quality degradation and slower response times represents a substantial setback for a model that previously demonstrated exceptional performance across all tested categories. The limited test run count of 3 versus the previous 5 may indicate deployment instability or reduced availability. Users should exercise caution when deploying this version for production workloads, particularly for reasoning-intensive tasks where performance has degraded most severely. The dramatic shift suggests either a problematic model update, infrastructure issues, or significant changes to the model's intended use case that have not yet stabilized.

Quality

37.3

Latency p50

4,279 ms

Test runs

✗ Quality dropped 62 points✗ Reasoning collapsed to 28✗ Latency increased 37%✗ Reduced test run availability

Bölüm 07

Tam model profili

Gemini Robotics-ER 1.6 Preview

1.6 revizyonu daha yeni olan versiyondur. Google'ın Gemini API'sine karşı bugün bir embodied-reasoning (somutlaştırılmış akıl yürütme) projesi başlatıyorsanız, değerlendirmeniz gereken de budur; 1.5 esas olarak bazı araştırma kod tabanlarının buna sabitlenmiş olması nedeniyle etrafta kalmaktadır. Aynı alan — robotik, sahne-temelli planlama, niyet-plan çevirisi — farklı revizyon, farklı pratik profil.

1.6'nın 1.5'e karşı manşet değişikliği bağlam penceresidir. Google, 1.048.576 token'lık bir pencereden 131.072'ye düştü. Bu bir gerileme gibi görünür ve ham spesifikasyonlar açısından öyledir, ancak pratikte ER kullanım senaryosu nadiren milyon-token'lık bağlamı kullanır ve daha küçük pencere, ölçülebilir şekilde daha iyi hatırlama ve daha hızlı geri dönüş süresi ile gelir. Elde ettiğiniz takas budur.

1.6'da neler farklı

Daha sıkı bağlam, daha keskin dikkat. 128K pencere, birkaç saniyelik bir algılama tamponu, birkaç sahne-bellek dönüşü ve eksiksiz bir hedef spesifikasyonu için fazlasıyla yeterlidir. Aralık boyunca hatırlama ve temellenme kalitesi 1.5'teki durumdan daha güçlüdür ki bu da Google'ın hedeflediği yeniden dengelemedir.

Çok adımlı planlarda daha iyi talimat takibi. 1.5 modeli sıklıkla makul ilk adımlar üretir ve ardından zincirlendiğinde sonraki adımlarda sapma gösterirdi — 1.6, daha uzun plan ufukları boyunca daha tutarlıdır.

Daha temiz yapılandırılmış çıktı. Plan çıktılarında JSON-şema uygulaması daha güvenilirdir. 1.5 etrafında şema-doğrulamalı adaptörler oluşturan ekipler, 1.6'ya geçtikten sonra daha düşük yeniden deneme oranları bildirdiler.

Farklı prompt kalıpları. Sahne açıklaması, aksiyon-uzay bildirimi ve kısıt spesifikasyonu etrafındaki Google'ın önerdiği promptlama revizyonlar arasında değişti. 1.5 için çalışan dokümantasyonun 1.6'ya taşınırken gözden geçirilmesi gerekir.

Nelerin değişmediği

Model hala önizleme seviyesindedir. Çıktı şekilleri revizyonlar arasında değişebilir; üretim duruşu sapma varsaymalıdır.

Hala bir kontrol döngüsü değildir. ER, hareket planlamasının üzerinde yaşar, içinde değil. 100ms sınıfı gecikme tabanı bunu kaçınılmaz kılar.

Hala embodied-reasoning'e özgü uzmanlaşmıştır. Genel amaçlı görevler, gemini-pro-latest modelinin aynı prompt için size vereceğinden daha kötü çıktı üretecektir.

Entegrasyon maliyeti hala yüksektir. Algılama-prompt biçimlendirici, plan-kontrolör adaptörü ve güvenlik doğrulayıcısı hala sizin tarafınızdan inşa edilmelidir.

Ne için tasarlandı

1.5'i haklı çıkaran aynı üç kategori geçerlidir.

Araştırma. Sınır modellere karşı kıyaslama yapan embodied AI laboratuvarları, simülasyonda talimat takibi değerlendirmeleri (Habitat, RoboCasa, BEHAVIOR), uzun ufuklu manipülasyon çalışmaları.

Algılama katmanının olgun olduğu ve varyasyonun hedef-odaklı olduğu endüstriyel pilot dağıtımlar. Betiklenmiş otomasyonun üzerinde al-ve-yerleştir. Öğeler değiştiği ancak iş hücresi değişmediği yerlerde kutu toplama.

Tele-robotik ve döngü içinde insan kontrolü. Operatörler niyetlerini doğal dilde ifade eder; model bunu özerklik katmanının karşısında planlayabileceği kısıtlara dönüştürür.

Nerede yetersiz kalıyor

Yeni somutlaştırmalar. Kol-ve-tutucu morfolojilerine eğilimli, küratörlü bir robotik veri karışımı üzerinde eğitilmiştir. Dört ayaklılar, hümanoidler, yumuşak robotlar — kalite düşer, bazen sessizce.

Dinamik çok-ajan sahneleri. Kalabalık depolar, insanların etrafta hareket ettiği mutfaklar, sahnenin algılama döngüsünün rapor ettiğinden daha hızlı değiştiği her yer — modelin planları, gerçekliğin sunduğundan daha fazla determinizm varsayar.

Güvenlik. 1.5 ile aynı: modelde çıktıyı resmi olarak sınırlayan hiçbir şey yok. Doğrulayıcı sizin yığınınızda oturur, Google'ınkinde değil.

Platformlar arası taşınabilirlik. Planlar, robot başına adaptör kodu gerektiren genelleştirilmiş bir koordinat uzayında ifade edilir. Demolar bunu gizler.

Önizleme seviyesi riski. Google, diğer Gemini hatlarında sınırlı bildirimle önizleme uç noktalarını emekliye ayırmıştır. 1.7 veya önizleme-olmayan halefi geldiğinde bir geçiş için plan yapın.

1.6 ne zaman 1.5'e tercih edilmeli

Yeni çalışmalar için varsayılan olarak 1.6'yı kullanın. Plan-ufuk tutarlılığı ve yapılandırılmış çıktı güvenilirliğindeki iyileştirmeler, pratikte 1M-token tavanının önem taşıdığından daha fazla önem taşır. Yalnızca şu durumlarda 1.5'te kalın:

Kod tabanınız buna sabitlenmiş ve geçiş maliyeti kalite deltasını aşıyor.
Milyon-token penceresini gerçekten kullanan belirli bir kullanım durumunuz var (robotikte nadir).
Yayınlanmış araştırma sonuçlarına karşı tekrarlanabilirlik, eski revizyonu gerektiriyor.

ER ne zaman hiç kullanılmamalı

Görev somutlaştırılmış değilse — fiziksel dünya hedefleri, sensör girdileri, aksiyon çıktıları — gemini-pro-latest veya başka bir genel amaçlı modele ulaşın. ER, tasarım gereği robotik olmayan her şeyde Pro'dan daha kötüdür.

Dağıtım güvenlik-kritik ise ve önizleme seviyesi davranış değişimlerini kabul edemiyorsanız, model sürümünü kontrol ettiğiniz kendi kendine barındırılan alternatiflere bakın. OpenVLA bariz başlangıç noktasıdır; ortaklık yoluyla erişebiliyorsanız Physical Intelligence'ın modelleri.

Kontrol-bitişik bir döngüde gecikme nedenleriyle cihaz üzerinde veya cihaza yakın çıkarıma ihtiyacınız varsa, ER yanlış şekildir. Jetson veya eşdeğer bir edge hızlandırıcısı üzerinde çalışan damıtılmış VLA modelleri konuşmanın konusudur.

İsimlendirmeye değer alternatifler

OpenVLA. 7B parametre, açık ağırlıklar, tek bir H100 üzerinde çalıştırılabilir, Open X-Embodiment veri seti üzerinde eğitilmiş. VLA araştırması için referans açık temel.

Physical Intelligence'ın pi0 ailesi. Manipülasyon genişliğinde en güçlü, kamuya açık olarak tartışılan tescilli alternatif.

NVIDIA Project GR00T. Hümanoid robotik için temel modeller; farklı morfoloji odağı, örtüşen teknik yaklaşım.

Figure'ın Helix'i. Figure'dan kapalı model, hümanoid platformlarında gösterilmiş. Karşılaştırılabilir bir API teklifi değil ancak yetenek işaretleyici olarak takip etmeye değer.

Pratik notlar

1.5'ten 1.6'ya geçerken promptlama kılavuzunu yeniden okuyun. Önerilen sahne-açıklama formatı ve aksiyon-uzay şeması değişti.

Yapılandırılmış çıktı adaptörünüzü yeniden doğrulayın. Şema-takip iyileştirmelerine rağmen bile, 1.5'te çalışan uç durumlar 1.6'da farklı şekiller üretebilir.

Her çağrıyla model revizyonunu kaydedin. Google önizleme uç noktasını döndürdüğünde, davranış değişikliği ile revizyon değişikliği arasındaki korelasyon hata ayıklamanın tek yoludur.

Dürüst özet: Robotics-ER 1.6 Preview, yeni robotik çalışmalar için iki önizleme revizyonunun daha iyisidir ve aile genelinde geçerli olan uzmanlaşma, önizleme seviyesi riski ve entegrasyon maliyeti hakkındaki aynı uyarılarla birlikte gelir.

Son otomatik test

21 Haz 2026 · 04:57 UTC · Test

P50 gecikme

4190 ms

P95 gecikme

—

Hatalar

0 / 6 çalıştırma

Son inceleyen Tokonomix Ekibi·26 Mayıs 2026