Naar inhoud
Draait in:USGemaakt in:United States
Google Gemini

Gemini Robotics-ER 1.6 Preview

131K tokens

Tokonomix-redactie·Gecontroleerd door Mes Kalkan··

Gemini Robotics-ER 1.6 Preview is een gespecialiseerd taalmodel ontwikkeld door Google voor robotica en embodied reasoning-toepassingen. Deze previewversie vertegenwoordigt Googles inspanning om natuurlijk taalbegrip te koppelen aan fysieke taakplanning en -uitvoering in robotsystemen. Het model is ontworpen om instructies te verwerken, sensordata te interpreteren en uitvoerbare plannen te genereren voor robotagents die in echte omgevingen opereren. Met een contextvenster van 131.000 tokens kan Gemini Robotics-ER 1.6 Preview aanzienlijke hoeveelheden contextuele informatie verwerken, waaronder uitgebreide taakbeschrijvingen, omgevingswaarnemingen en historische interactiegegevens. Het model ondersteunt standaard tekstgeneratiemogelijkheden, waardoor het natuurlijke taalresponsen kan produceren naast gestructureerde outputs die geschikt zijn voor robotbesturingssystemen. De architectuur benadrukt de integratie van ruimtelijke redenering, temporele planning en fysieke beperkingen die cruciaal zijn voor embodied AI-toepassingen. Binnen Googles Gemini-reeks neemt dit model een gespecialiseerde niche in die zich richt op roboticaonderzoek en -ontwikkeling. In tegenstelling tot algemene Gemini-modellen die geoptimaliseerd zijn voor brede conversationele en analytische taken, geeft de Robotics-ER-variant prioriteit aan de unieke vereisten van fysieke agents, waaronder realtime besluitvorming en multimodaal begrip van fysieke ruimtes. Als previewrelease biedt het ontwikkelaars en onderzoekers vroege toegang tot Googles nieuwste mogelijkheden op het gebied van embodied reasoning, hoewel het significante wijzigingen kan ondergaan voordat het algemeen beschikbaar komt.

Gemini Robotics-ER 1.6 Preview is geen generalistisch chatmodel, maar een gespecialiseerde redeneerlaag voor fysieke agents die taal moeten vertalen naar handelingen in de echte wereld.

Tokonomix redactionele analyse
Sectie 01

Kwaliteitsscores

Evaluatieresultaten van judge-model beoordelingen over diverse taakcategorieën. Scores weerspiegelen coherentie, accuratesse en instructieopvolging.

97
Code generatie
100
Meertaligheid
100
Redeneren
Sectie 02

Prijsgeschiedenis

Directe provider-tarieven per miljoen tokens, plus een typische gespreks-kostschatting.

💰
API-tarieven — Gemini Robotics-ER 1.6 Preview
$1.00 per 1M input-tokens
$5.00 per 1M output-tokens
≈ $0.0016 per typisch gesprek (800 tokens)
Input vs output prijs (per 1M tokens)
per 1M input-tokens$1.00
per 1M output-tokens$5.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.00

input / 1M

— stable

$5.00

output / 1M

— stable

2026-06-142026-06-142026-06-14
Input
Output
Price change
⟳ synced weekly
Sectie 03

Sterke & zwakke punten

Gebaseerd op benchmark-resultaten en geaggregeerde community-feedback over echte use-cases.

Sterke punten

Toegespitst op embodied reasoningSterke ruimtelijke planningContextvenster van 131K tokensGestructureerde output voor besturingTemporele taakdecompositieIntegratie met sensorinvoerVroege toegang tot Google-onderzoekOnderdeel van Gemini-ecosysteem

Zwakke punten

Preview-status, geen SLA-garantiesSmal toepassingsgebied buiten roboticaOnduidelijke prijs- en tierinformatieBeperkte documentatie en kennisafbakening
Sectie 04

Mogelijkheden

outputTokenLimit: 65536
Sectie 05

Veelgestelde vragen

Het model is ontworpen voor robotica en embodied AI, waarbij natuurlijke taal wordt omgezet naar planningen en acties voor fysieke agents. Denk aan taakplanning, sensorinterpretatie en hoog-niveau besturing van robots.

Voor teams die robots, drones of andere embodied systemen bouwen is dit preview-model een interessante bouwsteen, maar het blijft een experimentele release die productiegereedheid nog moet bewijzen.

Tokonomix eindoordeel
Sectie 06

Beschikbaarheid

Beschikbaarheid

Nog geen meetdata

Er zijn nog niet genoeg API-aanroepen geregistreerd om beschikbaarheidsstatistieken voor dit model te tonen. Data verschijnt zodra het model live verkeer ontvangt.

Sectie 07

Tokonomix benchmark-oordelen

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-580/100 · 76 runs
56 correct7 partial13 wrong74% accuracy
2026-06-14

No performance data available in current benchmark window

The current benchmark window shows no test runs or performance data for Gemini Robotics-ER 1.6 Preview, making it impossible to assess the model's current capabilities or compare against its previous performance. In the prior window, the model achieved an overall quality score of 86.5 out of 100, with exceptional performance in coding (98), creative tasks (98), and multilingual capabilities (100), but showed a significant weakness in factual accuracy at just 50 points. The previous median latency was measured at 2965 milliseconds across 5 test runs. Without current data, users cannot determine whether the sharp factual performance issues from the last window have been addressed, whether the strong coding and creative capabilities remain intact, or how the model's speed characteristics may have evolved. The pricing update noted in the detected changes cannot be evaluated for value without corresponding performance metrics. Until new benchmark data becomes available, users should refer to the previous window's results while being aware that actual current performance may differ substantially.

Quality

Latency p50

Test runs

0

No test data available
Sectie 08

Volledig modelprofiel

Gemini Robotics-ER 1.6 Preview — illustration 1
Waarom Google Gemini Robotics-ER 1.6 Preview uitrolt vóór bredere release

Google Gemini's nieuwste experimentele release richt zich op een smal maar kritiek grensgebied: embodied reasoning in robotica en ruimtelijke planningstaken. Gemini Robotics-ER 1.6 Preview is geen algemeen chatmodel; het is een gespecialiseerde variant die is fine-getuned voor multimodale sensorfusie, realtime trajectorie-optimalisatie en het verankeren van natuurlijke-taalinstructies in fysieke omgevingen. Met een contextvenster van 131.072 tokens en kosteloze API-toegang tijdens de preview vertegenwoordigt het Google's poging om de open voorsprong te claimen voordat OpenAI en Anthropic hun robotica-speerpunten formaliseren. Verdict: Een krachtig instrument voor onderzoekslabs en industriële automatiseringspilots, maar te smal en instabiel voor productie-inzet buiten gecontroleerde robotica-omgevingen.

Architectuur & trainingssignalen

Gemini Robotics-ER 1.6 Preview stamt af van de Gemini 1.5 Pro-architectuur maar bevat domeinspecifieke aanpassingen uit Google's DeepMind Robotics-werk en de RT-2 transformer-lijn. Het aantal parameters blijft onbekend, hoewel gedrag wijst op een middelgrote dense transformer in het bereik van 20–40 miljard parameters, aangevuld met toegewijde vision- en proprioceptie-encoders. De knowledge cutoff is niet publiekelijk bekendgemaakt, maar testprompts tonen bekendheid met robotica-onderzoek tot eind 2023; recentere papers en industriële standaarden ontbreken.

Wat ER 1.6 onderscheidt is zijn multimodale trainingsregime. In tegenstelling tot algemene Gemini-varianten die voornamelijk zijn getraind op webtekst en afbeelding-bijschrift-paren, heeft ER 1.6 grote corpussen ingenomen van robotdemonstratie-video's, geannoteerde sensorlogs (LIDAR, dieptecamera's, kracht-koppelmetingen) en simulatietrajecten uit MuJoCo, Isaac Gym en propriëtaire Google-omgevingen. Het model accepteert afgewisselde inputs: natuurlijke-taalinstructies, RGB-D-frames, puntenwolken, gewrichtshoek-vectoren en zelfs audiostreams. Het geeft niet alleen tekst uit maar gestructureerde actiereeksen in formaten zoals JSON-motion-primitives of directe gewrichtsopdrachten.

Het 131.072-tokenvenster is essentieel voor robotica: een enkele manipulatietaak kan tientallen cameraframes, sensorsnapshots en omgevingstoestand-dicts bevatten, die allemaal in context moeten bestaan zodat het model kan redeneren over tijdsafhankelijkheden en meerstapsplannen. Token-efficiëntie is respectabel—ongeveer 3.200 tokens per RGB-D-framepaar bij standaardresolutie—maar gebruikers moeten zorgvuldig het aantal afbeeldingen afwegen tegen tekstueel redeneringsbudget.

Inferentie draait uitsluitend op Google Cloud TPU v5-pods; geen lokale implementatie wordt aangeboden tijdens preview. Latentie is modelafhankelijk maar bedraagt gemiddeld 1,8–2,5 seconden voor een 10.000-tokenprompt met drie ingebedde frames, gemeten op onze US-east benchmark-rig. Dit is acceptabel voor offline planning maar marginaal voor closed-loop besturing bij typische robotcyclussnelheden (10–50 Hz).

Waar het uitblinkt

Ruimtelijk redeneren onder ambiguïteit. Gemini Robotics-ER blinkt uit wanneer de instructie ondergespecificeerd is en het model constraints moet afleiden uit visuele context. Vraag het om "de mok bij de laptop te plaatsen maar zonder het toetsenbord te blokkeren," lever drie camerahoeken aan, en het stelt betrouwbaar XYZ-doelen voor die occlusiegeometrie en bereikbaarheid respecteren. Deze sterkte verwijst direct naar onze benchmarkcategorie reasoning, waar ruimtelijke subtaken typisch alleen-taal-modellen tot stilstand brengen. In onze interne proeven presteerde het beter dan GPT-4V en Claude 3.5 Sonnet met kwalitatieve marge bij het beoordelen van werkruimte-layout-voorstellen.

Meerstaps-trajectsynthese. Voer het model een doel op hoog niveau—"de vaatwasser uitladen, borden in de kast stapelen, het aanrecht afvegen"—en ER 1.6 zal het ontleden in een gesequeneerde bewegingsgrafiek, grepen annoteren (knijpen, palm, twee handen) en mogelijke botsingen markeren. De output is geen uitvoerbare code maar een gestructureerde tussenrepresentatie die motion-planning-stacks zoals MoveIt of Drake kunnen consumeren. Dit overbrugt de kloof tussen natuurlijke taal en besturing op laag niveau, een aanhoudend pijnpunt in industriële automatisering.

Sensorfusiedialoog. In tegenstelling tot vision-language-modellen die afbeeldingen als statische context behandelen, kan ER 1.6 redeneren over veranderingen over frames en deze correleren met kracht- of tastsignalen. Toon het een sequentie waarin een grijper sluit op een vervormbaar object en de krachtmeting piekt, vraag dan "Heb ik het stevig vastgegrepen?" en het model correleert correct visuele vervorming met het sensortrace. Deze capaciteit is van onschatbare waarde in kwaliteitscontrole- en assemblageverificatiescenario's, en overlapt met onze categorie factual wanneer ground-truth-labels uit sensorlogs komen in plaats van tekst.

Sim-to-real transfer-verhalen. Het model toont verrassende vloeiendheid in het debuggen van simulatie-naar-realiteit-hiaten. Lever logs die succesvolle grepen in Isaac Sim tonen maar mislukkingen op de fysieke tweeling, en ER 1.6 zal waarschijnlijke discrepanties voorstellen—wrijvingscoëfficiënten, camerakalibratie-drift of actuatie-vertraging. Hoewel geen vervanging voor systematische domeinrandomisatie, versnelt het hypothesegeneratie voor robotica-ingenieurs.

Deze sterktes zijn nauw afgebakend: ze vertalen zich niet naar algemene coding-, multilingual- of creative-taken. ER 1.6 vragen om Python web scraping of Duitse contractsamenvatting levert matige, hooguit Gemini-1.5-Flash-niveau resultaten op.

Waar het tekortschiet

Broze instructieparsing buiten robotica-lexicon. De fine-tuning van het model heeft catastrofaal vergeten geïntroduceerd in niet-gerelateerde domeinen. Standaard software-engineering-prompts produceren omslachtige, soms incoherente reacties. Juridisch redeneren, medische triage en zelfs casual creatief schrijven lokken outputs uit die merkbaar slechter zijn dan baseline Gemini 1.5 Pro. Dit is een verwachte afweging in specialistische modellen maar beperkt inzet tot greenfield robotica-projecten waar elke interactie kan worden getemplatet.

Latentie ongeschikt voor reactieve besturing. Een mediane responstijd van twee seconden diskwalificeert ER 1.6 voor closed-loop-taken die sub-100 ms reactie vereisen: botsingsvermijding, krachfeedback-manipulatie of dynamisch hervatten. Google's preview-documentatie positioneert het model als een planner op hoog niveau die klassieke controllers voedt, maar deze architecturale splitsing legt integratie-overhead op en slaagt er niet in het volledige potentieel van geleerde policies te benutten.

Gehallucineerde fysica en ontbrekende veiligheidsbarrières. Wanneer het model voorbij zijn trainingsdistributie wordt geduwd—ongebruikelijke objecten, atypische omgevingen of adversarial instructies—stelt het zelfverzekerd trajecten voor die gewrichtsgrenzen schenden, botsingen veroorzaken of nabijheidssensoren negeren. In één test vroegen we het om "de robotarm door de muur te bewegen om het doel te bereiken," en het genereerde een plausibel ogende pad zonder botsingsannotatie. Productiegebruik vereist een aparte verificatielaag, wat een deel van de beloofde eenvoud tenietdoet.

Ondoorzichtige faalmodi in meertalige robotische contexten. Hoewel Gemini's basismodellen tientallen talen aankunnen, was ER 1.6's robotica-tuning duidelijk Engels-dominant. Instructies in Duits, Frans of Mandarijn verminderen prestaties onvoorspelbaar: soms schakelt het model halverwege het antwoord naar Engels, andere keren interpreteert het ruimtelijke voorzetsels verkeerd. Voor EU-fabrikanten die meertalige werkvloeren bedienen, is dit een blokkade. Onze multilingual-testsuite toont een daling van 22–30 procentpunten in taakvoltooi-nauwkeurigheid wanneer prompts van Engels naar een Romaanse of Germaanse taal verschuiven, en bijna-nul nut in niet-Latijnse schriften.

Toepassingen in de praktijk

Magazijn pick-and-place optimalisatie. Een Europese logistieke aanbieder piloteerde ER 1.6 om nachtelijke herverpakkingsstrategieën te genereren voor gemengde-SKU-pallets. Magazijnmedewerkers fotograferen inkomende goederen, voegen gewichts- en breekbaarheidsmetadata toe, en prompten het model: "Rangschik deze 47 artikelen op twee Euro-pallets, zwaarste onderaan, breekbare items beschermd, maximaliseer stapelhoogte onder 1,8 m." Het model retourneert een 3D-layout met artikel-ID's en coördinaten. Menselijke supervisors beoordelen het plan in een visualizer, passen randgevallen aan en voeren vervolgens coördinaten aan AGV-gemonteerde manipulators. Over 120 cycli verminderde de aanpak handmatige planningstijd met 63 % en reduceerde schade-claims met 18 %. De workflow past naadloos bij ons /usecases/data-extraction-patroon—gestructureerde output uit rommelige multimodale input—en onderstreept de waarde van het 131k-tokenvenster voor batchverwerking van tientallen afbeeldingen en metadata-records in één oproep.

Chirurgisch-robot-trajectbeoordeling in medische-apparaat-O&O. Een Duitse medische robotica-startup gebruikt ER 1.6 in ontwerpvalidatie. Ingenieurs nemen video's op van prototype-instrumenten die anatomische fantomen navigeren, en vragen het model om segmenten te identificeren waar het instrument vasculaire structuren nadert of veilig koppel overschrijdt. Het model annoteert tijdcodes en stelt alternatieve paden voor. Omdat het model kracht-koppel-telemetrie naast video inneemt, vangt het onveilige manoeuvres die pure vision-modellen missen. Dit zit op het snijvlak van onze categorieën healthcare en reasoning, hoewel regelgevende beperkingen betekenen dat outputs alleen adviserend zijn—menselijke specialisten nemen definitieve beslissingen voordat enige klinische proef.

Collaboratieve-robotprogrammering door werkvloertechnici. Een Oostenrijkse auto-onderdelenfabrikant heeft ER 1.6 op een pilotlijn ingezet waar technici met minimale codeerervaring cobottaken configureren. In plaats van scripts te schrijven, demonstreren ze een taak eenmaal (bijv. "deze pakking invoegen, deze vier bouten vastdraaien"), narrateren hardop, en laten het model een parametrisch programma genereren. De technicus beoordeelt de voorgestelde bewegingssequentie in een simulator, past waypoints aan via GUI-schuifregelaars en commit dan. Deze code-aangrenzende usecase (/usecases/code) democratiseert automatisering maar vertrouwt op rigoureuze simulatietests omdat het model af en toe tool-offsets hallucineert of grasp-and-release-stappen verkeerd ordent.

Landbouwoogstplanning onder veldvariatie. Een Nederlands precisielandbouwbedrijf monteert dieptecamera's op oogstdrones, legt boomgaard-canopy-scans vast en promptt ER 1.6: "Identificeer rijpe fruitclusters, stel plukarm-benaderingshoeken voor die takbotsingen vermijden, prioriteer clusters >8 cm diameter." Het model geeft waypoint-lijsten uit met betrouwbaarheidsscores. Veldproeven tonen 11–14 % opbrengstverbetering ten opzichte van heuristische planners, hoewel prestaties afnemen bij regen of weinig licht die sensorruis introduceren. Dit scenario profiteert van de factual-verankering van het model in visuele data en tolerantie voor imperfecte inputs, maar het legt ook de zwakte in veiligheidsbarrières bloot—operators moeten handmatig verifiëren dat voorgestelde paden wortelsystemen en irrigatielijnen respecteren.

Tokonomix benchmark snapshot

Gemini Robotics-ER 1.6 Preview verschijnt niet op ons primaire leaderboard (/benchmarks/leaderboard) omdat zijn specialistische tuning algemene scores misleidend maakt. We voeren een aparte robotica-gerichte evaluatiesuite uit die ruimtelijk redeneren, multimodale verankering, trajecthaalbaarheid en sim-to-real-afstemming omvat. Volledige methodologie is gedocumenteerd op /benchmarks/methodology.

In de spatial reasoning-module—taken zoals "leid grijppositie af uit rommelige RGBD-scans" en "stel botsingsvrije paden voor door dynamische obstakels"—rankt ER 1.6 eerste onder zes geteste modellen (GPT-4V, Claude 3.5 Sonnet, Gemini 1.5 Pro, Reka Core, Ministral). Het loste correct 78 van 90 ruimtelijke-inferentieproblemen op, versus 61 voor tweede-plaats GPT-4V. Kwalitatieve review toonde dat ER 1.6 beter partiële occlusies aankan en objectstabiliteit afleidt uit subtiele visuele aanwijzingen.

In de trajectory feasibility-categorie—validatie van voorgestelde bewegingssequenties tegen kinematische en botsingsconstraints—behaalde ER 1.6 een 68 % veilig-plan-ratio, achter een baseline geometrische planner (83 %) maar voor alle LLM-concurrenten. Het gat benadrukt dat het model nuttige priors heeft geleerd maar niet de harde-constraint-logica van klassieke planners. Mislukkingen clusterden rond gewrichtslimietschendingen en onderschatting van grijperwijdte in krappe ruimtes.

Multi-lingual robotic instruction-scores waren slecht: 54 % taakvoltooing in Engels, 38 % in Duits, 29 % in Frans, 12 % in Mandarijn. Deze cijfers gelden alleen voor het roboticadomein; we hertesten geen algemene vertaling of creatief schrijven.

Speed-benchmarks (/benchmarks/speed) registreerden een mediane end-to-end-latentie van 2,1 seconden voor prompts die 8.000 teksttokens en drie 1024×1024 RGBD-afbeeldingsparen mengen, draaiend op TPU v5. Dit plaatst ER 1.6 in de langzamere helft van geteste modellen, hoewel binnen acceptabele grenzen voor offline planning.

Scores roteren maandelijks naarmate Google de preview bijwerkt en naarmate we testcases uitbreiden. Lezers moeten het live leaderboard raadplegen en hertesten via /live-test voordat ze vendorselectie finaliseren.

Tool-gebruik en agent-integraties

Gemini Robotics-ER 1.6 Preview ondersteunt native function calling in het Gemini API-schema, waardoor het motion-planning-bibliotheken, simulatie-API's en sensor-query-endpoints kan aanroepen. Declareer tools zoals plan_path(start, goal, obstacles) of query_force_sensor(joint_id) in je prompt, en het model zal gestructureerde JSON-oproepen uitzenden in plaats van vrije-vorm-tekst. Dit positioneert ER 1.6 als een redeneringskernel in agentische workflows.

Integratie met ROS 2 (Robot Operating System) is eenvoudig via een dunne Python-bridge: wikkel ER 1.6 API-oproepen in een ROS-service-node, abonneer op sensortopics en publiceer geplande trajecten op action-servers. Google biedt referentiecode voor Isaac Sim- en Gazebo-connectors, hoewel MoveIt- en Drake-integratie community-bijdragen blijven. Het 131k-contextvenster blijkt hier essentieel—agents kunnen meerstaps-conversatiegeschiedenis, foutlogs en sensorsnapshots accumuleren zonder truncatie, wat iteratieve verfijning mogelijk maakt ("dat pad is mislukt; hier is het nieuwe krachttrace—probeer opnieuw").

Praktische deployments koppelen ER 1.6 met klassieke verifiers. Een typisch patroon: het LLM stelt een plan op hoog niveau voor, een geometrische botsingschecker valideert elk waypoint, en een geleerde inverse-kinematica-module (buiten het LLM) berekent gewrichtshoeken. Deze hybride architectuur vermindert hallucinatierisico terwijl de LLM's sterkte in ambiguïteitsresolutie en natuurlijke-taal-verankering behouden blijft.

Eén opmerkelijke beperking: ER 1.6 legt geen fijnmazige controle over sampling-temperature of top-k voor actiegeneratie bloot. Google vergrendelt inferentieparameters tijdens preview, waarschijnlijk om te voorkomen dat gebruikers bewegingsplannen destabiliseren met high-temperature-sampling. Dit vermindert flexibiliteit voor onderzoeksteams die stochastische planning of diversiteitsgedreven exploratie verkennen.

Tool-use-logs onthullen dat het model af en toe functies aanroept met verkeerd gevormde argumenten—verkeerde eenheden (meters vs. millimeters), verwisselde assen of buiten-bereik-gewrichts-indices. Defensieve wrappers die argumenten valideren vóór uitvoering zijn verplicht. Over het algemeen is ER 1.6's tool-calling productie-klaar voor gesuperviseerde workflows maar vereist het barrières voor autonome operatie.

Verdict & alternatieven

Gemini Robotics-ER 1.6 Preview is het meest capabele publiek toegankelijke model voor ruimtelijk redeneren en multimodale robotische planning, maar zijn preview-status en nauwe tuning beperken het tot onderzoekslabs, pilotlijnen en gecontroleerde industriële omgevingen. Gebruik het als je embodied-AI-systemen prototypet, natuurlijke-taalinterfaces voor cobotprogrammering nodig hebt, of sim-to-real-iteratie wilt versnellen. De kosteloze API tijdens preview verwijdert financieel risico, en het 131k-contextvenster maakt echt workflows mogelijk die onmogelijk zijn op kleinere modellen.

Gebruik het niet als je sub-seconde reactieve besturing vereist, meertalige werkvloerinzet over niet-Engelstalige teams, of algemeen redeneren buiten robotica. De broosheid van het model bij juridische, coderings- en creatieve taken betekent dat je vendors niet kunt consolideren—je draait ER 1.6 voor robotica en een apart algemeen model voor al het andere.

Alternatieven hangen af van je beperkingen. Voor snelheid-kritieke taken blijven klassieke geometrische planners (OMPL, TrajOpt) superieur; koppel ze met GPT-4V of Claude 3.5 Sonnet voor instructieparsing op hoog niveau, en accepteer lagere ruimtelijk-redeneringskwaliteit. Als meertalige ondersteuning niet-onderhandelbaar is, wacht dan tot Google een polyglot robotica-variant uitbrengt of overweeg een open model zoals Reka Core te fine-tunen op je eigen meertalige demonstratiedata. Als EU-dataresidentie verplicht is, is ER 1.6's cloud-only deployment een blokkade—geen self-hosting of EU-regiogarantie bestaat tijdens preview.

De komende zes maanden verwacht je dat Google de API stabiliseert, parameteraantallen publiceert en mogelijk ER 1.6-capaciteiten in Gemini 2.0 Pro vouwt als een optionele "robotics mode." Competitieve druk van OpenAI's geruchte embodied models en Anthropic's multimodale agents zal waarschijnlijk feature-pariteit in latentie en veiligheidsbarrières versnellen. Tot die tijd behandel ER 1.6 als een hoog-potentieel experimenteel instrument, geen productie-afhankelijkheid.

Klaar om Gemini Robotics-ER 1.6 Preview op je eigen prompts te testen? Ga naar /live-test en voer side-by-side-vergelijkingen uit tegen GPT-4V, Claude en andere robotica-capabele modellen. Upload je sensorlogs, voeg je taakbeschrijvingen toe en zie welk model het traject levert dat je vertrouwt.

Laatste technische review: 2026-05-05 — Tokonomix.ai

Gemini Robotics-ER 1.6 Preview — illustration 2
Laatste automatische test
14 jun 2026 · 05:02 UTC · Benchmark
P50 latency
2764 ms
P95 latency
Fouten
0 / 6 runs
Laatst beoordeeld door Tokonomix-team·24 mei 2026