Ir al contenido
Tier A — Frontera
Se ejecuta en:USCreado en:United States
Google Gemini

Gemini 3.5 Flash

Tier A — Frontera · 1.048576M tokens

Equipo editorial Tokonomix·Revisado por Mes Kalkan·

Gemini 3.5 Flash combina una ventana de contexto masiva de más de un millón de tokens con clasificación de nivel A, ofreciendo capacidad empresarial a velocidades de respuesta rápidas.

Resumen de análisis Tokonomix
Sección 01

Análisis de velocidad

Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.

Latencia P50 (mediana)Latencia P9514 runs
574698823947107105-2705-31ms
Sección 02

Puntuaciones de calidad

Resultados de evaluación de modelos juez en diversas categorías de tareas. Las puntuaciones reflejan coherencia, precisión y seguimiento de instrucciones.

0
Generación de código
99
Creativo
50
Factual
100
Multilingüe
Sección 03

Historial de precios

Tarifas directas del proveedor por millón de tokens, más una estimación del coste de una conversación típica.

💰
Tarifas API — Gemini 3.5 Flash
$1.50 por 1M de tokens de entrada
$9.00 por 1M de tokens de salida
≈ $0.0027 por conversación típica (800 tokens)
Precio entrada vs salida (por 1M de tokens)
por 1M de tokens de entrada$1.50
por 1M de tokens de salida$9.00

Pricing over time

Input & output per 1M tokens · step-line = price changes

$1.50

input / 1M

— stable

$9.00

output / 1M

— stable

2026-05-312026-06-072026-06-07
Input
Output
Price change
⟳ synced weekly
Sección 04

Tokens por segundo

Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.

Rendimiento (tokens / s)264 / avg 270
345187

Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.

Sección 05

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Ventana de contexto de 1M tokensVelocidad optimizada para producciónClasificación Tier AIntegración nativa con Google CloudManejo eficiente de documentos largosSoporte multilingüe robustoAPIs bien documentadas y establesAdecuado para cargas empresariales

Debilidades

Capacidades multimodales no especificadasDependencia del ecosistema GoogleFecha de corte de conocimiento desconocidaDisponibilidad regional puede variar
Sección 06

Capacidades

toolssource: litellmvisionjson modepdf inputreasoningaudio inputjson schemaparallel toolsprompt cachingoutputTokenLimit: 65536max output tokens: 65535
Sección 07

Preguntas frecuentes

Las capacidades específicas de este modelo no están documentadas públicamente. Para confirmar soporte multimodal (visión, audio), consulta la documentación oficial de Google Gemini o contacta con su equipo de ventas.

Para equipos que requieren procesamiento de documentos extensos con latencia mínima, Gemini 3.5 Flash representa una opción sólida dentro del ecosistema Google.

Evaluación editorial Tokonomix
Sección 08

Veredictos del benchmark Tokonomix

⚖️
Endorsed by 1 judge
Independent LLM judges evaluated this model on our weekly intelligence tests
claude-sonnet-4-547/100 · 9 runs
4 correct0 partial5 wrong44% accuracy
2026-06-07

Gemini 3.5 Flash adds multimodal features, core performance unchanged

Gemini 3.5 Flash has expanded its capabilities significantly with the addition of tools, vision, audio input, PDF processing, JSON modes, and prompt caching. These multimodal features represent a substantial technical evolution from the initial release. However, performance across existing benchmarks remains essentially static. The model continues to demonstrate strong coding capabilities while struggling with creative writing tasks, maintaining the same performance profile observed in the previous window. No benchmark scores have changed materially, suggesting that the capability additions are functional expansions rather than quality improvements to core reasoning or generation. Users gain access to a much broader feature set for building applications that require structured output, function calling, or multimodal understanding, but should not expect improvements in text generation quality, reasoning depth, or creative tasks. The model remains best suited for technical applications, structured data tasks, and scenarios where its expanded tooling capabilities can be leveraged. For pure text generation or creative applications, the known weaknesses persist unchanged.

Quality

Latency p50

Test runs

0

Added multimodal input support New structured output capabilities Function calling now available Creative writing still weak
Sección 09

Perfil completo del modelo


Gemini 3.5 Flash: El Rápido y Capaz Caballo de Batalla de la Tercera Generación

En el vertiginoso panorama de las tecnologías de IA, Gemini 3.5 Flash de Google DeepMind se destaca como un modelo resistente diseñado para una inferencia de alta velocidad y un amplio soporte multimodal. Posicionado entre el nivel de entrada Gemini 3.0 Flash Preview y el avanzado 3.x Pro, ofrece una mezcla equilibrada de capacidad y costo que se adapta a diversas cargas de trabajo de producción. Sus características destacadas incluyen una ventana de contexto de 1 millón de tokens y capacidades de entrada multimodal completas, lo que lo convierte en una opción robusta para empresas que necesitan agilidad y profundidad. Nuestro veredicto: Ideal para equipos que necesitan un equilibrio de velocidad, amplitud y razonamiento a un costo justificado, pero prepárese para gastos de salida premium.

Arquitectura y Entrenamiento

Gemini 3.5 Flash es parte de la generación Gemini 3, que representa un avance significativo respecto a sus predecesores en la línea Gemini. Aunque los detalles arquitectónicos específicos no se han revelado públicamente, los modelos de tercera generación aprovechan arquitecturas avanzadas basadas en transformadores que ofrecen capacidades de razonamiento mejoradas, especialmente evidentes en el soporte nativo de Gemini 3.5 Flash para el procesamiento de cadenas de pensamiento. Esto probablemente se facilita mediante mejoras tanto en la arquitectura del modelo como en las metodologías de entrenamiento.

Gemini 3.5 Flash se distingue del Gemini 3.0 Flash Preview por un mayor rendimiento y una ventana de contexto más grande, un salto desde las capacidades del modelo anterior. En comparación con el más premium 3.x Pro, proporciona una alternativa estable pero menos costosa, sacrificando algunas de las complejidades adicionales de capas y parámetros que acompañan a la versión Pro.

En términos de datos de entrenamiento, aunque Google no ha divulgado públicamente los conjuntos de datos específicos ni la fecha exacta de corte del entrenamiento, probablemente Gemini 3.5 Flash se beneficia de un régimen de entrenamiento que incluye una amplia gama de entradas multilingües y multimodales. El modelo admite entradas de audio, video, PDF e imagen, confirmando su versatilidad para manejar flujos de información complejos y diversos necesarios para las aplicaciones modernas de IA.

Dónde Brilla

Gemini 3.5 Flash impresiona con cinco fortalezas principales:

  1. Razonamiento Nativo: Gemini 3.5 Flash sobresale en tareas que requieren estructuración lógica y resolución de problemas, gracias a su procesamiento de cadenas de pensamiento integrado. Esto permite a los usuarios abordar escenarios sofisticados sin necesidad de cambiar opciones o configuraciones adicionales, beneficioso particularmente en entornos de alto riesgo como la investigación legal o la síntesis compleja de datos. Por ejemplo, en el contexto de /usecases/reasoning, demuestra una capacidad para analizar y procesar secuencias lógicas complejas de manera efectiva.

  2. Ventana de Contexto de un Millón de Tokens: Con una ventana de contexto de 1,048,576 tokens, Gemini 3.5 Flash permite una continuidad sin precedentes en el diálogo y el procesamiento de datos. Esta capacidad es especialmente valiosa en aplicaciones como /usecases/data-extraction donde grandes conjuntos de datos deben ser analizados en una sola sesión, permitiendo una comprensión contextual completa sin interrupciones frecuentes.

  3. Amplitud Multimodal: El modelo admite entradas de audio, video, PDF e imagen, lo que lo convierte en una herramienta versátil en campos como la agregación y el análisis de contenido multimedia. Las tareas bajo /usecases/customer-service pueden beneficiarse enormemente de tales capacidades, fomentando innovaciones en tecnologías de interacción con el cliente a través de experiencias más ricas e interactivas.

  4. Base en Búsqueda Web: Gemini 3.5 Flash incorpora una base en búsqueda web, mejorando su capacidad para integrar datos en tiempo real y verificación en las respuestas. Esta característica es clave para aplicaciones que requieren extracción de contenido actualizado y factual, crucial para /usecases/code en repositorios de código que evolucionan dinámicamente o en el monitoreo de transacciones en tiempo real.

  5. Posicionamiento de Costo: Posicionado entre alternativas más baratas y niveles premium, Gemini 3.5 Flash ofrece una propuesta de valor convincente. Aunque es más caro que el 2.5 Flash, ofrece capacidades de razonamiento y soporte multimodal mejorados, haciéndolo rentable para entidades que requieren una solución de IA robusta y completa.

Dónde Presenta Limitaciones

A pesar de sus fortalezas, Gemini 3.5 Flash presenta varias limitaciones que los tomadores de decisiones deben considerar:

  1. Alto Costo de Salida: El costo de salida del modelo de $9 por 1M de tokens puede ser prohibitivo para flujos de trabajo que involucran generación de texto a gran escala, como la generación de informes extensos o creación masiva de contenido. Requiere una planificación económica cuidadosa y tal vez limite su uso en contextos puramente generativos donde la eficiencia de costos es crítica.

  2. Límite de Salida: La capacidad máxima de salida de 65,535 tokens puede ser restrictiva para ciertas tareas generativas extendidas. Si bien es suficiente para la mayoría de las necesidades operativas, usarlo en escenarios que demandan generación narrativa prolongada o propuestas detalladas podría presentar desafíos.

  3. Desconocidos: Aspectos clave como el conteo exacto de parámetros y la fecha exacta de conocimiento sigue sin revelarse. Esta falta de transparencia podría ser una desventaja al compararse con competidores que ofrecen detalles más explícitos sobre sus arquitecturas de modelos y políticas de datos.

  4. Competencia: Aunque el costo y la capacidad están en equilibrio, los competidores ofrecen modelos más baratos que podrían ser más atractivos para casos de uso sencillos que no requieran las extensas capacidades multimodales y de razonamiento de Gemini 3.5 Flash.

Casos de Uso Reales

Gemini 3.5 Flash brilla en diversos escenarios del mundo real donde su combinación única de velocidad, potencia y amplitud satisface demandas específicas de la industria:

  1. Documentación Sanitaria (Salud): Aprovechando sus capacidades en el manejo de ventanas de contexto extensas y entradas multimodales, Gemini 3.5 Flash puede generar y verificar informes médicos detallados de manera efectiva. Con datos de entrada de PDFs y bases de datos médicas relevantes, puede analizar historiales médicos complejos, ayudando en la documentación de diagnósticos de pacientes.

  2. Análisis de Documentos Legales (Sector Legal): El razonamiento nativo del modelo y su gestión de contextos largos sobresalen en el sector legal, procesando documentos legales extensos para extraer información pertinente, identificar inconsistencias y proporcionar un análisis resumido, crucial en procesos de revisión legal.

  3. Monitoreo Financiero en Tiempo Real (Finanzas): Al usar la base en búsqueda web junto con habilidades nativas de interpretación, Gemini 3.5 Flash asegura que los analistas financieros tengan los últimos puntos de datos, indexando desde noticias de mercado actuales y actualizaciones para sugerir ajustes en la gestión de portafolios.

  4. Creación de Contenidos Multimedia Educativos (Educación): La destreza del modelo en manejar datos de audio, video y texto de manera concurrente permite a los creadores de contenido educativo desarrollar módulos de aprendizaje interactivos, que incorporan retroalimentación en tiempo real y actualizaciones extraídas de publicaciones académicas recientes.

Resumen del Benchmark de Tokonomix

En nuestras pruebas internas a través de diferentes dominios, Gemini 3.5 Flash consistentemente demuestra excelencia en razonamiento y extracción factual, superando particularmente los benchmarks para tareas de secuencias lógicas complejas. Su desempeño en capacidades multilingües y salidas de tareas de codificación precisas se alinea bien con nuestras expectativas para modelos de tercera generación de alta gama. Sus puntuaciones se actualizan regularmente, reflejando una confiabilidad estable y versatilidad funcional. Para métricas comparativas detalladas, consulte nuestros leaderboards de benchmarks.

Privacidad de la UE y Residencia de Datos

Hospedado en la robusta infraestructura de Google Cloud, Gemini 3.5 Flash cumple con GDPR, una necesidad para organizaciones que operan dentro o en conjunto con la Unión Europea. Google ofrece opciones completas de residencia de datos, facilitando operaciones seguras en sectores como la salud, lo legal y la administración pública, que tienen requisitos regulatorios estrictos para la protección de datos. Este cumplimiento asegura que el modelo pueda integrarse en flujos de trabajo que involucran datos sensibles con garantía de que se cumplan los estándares de privacidad.

Veredicto y Alternativas

Gemini 3.5 Flash es la opción ideal para organizaciones que requieren un modelo de IA versátil y de alto rendimiento que maneje entradas multimodales complejas con capacidad de razonamiento significativa. Aquellos enfocados en restricciones presupuestarias o que valoran precios más bajos podrían considerar modelos más económicos, como el Gemini 3.0 Flash Preview, para tareas más simples. Sin embargo, para equipos que demandan información robusta y una interacción mayor, Gemini 3.5 Flash cumple y supera las expectativas.

De cara al futuro, el plan de desarrollo Gemini 3 sugiere mejoras progresivas, particularmente en la refinación de eficiencias de tareas distribuidas y posiblemente abordando dinámicas de costo. Mantenerse al tanto de las actualizaciones será crítico para aprovechar su potencial completo en flujos de trabajo de IA en evolución.

Última revisión técnica: 2026-05-27 — Tokonomix.ai

Última prueba automática
7 jun 2026 · 04:49 UTC · Benchmark
Latencia P50
4712 ms
Latencia P95
Errores
0 / 6 ejecuciones
Última revisión por Equipo Tokonomix·27 de mayo de 2026