¿La ventana de 4096 tokens es un problema?

Para tareas de lenguaje sería limitante, pero aquí el contexto se usa principalmente para describir prompts musicales y parámetros de generación, así que es suficiente en la mayoría de casos.

¿Puedo usarlo en producción siendo un preview?

No es recomendable depender de él para cargas críticas, ya que la etiqueta preview implica posibles cambios de API, cuotas o disponibilidad sin previo aviso.

¿Qué casos de uso encajan mejor con Lyria 3 Pro Preview?

Prototipado de bandas sonoras, generación procedural de música para videojuegos, jingles publicitarios y experimentación creativa con composición asistida por IA.

¿Cómo se compara con otros modelos de OpenRouter?

No compite directamente con modelos de texto, sino que cubre un nicho propio de generación de audio que pocos modelos del catálogo abordan con esta especialización.

Tier A — Frontera

Se ejecuta en:Multi-regionCreado en:United States

OpenRouter

Google Lyria 3 Pro Preview

Tier A — Frontera · 4K tokens · undisclosed

Equipo editorial Tokonomix·Revisado por Mes Kalkan·Publicado 24 de mayo de 2026·Última revisión 24 de mayo de 2026

Google Lyria 3 Pro Preview es un modelo de IA especializado en generación musical y síntesis de audio, disponible a través de la plataforma OpenRouter. El modelo representa la tercera iteración de la tecnología Lyria de generación de audio de Google, ofreciendo capacidades que se extienden más allá de las interacciones basadas en texto para producir composiciones musicales y contenido de audio. Esta versión preview permite a desarrolladores y usuarios experimentar con las funciones de generación musical del modelo antes de su lanzamiento general. El modelo opera con una ventana de contexto de 4K tokens, modesta en comparación con los grandes modelos de lenguaje pero adecuada para sus tareas especializadas de generación de audio. Lyria 3 Pro Preview puede generar música original a partir de prompts de texto u otros parámetros de entrada, produciendo archivos de audio en lugar de únicamente respuestas de texto. La tecnología se apoya en técnicas de síntesis neuronal de audio para crear piezas musicales en distintos géneros y estilos. Dentro del catálogo de OpenRouter, este modelo ocupa un nicho diferenciado como herramienta de audio creativa, no como modelo de lenguaje de propósito general. La designación "Pro" sugiere que se trata de una versión de mayor capacidad dentro de la familia Lyria 3, aunque la etiqueta "Preview" indica que aún se encuentra en fase de pruebas o acceso anticipado. OpenRouter ofrece acceso gratuito a esta versión preview, permitiendo a los usuarios explorar las capacidades de generación musical sin barreras iniciales. El modelo resulta especialmente adecuado para aplicaciones que requieren generación procedural de música, prototipado de audio o desarrollo creativo de contenido sonoro.

Lyria 3 Pro Preview es la apuesta de Google por llevar la generación musical neuronal a manos de desarrolladores, sin las barreras habituales del acceso temprano.
— Resumen editorial de Tokonomix

Sección 01

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Generación musical original de alta calidadSalida de audio nativa, no solo textoAcceso gratuito durante el previewCobertura de múltiples géneros y estilosIntegración directa vía OpenRouterIdeal para prototipado de audio creativoRespaldo técnico de Google DeepMindSíntesis neuronal madura, tercera iteración

Debilidades

Ventana de contexto reducida de 4K tokensEstado preview, sin garantías de estabilidadNo sirve para tareas conversacionales o de textoDisponibilidad regional aún limitada

Sección 02

Capacidades

audio outputfree previewmusic generation

Sección 03

Preguntas frecuentes

Genera archivos de audio musical en lugar de respuestas en texto, lo que lo hace adecuado para flujos creativos y no para chatbots o asistentes generales.

Una herramienta especializada que brilla en su nicho creativo, siempre que entiendas que no es un modelo de lenguaje generalista.
— Veredicto de Tokonomix

Sección 04

Disponibilidad

Sin datos todavía

Aún no hemos registrado suficientes llamadas a la API para mostrar estadísticas de disponibilidad de este modelo. Los datos aparecen una vez que el modelo comienza a recibir tráfico en vivo.

Sección 05

Veredictos del benchmark Tokonomix

● 2026-06-14

Google Lyria 3 Pro Preview launches with audio and music generation

Google Lyria 3 Pro Preview has entered the benchmarking window as a new model specialized in music and audio generation. The model introduces three notable capabilities: audio output, music generation, and a free preview tier allowing users to test the system without initial cost barriers. As a first-generation entry in our tracking system, there are no performance metrics or benchmark scores available yet to assess its capabilities relative to other audio generation models. The model appears positioned as Google's entry into the AI music creation space, competing with other generative audio systems. Users should note that as a preview release, the model may undergo significant changes in features, performance, or availability as Google refines the technology. The free preview access provides an opportunity for early testing and experimentation. Without historical performance data or comparative benchmarks, users evaluating this model should conduct their own testing for their specific use cases, particularly around audio quality, musical coherence, prompt adherence, and generation speed. Future benchmark windows will provide clearer insights into how Lyria 3 Pro Preview performs against competing solutions.

Quality

—

Latency p50

—

Test runs

✓ Audio output capability added✓ Music generation now supported✓ Free preview access available

Sección 06

Perfil completo del modelo

Vista previa de Google Lyria 3 Pro: generación de música de alta fidelidad tras una puerta de acceso anticipado

La mayoría de los modelos de lenguaje en el ecosistema de agregadores son herramientas de entrada de texto y salida de texto optimizadas para razonamiento, generación de código o chat multiturnos. La vista previa de Lyria 3 Pro de Google rompe ese patrón por completo. Se trata de un modelo de generación de música—entrada de audio opcional, salida de audio siempre—que ofrece a los desarrolladores una ventana de vista previa gratuita al último trabajo de Google DeepMind en audio sintético. Si estás construyendo herramientas creativas, pipelines de contenido o flujos de trabajo experimentales de diseño de sonido, Lyria 3 Pro se sitúa en una categoría ocupada por casi nada más en el catálogo de OpenRouter. No es un chatbot con un complemento musical; está diseñado específicamente para generar composiciones musicales coherentes y de alta fidelidad a partir de prompts de texto o stems de audio.

El modelo se presenta a través de OpenRouter como una vista previa, lo que significa acceso gratuito, pero con el entendimiento implícito de que esta es infraestructura en fase de evaluación. Google no ha revelado el número de parámetros, y la ventana de contexto de 4k tokens sugiere que no se trata de un transformador multimodal masivo al estilo GPT-4. En cambio, Lyria 3 Pro parece ser una arquitectura especializada entrenada en conjuntos de datos específicos de música, optimizada para síntesis de audio a nivel de muestra en lugar de predicción de tokens. Para los equipos de producción acostumbrados a modelos de razonamiento, esto es una bestia diferente: no estás depurando lógica de prompts o salidas de cadena de pensamiento. Estás lidiando con tempo, tonalidades y coherencia tímbrica.

Capacidades e historia del entrenamiento

Lyria 3 Pro desciende de la familia más amplia Lyria de Google DeepMind, que surgió públicamente a finales de 2023 como parte del impulso de la compañía hacia medios generativos más allá del texto y las imágenes. Los detalles del entrenamiento son escasos—Google históricamente ha sido reservado sobre las especificaciones de arquitectura para modelos que desdibujan la línea entre vistas previas de investigación y lanzamientos de productos—pero el pipeline implícito involucra corpus de música a gran escala, representaciones MIDI y capas de síntesis de forma de onda. La designación "Pro" sugiere que este es un paso adelante respecto a iteraciones anteriores de Lyria en términos de fidelidad, controlabilidad, o ambos.

Lo que diferencia esto de los modelos de música de código abierto como MusicGen o AudioCraft es la ventaja de infraestructura de Google. DeepMind tiene acceso a los metadatos de la biblioteca musical de YouTube (sujeto a restricciones de licencias), grabaciones profesionales de estudio y el presupuesto computacional para entrenar modelos que manejan arreglos polifónicos, no solo beats en bucle o melodías de un solo instrumento. El resultado es un modelo que puede generar salidas que suenan multipistas—batería, bajo, armonía, melodía principal—sin los artefactos de fase o deriva rítmica que afectan a los transformadores musicales más pequeños.

La bandera de capacidad de salida de audio es la característica clave aquí. Envías un prompt de texto describiendo género, ambiente, instrumentación y tempo; Lyria 3 Pro devuelve un archivo de forma de onda (probablemente estéreo a 44.1kHz o 48kHz). La bandera de generación de música confirma que esta es síntesis de extremo a extremo, no un asistente de voz que tararea una melodía. La bandera de vista previa gratuita te indica que este es acceso exploratorio: sin SLA, sin garantías de que los prompts se comporten de manera consistente entre sesiones y sin compromiso de precios a largo plazo de Google.

Dónde brilla Lyria 3 Pro

Este modelo está construido para flujos de trabajo donde necesitas música original bajo demanda y puedes tolerar confiabilidad de nivel de vista previa. El ajuste más claro son los pipelines de producción de contenido—creadores de YouTube, productores de podcasts o equipos de redes sociales que necesitan pistas de fondo que no infrinjan derechos de autor. En lugar de licenciar música de archivo o contratar compositores para proyectos únicos, le das un prompt a Lyria 3 Pro con "pista electrónica animada, 120 BPM, pads de sintetizador y hi-hats ajustados, sin voces" e iteras hasta que la salida se ajuste a tu edición. La ventana de contexto de 4k tokens es ajustada, pero los prompts musicales suelen ser cortos: estás describiendo vibra y estructura, no escribiendo ensayos.

Otro caso de uso sólido es el prototipado rápido para audio de juegos o medios interactivos. Si estás diseñando un juego de rompecabezas y necesitas una docena de bucles ambientales—cada uno ligeramente diferente en ambiente pero cohesivo en estilo—Lyria 3 Pro te permite generar variaciones rápidamente. El nivel de vista previa gratuita significa que puedes explorar direcciones creativas sin ansiedad presupuestaria. Una vez que encuentres una dirección, podrías encargar a un compositor humano los activos finales, pero el modelo acelera la fase de I+D.

El trabajo publicitario y de marca es un tercer dominio. Las agencias que presentan conceptos a menudo necesitan música demo para acompañar storyboards o animatics. Lyria 3 Pro puede producir pistas de marcador de posición que suenan lo suficientemente profesionales para presentaciones a clientes, incluso si eventualmente se reemplazan con composiciones licenciadas o personalizadas. La ventaja clave sobre las bibliotecas de archivo es la especificidad: obtienes exactamente la energía y el ritmo que describes, no la coincidencia más cercana de un catálogo.

El modelo también muestra promesa en educación musical y exploración. Si estás enseñando arreglos o producción, puedes usar Lyria 3 Pro para demostrar convenciones de género—"¿cómo suena un ritmo de bossa nova con armonías de piano de jazz?" o "¿cómo interactúan los hi-hats de trap con una línea de bajo en tonalidad menor?" Las salidas no reemplazarán escuchar grabaciones reales, pero son instructivas como ejemplos generativos.

Donde Lyria 3 Pro se vuelve genuinamente interesante es en flujos de trabajo experimentales o híbridos. Algunos equipos lo están usando como una herramienta de co-creación: genera un stem de 30 segundos, cárgalo en un DAW, córtalo en bucles, súperpolo con instrumentos en vivo o voces. El modelo se convierte en una fuente de materia prima en lugar de producto terminado. Como es gratuito durante la ventana de vista previa, el riesgo es bajo y el potencial creativo es alto.

Dónde no encaja

Lyria 3 Pro no es un reemplazo para la producción musical profesional, y Google no afirma lo contrario. Las salidas son coherentes y a menudo impresionantes para un modelo generativo, pero carecen de las micro-decisiones que definen la gran música: el tira y afloja de un baterista en vivo, el control de respiración de un instrumentista de viento, las elecciones armónicas que un compositor hace en respuesta al contexto emocional. Si estás componiendo música para una película o lanzando un álbum, necesitas músicos humanos o MIDI programado meticulosamente, no un generador basado en prompts.

La ventana de contexto de 4k tokens es una restricción dura para briefs complejos. No puedes alimentar a Lyria 3 Pro con un plan de arreglo detallado—estructura de versos, progresión de acordes, cambios exactos de instrumentación en marcas de tiempo específicas—y esperar que siga cada instrucción. El modelo interpreta bien las vibras y parámetros amplios; es menos confiable con control granular. Si necesitas una pista que module de do mayor a mi bemol mayor en la marca 1:32, estás mejor usando herramientas DAW tradicionales.

El estado de vista previa gratuita también introduce incertidumbre. Google no ha publicado una hoja de ruta para la comercialización de Lyria 3 Pro. Es posible que el modelo permanezca gratuito con límites de uso, se gradúe a un nivel pago, o se retire por completo si la adopción no cumple con las métricas internas. Para flujos de trabajo de producción que necesitan APIs estables durante meses o años, esto es un problema. Puedes experimentar ahora, pero no construyas infraestructura crítica sobre modelos de nivel de vista previa a menos que tengas un plan de migración.

La ambigüedad de derechos de autor y licencias es otro punto de fricción. Google no ha aclarado si las salidas de Lyria 3 Pro están libres para uso comercial, o si conllevan restricciones vinculadas a los datos de entrenamiento. La mayoría de los modelos de música generativa entrenados en corpus con derechos de autor operan en una zona gris legal. Hasta que Google publique términos explícitos, los equipos reacios al riesgo—especialmente en publicidad o cine—dudarán en usar las salidas en trabajo orientado al cliente.

Finalmente, Lyria 3 Pro es solo audio. No se integra con modelos de texto para razonamiento multimodal, y no acepta entrada de audio para transferencia de estilo o generación de variaciones (al menos no en la interfaz de OpenRouter como se expone actualmente). Si quisieras subir una melodía y pedirle al modelo que la rearmonice, o proporcionar un stem vocal y generar acompañamiento, esos flujos de trabajo no están soportados. El modelo es generativo a partir de prompts de texto, no transformativo de audio existente.

Comparación con pares más cercanos

El conjunto competitivo para Lyria 3 Pro es escaso. Los modelos MusicGen y AudioCraft de Meta son alternativas de código abierto que funcionan en hardware de consumo, pero son más pequeños y producen salidas de menor fidelidad. MusicGen sobresale en bucles cortos y pasajes de un solo instrumento; tiene dificultades con arreglos de banda completa. Las salidas de Lyria 3 Pro suenan más cercanas a demos profesionales, con separación más limpia entre instrumentos y menos artefactos de síntesis obvios.

Stable Audio de Stability AI es otro par, aunque está posicionado más como un producto comercial que como una vista previa de investigación. Stable Audio ofrece tiempos de generación más largos y más controlabilidad a través de señales de condicionamiento, pero es un servicio de pago. Lyria 3 Pro intercambia algo de ese control por acceso gratuito y el respaldo de infraestructura de Google.

Jukebox de OpenAI, el modelo musical temprano de la era GPT, fue una curiosidad de investigación—impresionante para su época, pero poco práctico para flujos de trabajo reales debido a problemas de velocidad de generación y calidad. Lyria 3 Pro se siente como la siguiente generación: más rápido, más limpio y envuelto en una API en lugar de un cuaderno de Colab.

Donde Lyria 3 Pro se queda atrás de las bibliotecas de archivo curadas por humanos es en confiabilidad y capacidad de búsqueda. Plataformas como Epidemic Sound o Artlist te permiten filtrar por ambiente, tempo e instrumentación, luego previsualizar docenas de pistas que cumplen tus criterios. Lyria 3 Pro requiere prompting iterativo—podrías generar cinco pistas antes de aterrizar en una que funcione, y no hay catálogo para navegar. El modelo es mejor para crear algo que no existe que para encontrar algo que ya existe.

Historia de costos y disponibilidad

El nivel de vista previa gratuita es toda la historia aquí. Lyria 3 Pro es accesible a través de OpenRouter sin cargos por solicitud, sin suscripción mensual y sin límites de tokens revelados en el lanzamiento. Esto lo posiciona como una herramienta de evaluación sin fricción: puedes integrarlo en un prototipo, probarlo con prompts reales y decidir si la calidad de salida justifica costos futuros si Google transiciona a acceso de pago.

El modelo de agregador importa aquí. OpenRouter agrupa más de 200 modelos, y Lyria 3 Pro es uno de los pocos endpoints de generación de audio en ese catálogo. Para equipos que ya usan OpenRouter para modelos de texto, agregar generación de música a la misma integración de API es trivial. No estás registrándote en una cuenta de Google separada o navegando una interfaz personalizada; apuntas el mismo SDK a un slug de modelo diferente y ajustas tu esquema de solicitud para salidas de audio.

El tamaño de parámetros no revelado y la infraestructura opaca significan que no puedes auto-hospedar o ajustar finamente. Esta es una API de caja negra, lo cual es estándar para los modelos generativos de Google pero frustrante para equipos que quieren adaptar el modelo a géneros de nicho o reentrenar en conjuntos de datos propietarios. Si necesitas un modelo de música que entienda la identidad sonora de tu marca, Lyria 3 Pro no te llevará allí.

La latencia es otra incógnita. La generación de música es computacionalmente costosa—generar una pista de 30 segundos puede tomar decenas de segundos o minutos, dependiendo del tamaño del modelo y la programación por lotes. Google no ha publicado benchmarks, y la infraestructura de nivel de vista previa a menudo desprioriza la velocidad en favor del rendimiento. Si estás construyendo una experiencia interactiva en tiempo real, el tiempo de ida y vuelta podría ser prohibitivo.

Nuestro veredicto

La vista previa de Lyria 3 Pro es una herramienta especialista para un conjunto estrecho de flujos de trabajo, y se está ofreciendo a un precio—cero—que hace que la experimentación sea trivial. Si estás construyendo pipelines de contenido que necesitan música original, o si estás explorando audio generativo como parte de un producto creativo, este modelo merece unas horas de prueba práctica. Las salidas son de suficiente alta fidelidad para ser útiles, y el acceso gratuito elimina la barrera habitual para probar algo nuevo.

La designación de vista previa es la advertencia. Google tiene un historial de lanzar modelos de investigación como vistas previas gratuitas, luego productizarlos con precios significativos o descontinuarlos silenciosamente. Lyria 3 Pro se siente como un experimento en ajuste de mercado: DeepMind quiere ver cómo los desarrolladores usan la generación de música antes de comprometerse con un producto a escala completa. Eso está bien para prototipar, pero no es una base para infraestructura de producción.

Para equipos acostumbrados al panorama de modelos de texto, Lyria 3 Pro es un recordatorio de que la IA generativa se extiende mucho más allá de chatbots y asistentes de código. La generación de música sigue siendo un dominio inmaduro—no hay equivalente a RLHF para el gusto musical, no hay benchmarks establecidos para composición "buena"—pero la tecnología está avanzando rápidamente. Lyria 3 Pro se sitúa en la vanguardia de ese progreso, envuelto en una API accesible y ofrecido sin costo inmediato.

La pregunta no es si Lyria 3 Pro es el mejor modelo de música disponible—probablemente lo es, condicionado a tu definición de "mejor"—sino si tu flujo de trabajo puede absorber la incertidumbre de la infraestructura de nivel de vista previa. Si la respuesta es sí, este es el endpoint de generación de audio más interesante en el catálogo de OpenRouter. Si la respuesta es no, márcalo y revísalo en seis meses para ver si Google se ha comprometido con un producto estable con precio. De cualquier manera, el modelo representa una expansión significativa de lo que el ecosistema de agregadores puede ofrecer más allá de completar texto.

Última prueba automática

16 jun 2026 · 14:02 UTC · Benchmark de velocidad

Latencia P50

920 ms

Latencia P95

1007 ms

Errores

3 / 6 ejecuciones

Última revisión por Equipo Tokonomix·24 de mayo de 2026