Ir al contenido
Tier A — Frontera
Se ejecuta en:Multi-regionCreado en:United States
OpenRouter

Google Lyria 3 Pro Preview

Tier A — Frontera · 4K tokens · undisclosed

Equipo editorial Tokonomix·Revisado por Mes Kalkan··

Google Lyria 3 Pro Preview es un modelo de IA especializado en generación musical y síntesis de audio, disponible a través de la plataforma OpenRouter. El modelo representa la tercera iteración de la tecnología Lyria de generación de audio de Google, ofreciendo capacidades que se extienden más allá de las interacciones basadas en texto para producir composiciones musicales y contenido de audio. Esta versión preview permite a desarrolladores y usuarios experimentar con las funciones de generación musical del modelo antes de su lanzamiento general. El modelo opera con una ventana de contexto de 4K tokens, modesta en comparación con los grandes modelos de lenguaje pero adecuada para sus tareas especializadas de generación de audio. Lyria 3 Pro Preview puede generar música original a partir de prompts de texto u otros parámetros de entrada, produciendo archivos de audio en lugar de únicamente respuestas de texto. La tecnología se apoya en técnicas de síntesis neuronal de audio para crear piezas musicales en distintos géneros y estilos. Dentro del catálogo de OpenRouter, este modelo ocupa un nicho diferenciado como herramienta de audio creativa, no como modelo de lenguaje de propósito general. La designación "Pro" sugiere que se trata de una versión de mayor capacidad dentro de la familia Lyria 3, aunque la etiqueta "Preview" indica que aún se encuentra en fase de pruebas o acceso anticipado. OpenRouter ofrece acceso gratuito a esta versión preview, permitiendo a los usuarios explorar las capacidades de generación musical sin barreras iniciales. El modelo resulta especialmente adecuado para aplicaciones que requieren generación procedural de música, prototipado de audio o desarrollo creativo de contenido sonoro.

Lyria 3 Pro Preview es la apuesta de Google por llevar la generación musical neuronal a manos de desarrolladores, sin las barreras habituales del acceso temprano.

Resumen editorial de Tokonomix
Sección 01

Análisis de velocidad

Latencia medida en todas las ejecuciones de benchmark. P50 (mediana) y P95 (percentil 95) dan una imagen realista de la velocidad de respuesta bajo carga normal y máxima.

Latencia P50 (mediana)Latencia P9567 runs
523120118782556323305-2406-09ms
Sección 02

Tokens por segundo

Rendimiento en tokens por segundo, derivado de la latencia P50 medida. Más alto es mejor; las fluctuaciones reflejan la carga del lado del proveedor.

Rendimiento (tokens / s)218 / avg 219
379134

Estimado a partir de latencia P50 × 200 tokens de salida — el número absoluto depende de esta suposición; lo que importa es la tendencia.

Sección 03

Fortalezas & debilidades

Basado en resultados de benchmarks y comentarios agregados de la comunidad sobre casos de uso reales.

Fortalezas

Generación musical original de alta calidadSalida de audio nativa, no solo textoAcceso gratuito durante el previewCobertura de múltiples géneros y estilosIntegración directa vía OpenRouterIdeal para prototipado de audio creativoRespaldo técnico de Google DeepMindSíntesis neuronal madura, tercera iteración

Debilidades

Ventana de contexto reducida de 4K tokensEstado preview, sin garantías de estabilidadNo sirve para tareas conversacionales o de textoDisponibilidad regional aún limitada
Sección 04

Capacidades

audio outputfree previewmusic generation
Sección 05

Preguntas frecuentes

Genera archivos de audio musical en lugar de respuestas en texto, lo que lo hace adecuado para flujos creativos y no para chatbots o asistentes generales.

Una herramienta especializada que brilla en su nicho creativo, siempre que entiendas que no es un modelo de lenguaje generalista.

Veredicto de Tokonomix
Sección 06

Veredictos del benchmark Tokonomix

2026-06-07

Google Lyria 3 Pro Preview debuts with music generation capabilities

Google Lyria 3 Pro Preview enters the benchmark as a specialized music generation model with audio output capabilities. This is the first window where this model appears, making it impossible to establish performance trends or compare against previous iterations. The model is currently offered as a free preview through OpenRouter, suggesting an evaluation or beta period. As a music generation system, Lyria 3 Pro Preview focuses on audio synthesis rather than traditional language model tasks, placing it in a distinct category from text-focused models. The addition of audio output and music generation capabilities indicates Google's expansion into creative AI tools beyond conversational and text-based applications. Without quantitative benchmark data from prior windows, assessment is limited to capability enumeration. Users should expect this to be an experimental offering where features and availability may change as Google refines the model based on usage patterns. The free preview status may indicate limited capacity or restricted access terms. Future benchmark windows will be critical for establishing whether this model demonstrates competitive performance in music quality, generation speed, or prompt adherence compared to other audio generation systems.

Quality

Latency p50

Test runs

0

Music generation capability added Audio output now supported Free preview access available
Sección 07

Perfil completo del modelo

Google Lyria 3 Pro Preview — illustration 1
Vista previa de Google Lyria 3 Pro: generación de música de alta fidelidad tras una puerta de acceso anticipado

La mayoría de los modelos de lenguaje en el ecosistema de agregadores son herramientas de entrada de texto y salida de texto optimizadas para razonamiento, generación de código o chat multiturnos. La vista previa de Lyria 3 Pro de Google rompe ese patrón por completo. Se trata de un modelo de generación de música—entrada de audio opcional, salida de audio siempre—que ofrece a los desarrolladores una ventana de vista previa gratuita al último trabajo de Google DeepMind en audio sintético. Si estás construyendo herramientas creativas, pipelines de contenido o flujos de trabajo experimentales de diseño de sonido, Lyria 3 Pro se sitúa en una categoría ocupada por casi nada más en el catálogo de OpenRouter. No es un chatbot con un complemento musical; está diseñado específicamente para generar composiciones musicales coherentes y de alta fidelidad a partir de prompts de texto o stems de audio.

El modelo se presenta a través de OpenRouter como una vista previa, lo que significa acceso gratuito, pero con el entendimiento implícito de que esta es infraestructura en fase de evaluación. Google no ha revelado el número de parámetros, y la ventana de contexto de 4k tokens sugiere que no se trata de un transformador multimodal masivo al estilo GPT-4. En cambio, Lyria 3 Pro parece ser una arquitectura especializada entrenada en conjuntos de datos específicos de música, optimizada para síntesis de audio a nivel de muestra en lugar de predicción de tokens. Para los equipos de producción acostumbrados a modelos de razonamiento, esto es una bestia diferente: no estás depurando lógica de prompts o salidas de cadena de pensamiento. Estás lidiando con tempo, tonalidades y coherencia tímbrica.

Capacidades e historia del entrenamiento

Lyria 3 Pro desciende de la familia más amplia Lyria de Google DeepMind, que surgió públicamente a finales de 2023 como parte del impulso de la compañía hacia medios generativos más allá del texto y las imágenes. Los detalles del entrenamiento son escasos—Google históricamente ha sido reservado sobre las especificaciones de arquitectura para modelos que desdibujan la línea entre vistas previas de investigación y lanzamientos de productos—pero el pipeline implícito involucra corpus de música a gran escala, representaciones MIDI y capas de síntesis de forma de onda. La designación "Pro" sugiere que este es un paso adelante respecto a iteraciones anteriores de Lyria en términos de fidelidad, controlabilidad, o ambos.

Lo que diferencia esto de los modelos de música de código abierto como MusicGen o AudioCraft es la ventaja de infraestructura de Google. DeepMind tiene acceso a los metadatos de la biblioteca musical de YouTube (sujeto a restricciones de licencias), grabaciones profesionales de estudio y el presupuesto computacional para entrenar modelos que manejan arreglos polifónicos, no solo beats en bucle o melodías de un solo instrumento. El resultado es un modelo que puede generar salidas que suenan multipistas—batería, bajo, armonía, melodía principal—sin los artefactos de fase o deriva rítmica que afectan a los transformadores musicales más pequeños.

La bandera de capacidad de salida de audio es la característica clave aquí. Envías un prompt de texto describiendo género, ambiente, instrumentación y tempo; Lyria 3 Pro devuelve un archivo de forma de onda (probablemente estéreo a 44.1kHz o 48kHz). La bandera de generación de música confirma que esta es síntesis de extremo a extremo, no un asistente de voz que tararea una melodía. La bandera de vista previa gratuita te indica que este es acceso exploratorio: sin SLA, sin garantías de que los prompts se comporten de manera consistente entre sesiones y sin compromiso de precios a largo plazo de Google.

Dónde brilla Lyria 3 Pro

Este modelo está construido para flujos de trabajo donde necesitas música original bajo demanda y puedes tolerar confiabilidad de nivel de vista previa. El ajuste más claro son los pipelines de producción de contenido—creadores de YouTube, productores de podcasts o equipos de redes sociales que necesitan pistas de fondo que no infrinjan derechos de autor. En lugar de licenciar música de archivo o contratar compositores para proyectos únicos, le das un prompt a Lyria 3 Pro con "pista electrónica animada, 120 BPM, pads de sintetizador y hi-hats ajustados, sin voces" e iteras hasta que la salida se ajuste a tu edición. La ventana de contexto de 4k tokens es ajustada, pero los prompts musicales suelen ser cortos: estás describiendo vibra y estructura, no escribiendo ensayos.

Otro caso de uso sólido es el prototipado rápido para audio de juegos o medios interactivos. Si estás diseñando un juego de rompecabezas y necesitas una docena de bucles ambientales—cada uno ligeramente diferente en ambiente pero cohesivo en estilo—Lyria 3 Pro te permite generar variaciones rápidamente. El nivel de vista previa gratuita significa que puedes explorar direcciones creativas sin ansiedad presupuestaria. Una vez que encuentres una dirección, podrías encargar a un compositor humano los activos finales, pero el modelo acelera la fase de I+D.

El trabajo publicitario y de marca es un tercer dominio. Las agencias que presentan conceptos a menudo necesitan música demo para acompañar storyboards o animatics. Lyria 3 Pro puede producir pistas de marcador de posición que suenan lo suficientemente profesionales para presentaciones a clientes, incluso si eventualmente se reemplazan con composiciones licenciadas o personalizadas. La ventaja clave sobre las bibliotecas de archivo es la especificidad: obtienes exactamente la energía y el ritmo que describes, no la coincidencia más cercana de un catálogo.

El modelo también muestra promesa en educación musical y exploración. Si estás enseñando arreglos o producción, puedes usar Lyria 3 Pro para demostrar convenciones de género—"¿cómo suena un ritmo de bossa nova con armonías de piano de jazz?" o "¿cómo interactúan los hi-hats de trap con una línea de bajo en tonalidad menor?" Las salidas no reemplazarán escuchar grabaciones reales, pero son instructivas como ejemplos generativos.

Donde Lyria 3 Pro se vuelve genuinamente interesante es en flujos de trabajo experimentales o híbridos. Algunos equipos lo están usando como una herramienta de co-creación: genera un stem de 30 segundos, cárgalo en un DAW, córtalo en bucles, súperpolo con instrumentos en vivo o voces. El modelo se convierte en una fuente de materia prima en lugar de producto terminado. Como es gratuito durante la ventana de vista previa, el riesgo es bajo y el potencial creativo es alto.

Dónde no encaja

Lyria 3 Pro no es un reemplazo para la producción musical profesional, y Google no afirma lo contrario. Las salidas son coherentes y a menudo impresionantes para un modelo generativo, pero carecen de las micro-decisiones que definen la gran música: el tira y afloja de un baterista en vivo, el control de respiración de un instrumentista de viento, las elecciones armónicas que un compositor hace en respuesta al contexto emocional. Si estás componiendo música para una película o lanzando un álbum, necesitas músicos humanos o MIDI programado meticulosamente, no un generador basado en prompts.

La ventana de contexto de 4k tokens es una restricción dura para briefs complejos. No puedes alimentar a Lyria 3 Pro con un plan de arreglo detallado—estructura de versos, progresión de acordes, cambios exactos de instrumentación en marcas de tiempo específicas—y esperar que siga cada instrucción. El modelo interpreta bien las vibras y parámetros amplios; es menos confiable con control granular. Si necesitas una pista que module de do mayor a mi bemol mayor en la marca 1:32, estás mejor usando herramientas DAW tradicionales.

El estado de vista previa gratuita también introduce incertidumbre. Google no ha publicado una hoja de ruta para la comercialización de Lyria 3 Pro. Es posible que el modelo permanezca gratuito con límites de uso, se gradúe a un nivel pago, o se retire por completo si la adopción no cumple con las métricas internas. Para flujos de trabajo de producción que necesitan APIs estables durante meses o años, esto es un problema. Puedes experimentar ahora, pero no construyas infraestructura crítica sobre modelos de nivel de vista previa a menos que tengas un plan de migración.

La ambigüedad de derechos de autor y licencias es otro punto de fricción. Google no ha aclarado si las salidas de Lyria 3 Pro están libres para uso comercial, o si conllevan restricciones vinculadas a los datos de entrenamiento. La mayoría de los modelos de música generativa entrenados en corpus con derechos de autor operan en una zona gris legal. Hasta que Google publique términos explícitos, los equipos reacios al riesgo—especialmente en publicidad o cine—dudarán en usar las salidas en trabajo orientado al cliente.

Finalmente, Lyria 3 Pro es solo audio. No se integra con modelos de texto para razonamiento multimodal, y no acepta entrada de audio para transferencia de estilo o generación de variaciones (al menos no en la interfaz de OpenRouter como se expone actualmente). Si quisieras subir una melodía y pedirle al modelo que la rearmonice, o proporcionar un stem vocal y generar acompañamiento, esos flujos de trabajo no están soportados. El modelo es generativo a partir de prompts de texto, no transformativo de audio existente.

Comparación con pares más cercanos

El conjunto competitivo para Lyria 3 Pro es escaso. Los modelos MusicGen y AudioCraft de Meta son alternativas de código abierto que funcionan en hardware de consumo, pero son más pequeños y producen salidas de menor fidelidad. MusicGen sobresale en bucles cortos y pasajes de un solo instrumento; tiene dificultades con arreglos de banda completa. Las salidas de Lyria 3 Pro suenan más cercanas a demos profesionales, con separación más limpia entre instrumentos y menos artefactos de síntesis obvios.

Stable Audio de Stability AI es otro par, aunque está posicionado más como un producto comercial que como una vista previa de investigación. Stable Audio ofrece tiempos de generación más largos y más controlabilidad a través de señales de condicionamiento, pero es un servicio de pago. Lyria 3 Pro intercambia algo de ese control por acceso gratuito y el respaldo de infraestructura de Google.

Jukebox de OpenAI, el modelo musical temprano de la era GPT, fue una curiosidad de investigación—impresionante para su época, pero poco práctico para flujos de trabajo reales debido a problemas de velocidad de generación y calidad. Lyria 3 Pro se siente como la siguiente generación: más rápido, más limpio y envuelto en una API en lugar de un cuaderno de Colab.

Donde Lyria 3 Pro se queda atrás de las bibliotecas de archivo curadas por humanos es en confiabilidad y capacidad de búsqueda. Plataformas como Epidemic Sound o Artlist te permiten filtrar por ambiente, tempo e instrumentación, luego previsualizar docenas de pistas que cumplen tus criterios. Lyria 3 Pro requiere prompting iterativo—podrías generar cinco pistas antes de aterrizar en una que funcione, y no hay catálogo para navegar. El modelo es mejor para crear algo que no existe que para encontrar algo que ya existe.

Historia de costos y disponibilidad

El nivel de vista previa gratuita es toda la historia aquí. Lyria 3 Pro es accesible a través de OpenRouter sin cargos por solicitud, sin suscripción mensual y sin límites de tokens revelados en el lanzamiento. Esto lo posiciona como una herramienta de evaluación sin fricción: puedes integrarlo en un prototipo, probarlo con prompts reales y decidir si la calidad de salida justifica costos futuros si Google transiciona a acceso de pago.

El modelo de agregador importa aquí. OpenRouter agrupa más de 200 modelos, y Lyria 3 Pro es uno de los pocos endpoints de generación de audio en ese catálogo. Para equipos que ya usan OpenRouter para modelos de texto, agregar generación de música a la misma integración de API es trivial. No estás registrándote en una cuenta de Google separada o navegando una interfaz personalizada; apuntas el mismo SDK a un slug de modelo diferente y ajustas tu esquema de solicitud para salidas de audio.

El tamaño de parámetros no revelado y la infraestructura opaca significan que no puedes auto-hospedar o ajustar finamente. Esta es una API de caja negra, lo cual es estándar para los modelos generativos de Google pero frustrante para equipos que quieren adaptar el modelo a géneros de nicho o reentrenar en conjuntos de datos propietarios. Si necesitas un modelo de música que entienda la identidad sonora de tu marca, Lyria 3 Pro no te llevará allí.

La latencia es otra incógnita. La generación de música es computacionalmente costosa—generar una pista de 30 segundos puede tomar decenas de segundos o minutos, dependiendo del tamaño del modelo y la programación por lotes. Google no ha publicado benchmarks, y la infraestructura de nivel de vista previa a menudo desprioriza la velocidad en favor del rendimiento. Si estás construyendo una experiencia interactiva en tiempo real, el tiempo de ida y vuelta podría ser prohibitivo.

Nuestro veredicto

La vista previa de Lyria 3 Pro es una herramienta especialista para un conjunto estrecho de flujos de trabajo, y se está ofreciendo a un precio—cero—que hace que la experimentación sea trivial. Si estás construyendo pipelines de contenido que necesitan música original, o si estás explorando audio generativo como parte de un producto creativo, este modelo merece unas horas de prueba práctica. Las salidas son de suficiente alta fidelidad para ser útiles, y el acceso gratuito elimina la barrera habitual para probar algo nuevo.

La designación de vista previa es la advertencia. Google tiene un historial de lanzar modelos de investigación como vistas previas gratuitas, luego productizarlos con precios significativos o descontinuarlos silenciosamente. Lyria 3 Pro se siente como un experimento en ajuste de mercado: DeepMind quiere ver cómo los desarrolladores usan la generación de música antes de comprometerse con un producto a escala completa. Eso está bien para prototipar, pero no es una base para infraestructura de producción.

Para equipos acostumbrados al panorama de modelos de texto, Lyria 3 Pro es un recordatorio de que la IA generativa se extiende mucho más allá de chatbots y asistentes de código. La generación de música sigue siendo un dominio inmaduro—no hay equivalente a RLHF para el gusto musical, no hay benchmarks establecidos para composición "buena"—pero la tecnología está avanzando rápidamente. Lyria 3 Pro se sitúa en la vanguardia de ese progreso, envuelto en una API accesible y ofrecido sin costo inmediato.

La pregunta no es si Lyria 3 Pro es el mejor modelo de música disponible—probablemente lo es, condicionado a tu definición de "mejor"—sino si tu flujo de trabajo puede absorber la incertidumbre de la infraestructura de nivel de vista previa. Si la respuesta es sí, este es el endpoint de generación de audio más interesante en el catálogo de OpenRouter. Si la respuesta es no, márcalo y revísalo en seis meses para ver si Google se ha comprometido con un producto estable con precio. De cualquier manera, el modelo representa una expansión significativa de lo que el ecosistema de agregadores puede ofrecer más allá de completar texto.

Google Lyria 3 Pro Preview — illustration 2
Última prueba automática
9 jun 2026 · 20:02 UTC · Benchmark de velocidad
Latencia P50
919 ms
Latencia P95
1305 ms
Errores
3 / 6 ejecuciones
Última revisión por Equipo Tokonomix·24 de mayo de 2026