Pourquoi la fenêtre de contexte est-elle si petite (4096 tokens) ?

Le contexte sert ici à décrire le prompt musical (style, instruments, ambiance, durée), pas à traiter de longs documents. 4K tokens suffisent largement pour piloter une génération audio.

Le statut « Preview » pose-t-il un risque pour la production ?

Oui, un modèle en preview peut voir son API, ses quotas ou sa disponibilité changer sans préavis. Il est recommandé de l'utiliser pour de l'expérimentation ou des features non critiques.

Peut-on utiliser Lyria 3 Pro pour générer de la voix ou des dialogues ?

Non, le modèle est orienté composition musicale et synthèse audio, pas synthèse vocale. Pour de la voix off ou du TTS, il faut s'orienter vers un modèle dédié.

Quelles précautions juridiques prendre sur les morceaux générés ?

Comme pour toute IA musicale, vérifiez les conditions d'utilisation de Google et d'OpenRouter concernant les droits commerciaux, l'attribution et l'éventuelle similarité avec des œuvres existantes avant toute exploitation.

Tier A — Frontier

Fonctionne en :Multi-regionCréé en :United States

OpenRouter

Google Lyria 3 Pro Preview

Tier A — Frontier · 4K tokens · undisclosed

Équipe éditoriale Tokonomix·Relu par Mes Kalkan·Publié le 24 mai 2026·Dernière relecture 24 mai 2026

Google Lyria 3 Pro Preview est un modèle d'IA spécialisé dans la génération musicale et la synthèse audio, accessible via la plateforme d'OpenRouter. Le modèle représente la troisième itération de Google de sa technologie de génération audio Lyria, offrant des capacités qui dépassent les interactions textuelles pour produire des compositions musicales et du contenu audio. Cette version d'aperçu permet aux développeurs et aux utilisateurs d'expérimenter les fonctionnalités de génération musicale du modèle avant une diffusion plus large. Le modèle fonctionne avec une fenêtre de contexte de 4K tokens, modeste comparée aux grands modèles de langage mais adaptée à ses tâches spécialisées de génération audio. Lyria 3 Pro Preview peut générer de la musique originale à partir de prompts textuels ou d'autres paramètres d'entrée, produisant des fichiers audio plutôt que des réponses uniquement textuelles. La technologie s'appuie sur des techniques de synthèse audio neuronale pour créer des pièces musicales dans divers genres et styles. Au sein du catalogue d'OpenRouter, ce modèle occupe une niche distincte en tant qu'outil audio créatif plutôt que modèle de langage généraliste. La désignation « Pro » suggère qu'il s'agit d'une version aux capacités supérieures au sein de la famille Lyria 3, tandis que l'étiquette « Preview » indique qu'il reste en phase de test ou d'accès anticipé. OpenRouter fournit un accès gratuit à cette version d'aperçu, permettant aux utilisateurs d'explorer les capacités de génération musicale sans barrières initiales. Le modèle convient particulièrement aux applications nécessitant la génération procédurale de musique, le prototypage audio ou le développement créatif de contenu sonore.

Lyria 3 Pro Preview occupe une place à part dans le catalogue d'OpenRouter : ce n'est pas un modèle de langage, mais un générateur musical neuronal signé Google.
— Synthèse éditoriale Tokonomix

Section 01

Forces & faiblesses

Basé sur les résultats de benchmarks et les retours communautaires agrégés sur des cas d'usage réels.

Forces

Génération musicale nativeSortie audio directeAccès preview gratuitCouverture multi-genresIdéal pour le prototypage créatifNiveau Pro de la famille Lyria 3Intégration via OpenRouterSynthèse neuronale signée Google

Faiblesses

Fenêtre de contexte limitée à 4KStatut preview, stabilité non garantieAucune capacité texte ou chatDisponibilité régionale incertaine

Section 02

Capacités

audio outputfree previewmusic generation

Section 03

Questions fréquentes

Lyria 3 Pro Preview vise la génération musicale procédurale, les maquettes sonores, les pistes d'ambiance et le prototypage audio pour jeux, vidéos ou applications créatives. Ce n'est pas un modèle conversationnel.

Un outil créatif prometteur pour le prototypage sonore, à condition d'accepter son statut de preview et son périmètre strictement audio.
— Verdict Tokonomix

Section 04

Disponibilité

Pas encore de données

Nous n'avons pas encore enregistré suffisamment d'appels API pour afficher les statistiques de disponibilité de ce modèle. Les données apparaîtront dès que le modèle reçoit du trafic en direct.

Section 05

Verdicts benchmark Tokonomix

● 2026-06-14

Google Lyria 3 Pro Preview launches with audio and music generation

Google Lyria 3 Pro Preview has entered the benchmarking window as a new model specialized in music and audio generation. The model introduces three notable capabilities: audio output, music generation, and a free preview tier allowing users to test the system without initial cost barriers. As a first-generation entry in our tracking system, there are no performance metrics or benchmark scores available yet to assess its capabilities relative to other audio generation models. The model appears positioned as Google's entry into the AI music creation space, competing with other generative audio systems. Users should note that as a preview release, the model may undergo significant changes in features, performance, or availability as Google refines the technology. The free preview access provides an opportunity for early testing and experimentation. Without historical performance data or comparative benchmarks, users evaluating this model should conduct their own testing for their specific use cases, particularly around audio quality, musical coherence, prompt adherence, and generation speed. Future benchmark windows will provide clearer insights into how Lyria 3 Pro Preview performs against competing solutions.

Quality

—

Latency p50

—

Test runs

✓ Audio output capability added✓ Music generation now supported✓ Free preview access available

Section 06

Profil complet du modèle

Google Lyria 3 Pro Preview : génération musicale haute fidélité derrière un portail d'aperçu

La plupart des modèles de langage dans l'écosystème d'agrégateurs sont des chevaux de labour texte-entrant, texte-sortant optimisés pour le raisonnement, la génération de code ou le chat multi-tours. Le Lyria 3 Pro Preview de Google rompt entièrement avec ce schéma. Il s'agit d'un modèle de génération musicale—audio-entrant-optionnel, audio-sortant-toujours—offrant aux développeurs une fenêtre d'aperçu gratuite sur les derniers travaux de Google DeepMind en matière d'audio synthétique. Si vous construisez des outils créatifs, des pipelines de contenu ou des workflows expérimentaux de conception sonore, Lyria 3 Pro occupe une catégorie peuplée par presque rien d'autre dans le catalogue OpenRouter. Ce n'est pas un chatbot avec un module musical additionnel ; il est conçu spécifiquement pour générer des compositions musicales cohérentes et haute fidélité à partir de prompts textuels ou de stems audio.

Le modèle est exposé via OpenRouter en tant qu'aperçu—c'est-à-dire un accès gratuit, mais avec la compréhension implicite qu'il s'agit d'une infrastructure en phase d'évaluation. Google n'a pas divulgué le nombre de paramètres, et la fenêtre de contexte de 4k tokens suggère qu'il ne s'agit pas d'un transformeur multimodal massif dans le moule de GPT-4. Au lieu de cela, Lyria 3 Pro semble être une architecture spécialisée entraînée sur des jeux de données spécifiques à la musique, optimisée pour la synthèse audio au niveau de l'échantillon plutôt que la prédiction de tokens. Pour les équipes de production habituées aux modèles de raisonnement, c'est une bête différente : vous ne déboguez pas la logique de prompt ou les sorties de chaîne de pensée. Vous vous débattez avec le tempo, les tonalités et la cohérence timbrale.

Capacités et historique d'entraînement

Lyria 3 Pro descend de la famille Lyria plus large de Google DeepMind, qui a émergé publiquement fin 2023 dans le cadre de la poussée de l'entreprise vers les médias génératifs au-delà du texte et des images. Les détails d'entraînement sont rares—Google a historiquement été discret sur les spécificités architecturales des modèles qui brouillent la frontière entre aperçus de recherche et lancements de produits—mais le pipeline implicite implique des corpus musicaux à grande échelle, des représentations MIDI et des couches de synthèse de formes d'onde. La désignation « Pro » suggère qu'il s'agit d'un pas en avant par rapport aux itérations Lyria antérieures en termes de fidélité, de contrôlabilité, ou les deux.

Ce qui distingue ce modèle des modèles musicaux à poids ouverts comme MusicGen ou AudioCraft, c'est l'avantage infrastructurel de Google. DeepMind a accès aux métadonnées de la bibliothèque musicale de YouTube (sous réserve de contraintes de licence), à des enregistrements professionnels en studio et au budget de calcul nécessaire pour entraîner des modèles qui gèrent des arrangements polyphoniques, et pas seulement des rythmes en boucle ou des mélodies à instrument unique. Le résultat est un modèle capable de générer des sorties à sonorité multi-pistes—batterie, basse, harmonie, lead—sans les artefacts de phase ou la dérive rythmique qui affligent les transformeurs musicaux plus petits.

L'indicateur de capacité de sortie audio est la fonctionnalité clé ici. Vous envoyez un prompt textuel décrivant le genre, l'ambiance, l'instrumentation et le tempo ; Lyria 3 Pro retourne un fichier de forme d'onde (probablement stéréo 44,1 kHz ou 48 kHz). L'indicateur de génération musicale confirme qu'il s'agit d'une synthèse de bout en bout, pas d'un assistant vocal qui fredonne un air. L'indicateur d'aperçu gratuit vous indique qu'il s'agit d'un accès exploratoire : pas de SLA, aucune garantie que les prompts se comportent de manière cohérente entre les sessions, et aucun engagement tarifaire à long terme de la part de Google.

Où Lyria 3 Pro excelle

Ce modèle est conçu pour des workflows où vous avez besoin de musique originale à la demande et pouvez tolérer une fiabilité de niveau aperçu. L'adéquation la plus claire est les pipelines de production de contenu—créateurs YouTube, producteurs de podcasts ou équipes de médias sociaux qui ont besoin de pistes de fond n'enfreignant pas les droits d'auteur. Au lieu de licencier de la musique stock ou d'engager des compositeurs pour des projets ponctuels, vous lancez un prompt à Lyria 3 Pro avec « morceau électronique énergique, 120 BPM, nappes de synthé et charleston serrés, sans voix » et itérez jusqu'à ce que la sortie corresponde à votre montage. La fenêtre de contexte de 4k tokens est serrée, mais les prompts musicaux sont généralement courts : vous décrivez une ambiance et une structure, pas vous n'écrivez des essais.

Un autre cas d'usage solide est le prototypage rapide pour l'audio de jeux ou les médias interactifs. Si vous concevez un jeu de puzzle et avez besoin d'une douzaine de boucles ambiantes—chacune légèrement différente en ambiance mais cohérente en style—Lyria 3 Pro vous permet de générer des variations rapidement. Le niveau d'aperçu gratuit signifie que vous pouvez explorer des directions créatives sans anxiété budgétaire. Une fois que vous avez trouvé une direction, vous pourriez commander un compositeur humain pour les actifs finaux, mais le modèle accélère la phase de R&D.

La publicité et le travail de marque est un troisième domaine. Les agences qui présentent des concepts ont souvent besoin de musique de démonstration pour accompagner des storyboards ou des animatiques. Lyria 3 Pro peut produire des pistes de substitution qui sonnent suffisamment professionnelles pour des présentations clients, même si elles sont finalement remplacées par des compositions licenciées ou personnalisées. L'avantage clé par rapport aux bibliothèques stock est la spécificité : vous obtenez exactement l'énergie et le rythme que vous décrivez, pas la correspondance la plus proche d'un catalogue.

Le modèle montre également des promesses dans l'éducation et l'exploration musicales. Si vous enseignez l'arrangement ou la production, vous pouvez utiliser Lyria 3 Pro pour démontrer les conventions de genre—« à quoi ressemble un rythme de bossa nova avec des harmonies de piano jazz ? » ou « comment les charlestons trap interagissent-ils avec une ligne de basse en tonalité mineure ? » Les sorties ne remplaceront pas l'écoute d'enregistrements réels, mais elles sont instructives en tant qu'exemples génératifs.

Là où Lyria 3 Pro devient véritablement intéressant, c'est dans les workflows expérimentaux ou hybrides. Certaines équipes l'utilisent comme outil de co-création : générer un stem de 30 secondes, le charger dans une station de travail audionumérique (DAW), le découper en boucles, le superposer avec des instruments live ou des voix. Le modèle devient une source de matériau brut plutôt qu'un produit fini. Parce qu'il est gratuit pendant la fenêtre d'aperçu, le risque est faible et le potentiel créatif est élevé.

Où il ne convient pas

Lyria 3 Pro n'est pas un remplacement pour la production musicale professionnelle, et Google ne prétend pas le contraire. Les sorties sont cohérentes et souvent impressionnantes pour un modèle génératif, mais elles manquent des micro-décisions qui définissent la grande musique : le push-and-pull d'un batteur en direct, le contrôle du souffle d'un instrumentiste à vent, les choix harmoniques qu'un compositeur fait en réponse au contexte émotionnel. Si vous composez la musique d'un film ou sortez un album, vous avez besoin de musiciens humains ou de MIDI programmé minutieusement, pas d'un générateur piloté par prompts.

La fenêtre de contexte de 4k tokens est une contrainte dure pour les briefs complexes. Vous ne pouvez pas fournir à Lyria 3 Pro un plan d'arrangement détaillé—structure des couplets, progression d'accords, changements d'instrumentation exacts à des horodatages spécifiques—et vous attendre à ce qu'il suive chaque instruction. Le modèle interprète bien les ambiances et les paramètres larges ; il est moins fiable avec un contrôle granulaire. Si vous avez besoin d'une piste qui module de do majeur à mi♭ majeur à la marque 1:32, vous feriez mieux d'utiliser les outils DAW traditionnels.

Le statut d'aperçu gratuit introduit également de l'incertitude. Google n'a pas publié de feuille de route pour la commercialisation de Lyria 3 Pro. Il est possible que le modèle reste gratuit avec des limites d'utilisation, passe à un niveau payant, ou soit retiré entièrement si l'adoption ne répond pas aux métriques internes. Pour les workflows de production qui nécessitent des API stables sur des mois ou des années, c'est un obstacle majeur. Vous pouvez expérimenter maintenant, mais ne construisez pas d'infrastructure critique sur des modèles de niveau aperçu à moins d'avoir un plan de migration.

L'ambiguïté des droits d'auteur et de licence est un autre point de friction. Google n'a pas clarifié si les sorties de Lyria 3 Pro sont libres pour un usage commercial, ou si elles portent des restrictions liées aux données d'entraînement. La plupart des modèles de génération musicale entraînés sur des corpus protégés par droits d'auteur opèrent dans une zone grise juridique. Jusqu'à ce que Google publie des conditions explicites, les équipes averses au risque—en particulier dans la publicité ou le cinéma—hésiteront à utiliser les sorties dans des travaux destinés aux clients.

Enfin, Lyria 3 Pro est audio uniquement. Il ne s'intègre pas avec des modèles textuels pour le raisonnement multimodal, et il n'accepte pas d'entrée audio pour le transfert de style ou la génération de variations (du moins pas dans l'interface OpenRouter telle qu'actuellement exposée). Si vous vouliez télécharger une mélodie et demander au modèle de la réharmoniser, ou fournir un stem vocal et générer un accompagnement, ces workflows ne sont pas pris en charge. Le modèle est génératif à partir de prompts textuels, pas transformatif d'audio existant.

Comparaison aux pairs les plus proches

L'ensemble compétitif pour Lyria 3 Pro est clairsemé. Les modèles MusicGen et AudioCraft de Meta sont des alternatives à poids ouverts qui fonctionnent sur du matériel grand public, mais ils sont plus petits et produisent des sorties de fidélité inférieure. MusicGen excelle dans les boucles courtes et les passages à instrument unique ; il peine avec les arrangements de groupe complet. Les sorties de Lyria 3 Pro sonnent plus proche de démos professionnelles, avec une séparation plus nette entre les instruments et moins d'artefacts de synthèse évidents.

Stable Audio de Stability AI est un autre pair, bien qu'il soit positionné davantage comme un produit commercial qu'un aperçu de recherche. Stable Audio offre des temps de génération plus longs et plus de contrôlabilité via des signaux de conditionnement, mais c'est un service payant. Lyria 3 Pro échange une partie de ce contrôle contre un accès gratuit et le soutien infrastructurel de Google.

Jukebox d'OpenAI, le modèle musical précoce de l'ère GPT, était une curiosité de recherche—impressionnante pour son époque, mais impraticable pour de vrais workflows en raison de la vitesse de génération et des problèmes de qualité. Lyria 3 Pro semble être la prochaine génération : plus rapide, plus propre, et enveloppé dans une API plutôt qu'un carnet Colab.

Là où Lyria 3 Pro est en retard par rapport aux bibliothèques stock curées par des humains, c'est en fiabilité et capacité de recherche. Des plateformes comme Epidemic Sound ou Artlist vous permettent de filtrer par ambiance, tempo et instrumentation, puis de prévisualiser des dizaines de pistes répondant à vos critères. Lyria 3 Pro nécessite des prompts itératifs—vous pourriez générer cinq pistes avant d'en trouver une qui fonctionne, et il n'y a pas de catalogue à parcourir. Le modèle est meilleur pour créer quelque chose qui n'existe pas que pour trouver quelque chose qui existe déjà.

Histoire des coûts et de la disponibilité

Le niveau d'aperçu gratuit est toute l'histoire ici. Lyria 3 Pro est accessible via OpenRouter sans frais par requête, sans abonnement mensuel et sans limites de tokens divulguées au lancement. Cela le positionne comme un outil d'évaluation sans friction : vous pouvez l'intégrer dans un prototype, le tester avec de vrais prompts, et décider si la qualité de sortie justifie les coûts futurs si Google passe à un accès payant.

Le modèle d'agrégateur compte ici. OpenRouter regroupe plus de 200 modèles, et Lyria 3 Pro est l'un des rares points de terminaison de génération audio dans ce catalogue. Pour les équipes utilisant déjà OpenRouter pour les modèles textuels, ajouter la génération musicale à la même intégration API est trivial. Vous ne créez pas un compte Google séparé ni ne naviguez dans une interface sur mesure ; vous pointez le même SDK vers un slug de modèle différent et ajustez votre schéma de requête pour les sorties audio.

La taille de paramètres non divulguée et l'infrastructure opaque signifient que vous ne pouvez pas auto-héberger ou affiner. C'est une API boîte noire, ce qui est standard pour les modèles génératifs de Google mais frustrant pour les équipes qui veulent adapter le modèle à des genres de niche ou réentraîner sur des jeux de données propriétaires. Si vous avez besoin d'un modèle musical qui comprend l'identité sonore de votre marque, Lyria 3 Pro ne vous y mènera pas.

La latence est une autre inconnue. La génération musicale est coûteuse en calcul—générer une piste de 30 secondes peut prendre des dizaines de secondes ou des minutes, selon la taille du modèle et la planification des lots. Google n'a pas publié de benchmarks, et l'infrastructure de niveau aperçu déprioritise souvent la vitesse en faveur du débit. Si vous construisez une expérience interactive en temps réel, le temps d'aller-retour pourrait être prohibitif.

Notre verdict

Lyria 3 Pro Preview est un outil spécialisé pour un ensemble étroit de workflows, et il est offert à un prix—zéro—qui rend l'expérimentation triviale. Si vous construisez des pipelines de contenu nécessitant de la musique originale, ou si vous explorez l'audio génératif dans le cadre d'un produit créatif, ce modèle mérite quelques heures de tests pratiques. Les sorties sont suffisamment haute fidélité pour être utiles, et l'accès gratuit supprime la barrière habituelle à essayer quelque chose de nouveau.

La désignation d'aperçu est la mise en garde. Google a un historique de lancement de modèles de recherche en tant qu'aperçus gratuits, puis soit de les productiser avec une tarification significative, soit de les abandonner discrètement. Lyria 3 Pro ressemble à une expérience d'adéquation au marché : DeepMind veut voir comment les développeurs utilisent la génération musicale avant de s'engager dans un produit à grande échelle. C'est acceptable pour le prototypage, mais ce n'est pas une fondation pour l'infrastructure de production.

Pour les équipes habituées au paysage des modèles textuels, Lyria 3 Pro est un rappel que l'IA générative s'étend bien au-delà des chatbots et des assistants de code. La génération musicale est encore un domaine immature—il n'y a pas d'équivalent RLHF pour le goût musical, pas de benchmarks établis pour la « bonne » composition—mais la technologie avance rapidement. Lyria 3 Pro se situe à la pointe de ce progrès, enveloppé dans une API accessible et offert sans coût immédiat.

La question n'est pas de savoir si Lyria 3 Pro est le meilleur modèle musical disponible—il l'est probablement, conditionnel à votre définition de « meilleur »—mais si votre workflow peut absorber l'incertitude de l'infrastructure de niveau aperçu. Si la réponse est oui, c'est le point de terminaison de génération audio le plus intéressant du catalogue OpenRouter. Si la réponse est non, mettez-le en signet et revenez dans six mois pour voir si Google s'est engagé dans un produit stable et tarifé. Quoi qu'il en soit, le modèle représente une expansion significative de ce que l'écosystème d'agrégateurs peut offrir au-delà de la complétion de texte.

Dernier test automatisé

16 juin 2026 · 14:02 UTC · Benchmark de vitesse

Latence P50

920 ms

Latence P95

1007 ms

Erreurs

3 / 6 exécutions

Dernière revue par Équipe Tokonomix·24 mai 2026