Usa prompts, letras, timing, BPM e imágenes de la forma correcta
Esta guía resume las capacidades de Google Lyria 3 en un flujo pensado para creadores. Cubre Clip vs Pro, letras personalizadas, estructura temporal, imagen a música, prompts instrumentales, control de idioma, lectura de la salida y límites prácticos.
Por qué existe esta página
El builder usa Google Lyria 3, pero el flujo está modelado por nuestra capa de producto: prompts más estructurados, mejor control de letras y timing, mejores valores por defecto, orquestación asíncrona y gestión reutilizable de pistas.
Lyria 3 Clip
lyria-3-clip-preview
Ideal para
Pruebas rápidas, hooks, loops y previews
Duración
Siempre 30 segundos
Salida
MP3
Lyria 3 Pro
lyria-3-pro-preview
Ideal para
Canciones más completas con versos, estribillos y puentes
Duración
Un par de minutos, guiados por tu prompt
Salida
Audio seleccionado por el modelo + texto
1. Empieza con el modelo correcto
Usa Clip cuando quieras explorar ideas rápido. Usa Pro cuando ya tengas clara la dirección y quieras una pieza más larga y estructurada.
Clip está fijado en 30 segundos, así que es ideal para probar géneros, ambientes y hooks.
Pro es mejor cuando necesitas versos, estribillos, puentes o un arco emocional más largo.
Un buen flujo suele ser Clip primero y Pro después.
2. Escribe un prompt musical específico
Lyria funciona mejor cuando describes el encargo musical real en lugar de limitarte a una vibra vaga.
Menciona el género o mezcla de géneros: lo-fi hip hop, orquestal cinematográfico, indie pop, jazz fusión.
Nombra instrumentos: Rhodes, cuerdas, metales, 808, guitarra acústica, armonías vocales.
Define tempo y tonalidad si importan: 85 BPM, Re menor, Sol mayor.
Describe el ambiente y la energía: nostálgico, agresivo, soñador, luminoso, tenso.
En Pro, menciona la duración deseada dentro del prompt si la longitud es importante.
3. Usa letras personalizadas cuando las palabras importen
Si ya tienes clara la dirección de la letra, pégala con claridad y sepárala de las instrucciones de producción.
Usa etiquetas de sección como [Verse], [Chorus], [Bridge], [Intro] y [Outro].
Pon la dirección musical por encima de la letra para que el modelo vea tanto la intención como las palabras.
Si no quieres voces, no incluyas letras y especifica claramente que quieres solo instrumental.
4. Controla el timing y la estructura con marcas de tiempo
Cuando necesites un ritmo preciso, dile al modelo qué debe ocurrir en cada tramo temporal.
Ejemplo: [0:00 - 0:10] Intro, [0:10 - 0:30] Verse, [0:30 - 0:50] Chorus.
Las marcas de tiempo ayudan a controlar subidas de energía, entradas de instrumentos, entradas vocales y fade-outs.
Esto resulta especialmente útil para tráilers, música de escena y construcciones dirigidas.
5. Añade imágenes cuando lo visual deba influir en la canción
Google Lyria 3 admite generación musical multimodal. Puedes aportar hasta 10 imágenes y pedir que la música siga su ambiente, colores e historia.
Usa moodboards, concept art, bocetos de portada, fotogramas o visuales de producto.
Añade imágenes solo cuando la dirección visual realmente importe. Si no, mantén la petición más simple.
Las imágenes funcionan mejor cuando tu prompt también explica qué sensación musical deberían provocar.
6. Fuerza salida instrumental cuando la necesites
Para música de fondo, tráilers, juegos y beats, deja claro a Lyria que no quieres voces.
Usa una frase como: Instrumental only, no vocals.
Esto debe aparecer directamente en el prompt, no solo como una preferencia implícita.
Clip suele ser suficiente para probar ideas instrumentales antes de pasar a Pro.
7. Haz coincidir el idioma del prompt con el idioma del canto
Lyria adapta el estilo vocal y la pronunciación al idioma de tu prompt.
Si quieres letra en francés, escribe el prompt en francés.
Si quieres voces en inglés con etiquetas de sección o notas en japonés, indícalo de forma explícita.
El control de idioma funciona mejor cuando evitas mezclar demasiados idiomas en una sola petición.
8. Entiende correctamente la respuesta
El modelo devuelve varias partes. Algunas son texto y otras son datos de audio.
No asumas que la primera parte siempre es la letra o siempre es el audio.
Recorre todas las partes devueltas y distingue entre texto y audio embebido.
La salida de texto puede incluir letras, notas de estructura u otro material escrito junto al audio.