正确使用提示词、歌词、时间结构、BPM 和图片
这份指南把 Google Lyria 3 的官方能力整理成更适合创作者的工作流,涵盖 Clip 与 Pro、自定义歌词、时间结构、图片转音乐、纯伴奏提示词、语言控制、输出解析与实用边界。
为什么需要这页
构建器底层是 Google Lyria 3,但整个工作流由我们的 agent 层塑造:更结构化的提示方式、更清晰的歌词与时间控制、更强的默认生成设置、异步编排,以及可复用的曲库管理。它并不是对单一 API 调用的薄封装。
Lyria 3 Clip
lyria-3-clip-preview
适合
快速测试、hook、loop、预览
时长
固定 30 秒
输出
MP3
Lyria 3 Pro
lyria-3-pro-preview
适合
更完整的歌曲,包括主歌、副歌和桥段
时长
通常为几分钟,具体受提示词引导
输出
可选 MP3 或 WAV
1. 先选对模型
如果你想快速探索方向,先用 Clip。如果你已经明确方向,需要更长、更有结构的作品,就用 Pro。
Clip 固定为 30 秒,适合快速测试流派、情绪和 hook。
Pro 更适合需要主歌、副歌、桥段和更长情绪弧线的歌曲。
一个有效流程通常是先 Clip,再 Pro。
2. 写出更具体的音乐提示词
Lyria 在你描述具体音乐需求时,效果通常会比泛泛的氛围描述更好。
说明流派或流派混合:lo-fi hip hop、cinematic orchestral、indie pop、jazz fusion。
写出乐器:Rhodes、电弦乐、铜管、808、原声吉他、人声和声。
必要时写上速度和调式:85 BPM、D minor、G major。
描述情绪和能量:怀旧、激烈、梦幻、振奋、紧张。
如果用 Pro,且时长重要,也可以在提示词中说明目标长度。
3. 当歌词重要时,使用自定义歌词
如果你已经有明确的歌词方向,请清晰粘贴歌词,并与制作指令区分开。
使用 [Verse]、[Chorus]、[Bridge]、[Intro]、[Outro] 等段落标签。
把音乐方向放在歌词之前,让模型同时理解意图与文字。
如果你不想要演唱,就不要提供歌词,并明确写上仅伴奏。
4. 用时间结构控制节奏与编排
当你需要精确节奏推进时,告诉模型每个时间段应该发生什么。
例如:[0:00 - 0:10] Intro,[0:10 - 0:30] Verse,[0:30 - 0:50] Chorus。
使用时间戳控制能量提升、乐器进入、人声时机以及淡出。
这对预告片、场景音乐和更具导演感的构建尤其有用。
5. 当视觉应该影响歌曲时加入图片
Google Lyria 3 支持多模态音乐生成。你最多可以提供 10 张图片,让音乐跟随它们的情绪、色彩和故事。
可以使用 moodboard、概念图、封面草图、场景静帧或产品视觉图。
只有当视觉方向真的重要时再上传图片,否则保持请求更简单。
如果提示词也能解释这些视觉应该产生怎样的音乐感觉,图片效果会更好。
6. 在需要时强制输出纯伴奏
如果你在做背景音乐、预告片、游戏或 beat,请明确告诉 Lyria 你不要人声。
可以写:Instrumental only, no vocals。
这句话应该直接写进提示词里,而不是只作为隐含偏好。
在切到 Pro 之前,Clip 通常已经足够做纯伴奏概念测试。
7. 让提示词语言和歌词语言一致
Lyria 会根据你的提示词语言调整演唱风格和发音。
如果你想要法语歌词,就用法语写提示词。
如果你想要英文演唱但带日文段落标签或说明,也请明确写出。
当你避免在一次请求里混用太多语言时,语言控制通常更稳定。
8. 正确理解模型返回结果
模型返回的是多个部分。有些部分是文本,有些部分是音频字节。
不要默认第一部分一定是歌词,或者一定是音频。
请遍历所有返回部分,并识别文本与内联音频数据。
文本输出可能同时包含歌词、结构说明或其他书面材料。
最佳实践
限制与安全说明
合规与反侵权说明
这个工具基于 Google Lyria 3 构建,并遵循当前主流创意 AI 产品同类的安全护栏。避免请求受版权保护的歌词、模仿艺人姓名风格,或克隆可识别表演者。请专注于原创简报:流派、编曲、配器、情绪、语言、歌词与结构。