如何使用 Google Lyria 3基于 Google Lyria 344.1kHz 高保真立体声音频

正确使用提示词、歌词、时间结构、BPM 和图片

这份指南把 Google Lyria 3 的官方能力整理成更适合创作者的工作流,涵盖 Clip 与 Pro、自定义歌词、时间结构、图片转音乐、纯伴奏提示词、语言控制、输出解析与实用边界。

为什么需要这页

构建器底层是 Google Lyria 3,但整个工作流由我们的 agent 层塑造:更结构化的提示方式、更清晰的歌词与时间控制、更强的默认生成设置、异步编排,以及可复用的曲库管理。它并不是对单一 API 调用的薄封装。

Lyria 3 Clip

lyria-3-clip-preview

适合

快速测试、hook、loop、预览

时长

固定 30 秒

输出

MP3

Lyria 3 Pro

lyria-3-pro-preview

适合

更完整的歌曲,包括主歌、副歌和桥段

时长

通常为几分钟,具体受提示词引导

输出

可选 MP3 或 WAV

1. 先选对模型

如果你想快速探索方向,先用 Clip。如果你已经明确方向,需要更长、更有结构的作品,就用 Pro。

Clip 固定为 30 秒,适合快速测试流派、情绪和 hook。

Pro 更适合需要主歌、副歌、桥段和更长情绪弧线的歌曲。

一个有效流程通常是先 Clip,再 Pro。

2. 写出更具体的音乐提示词

Lyria 在你描述具体音乐需求时,效果通常会比泛泛的氛围描述更好。

说明流派或流派混合:lo-fi hip hop、cinematic orchestral、indie pop、jazz fusion。

写出乐器:Rhodes、电弦乐、铜管、808、原声吉他、人声和声。

必要时写上速度和调式:85 BPM、D minor、G major。

描述情绪和能量:怀旧、激烈、梦幻、振奋、紧张。

如果用 Pro,且时长重要,也可以在提示词中说明目标长度。

3. 当歌词重要时,使用自定义歌词

如果你已经有明确的歌词方向,请清晰粘贴歌词,并与制作指令区分开。

使用 [Verse]、[Chorus]、[Bridge]、[Intro]、[Outro] 等段落标签。

把音乐方向放在歌词之前,让模型同时理解意图与文字。

如果你不想要演唱,就不要提供歌词,并明确写上仅伴奏。

4. 用时间结构控制节奏与编排

当你需要精确节奏推进时,告诉模型每个时间段应该发生什么。

例如:[0:00 - 0:10] Intro,[0:10 - 0:30] Verse,[0:30 - 0:50] Chorus。

使用时间戳控制能量提升、乐器进入、人声时机以及淡出。

这对预告片、场景音乐和更具导演感的构建尤其有用。

5. 当视觉应该影响歌曲时加入图片

Google Lyria 3 支持多模态音乐生成。你最多可以提供 10 张图片,让音乐跟随它们的情绪、色彩和故事。

可以使用 moodboard、概念图、封面草图、场景静帧或产品视觉图。

只有当视觉方向真的重要时再上传图片,否则保持请求更简单。

如果提示词也能解释这些视觉应该产生怎样的音乐感觉,图片效果会更好。

6. 在需要时强制输出纯伴奏

如果你在做背景音乐、预告片、游戏或 beat,请明确告诉 Lyria 你不要人声。

可以写:Instrumental only, no vocals。

这句话应该直接写进提示词里,而不是只作为隐含偏好。

在切到 Pro 之前,Clip 通常已经足够做纯伴奏概念测试。

7. 让提示词语言和歌词语言一致

Lyria 会根据你的提示词语言调整演唱风格和发音。

如果你想要法语歌词,就用法语写提示词。

如果你想要英文演唱但带日文段落标签或说明,也请明确写出。

当你避免在一次请求里混用太多语言时,语言控制通常更稳定。

8. 正确理解模型返回结果

模型返回的是多个部分。有些部分是文本,有些部分是音频字节。

不要默认第一部分一定是歌词,或者一定是音频。

请遍历所有返回部分,并识别文本与内联音频数据。

文本输出可能同时包含歌词、结构说明或其他书面材料。

最佳实践

先用 Clip 迭代,再把最强的提示词送到 Pro。
尽量使用具体音乐语言,而不是只给泛泛形容词。
把歌词内容和制作说明分开,能让引导更干净。
当结构比氛围更重要时,优先使用时间戳。
提示词尽量使用你希望被演唱出来的语言。
避免在提示词里请求版权内容或模仿特定艺人风格。

限制与安全说明

Clip 始终返回 30 秒。
Pro 通常会生成几分钟,具体长度会随提示词变化。
结果具有非确定性,因此相同提示词可能生成不同音乐。
Lyria 3 生成是单轮输出,不是原位迭代编辑。
Google 表示生成音频包含 SynthID 水印。
安全过滤可能拦截受版权保护的歌词或艺人声音模仿请求。

合规与反侵权说明

这个工具基于 Google Lyria 3 构建,并遵循当前主流创意 AI 产品同类的安全护栏。避免请求受版权保护的歌词、模仿艺人姓名风格,或克隆可识别表演者。请专注于原创简报:流派、编曲、配器、情绪、语言、歌词与结构。