Google Lyria 3 の使い方Google Lyria 3 ベースプロンプト + 歌詞 + 画像

プロンプト、歌詞、タイミング、BPM、画像を正しく使う

このガイドは Google Lyria 3 の機能を、クリエイター向けの実用ワークフローに凝縮しています。Clip と Pro の使い分け、カスタム歌詞、タイムスタンプ構成、画像から音楽、インスト指定、言語コントロール、出力の読み取り、実践的なガードレールまでカバーします。

このページがある理由

ビルダーの中核は Google Lyria 3 ですが、ワークフローはプロダクト層で整えています。構造化したプロンプト、歌詞とタイミングのより明確な制御、より安定したデフォルト、非同期オーケストレーション、再利用できるトラック管理を提供します。

Lyria 3 Clip

lyria-3-clip-preview

おすすめ

素早いテスト、フック、ループ、プレビュー

長さ

常に 30 秒

出力

MP3

Lyria 3 Pro

lyria-3-pro-preview

おすすめ

バース、サビ、ブリッジを含むより完成度の高い楽曲

長さ

数分(プロンプトにより変動)

出力

モデル選択の音声 + テキスト

1. まずはモデルを正しく選ぶ

方向性を素早く探りたいなら Clip。方向性が固まっていて、より長く構成のある曲が欲しいなら Pro を使いましょう。

Clip は 30 秒固定なので、ジャンル、ムード、フックのテストに最適です。

Pro はバース、サビ、ブリッジ、長い感情の弧が必要なときに向いています。

強いワークフローは「まず Clip、次に Pro」です。

2. 音楽的に具体的なプロンプトを書く

Lyria は、曖昧な雰囲気よりも、具体的な音楽ブリーフを伝えた方が良い結果になりやすいです。

ジャンル、またはジャンルのブレンドを指定: lo-fi hip hop、cinematic orchestral、indie pop、jazz fusion。

楽器を指定: Rhodes、ストリングス、ブラス、808、アコースティックギター、ボーカルハーモニー。

必要ならテンポとキーも指定: 85 BPM、D minor、G major。

ムードとエネルギーを指定: ノスタルジック、アグレッシブ、ドリーミー、高揚感、緊張感。

Pro で長さが重要なら、目標尺もプロンプトに書きましょう。

3. 言葉が重要ならカスタム歌詞を使う

歌詞の方向性が決まっているなら、歌詞を明確に貼り付け、制作指示と分けて書きましょう。

[Verse]、[Chorus]、[Bridge]、[Intro]、[Outro] などのセクションタグを使いましょう。

音楽の方向性は歌詞の上に書くと、意図と言葉の両方が伝わりやすいです。

ボーカルなしが良い場合は歌詞を入れず、インストのみと明確に書きましょう。

4. タイムスタンプで展開と構成を制御する

テンポ感や展開を正確にしたいときは、各時間帯で何が起こるべきかを伝えましょう。

例: [0:00 - 0:10] Intro、[0:10 - 0:30] Verse、[0:30 - 0:50] Chorus。

タイムスタンプで、エネルギーの上げ方、楽器の入れ方、ボーカルのタイミング、フェードアウトなどを制御できます。

トレーラー、場面音楽、狙ったビルドアップに特に有効です。

5. ビジュアルが音楽に影響すべきなら画像を加える

Google Lyria 3 はマルチモーダル音楽生成に対応しています。最大 10 枚の画像を渡し、ムード、色、ストーリーに沿って作曲させることができます。

ムードボード、コンセプトアート、ジャケット案、シーンの静止画、プロダクトビジュアルなどを使えます。

ビジュアルの方向性が本当に重要なときだけ画像を追加し、それ以外はシンプルに保ちましょう。

プロンプトで「画像からどんな音楽感を出したいか」まで書くと、さらに効きやすいです。

6. 必要ならインスト出力を強制する

BGM、トレーラー、ゲーム、ビート用途では、ボーカル不要を明確に伝えましょう。

例: Instrumental only, no vocals.

この一文は好みとして暗黙にせず、プロンプト本文に入れてください。

インストの方向性テストなら、Pro に移る前に Clip で十分なことが多いです。

7. プロンプト言語を歌詞言語に合わせる

Lyria は、プロンプトの言語に合わせて歌唱スタイルや発音を調整します。

フランス語の歌詞が欲しいなら、フランス語でプロンプトを書きましょう。

英語歌唱に日本語のセクションタグや注釈を混ぜたい場合は、その意図を明示しましょう。

1つのリクエスト内で多言語を混ぜすぎない方が、言語コントロールは安定します。

8. 返り値の構造を正しく理解する

モデルは複数パートを返します。テキストのパートもあれば、音声バイトのパートもあります。

最初のパートが必ず歌詞、または必ず音声だと決めつけないでください。

返却された全パートを走査し、テキストとインライン音声データを判別してください。

テキスト出力には、歌詞だけでなく構成メモなどが音声と一緒に含まれることがあります。

ベストプラクティス

まず Clip で反復し、最も強いプロンプトを Pro に持ち込みましょう。
抽象的な形容詞だけでなく、具体的な音楽言語を使いましょう。
歌詞と制作メモを分けて書くと指示が明確になります。
雰囲気より構成が重要ならタイムスタンプを優先しましょう。
歌ってほしい言語でプロンプトを書きましょう。
著作権のある歌詞や特定アーティスト模倣の要求は避けましょう。

制限と安全上の注意

Clip は常に 30 秒です。
Pro は通常数分の出力になりますが、正確な長さは変動します。
結果は非決定的で、同じプロンプトでも異なる音楽になることがあります。
Lyria 3 は1回生成で、同一出力をその場で反復編集するタイプではありません。
生成音声にはプラットフォームのウォーターマークや安全制御が含まれる場合があります。
安全フィルターにより、著作権のある歌詞やアーティスト音声模倣の要求がブロックされることがあります。