Suno AI Music Generation: The Definitive Technical Reference
#
2026年3月4日更新
TL;DR: Sunoはテキストプロンプトからフル楽曲(ボーカル、楽器、アレンジ、ミックス)を生成します。V5は48kHzのブロードキャスト品質オーディオを1回の生成で最大4分まで出力できます。3つのシステム(プロンプトテキスト + メタタグ + Creative Sliders)をマスターすれば、Sunoは目新しいだけのツールではなく、本格的な制作ツールになります。Custom Modeで細かくコントロールし、メタタグで楽曲構成を指定し、Song Editorで反復的に仕上げていきましょう。Proティア(月額$10)でV5と商用利用権が有効になります。クレジットは翌月に繰り越されません。
Sunoの200万人の有料ユーザーは1日あたり700万曲を生成しており、Spotifyの全カタログ1億曲を2週間ごとに上回るペースです。18 V5は、以前のバージョンでは超えられなかった閾値を突破しました。リスナーがAI生成だと気づかずに楽しめるレベルの出力です。1 単なる好奇心の対象や仮の素材としてではなく、実際の制作現場で使われる本物の音楽としてです。
「面白いAI音楽」と「実際にリリースできる音楽」の差は、3つのコントロールシステムの理解にかかっています。
- プロンプトテキスト: ジャンル、ムード、楽器構成、ボーカルスタイルを自然言語で記述します
- メタタグ:
[Verse]、[Chorus]、[Bridge]などのアレンジを制御する構造指示タグです - Creative Sliders: Weirdness、Style Influence、Audio Influenceの3つのスライダーで、生成される楽曲の個性を調整します
デフォルトのワークフロー(一文を入力して生成ボタンを押すだけ)では当たり外れのある結果になります。Sunoは幅広い層に受ける出力に最適化されており、あなたが具体的に求めるものに最適化されているわけではないからです。使える出力とランダムな結果を分けるのは、精度です。
私はSunoが対応するあらゆるジャンルで数千曲を生成し、公式・非公式を問わずすべてのメタタグの組み合わせをテストし、各モデルバージョンが得意とする領域と苦手とする領域の境界をマッピングしてきました。本ガイドは、その経験を凝縮した決定版テクニカルリファレンスです。
重要ポイント
- 本格的な制作にはCustom Modeが必須です。 Simple Modeでは、Sunoをプロダクションツールとして活用するための操作が失われます。本ガイドのすべてのテクニックは、Style、Lyrics、Titleフィールドが分離されたCustom Modeの使用を前提としています。
- コントロールシステムは1つではなく3つあります。 プロンプトテキストは楽曲の音楽的特徴を定義します。メタタグ(Metatags)はアレンジと構成を制御します。Creative Slidersは生成の個性を形作ります。この3つすべてを使いこなすことが、実用的な出力とランダムな結果を分けるポイントです。
- メタタグは最もインパクトの大きいスキルです。
[Verse]/[Chorus]/[Bridge]構造にパラメータ付き修飾子([Verse: whispered vocals, acoustic guitar only])を組み合わせることで、テキストだけでDAWレベルのアレンジに迫るセクションごとの制御が可能になります。 - V5でプロダクション品質の閾値を超えました。 V4.5からV5への進化は、「興味深いAI音楽」と「リリースできる音楽」の違いです。48kHzオーディオ、自然なボーカル、本物の楽器分離を実現しています。V5へのアクセスにはProティア(月額$10)が必要です。
- 祈るのではなく、反復してください。 生成ループ(アイデア出し → 選択 → 改善 → 延長 → 編集 → エクスポート)では、1曲の完成に通常50〜100クレジットかかります。一発の完璧さではなく、反復のためにクレジットを確保してください。
- 月間クレジットは繰り越せませんが、追加購入クレジットは期限切れになりません。 月間クレジットは各請求サイクルでリセットされます。追加購入したクレジットはサブスクリプションが有効な限り保持されるため、集中的なセッションの前にストックしておくのに便利です。13
本ガイドの使い方
| あなたのレベル | ここから始めましょう | 次に探索しましょう |
|---|---|---|
| Sunoを初めて使う方 | はじめに、プロンプトアーキテクチャ | メタタグリファレンス、ジャンルとスタイルの記述子 |
| より良い結果を求めるカジュアルユーザー | プロンプトアーキテクチャ、Creative Sliders | 高度なメタタグパターン、トラブルシューティング |
| リリース向けに音楽を制作する方 | 生成ループ、Suno Studio DAW | DAW連携、商用ライセンス |
| Sunoと代替サービスを比較検討中の方 | Sunoとは?、競合と代替サービス | APIと連携状況、著作権と法的状況 |
目次
Part 1: 基礎
Part 2: プロンプトエンジニアリング
Part 3: 曲の構成
Part 4: クリエイティブコントロール
Part 5: プロダクションワークフロー
Part 6: 上級テクニック
Part 7: ビジネスと法律
Part 8: リファレンス
Sunoとは?
Sunoは、テキストの説明から完成された楽曲を生成するジェネレーティブAIプラットフォームです。DAW、サンプルライブラリ、ループベースのツールとは異なり、Sunoはトラックのすべての要素を同時に生成します:メロディ、ハーモニー、リズム、楽器編成、ボーカル(歌詞付き)、アレンジ、ミックスのすべてです。あなたが求めるものを記述すれば、Sunoが完成された楽曲を生成します。
Sunoと従来の音楽制作の比較
| 側面 | Suno | 従来の音楽制作 |
|---|---|---|
| 入力 | テキストプロンプト+任意の歌詞 | 音符、MIDI、オーディオ録音 |
| 出力 | ミックス済みの完成楽曲 | ミキシングが必要な個別トラック |
| 最初の出力までの時間 | 約30秒 | 数時間〜数日 |
| 必要な音楽知識 | 描写力のある語彙 | 楽器の演奏技術、音楽理論、ミキシング |
| 反復方法 | 再プロンプト、セクション編集、スライダー調整 | 再録音、再アレンジ、再ミックス |
| 最大長 | 1回の生成で4分(延長可能) | 無制限 |
制作できるもの:
- ボーカル付きフル楽曲:あらゆるジャンル、あらゆる言語、オリジナル歌詞またはAI生成歌詞
- インストゥルメンタル:BGM、スコア、アンビエントトラック
- ジャンル実験:複数の専門ミュージシャンが必要なクロスジャンルフュージョン
- バリエーション:同じコンセプトで多数のテイクを生成し、最良のものを選択
- プロダクション素材:従来のDAWワークフローで使用するためのstem
Sunoでないもの:
- DAWではありません:手動でのミックス、マスタリング、アレンジはできません(ただしStudioで一部対応)
- 決定論的ではありません:同じプロンプトでも毎回異なる結果が生成されます
- サンプルライブラリではありません:個々の音を正確に分離して再利用することはできません
- 無制限ではありません:生成にはクレジットが必要で、品質はテイクごとに異なります
はじめに
クイックスタート(5分)
-
アカウントを作成します。 suno.comにアクセスしてください。無料ティアでは1日50クレジット(約10回の生成)が付与されます。
-
まずSimple Modeを試してください。 「upbeat indie rock song about a road trip」のような短い説明を入力し、Createをクリックします。Sunoが歌詞、メロディ、アレンジ、ボーカルを自動的に生成します。
-
制御が必要ならCustom Modeに切り替えてください。 Custom Modeではプロンプトが個別のフィールドに分かれます:
- Style of Music:ジャンル、ムード、楽器編成の記述子
- Lyrics:構造用のメタタグ付き歌詞
-
Title:曲のタイトル
-
両方の出力を聴いてください。 Sunoは1回の生成で2つのバリエーションを作成します。意図に近い方を選び、そこから改善します。
-
Extendで最初の生成を超えて曲を延長するか、Song Editorで特定のセクションを置き換えます。
インターフェースの概要
Sunoのウェブインターフェースには2つの主要な制作モードがあります:
Simple Mode:テキストボックスが1つだけです。自然言語で楽曲を記述します。Sunoがジャンルを推定し、歌詞を書き、すべてを生成します。探索には適していますが、精密な制御には向いていません。
Custom Mode:3つの個別フィールド(Style、Lyrics、Title)とCreative Slidersを備えています。Custom Modeが本格的な制作の場です。Styleフィールドにはジャンルやプロダクション記述子を入力します。Lyricsフィールドにはメタタグ付きのテキストを入力します。スライダーで生成の個性を制御します。
Custom Modeから始めてください。 Simple Modeは手軽ですが、Sunoをプロダクションワークで活用するための制御手段が失われます。本ガイドのすべてのテクニックはCustom Modeを前提としています。
モデルとバージョン
Sunoはローンチ以来、急速にイテレーションを重ねてきました。各バージョンで音質が大きく向上していますが、利用できるモデルはサブスクリプションティアによって異なります。
バージョンの変遷
| バージョン | リリース時期 | 主な改善点 |
|---|---|---|
| V2 | 2023年秋 | 初の一般公開モデル。短いクリップ(約30秒)、限られたジャンル範囲、明らかなAIアーティファクト。 |
| V3 | 2024年3月 | 2分まで延長。ボーカルの明瞭度が向上。対応ジャンルが拡大。 |
| V3.5 | 2024年夏 | ミキシングの改善、アーティファクトの低減、ボーカルの自然さが向上。 |
| V4 | 2024年11月19日 | 大幅な品質向上。4分の生成、多言語ボーカル、Covers機能、2-stem分離。 |
| V4.5 | 2025年5月1日 | 1回の生成で最大8分(従来の4分から拡張)、Creative Sliders(Weirdness、Style Influence)、Prompt Enhancement Helper、ジャンル精度の向上、ボーカルの強化。19 |
| V4.5-All | 2025年後半 | 無料ティア向けモデル。V4.5の改善点をより幅広いユーザーに提供。 |
| V5 | 2025年9月 | 現行フラッグシップモデル。48kHzオーディオ20、放送品質の出力、Suno Studio DAW2、12-stem分離22、Persona Voices15。内部名称:chirp-crow。20 |
現在のモデルアクセス
| ティア | 利用可能なモデル | 品質に関する補足 |
|---|---|---|
| Free | V4.5-All | 良好な品質だが、ボーカルの自然さとミックスの明瞭度でV5に劣る |
| Pro($10/月) | V5 | 放送品質。ボーカルのリアリズム、楽器の分離、ダイナミックレンジが大幅に向上 |
| Premier($30/月) | V5 + Studio | 生成品質はProと同等、加えてSuno Studio DAWで生成後の編集が可能 |
V5はV4.5からの意味ある進化です。 違いが最も顕著なのは、ボーカルの自然さ(「AIシンガー」感の低減)、低域の明瞭度(ベースとキックの分離)、ステレオイメージングです。Sunoをプロダクション用途で検討している場合は、無料ティアではなくV5で評価してください。
V5で変わったこと
V5(内部名称「chirp-crow」20)は、Sunoの単一バージョンとしては最大の改善を実現しました:1
- 48kHzサンプルレート:V4.5の44.1kHzから向上。スタジオモニターや高品質ヘッドホンで高域のディテールが聴感上改善されています。1620
- ボーカルの自然さ:従来のバージョンで見られた「不気味の谷」的な質感が軽減されました。ビブラート、ブレス音、子音のアーティキュレーションがより説得力のあるものになっています。1
- 楽器の分離:ミックス内の各楽器がより明瞭に聴き取れます。以前の「音の壁」的なブレンドが改善されました。1
- ダイナミックレンジ:静かな部分から大きな部分への遷移の処理が向上。従来のバージョンではすべてが圧縮される傾向がありました。1
- ジャンル精度:ジャンルの慣習により忠実な出力。「jazz」プロンプトが「ジャズコードを使ったポップ」ではなく、本格的なジャズに聴こえるようになりました。19
- Suno Studio:生成後の編集が可能なブラウザ内DAW。ミックス調整、stem分離、アレンジの変更を再生成なしで行えます。2
料金とクレジット
2026年3月時点の情報です。 Sunoの料金は予告なく変更される場合があります。最新の料金はsuno.com/pricingでご確認ください。13
プラン比較
| 機能 | Free | Pro($10/月) | Premier($30/月) |
|---|---|---|---|
| 年額プラン | なし | $8/月($96/年) | $24/月($288/年) |
| クレジット | 50/日 | 2,500/月 | 10,000/月 |
| モデル | V4.5-All | V5 | V5 |
| 1日あたりの生成数 | 約10 | 約500 | 約2,000 |
| Song Editor | 制限あり | フル機能 | フル機能 |
| Covers/Remixes | なし | あり | あり |
| Persona Voices | なし | あり | あり |
| Suno Studio | なし | なし | あり |
| Stem Separation | 2-stem | 2-stem + 12-stem | 2-stem + 12-stem |
| 商用利用 | 不可 | 可 | 可 |
| 優先生成 | なし | あり | あり |
| クレジット繰り越し | なし | なし | なし |
| クレジット追加購入 | 不可 | 可 | 可 |
クレジットの経済性
各生成には約5クレジットが必要で、2つのバリエーションが生成されます。Proサブスクリプションの月間2,500クレジットで、約500回の生成(1,000曲のバリエーション)が可能です。
クレジットを効率的に使うコツ: - Custom Modeで具体的なプロンプトを指定し、無駄な生成を減らす - ゼロから再生成するのではなく、有望なトラックをExtendで延長する - 曲全体を再生成するのではなく、Song Editorでセクションを修正する - 生成前にStyleプロンプトを練り上げてクレジットを節約する
月間クレジットは繰り越しできません。 請求サイクル終了時の未使用クレジットは失効します。生成セッションを計画的に進めてください。
追加購入したクレジットには有効期限がありません。 購入した追加クレジットは、サブスクリプションが有効である限り無期限に保持されます。サブスクリプションを解約すると、再契約するまで追加クレジットは使用できなくなります。この永続性により、集中的なプロダクションセッション前のストックとして追加購入が有効です。13
プロンプトアーキテクチャ
SunoのCustom Modeでは、クリエイティブな入力を3つのフィールドに分けており、それぞれ異なる目的を持っています。何をどこに入力するか(そして何を入力しないか)を理解することが、当たり外れのある結果と安定した出力の違いを生みます。
Styleフィールド
Styleフィールドは、生成される楽曲の音楽的特徴を定義します。ジャンル、ムード、テンポ、楽器構成、ボーカルの質、プロダクションスタイルに関する自然言語の記述を受け付けます。
最適なフォーミュラ:
[Genre] [Subgenre], [Tempo/Energy], [Key instruments], [Vocal style], [Production quality], [Mood]
例:
Indie folk rock, mid-tempo, acoustic guitar and mandolin, warm female vocals, lo-fi production, nostalgic and wistful
記述子のスイートスポットは4〜7個です。 4個未満ではSunoに自由度を与えすぎます。7個を超えると記述子同士が競合し始め、どの特徴も明確に表現されない曖昧な結果になります。14
ビフォー&アフター:プロンプトの精度が重要
同じクリエイティブな意図でも、Styleフィールドの精度によって大きく異なる結果が生まれます。
曖昧なプロンプト(記述子2個):
rock, energetic
結果: 標準的なドラム、ディストーションギター、ラジオ向けのトーンにデフォルトした男性ボーカルの、ありきたりなポップロックになります。Sunoは指定されていないパラメータをすべて最も一般的なデフォルトで埋めます。10回生成しても、互いに関連性のあるものは1つもありません。
精密なプロンプト(記述子6個):
Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production
結果: 識別可能なローファイキャラクターを持つ、一貫したガレージロックが生成されます。ドラムはルームマイクで録ったような音、ベースが支配的、ボーカルは生々しいものになります。10回生成しても、すべてが認識可能なソニックアイデンティティを共有します。違いはメロディとアレンジにあり、根本的な音楽的特徴ではありません。
なぜ違いが出るのか: 各記述子は出力の1つの次元を制約します。「Rock」だけではテンポ、ボーカルスタイル、プロダクション品質、楽器バランス、ムードがすべてSuno任せになります。「garage」を追加するとサブジャンルの慣習が制約され、「lo-fi production」で音響テクスチャが制約され、「shouted male vocals」でボーカルの表現が制約されます。モデルがジェネリックな選択にデフォルトする余地が少なくなるのです。
過剰指定のプロンプト(記述子10個以上):
Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production, 145 BPM, minor key, reverb-heavy, vintage tube amp warmth, 1960s Detroit influence
結果: 曖昧な妥協の産物になります。Sunoはすべての制約を同時に満たすことができないため、各制約を部分的にしか満たしません。「1960s Detroit influence」は「145 BPM」と矛盾する可能性があり、「reverb-heavy」は「lo-fi production」と相反します。出力は具体的というより混乱したものになります。
Styleフィールドで効果的なもの
| 記述子の種類 | 例 | 効果 |
|---|---|---|
| ジャンル | rock, jazz, hip-hop, EDM, classical, country | 基本的な音楽フレームワーク |
| サブジャンル | shoegaze, bossa nova, trap, dubstep, baroque | ジャンルの慣習を絞り込む |
| テンポ | slow, mid-tempo, upbeat, fast, 120 BPM | 速度を制御(BPM値は正確ではなく近似値) |
| 楽器 | acoustic guitar, synth pad, brass section, strings | 楽器構成を示唆(保証はされない) |
| ボーカルの質 | raspy male vocals, ethereal female vocals, choir | ボーカルの特徴を形成 |
| プロダクション | lo-fi, polished, raw, overdriven, clean | 全体的な音響テクスチャ |
| ムード | melancholic, euphoric, aggressive, dreamy, dark | 感情的なトーン |
| 年代 | 80s, 90s grunge, 2000s pop, vintage, modern | 時代特有の慣習 |
Styleフィールドで効果がないもの
- 特定のアーティスト名:「Sounds like Adele」は不安定で、フィルタリングされる可能性があります。代わりに記述的な表現を使いましょう:「powerful female vocal, piano-driven pop ballad」
- テクニカルなミキシング用語:「Sidechain compression on the kick」は無視されます。Sunoはミキシングパラメータを解釈しません
- 正確なBPMコントロール:「127 BPM」はおおよそのガイダンスとして扱われ、正確なメトロノームロックではありません
- 否定的な指示:Styleフィールドでの「No drums」は信頼性が低いです。構造的な制御にはInstrumentalトグルやメタタグを使用してください
Lyricsフィールド
Lyricsフィールドは、構造制御のためのオプションのメタタグ付きで歌詞テキストを受け付けます。メタタグなしの場合、Sunoは改行やコンテンツのパターンから構造を推測します。
基本的な歌詞(メタタグなし):
Walking down the empty road
Headlights fading in the rain
Every mile feels like a year
But I keep driving through the pain
メタタグ付きの歌詞(推奨):
[Verse 1]
Walking down the empty road
Headlights fading in the rain
[Chorus]
Keep driving, keep driving
Through the storm and through the night
[Verse 2]
Every mile feels like a year
But the horizon's getting bright
[Chorus]
Keep driving, keep driving
Through the storm and through the night
[Outro]
And the sun comes up again
必ずメタタグを使用してください。 メタタグなしでは、Sunoがあなたの意図と合わない構造的な判断を行う可能性があります。
[Chorus]タグは繰り返しとメロディの強調を保証します。[Bridge]タグはハーモニーの転換を示します。これらの構造的な手がかりは、出力の一貫性を大幅に向上させます。
Titleフィールド
Titleフィールドは生成された楽曲に名前を付けます。音楽的な出力にはほとんど影響しませんが、メタデータやSunoのライブラリに表示されます。整理しやすいように分かりやすい名前を付けましょう。
Prompt Enhancement Helper
V4.5で導入されたPrompt Enhancement Helperは、生成前にStyleフィールドのプロンプトを書き換えるAIパワードの機能です。有効にすると、Sunoはあなたの記述子をより詳細なプロンプトに拡張し、モデルがより正確に解釈できるようにします。14
仕組み
- Styleプロンプトを入力します:
indie rock, energetic - Helperがそれを次のように拡張します:
Energetic indie rock, driving electric guitars, punchy drums, dynamic bass, bright and raw production, anthemic and youthful - Sunoはあなたの元のプロンプトではなく、拡張されたプロンプトから生成します
使用するタイミング
| シナリオ | Helperを使うか? | 理由 |
|---|---|---|
| 短く曖昧なプロンプト | はい | 提供していない具体性をHelperが追加してくれます |
| 新しいジャンルを探索するとき | はい | 知らなかった記述子を発見できます |
| 精密で詳細なプロンプト(記述子5個以上) | いいえ | Helperがあなたの意図を上書きしたり薄めたりする可能性があります |
| 実績のあるStyleプロンプトを繰り返すとき | いいえ | 再解釈ではなく一貫性が必要です |
重要な動作
- Helperは非決定的です:同じ入力でも毎回異なる書き換えを行います
- 生成後に拡張されたプロンプトを確認でき、Sunoがどの記述子を有用と判断したか学べます
- 拡張されたプロンプトは優れた学習ツールです:Helperを有効にして1回生成し、拡張内容を読んでから、それらの記述子をHelperなしで今後のプロンプトに直接使用しましょう
- 正確にSunoに何を送るかコントロールしたい本番作業では無効にしてください
Helperは学習のために使い、依存しないでください。 拡張から有用な記述子を抽出し、自分のボキャブラリーに追加して、自分で精密なプロンプトを書きましょう。最良の結果は、完全にあなたがコントロールするプロンプトから生まれます。
ジャンルとスタイルの記述子
Sunoは数百のジャンルおよびスタイル用語を認識します。研究によると、AI音楽モデルの学習データの約86%はグローバル・ノース(先進国圏)のジャンルから構成されており、ギター、ピアノ、ドラムなどの楽器が学習クリップの52〜67%を占める一方、地域固有の楽器は3%未満にとどまっています。21 その直接的な結果として、ジャンルの再現精度は具体性や文化的出自によって異なります。
高精度ジャンル(安定した結果が得られるもの)
これらのジャンルは学習データに十分含まれているため、安定して正確な出力が得られます:
| ジャンル | 効果的な記述子 | 備考 |
|---|---|---|
| Pop | pop, synth-pop, indie pop, dream pop, electropop | Sunoが最も得意とするジャンルです。未指定の場合、デフォルトでpop寄りになる傾向があります。 |
| Rock | rock, indie rock, alt-rock, classic rock, punk rock, post-punk | 楽器の分離が良好です。ギタートーンは説得力があります。 |
| Hip-Hop/Rap | hip-hop, trap, boom bap, lo-fi hip-hop, conscious rap | V5ではラップボーカルが良好に機能します。フローとデリバリーは歌詞のフォーマットで制御できます。 |
| Electronic/EDM | EDM, house, techno, trance, drum and bass, dubstep | ビルド→ドロップ構造が得意です。シンセテクスチャーも多彩です。 |
| R&B/Soul | R&B, neo-soul, contemporary R&B, motown | 滑らかなボーカル品質です。グルーブベースのアレンジが得意です。 |
| Country | country, country rock, outlaw country, bluegrass | アコースティック楽器の再現性が高いです。ペダルスティールやバンジョーも認識可能です。 |
| Folk | folk, indie folk, folk rock, Americana | アコースティック重視です。自然なボーカルスタイルが得られます。 |
| Jazz | jazz, smooth jazz, jazz fusion, bebop, swing | V5で大幅に改善されました。和声の複雑さはV4と比べて明らかに向上しています。 |
中精度ジャンル(ガイダンスがあれば使えるもの)
| ジャンル | 効果的な記述子 | 備考 |
|---|---|---|
| Metal | metal, heavy metal, death metal, black metal, metalcore | ディストーションギターのトーンは良好です。エクストリームボーカル(グロウル、スクリーム)は当たり外れがあります。 |
| Classical | classical, orchestral, chamber music, symphony | 基本的なオーケストラアレンジは得意です。複雑な対位法は苦手です。 |
| Latin | reggaeton, salsa, bossa nova, cumbia, bachata | リズムパターンは概ね正確です。楽器の具体性にはばらつきがあります。 |
| Afrobeats | afrobeats, afropop, highlife | 改善傾向にあります。リズムの正確性はV4よりもV5の方が優れています。 |
| K-Pop/J-Pop | K-pop, J-pop, city pop | プロダクションスタイルは認識可能です。歌詞で指定しない限り、ボーカルの言語は英語がデフォルトになる場合があります。 |
低精度ジャンル(反復的な試行が必要なもの)
| ジャンル | 効果的な記述子 | 備考 |
|---|---|---|
| Microtonal/Avant-garde | avant-garde, experimental, noise | 予測困難です。結果はクリエイティブですが、意図通りになることは稀です。 |
| Traditional/Folk(非西洋) | gamelan, raga, Tuvan throat singing | 学習データが限られています。結果は本物の再現というよりも近似にとどまります。 |
| Sound design/SFX | ambient drone, soundscape | Stable Audioの方が適しています。Sunoは楽曲構造に最適化されています。 |
ボーカルスタイリング
ボーカルの特性は、Sunoの出力の中で最も制御しやすい要素の一つです。V5ではボーカルの自然さと表現力が大幅に向上しました。
ボーカル記述子
| 記述子 | 効果 |
|---|---|
| 性別 | “male vocals”, “female vocals”, “androgynous vocals” |
| トーン | “warm”, “bright”, “dark”, “rich”, “thin”, “breathy” |
| テクニック | “raspy”, “smooth”, “vibrato”, “falsetto”, “belt”, “whisper” |
| スタイル | “soulful”, “punk”, “operatic”, “conversational”, “spoken word” |
| プロセッシング | “reverb-heavy”, “dry vocals”, “auto-tuned”, “distorted”, “lo-fi” |
| ハーモニー | “harmonized”, “choir”, “backing vocals”, “vocal layering” |
ボーカル記述子の組み合わせ
2〜3個のボーカル記述子を重ねることで、精密な制御が可能になります:
Raspy male vocals with subtle vibrato, lo-fi warmth
Ethereal female vocals, breathy and reverb-heavy, choir harmonies
Deep baritone, smooth jazz delivery, minimal processing
言語と多言語ボーカル
Suno V5は多言語でのボーカル生成に対応しています。モデルは歌詞から言語を推定します。英語以外の歌詞を使用する場合:
- Lyricsフィールドに対象言語で歌詞を記述します
- 必要に応じてStyleフィールドに言語を追加します:”Japanese city pop, female vocals”
- 最も良い結果が得られるのは英語、スペイン語、ポルトガル語、フランス語、日本語、韓国語、中国語(北京語)です
- 学習データが少ない言語では、訛りのある発音や不正確な発音になる場合があります
Instrumental Mode
Custom ModeでInstrumentalをオンに切り替えると、ボーカルなしのトラックが生成されます。Styleフィールドが唯一のクリエイティブ入力となります。
Instrumental Modeを使うべき場面
- BGM:ポッドキャストのイントロ、映像のスコア、作業用アンビエント音楽
- プロダクション素材:ビートベッド、コード進行、アトモスフェリックテクスチャー
- ジャンル探索:ボーカル品質を変数から除外して、ジャンル記述子をテストする
- DAW連携:ライブボーカル録音用のバッキングトラックを生成する
Instrumentalプロンプトのパターン
ボーカルがないため、Styleフィールドにはより詳細な記述が必要です:
Cinematic orchestral score, sweeping strings, French horns, timpani rolls, epic and triumphant, Hans Zimmer inspired
Lo-fi hip-hop beat, jazzy piano chords, vinyl crackle, mellow drums, study music
Ambient electronic, pad textures, slow evolving synths, ethereal and spacious, Brian Eno inspired
ヒント: Instrumental Modeでも、Lyricsフィールドに
[Instrumental]や[Instrumental Break]などのメタタグを追加することで、意図を強調しアレンジ構造を制御できます。
メタタグリファレンス
メタタグ(metatags)はSunoの構造制御言語です。Lyricsフィールドに角括弧で囲んで配置することで、アレンジ、楽器編成、ダイナミクス、ボーカルの振る舞いを指示します。メタタグを活用することで、Sunoは単なるプロンプト→楽曲生成ツールから、本格的な作曲ツールへと変わります。10
メタタグの仕組み
メタタグは歌詞としてではなく、アレンジの指示として処理されます。Sunoが[Chorus]を検出すると、以下の処理が行われます:
1. アレンジにおけるセクション変更のシグナルとなります
2. コーラスに典型的な特性(メロディの強調、より厚い楽器編成、高いエネルギー)が適用されます
3. 同じ[Chorus]テキストが再度出現した場合、メロディとアレンジの繰り返しが試みられます
メタタグは大文字小文字を区別しません:[VERSE]、[Verse]、[verse]はすべて同じ意味です。
メタタグがプロンプトテキストよりも重要な理由: メタタグがない場合、Sunoは改行や歌詞の内容から楽曲構造を推測します。モデルは学習パターンに基づいて、ヴァースの終わりとコーラスの始まりを推定します。メタタグはこの推測を排除します。Sunoにコーラスをコーラスとして認識してもらうことを期待する代わりに、[Chorus]はコーラスに適した音楽的振る舞い——メロディックなフック、より厚い楽器編成、高いエネルギー、以降の出現時の繰り返し——を明示的にトリガーします。この効果は楽曲全体で累積されます。メタタグなしの3分間のトラックでは、構造的な判断はSunoの推測による6〜8回程度です。メタタグありのトラックでは、その6〜8回の構造的判断はあなた自身が行うことになります。
構造タグ
これらのタグは楽曲のセクションを定義し、アレンジの流れを制御します。
主要な構造タグ
| タグ | 目的 | 音楽的効果 |
|---|---|---|
[Intro] |
オープニングセクション | 通常インストゥルメンタルまたはスパースで、曲の雰囲気を設定します |
[Verse] または [Verse 1] |
ヴァースセクション | 中程度のエネルギー、ナラティブ重視、変化のあるメロディ |
[Pre-Chorus] |
コーラスへの橋渡し | エネルギーが上昇し、和声が転調に向かいます |
[Chorus] |
フック/リフレイン | エネルギーのピーク、記憶に残るメロディ、フル楽器編成 |
[Post-Chorus] |
コーラスの後 | エネルギーを維持しつつ、徐々に下降していきます |
[Bridge] |
対比セクション | 異なるコード、異なるエネルギーで、楽曲に変化をもたらします |
[Breakdown] |
削ぎ落としセクション | 楽器編成を縮小し、空間を生み出します |
[Build] または [Build-Up] |
エネルギーの上昇 | 段階的にインテンシティが増加、EDMでよく使われます |
[Drop] |
高エネルギーの解放 | 楽器編成とエネルギーが最大に、ビルドの後に続きます |
[Hook] |
キャッチーなフレーズ | 短く記憶に残る音楽フレーズ |
[Interlude] |
インストゥルメンタルブレイク | セクション間をつなぎ、パレットクレンザーの役割を果たします |
[Outro] |
クロージングセクション | エネルギーを落とし、楽曲を締めくくります |
[End] |
ハードストップ | 楽曲の終了を示します(余分なオーディオの残存を防ぎます) |
ナンバリングされたセクション
繰り返されるセクションタイプを区別するために番号を使用します:
[Verse 1]
First verse lyrics here
[Chorus]
Chorus lyrics
[Verse 2]
Second verse with different lyrics
[Chorus]
Same chorus lyrics (encourages melodic repetition)
ヴァースに番号を付けることで、各ヴァースには異なるメロディを、コーラスにはメロディの繰り返しを適用すべきであることをSunoに理解させることができます。
インストゥルメンタルタグとボーカルタグ
これらのタグは、セクション内の楽器編成とボーカルの振る舞いを制御します。
インストゥルメンタルタグ
| タグ | 効果 |
|---|---|
[Instrumental] |
ボーカルなしのセクション |
[Instrumental Intro] |
インストゥルメンタルのオープニング |
[Instrumental Break] |
曲中のインストゥルメンタルセクション |
[Guitar Solo] |
ギターを中心としたインストゥルメンタルパッセージ |
[Piano Solo] |
ピアノを中心としたパッセージ |
[Drum Solo] |
パーカッションを中心としたパッセージ |
[Bass Solo] |
ベースを中心としたパッセージ |
[Saxophone Solo] |
サックスを中心としたパッセージ |
[Strings Rise] |
ストリングスセクションのスウェル |
[Percussion Break] |
リズムに焦点を当てたブレイクダウン |
[Synth Solo] |
シンセサイザーリードのパッセージ |
ボーカルタグ
| タグ | 効果 |
|---|---|
[Male Vocal] |
男性ボーカルに切り替え |
[Female Vocal] |
女性ボーカルに切り替え |
[Duet] |
2つのボーカルパート |
[Choir] |
合唱ボーカル |
[Harmony] |
ボーカルハーモニー |
[Rap] |
ラップデリバリー |
[Spoken Word] |
歌唱ではなくスポークンデリバリー |
[Whisper] |
ウィスパーデリバリー |
[Scream] |
スクリーム/シャウトデリバリー(メタル、パンク) |
[Ad-lib] |
即興的なボーカルフレーズ |
[Humming] |
ハミングによるメロディ |
[Backing Vocals] |
バックグラウンドボーカルパート |
高度なメタタグパターン
パラメータ付きメタタグ
メタタグはコロンの後に説明的な修飾子を受け付けます:
[Verse: whispered vocals, acoustic guitar only]
Walking through the morning mist
The world still sleeping, still
[Chorus: full band, powerful vocals]
But I'm awake, I'm alive
And every sound is a sign
コロン構文を使うことで、グローバルなStyleフィールドを変更せずに個別のセクションを修飾できます。パラメータ付きメタタグは最も強力なメタタグ機能であり、セクションごとのアレンジメントを細かく制御できます。
ダイナミクスとプロダクション用メタタグ
| タグ | 効果 |
|---|---|
[Fade In] |
音量の段階的な増加 |
[Fade Out] |
音量の段階的な減少 |
[Silence] |
オーディオの短い休止 |
[Crescendo] |
強度の高まり |
[Decrescendo] |
強度の減少 |
[Tempo: slow] |
セクション単位のテンポ変更 |
[Key Change] |
和声的な転調 |
構造タグと修飾タグの組み合わせ
[Intro: ambient pads, reversed guitar, ethereal]
[Verse 1: lo-fi drums, muted bass, whispered vocals]
Words that float on morning air
Disappearing into light
[Pre-Chorus: building energy, adding layers]
But something shifts beneath the surface
[Chorus: full production, soaring vocals, epic drums]
We break through the silence
Into the wide open sky
[Bridge: stripped down, piano only, vulnerable vocals]
And in the quiet after the storm
[Outro: fade out, ambient reprise]
これにより、テキストだけでDAWレベルのアレンジメント制御が可能になります。
Creative Sliders
Creative Slidersは、生成の個性を形作るV4.5以降のコントロールです。Custom Modeの歌詞フィールドの下に表示されます。11
テキストプロンプトと併用する理由: テキストプロンプトは何を生成するか(ジャンル、楽器、ムード)を定義します。スライダーはモデルがそのプロンプトをどのように解釈するかを制御します。「jazz」というプロンプトでもWeirdnessが低ければ従来型のジャズスタンダードが生成されます。同じプロンプトでWeirdnessを高くすると、ジャズの慣習を自ら打ち破るようなジャズが生成されます。プロンプトが語彙を定義し、スライダーが文法を定義するのです。
Weirdness
範囲: Safe ← → Chaos(スライダー、数値は非公開)
| 位置 | 効果 |
|---|---|
| Safe(左端) | 従来型の構成、予測可能なジャンル準拠、安定したメロディ選択 |
| 中央(デフォルト、約50%) | バランス型。ジャンルの慣習内で適度な創造的サプライズ |
| Chaos(右端) | 型破りな構成、予想外のハーモニー選択、ジャンルの融合。一貫性を欠くリスクが高まる |
Weirdnessの仕組み: このスライダーは生成時のモデルのサンプリング温度を調整します。低い値ではSunoが各ステップで最も確率の高い次の音楽イベントを選択するため、従来型の結果になります。高い値では低確率のイベントがより頻繁に選ばれるため、意外な組み合わせが生まれます。トレードオフは一貫性です:高確率=予測可能だが洗練されている、低確率=創造的だが一貫性を欠く可能性があります。
Weirdnessを上げるべき場合: - 実験的またはアヴァンギャルドなジャンル - 従来型の結果が平凡に感じられる場合 - ジャンル融合の実験
Weirdnessを下げるべき場合: - 「普通」に聞こえる必要があるコマーシャル音楽 - 厳密なジャンルの慣習に従う場合 - 注意を引くべきでないBGM/アンビエント音楽
Style Influence
範囲: Loose ← → Strong(スライダー)
| 位置 | 効果 |
|---|---|
| Loose(左端) | スタイルの記述は指示ではなく提案として扱われる。Sunoがより自由に創作する |
| 中央(デフォルト) | スタイル記述へのバランスの取れた準拠 |
| Strong(右端) | スタイル記述への厳密な準拠。創造的な逸脱が少なくなる |
StrongはStyleフィールドが精密で、記述通りの結果を求める場合に使用します。LooseはSunoにプロンプトをより自由に解釈させ、意外な結果を期待する場合に使用します。
Audio Influence
範囲: アップロードされたオーディオリファレンスが生成にどの程度影響するかを制御します。
Audio Upload(Covers、Remixes、またはAdd Vocals/Instrumentals)使用時に利用可能です。値が高いほど、出力がリファレンスオーディオの特性により忠実になります。
Song Editor
Song Editorは、楽曲全体を再生成することなく、生成後の編集を可能にします。「90%完璧だが1つのセクションだけ問題がある」という課題を解決するツールです。12
利用可能な操作
| 操作 | 機能 | 使用場面 |
|---|---|---|
| Inpainting | 特定の時間範囲を新しいコンテンツに置き換える | ヴァースが弱いがコーラスは完璧な場合 |
| Extend | 現在のエンドポイントを超えて楽曲を延長する | 楽曲が短すぎる、または追加セクションが必要な場合 |
| Crop | 楽曲を短くトリミングする | 末尾の無音や不要なセクションを除去する場合 |
| Fade In/Out | 開始/終了時に音量のグラデーション変化を適用する | プロフェッショナルなイントロ/アウトロの仕上げ |
| Replace Section | 新しい指示でセクションを再生成する | ブリッジの調性が合わない場合 |
Inpaintingのワークフロー
- 置き換える時間範囲を選択(波形上でドラッグ)
- 必要に応じて、置き換えセクション用の新しい歌詞/メタタグを入力
- 生成:Sunoが周囲のオーディオに合った新しいコンテンツを作成
- 聴き比べて、承認または再生成
Inpaintingは反復的なプロセスです。 最初の置き換えで周囲のコンテキストに完璧にマッチすることは稀です。シームレスな結果を得るには2〜5回の試行を見込んでください。
Extendのワークフロー
- 既存の生成でExtendをクリック
- 必要に応じて続きの歌詞/メタタグを入力
- Sunoがエンドポイントから約30〜60秒の新しいオーディオを生成
- 各延長は別個の生成としてカウント(クレジットを消費)
ベストプラクティス: 延長プロンプトの先頭に構造メタタグ(例:[Chorus]や[Outro])を含めることで、延長部分の内容をガイドできます。
Covers and Remixes
ProおよびPremierティアでは、既存のSunoトラックのカバーとリミックスを作成できます。
Covers
既存のSunoトラックをリファレンスとしてアップロードまたは選択し、新しいスタイルを適用します:
Style: Acoustic folk cover, fingerpicked guitar, soft female vocals, intimate production
カバーはメロディと歌詞を維持しつつ、アレンジメントとプロダクションを再構成します。
Remixes
リミックスは既存のトラックをカバーよりも大幅に変容させます:
Style: EDM remix, heavy bass, 128 BPM, drop-focused, festival energy
Add Vocals / Add Instrumentals
既存のオーディオに重ねる2つの特化モード:
- Add Vocals:インストゥルメンタルトラックをアップロードし、Sunoがその上にボーカルを生成
- Add Instrumentals:ボーカルトラックをアップロードし、Sunoがバックの伴奏を生成
両モードともSunoを従来のプロダクションワークフローに統合できます:実際のボーカルを録音してSunoにバッキングトラックを生成させる、またはその逆の使い方が可能です。
Persona Voices
Persona Voices(Pro/Premier)は、生成間で一貫したボーカルキャラクターを作成・再利用する機能です。毎回の生成で似た声が割り当てられることを期待するのではなく、ペルソナを定義して参照できます。15
Persona Voiceの作成
- 気に入ったボーカルの楽曲を生成
- その生成の3点メニューをクリックし、「Create Persona」を選択
- ペルソナにわかりやすい名前を付ける(例:「Warm Alto Folk」「Raspy Baritone Rock」「Ethereal Soprano」)
- ペルソナがアカウントライブラリに保存される
効果的なペルソナを作成するためのヒント: - 他の楽曲の副産物としてではなく、ペルソナ作成を目的として生成してください。ボーカルが際立つ、明確でジャンルに適したStyleプロンプトを使用します。 - 強いボーカルエフェクト(オートチューン、ディストーション)がかかった楽曲からペルソナを作成するのは避けてください。ペルソナは元の声ではなく、加工された音を記録します。 - 「万能」な声を1つ作るのではなく、ジャンル別のペルソナを作成してください。インディーフォークのトラックで作成したペルソナをトラップビートに適用すると、予測困難な結果になります。
Persona Voicesの使用
Custom Modeで、生成前にPersonaドロップダウンから保存済みペルソナを選択します。ペルソナは変更するまでそのセッションのすべての生成に適用されます。
ペルソナの動作: - ペルソナは音色(ボーカルトーン、共鳴)と基本的な歌唱スタイル(ブレス感、ハスキーさ、スムーズさ)を保持します - 正確なメロディパターン、フレージング、リズムの歌い回しは保持しません。これらはStyleプロンプトとメタタグによって決まります - 異なるテンポやキーへのペルソナの適用は良好に機能します。大きく異なるジャンル間での適用(例:ジャズのペルソナをデスメタルに適用)は、一貫性のない結果になります。
ペルソナの管理
- 保存上限:Sunoは複数のペルソナの保存を許可しています(正確な上限は公式に文書化されていませんが、ユーザーからは20以上でも問題ないとの報告があります)
- 命名規則:ボーカルの質とジャンルのコンテキストを含むわかりやすい名前を使用してください。「Voice 3」がどれだったか忘れてしまいます
- 削除:ペルソナはライブラリから削除できます。削除は元に戻せません。
- アカウント固有:ペルソナはアカウント間で共有したりエクスポートしたりすることはできません
制限事項
- Persona Voicesは音色と基本的な歌唱スタイルを記録しますが、正確なボーカルテクニックは記録しません
- ペルソナを元のジャンルから大きく離れたジャンルに適用すると、結果にばらつきが出ます
- Persona Voicesはアカウント固有であり、共有はできません
- 2025年12月のアップデートで生成間のペルソナの一貫性が改善されましたが、完全な再現はまだ保証されていません15
生成ループ
Sunoを効果的に使うには、一度のプロンプトで完成させるのではなく、反復的なワークフローが重要です。
プロダクションサイクル
1. IDEATION
↓ Generate 5-10 variations with different Style descriptors
↓ (Cost: ~25-50 credits)
2. SELECTION
↓ Pick the 1-2 best results
↓ Identify what works and what doesn't
3. REFINEMENT
↓ Adjust Style descriptors based on what you heard
↓ Refine lyrics and metatags
↓ Regenerate with tighter prompts
↓ (Cost: ~15-30 credits per round)
4. EXTENSION
↓ Extend the best track to full length
↓ Add missing sections (bridge, outro)
↓ (Cost: ~5-15 credits)
5. EDITING
↓ Use Song Editor to fix weak sections
↓ Inpaint, crop, fade as needed
↓ (Cost: ~5-20 credits)
6. EXPORT
↓ Download final audio (MP3/WAV)
↓ Optionally export stems for DAW work
仕上がったトラック1曲あたりの典型的なコスト: 50〜100クレジット(全ステージ合わせて10〜20回の生成)。
ウォークスルー:コンセプトからエクスポートまでの1曲
実際のプロンプトと各ステージでの判断を示す、1曲の完全なプロダクションサイクルです。
1. コンセプト:「不眠をテーマにしたムーディーなインディーフォークソング」
2. 最初の生成(10クレジット、2バリエーション):
Style: Indie folk, slow tempo, acoustic guitar fingerpicking, soft female vocals, intimate lo-fi recording, melancholic
Lyrics:
[Verse 1]
The ceiling holds no answers
Just shadows and the clock
Every hour stretches longer
When the world has gone to dark
[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound
[Verse 2]
The neighbors' lights went out at ten
The street grew still by twelve
Now it's somewhere past forever
And I'm talking to myself
[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound
[Outro: fade out, humming]
3. 選定: バリエーションBはボーカルのトーンが良いものの、コーラスのメロディーが曲の雰囲気に対して明るすぎます。バリエーションAはコーラスが優れていますが、ギターの音が薄いです。
4. リファインメント(10クレジット): Styleを調整して再生成。「lo-fi recording」を「warm analog recording」に変更し、「sparse arrangement」を追加しました。歌詞はそのまま維持。新しいバリエーションAには最初のラウンドの温かみと控えめなコーラスが備わっています。
5. エクステンション(5クレジット): 曲が2:30で終わっていたため、[Bridge: piano only, vulnerable vocals] + 新しい歌詞 + [Chorus] + [Outro: fade out, ambient reprise] で延長しました。ブリッジでピアノが自然に導入されています。
6. 編集(10クレジット): Verse 2からコーラスへの移行が唐突でした。Song Editorを使用してその接続部分の4秒間をInpaintingしました。2回目のInpaintingでスムーズにつながりました。
7. エクスポート: Logic Proでマスタリングするためにwavをダウンロード。合計コスト:35クレジット、7回の生成。
重要なポイント: クレジットの大半は最初の2ラウンド(適切なサウンドの発見)に費やされ、残りの3ラウンド(良いテイクの仕上げ)ではありません。プロンプトの精度を最初に高めることで、曖昧なプロンプトで試行錯誤するアプローチと比べて少なくとも30クレジットを節約できました。
クレジット効率の良いワークフローのコツ
- 生成回数ではなくプロンプトに時間をかけましょう。 作り込まれたStyle + Lyricsプロンプトは、曖昧なプロンプトで繰り返し生成するよりも良い初回結果を生み出します。
- バッチで生成しましょう。 コンセプトを探る段階では、一度に4〜6個のバリエーションを生成し、リファインメントに進む前に最適な方向性を選びましょう。
- 再生成よりもSong Editorを活用しましょう。 トラックの80%が良ければ、曲全体を再生成するのではなく、残りの20%を編集しましょう。
- 成功したStyleプロンプトを保存しましょう。 特定のディスクリプターの組み合わせがうまくいった場合は、再利用のために保存しておきましょう。
Suno Studio DAW
Suno Studio(Premierティア、V5と同時にリリース)は、生成後の編集のためのブラウザ内デジタルオーディオワークステーションです。Sunoの生成エンジンと従来の音楽制作の橋渡しをします。2
Studioの機能
| 機能 | 説明 |
|---|---|
| マルチトラックビュー | 個別のstemトラックを含むビジュアルタイムライン |
| ミックスコントロール | stemごとのボリューム、パン、ミュート、ソロ |
| Warp Markers | ピッチに影響を与えずに特定のセクションをタイムストレッチ |
| Remove FX | stemからリバーブ、ディレイ、その他のエフェクトを除去 |
| Alt Takes | 特定のセクションの代替バージョンを生成 |
| 拍子記号 | 拍子記号の解釈を調整・修正 |
| Stem分離 | 最大12個の個別stemにアクセスして詳細なミキシングが可能 |
Studio 1.2(2026年2月)
最新のStudioアップデートで以下が追加されました:4
- Warp Markers:個々の音符やフレーズのタイミングを微調整
- Remove FX:AIが適用したリバーブとディレイを除去してドライなstemを取得
- Alt Takes:代替セクションをインラインで生成・試聴
- 拍子記号サポートの拡張:3/4、6/8、変拍子のより良いハンドリング
Studioを使うべきか、DAWにエクスポートすべきか?
| シナリオ | Studioを使用 | DAWにエクスポート |
|---|---|---|
| クイックフィックス(音量バランス、stemのミュート) | はい | いいえ |
| 本格的なプロフェッショナルミキシングとマスタリング | いいえ | はい |
| アレンジのバリエーションを試す | はい | いいえ |
| 外部オーディオの追加(生演奏、ボーカル) | いいえ | はい |
| カジュアルな視聴と共有 | はい | いいえ |
| 商用リリースの準備 | 場合による | はい |
Stem分離とエクスポート
Sunoは2段階のstem分離を提供しています。
2-stem分離(全ティア)
オーディオを以下に分離します: - Vocals:すべてのボーカルコンテンツ - Instrumental:それ以外のすべて
用途:カラオケバージョン、ボーカルサンプリング、基本的なリミックス。
12-stem分離(Pro/Premier)
オーディオを最大12個の個別stemに分離します:22 - Vocals、drums、bass、guitar、keys/piano、synths、strings、brass、woodwinds、percussion、effects、other
重要な違い: Sunoの「stem分離」は、iZotope RXやDemucsのようなツールとは根本的に異なります。それらのツールはミックス済みのオーディオファイルを分析し、事後的にソースの分離を試みます。Sunoはすべてのオーディオを自ら生成しているため、個別の生成レイヤーを直接エクスポートしている可能性が高いです。その結果は、事後的なソース分離というよりも、DAWからサブミックスをエクスポートすることに近いものです。23 実際、Sunoのstemは同じミックスファイルに対してサードパーティの分離ツールが生成するものよりもクリーンですが、オリジナルミックスに対して完全にヌルテストが通るとは限りません。
品質に関する注意点: stem間にはある程度のブリード(音漏れ)が予想されます。特に周波数帯域が近い楽器間で顕著です。分離品質はV5で大幅に向上しました。任意のオーディオファイル(Sunoで生成されたものではないファイル)のプロフェッショナルな作業には、DemucsやiZotope RXなどの専用ツールが引き続き標準です。23
エクスポート形式
- MP3:標準的な圧縮オーディオ。共有、ストリーミング、ドラフトに最適です。
- WAV:非圧縮オーディオ。プロフェッショナルなDAW作業とマスタリングに必須です。
DAWとの統合
Sunoの出力は、stemエクスポートを通じて従来の制作ワークフローに統合できます。
推奨ワークフロー
- Sunoで生成 — アレンジと雰囲気が決まるまで
- 12 stemをエクスポート(Pro/Premier)— WAVファイルとして
- DAWにインポート(Logic Pro、Ableton、Pro Tools、FL Studio、Reaper)
- プロフェッショナルなツールとプロセッシングでミックス&マスタリング
- 必要に応じて個別のstemを生演奏に差し替えまたは補強
DAWミキシングで得られるもの
- EQとコンプレッション:SunoのAIミキシングでは提供されない、stemごとの音色調整
- 空間処理:精密なステレオ配置、リバーブセンド、ディレイスロー
- オートメーション:時間経過に伴うダイナミックな変化(フェードビルド、フィルタースウィープ)
- 外部楽器:AI生成stemに生演奏をレイヤリング
- マスタリングチェーン:ラウドネスノーマライゼーション、リミッティング、リリース前の最終仕上げ
- オートメーションスクリプト:Claude Codeを使用してプロンプトテンプレートの構築、Styleフィールドのバリエーションのバッチ処理、生成-選定-リファインメントループのスクリプト化が可能
ジャンルブレンディング
Sunoのユニークな強みの一つは、従来の制作では複数の専門ミュージシャンが必要となるジャンルの交差点で音楽を生成できることです。
効果的なブレンディングパターン
2ジャンルフュージョン(最も安定):
Jazz-funk fusion, slap bass, Rhodes piano, syncopated drums, groovy and sophisticated
ジャンル + 年代のマッシュアップ:
80s synthwave meets modern trap, analog synths, 808 bass, retro-futuristic
ジャンル + 意外な楽器:
Death metal with jazz saxophone solos, blast beats, dissonant chords
ブレンディングのルール
- 主要ジャンルを先頭に置きましょう。「Jazz with electronic elements」と「Electronic with jazz elements」では異なる結果が生まれます。
- 2〜3ジャンルに絞りましょう。 それ以上になると、Sunoの出力は焦点の定まらない妥協的なものになります。
- 年代マーカーでスタイルを固定しましょう。「90s」や「2020s」と指定することで、Sunoが適切なプロダクション手法を選択しやすくなります。
- 珍しいフュージョンにはWeirdnessを上げましょう。 デフォルトのWeirdness設定はすべてを標準化しようとするため、ジャンルブレンディングの目的に反してしまいます。
マルチセクション構成
4分を超える楽曲の場合、複数回の生成で作曲し、それらを結合する必要があります。
戦略1:Extend
最初のセクションを生成し、Extendを使って後続のセクションを追加します。各エクステンションは前のセクションの末尾をコンテキストとして使用します。
メリット: 音楽的な連続性が保たれます。各エクステンションが自然に前のセクションに続きます。 デメリット: 後半のセクションに対するコントロールが低下します。複数回のエクステンションで音楽的なドリフトが発生する可能性があります。
戦略2:セクションごとの個別生成
各セクションを特定のメタタグ + Styleの組み合わせで独立して生成し、DAWで結合します。
メリット: 各セクションのキャラクターを最大限にコントロールできます。 デメリット: 独立して生成されたセクション間のトランジションが不自然に聞こえる場合があります。結合にはDAWスキルが必要です。
戦略3:ハイブリッドアプローチ(推奨)
- 曲のコア部分(verse-chorus-verse-chorus)を1回の生成で作成
- ブリッジと最終コーラスはExtendで追加
- Song Editorを使って弱いトランジションをInpainting
- stemをエクスポートしてDAWで仕上げ
プロンプトチェイニング
関連する一連の生成を通じて、複雑な楽曲を構築できます。
チェインパターン
Generation 1: "Atmospheric intro, ambient pads, slow build"
→ Extend with: "[Build-Up] [Drop: full energy, heavy drums]"
→ Extend with: "[Verse 1: vocals enter, riding the beat]"
→ Extend with: "[Chorus: anthemic, crowd-singing energy]"
→ Extend with: "[Outro: fade out, return to ambient pads]"
各エクステンションは前の生成の音楽的DNAを引き継ぐため、毎回ゼロから始めることなく、一貫性のあるマルチセクション構成を作成できます。
トラブルシューティング
Sunoの楽曲がおかしく聞こえる場合
| 問題 | 考えられる原因 | 解決策 |
|---|---|---|
| Styleプロンプトと全く異なる楽曲になる | 記述子が競合している、またはWeirdnessが高すぎる | コアとなる記述子を4〜5個に絞り、Weirdnessを下げてください。 |
| ボーカルがロボット的に聞こえる | 無料プランでのV4.5-Allモデル | Proにアップグレードして、V5のボーカル品質を利用してください。 |
| 楽曲が突然終わる | [Outro]タグがない |
歌詞に[Outro]または[End]を追加してください。 |
| 自然な終わりの後も楽曲が続く | Sunoが最大長まで埋めようとしている | 最後のセクションの後に[End]タグを追加してください。 |
| 意図しないジャンルが支配的になる | 2番目に記載されたジャンルが優先度を下げられている | Styleフィールドでメインのジャンルを最初に記載してください。 |
| メタタグが歌詞として表示される | タグの構文エラー | タイプミスを確認してください。タグは角括弧を使い[Tag]の形式にする必要があります。 |
| セクション間でボーカルが一貫しない | Persona Voiceが設定されていない | 生成間の一貫性を保つためにPersona Voicesを使用してください。 |
| エクステンションがオリジナルと合わない | オリジナルとエクステンション間の生成回数が多すぎる | オリジナルからではなく、最新バージョンからExtendしてください。 |
| インストゥルメンタルトラックにボーカルのアーティファクトがある | Style記述子がボーカルを示唆している | Instrumentalモードを明示的にオンにし、[Instrumental]タグを追加してください。 |
生成品質チェックリスト
クレジットをリファインメントに使う前に、プロンプトが以下をカバーしているか確認してください:
- [ ] ジャンルが具体的(単なる「rock」ではなく「indie rock」や「post-punk」など)
- [ ] ボーカルスタイルが記述されている(またはInstrumentalがオンになっている)
- [ ] メタタグで構造が定義されている(最低限:Verse、Chorus、Outro)
- [ ] Styleフィールドに4〜7個の記述子がある(少なすぎず、多すぎず)
- [ ] ムードが明示されている(指定しないとSunoはアップビート/ポジティブをデフォルトにします)
商用ライセンス
2026年3月時点で確認済み。 ライセンス条件は変更される可能性があります。拘束力のある条件についてはSunoの最新の利用規約を確認してください。5
各プランで許可される使用範囲
| 用途 | Free | Pro | Premier |
|---|---|---|---|
| 個人的な視聴 | はい | はい | はい |
| SNS投稿 | はい | はい | はい |
| 収益化されたYouTube/TikTok | いいえ | はい | はい |
| ストリーミングプラットフォーム(Spotify、Apple Music) | いいえ | はい | はい |
| 商用製品(広告、ゲーム、映画) | いいえ | はい | はい |
| Sunoへのロイヤリティ義務 | N/A | なし(100%あなたのもの) | なし(100%あなたのもの) |
重要な注意事項
100% AI生成コンテンツの著作権保護は法的に未確定です。 2026年現在、完全にAIで生成された音楽は米国での著作権登録の対象にならない可能性があります。その影響は以下の通りです: - 商用利用権はあります(Sunoがライセンスを付与します) - ただし、他者が同一または類似の出力を使用することを防止できない可能性があります - 人間のクリエイティブ要素(オリジナルの歌詞、生楽器の録音、DAWでのアレンジ選択)を加えることで、著作権の主張が強化されます
収益はすべてあなたのものです。 ProおよびPremierユーザーは、Suno生成音楽からの収益を100%保持できます。Sunoはロイヤリティや収益分配を請求しません。5
著作権と法的状況
AI音楽生成は進化し続ける法的環境の中に存在します。
主な法的動向
- Warner Music和解(2025年11月):WarnerはSunoに対する訴訟で和解しました。条件は非公開ですが、Sunoは運営を継続しています。6
- UMGおよびSonyの訴訟:大手レーベルによるSunoへの訴訟は2026年初頭時点で係争中です。訴えの中心は、トレーニングデータに著作権のある録音が使用されたとする主張です。6
- Udio/UMG和解(2025年):競合のUdioがUMGと和解し、業界にある程度の先例を確立しました。7
- 米国著作権局:純粋にAIで生成された作品は著作権の対象にならないと表明していますが、十分な人間の著作性を含むAI要素を持つ作品は対象となる可能性があるとしています。8
実用的なガイダンス
- 特定の著作権のある楽曲を再現するためにSunoを使用しないでください。 Covers機能は、商用録音ではなく、Suno生成トラックをカバーするために設計されています。
- 著作権の主張を強化するために人間のクリエイティブ要素を追加してください: オリジナルの歌詞を書く、Sunoのstemに生楽器を重ねる、DAWでアレンジの意思決定を行うなど。
- クリエイティブプロセスを記録してください。 あなたの作品が異議を申し立てられた場合、人間によるクリエイティブな選択の証拠がポジションを強化します。Obsidianなどのツールは、この目的でタイムスタンプ付きのクリエイティブジャーナルとして活用できます。
- 法的動向を常に把握してください。 この分野は急速に変化しています。
競合サービスと代替手段
| プラットフォーム | 強み | 弱み | 最適な用途 |
|---|---|---|---|
| Suno | 総合的な楽曲品質が最高、豊富な編集ツール、Studio DAW | 公式APIなし、非決定的、クレジットは繰り越し不可 | 完全な楽曲制作 |
| Udio | stem品質が最高(ネイティブ48kHz)、ジャンル精度が高い | ユーザーベースが小さい、編集ツールが少ない | stemベースの制作 |
| Stable Audio | 公式API、SFX/サウンドデザイン機能、オープンウェイト | ボーカル品質が弱い、出力が短い | API統合、サウンドエフェクト |
| Google MusicFX | 無料、アクセスしやすい | コントロールが限定的、出力が短い、商用利用不可 | カジュアルな実験 |
| AIVA | クラシック/映画音楽に特化、MIDIエクスポート | ジャンル範囲が狭い | 映画・ゲームのスコアリング |
どのAI音楽ジェネレーターを使うべきか?
- ボーカル付きの完全な楽曲:Suno(V5)
- DAW制作用のstem:Udio(最高のstem品質)
- API駆動の生成:Stable Audio(公開APIを持つ唯一のプラットフォーム)
- サウンドデザインとSFX:Stable Audio
- 映画音楽:AIVA(オーケストラ編集用のMIDIエクスポート)
- アルバムアート用のAI画像生成:音楽制作ワークフローと相性の良いプロンプトエンジニアリング技法についてはMidjourneyガイドを参照してください
APIと統合ステータス
2026年3月時点で確認済み。
Sunoは公開APIを提供していません。 個人ユーザーや開発者向けの公式REST API、SDK、またはプログラマティックアクセスは存在しません。17
現在の状況
| アクセスタイプ | ステータス | 詳細 |
|---|---|---|
| 公式公開API | 利用不可 | 発表されたタイムラインなし |
| エンタープライズ/パートナーAPI | プライベートベータ | 招待制のみ。Sunoの営業チームにお問い合わせください。 |
| コミュニティラッパー | 非公式 | gcui-art/suno-api:リバースエンジニアリングされたラッパーです。Sunoの公認ではありません。予告なく動作しなくなる可能性があります。9 |
| Chirp API | 過去のもの | 初期のAPIアクセスプログラム。新規ユーザーの受付は終了しています。 |
開発者向け
プログラマティックな音楽生成が必要な場合: - Stable Audio:ドキュメント化されたエンドポイントを持つ公式APIがあります - Replicate:APIアクセス付きのオープンソース音楽生成モデルをホストしています - カスタムデプロイ:MusicGen(Meta)などのオープンソースモデルをセルフホスト可能です
クイックリファレンスカード
Custom Modeテンプレート
STYLE FIELD:
[Genre] [Subgenre], [Tempo], [Key instruments], [Vocal style], [Production], [Mood]
LYRICS FIELD:
[Intro: descriptors]
[Verse 1]
Your lyrics here
[Pre-Chorus]
Building lyrics
[Chorus]
Hook lyrics
[Verse 2]
More lyrics
[Chorus]
Same hook (for melodic repetition)
[Bridge: contrasting descriptors]
Different energy lyrics
[Chorus]
Final hook
[Outro: fade out]
必須メタタグ
| タグ | 用途 |
|---|---|
[Verse] |
ナラティブセクション |
[Chorus] |
フック/リフレイン |
[Bridge] |
コントラストセクション |
[Intro] |
オープニング |
[Outro] |
クロージング |
[End] |
ハードストップ |
[Instrumental] |
ボーカルなし |
[Guitar Solo] |
楽器フィーチャー |
[Fade Out] |
徐々にフェードアウト |
[Tag: descriptors] |
セクションごとのコントロール |
Creative Slidersチートシート
| スライダー | 左 | 中央 | 右 |
|---|---|---|---|
| Weirdness | 従来型 | バランス | 実験的 |
| Style Influence | ゆるい解釈 | デフォルト | 厳密な準拠 |
| Audio Influence | 最小限の参照 | バランス | 強い参照 |
料金クイックリファレンス
| Free | Pro($10/月) | Premier($30/月) | |
|---|---|---|---|
| クレジット | 50/日 | 2,500/月 | 10,000/月 |
| V5 | いいえ | はい | はい |
| 商用利用 | いいえ | はい | はい |
| Studio | いいえ | いいえ | はい |
変更履歴
| 日付 | 変更内容 | ソース |
|---|---|---|
| 2026-03-04 | 公開レビュー:引用の帰属を修正(1を検証済みソースに分割)、V4.5の8分生成、ビフォー/アフタープロンプト例、完全な楽曲ウォークスルー、メタタグとCreative Slidersの「理由」説明、西洋音楽トレーニングバイアスの引用、stem分離の技術的区別、新規リファレンス6件18-23、内部クロスリンク、統計オープニングを追加 | 品質レビュー |
| 2026-03-04 | 品質レビュー:Key Takeaways、このガイドの使い方、Prompt Enhancement Helperセクション、Persona Voicesの拡充を追加、全引用を接続、Udio/UMGの引用を修正、年間プランとトップアップクレジットの詳細を追加 | 品質レビュー |
| 2026-03-03 | V5、料金、メタタグ、Studio、制作ワークフロー、ライセンス、完全なプロンプトエンジニアリングリファレンスを網羅するガイドを作成 | 複数 |
| 2026-02-01 | Suno Studio 1.2:Warp Markers、Remove FX、Alt Takes、拍子記号 | 4 |
| 2025-09-25 | V5(chirp-crow)リリース:48kHz、Studio DAW、12-stem分離、Persona Voices | 1 |
| 2025-11-01 | Warner Music和解 | 6 |
| 2025-05-01 | V4.5リリース:8分生成、Creative Sliders、Prompt Enhancement Helper | 19 |
| 2024-11-19 | V4リリース:4分生成、Covers、2-stem分離 | 3 |
参考文献
-
Suno V5 Release and Review。V5(chirp-crow)は2025年9月23〜25日にリリースされました。48kHzオーディオ、放送品質の出力、Suno Studio DAW、12stem分離、Persona Voices。 ↩↩↩↩↩↩↩
-
Introducing Suno Studio。生成後の編集に対応したブラウザベースDAW。マルチトラックビュー、ミックスコントロール、stem分離機能。 ↩↩↩
-
Suno Model Timeline。V2からV5までの公式モデルバージョン履歴。 ↩
-
Suno Studio 1.2 Master Guide。2026年2月アップデート:Warp Markers、Remove FX、Alt Takes、拍子記号サポートの拡張。 ↩↩
-
Suno Rights & Ownership。商用ライセンス:ProおよびPremierユーザーは収益の100%を保持します。無料プランは非商用利用のみです。 ↩↩
-
WMG and Suno Partnership。Warner Music は2025年11月に和解しました。SunoはSongkickを買収し、WMGライセンスモデルを開発予定です。アーティストは名前、肖像、声の使用に対する管理権を保持します。 ↩↩↩
-
UMG Settles Udio Lawsuit, Announces Partnership。UMGとUdioは2025年10月29日に和解しました。2026年に新しいライセンス付きAI音楽制作プラットフォームが計画されています。録音音楽および出版ライセンスが含まれます。 ↩
-
US Copyright Office on AI-Generated Works。純粋にAIが生成した作品は著作権を取得できません。十分な人間の創作性がある作品は対象となる可能性があります。 ↩
-
gcui-art/suno-api。コミュニティ制作の非公式Sunoラッパーです。Sunoの公認ではありません。予告なく動作しなくなる可能性があります。 ↩
-
Suno Metatags Complete Guide。構造、ボーカル、楽器、プロダクション向けの500以上のメタタグをまとめたコミュニティ編集リスト。 ↩
-
Suno Creative Sliders Guide。Weirdness、Style Influence、Audio Influenceコントロールの公式ドキュメント。 ↩
-
Suno Song Editor。Replace Section、Extend、Crop、Fade操作の公式ドキュメント。 ↩
-
Suno Pricing Plans。現在のプラン比較:Free、Pro($10/月)、Premier($30/月)。 ↩↩↩
-
Suno Prompt Engineering Best Practices。効果的なプロンプト構造とディスクリプターの使い方に関するコミュニティガイド。 ↩↩
-
Suno AI Personas。Personaの作成、使用方法、および制限事項。 ↩↩↩
-
Suno V5 Audio Specifications。各プラン間のオーディオ品質比較:サンプルレート、ビット深度、エクスポート形式。 ↩
-
The Suno API Reality。公式および非公式APIの現状分析と法的リスク。 ↩
-
Suno Hits 2M Paid Subscribers and $300M ARR。TechCrunch、2026年2月。1日あたり700万トラックが生成され、Spotifyの1億曲カタログを2週間ごとに上回るペースです。 ↩↩
-
Introducing V4.5。Suno公式発表。8分間の単一生成、Creative Sliders、プロンプト改善ヘルパー、ジャンル精度の向上、ボーカルの強化。 ↩↩↩
-
Suno V5 (chirp-crow) Specifications。V5の内部モデル名はchirp-crow。48kHzサンプルレート、320kbps、Personaサポート、stemエクスポート。 ↩↩↩↩
-
Missing Melodies: AI Music Generation and Its Omission of the Global South。AI音楽のトレーニングデータの86%がグローバルノースのジャンルに由来します。ギター、ピアノ、ドラムがトレーニングクリップの52〜67%を占め、地域固有の楽器は3%未満です。 ↩
-
Suno Stem Extraction。2stem(Vocals+Instrumental)および12トラックstem抽出の公式ドキュメント。 ↩↩
-
Suno Separation Quality vs SpectraLayers。Sunoのstemエクスポートが事後的なソース分離ではなく、個々のレイヤーを再生成している可能性についての議論。 ↩↩↩