suno:~/music$ cat suno.md

Suno AI 音樂生成:權威技術參考指南

# Suno AI 音樂生成:權威技術參考指南

words: 2970 read_time: 36m updated: 2026-04-18 19:21
$ less suno.md

2026年4月1日更新

重點摘要: Suno 能從文字提示生成完整歌曲(人聲、樂器、編曲與混音)。V5.5 以 48kHz 產出廣播級音質,單次生成最長可達 4 分鐘,並新增 Voice Cloning、Custom Models 與 My Taste 自適應偏好功能。掌握三大系統(提示文字 + metatags + Creative Sliders),Suno 便從新奇玩具蛻變為正式的製作工具。善用 Custom Mode 精準控制、metatags 規劃歌曲結構、Song Editor 進行迭代修飾。Pro 方案(每月 $10)可使用 V5.5 並享有商業授權,點數不累計至下月。

Suno 擁有 200 萬付費訂閱用戶,每天產出 700 萬首曲目,每兩週的產量便超越 Spotify 一億首歌曲的完整曲庫。18 V5 跨越了早期版本無法企及的門檻:聽眾在不知情的狀況下,依然願意主動聆聽這些作品。1 這不再是獵奇或過渡性質的產物,而是真正應用於製作場景中的音樂。

「有趣的 AI 音樂」與「我真正願意發行的音樂」之間的差距,關鍵在於是否理解三套控制系統:

  1. 提示文字:以自然語言描述曲風、氛圍、配器與人聲風格
  2. Metatags:如 [Verse][Chorus][Bridge] 等結構指令,用以控制編曲走向
  3. Creative Sliders:Weirdness、Style Influence 與 Audio Influence,決定生成作品的個性與走向

預設工作流程(輸入一句話、點擊生成)產出的結果好壞參半,原因在於 Suno 預設針對大眾口味最佳化,而非針對您的特定需求。精準操控,才是區分堪用成果與隨機結果的關鍵。

我已跨越 Suno 支援的所有曲風,生成數千首曲目,測試過每一種已記載與未記載的 metatag 組合,並完整摸索出各模型版本的能力邊界與弱點所在。本指南將這些經驗濃縮為一份權威技術參考手冊。


重點摘要

  • 正式創作必須使用 Custom Mode。 Simple Mode 會移除讓 Suno 成為製作工具的關鍵控制項。本指南所有技巧皆以 Custom Mode 為前提,分別使用 Style、Lyrics 和 Title 欄位。
  • 三套控制系統,缺一不可。 提示文字定義音樂特質,Metatags 控制編排與結構,Creative Sliders 塑造生成的個性。三者兼備,才能將堪用的產出與隨機結果拉開差距。
  • Metatags 是影響最大的技巧。[Verse]/[Chorus]/[Bridge] 建立結構,搭配參數化修飾([Verse: whispered vocals, acoustic guitar only]),即可透過純文字達到近似 DAW 等級的逐段編排控制。
  • V5.5 是目前的旗艦版本。 在 V5 的製作級基礎上(48kHz 音訊、自然人聲、真實樂器分離),V5.5 新增 Voice Cloning、依個人風格訓練的 Custom Models,以及 My Taste 自適應偏好功能。使用 V5.5 及 Voice Cloning/Custom Models 需訂閱 Pro 方案(每月 $10)。
  • 反覆迭代,而非碰運氣。 生成流程(構思 → 篩選 → 精修 → 延伸 → 編輯 → 匯出)每首完成品通常耗費 50–100 點額度。請為迭代預留空間,別指望一次到位。
  • 月額度不累計,但加購額度不過期。 每月額度於帳單週期重置,而額外購買的加購額度在訂閱有效期間持續保留,適合在密集創作前囤積使用。13

如何使用本指南

您的身分 從這裡開始 接著探索
Suno 新手 入門指南提示詞架構 Metatags 參考曲風與風格描述詞
想提升成果的一般使用者 提示詞架構Creative Sliders 進階 Metatag 模式疑難排解
為發行製作音樂 生成流程Suno Studio DAW DAW 整合商業授權
評估 Suno 與替代方案 什麼是 Suno?競品與替代方案 API 與整合現況著作權與法律環境

目錄

第一部分:基礎篇

  1. 什麼是 Suno?
  2. 入門指南
  3. 模型與版本
  4. 方案與額度

第二部分:Prompt Engineering

  1. 提示詞架構
  2. 提示詞增強輔助工具
  3. 曲風與風格描述詞
  4. 人聲風格
  5. 純樂器模式

第三部分:歌曲結構

  1. Metatags 參考
  2. 結構標籤
  3. 樂器與人聲標籤
  4. 進階 Metatag 模式

第四部分:創作控制

  1. Creative Sliders
  2. Song Editor
  3. Covers 與 Remixes
  4. 人聲
  5. My Taste(V5.5)

第五部分:製作工作流程

  1. 生成流程
  2. Suno Studio DAW
  3. Stem 分離與匯出
  4. DAW 整合

第六部分:進階技巧

  1. 曲風融合
  2. 多段落作曲
  3. 提示詞串接
  4. 疑難排解

第七部分:商業與法律

  1. 商業授權
  2. 著作權與法律環境
  3. 競品與替代方案

第八部分:參考資料

  1. API 與整合現況
  2. 快速參考卡
  3. 更新日誌
  4. 參考文獻

什麼是 Suno?

Suno 是一個生成式 AI 平台,能從文字描述創作完整歌曲。不同於 DAW、取樣音色庫或迴圈拼貼工具,Suno 會同時生成一首曲目的所有元素:旋律、和聲、節奏、配器、人聲(含歌詞)、編排與混音。您只需描述想要的效果,Suno 便產出一首完成品。

Suno 與傳統音樂製作有何不同?

面向 Suno 傳統製作
輸入 文字提示詞 + 選填歌詞 音符、MIDI、錄音素材
輸出 完整混音歌曲 需要後續混音的個別音軌
首次產出時間 約 30 秒 數小時至數天
所需音樂知識 描述性詞彙 樂器演奏、樂理、混音技術
迭代方式 重新提示、編輯段落、調整滑桿 重新錄製、重新編排、重新混音
最大長度 每次生成 4 分鐘(可延伸) 無限制

您可以創作:

  • 含人聲的完整歌曲:任何曲風、任何語言,可用原創歌詞或 AI 生成
  • 純樂器作品:背景音樂、配樂、氛圍音樂
  • 曲風實驗:跨曲風融合——傳統製作需要多位專業樂手才能實現
  • 多版本變化:針對同一概念生成數十個版本,從中挑選最佳
  • 製作素材:匯出 stem 用於傳統 DAW 工作流程

Suno 不是:

  • 不是 DAW:無法手動混音、母帶處理或編排(但 Studio 提供部分功能)
  • 不具確定性:相同提示詞每次產生不同結果
  • 不是取樣音色庫:無法精確擷取並重複使用個別音色
  • 不是無限的:生成需消耗額度,品質因次而異

入門指南

快速上手(5 分鐘)

  1. 建立帳號:前往 suno.com 註冊。免費方案每日提供 50 點額度(約可生成 10 次)。

  2. 先試試 Simple Mode。 輸入簡短描述,例如「upbeat indie rock song about a road trip」,然後點擊 Create。Suno 會自動生成歌詞、旋律、編排和人聲。

  3. 切換至 Custom Mode 以獲得完整控制。Custom Mode 將提示詞拆分為獨立欄位:

  4. Style of Music:曲風、氛圍、配器描述詞
  5. Lyrics:搭配 Metatags 標記結構的歌詞
  6. Title:歌曲標題

  7. 試聽兩個版本。 Suno 每次生成兩個變化版本。選擇較接近您意圖的版本,再加以精修。

  8. 使用 Extend 將歌曲延伸至初次生成之後的段落,或使用 Song Editor 替換特定片段。

介面概覽

Suno 的網頁介面提供兩種主要創作模式:

Simple Mode:單一文字輸入框。以自然語言描述歌曲,Suno 會推斷曲風、撰寫歌詞並生成所有內容。適合探索,但精準度不足。

Custom Mode:三個獨立欄位(Style、Lyrics、Title)加上 Creative Sliders。正式創作在此進行。Style 欄位接受曲風與製作描述詞,Lyrics 欄位接受含 Metatags 的文字,滑桿則控制生成的個性。

請直接從 Custom Mode 開始。 Simple Mode 雖然方便,卻移除了讓 Suno 真正發揮製作實力的控制項。本指南所有技巧皆以 Custom Mode 為前提。


模型與版本

Suno 自推出以來迭代速度極快。每個版本都帶來顯著的品質提升,但不同訂閱方案可使用的模型有所不同。

版本時間線

版本 發布時間 主要改進
V2 2023年秋季 首個公開模型。短片段(約30秒),曲風範圍有限,AI痕跡明顯。
V3 2024年3月 延長至2分鐘。人聲清晰度提升,曲風涵蓋範圍擴大。
V3.5 2024年夏季 混音品質更佳,瑕疵減少,人聲更自然。
V4 2024年11月19日 品質大幅躍進。可生成4分鐘作品,支援多語言人聲、Covers 功能、2軌 stem 分離。
V4.5 2025年5月1日 單次可生成8分鐘(原為4分鐘)、Creative Sliders(Weirdness、Style Influence)、Prompt Enhancement Helper、曲風精準度提升、人聲品質強化。19
V4.5-All 2025年底 免費方案模型。結合 V4.5 的改進,開放給更廣泛的使用者。
V5 2025年9月 48kHz 音訊20、廣播級輸出品質、Suno Studio DAW2、12軌 stem 分離22、Persona Voices15。內部代號:chirp-crow。20
V5.5 2026年3月26日 當前旗艦版本。Voice Cloning 需通過驗證(Pro/Premier)、Custom Models(Pro/Premier 訂閱者最多可建立3個)、My Taste 自適應偏好系統(所有使用者皆可使用)。30

目前模型使用權限

方案 可用模型 品質說明
免費 V4.5-All 品質不錯,但在人聲自然度與混音清晰度上明顯不及 V5.5。無法使用 Voice Cloning 或 Custom Models。可使用 My Taste。
Pro($10/月) V5.5 廣播級品質。可使用 Voice Cloning、最多3個 Custom Models、My Taste。
Premier($30/月) V5.5 + Studio 生成品質與 Pro 相同,另附 Suno Studio DAW。可使用 Voice Cloning、最多3個 Custom Models、My Taste。

V5 相較 V4.5 有顯著提升。 差異在人聲自然度(減少「AI歌手」感)、低頻清晰度(貝斯與大鼓的分離度)以及立體聲音場上最為明顯。若您正在評估 Suno 是否適合正式製作,請以 V5 為基準,而非免費方案的版本。

V5 的變革

V5(內部代號「chirp-crow」20)是 Suno 歷來單一版本中最大幅度的升級:1

  • 48kHz 取樣率:從 V4.5 的 44.1kHz 提升。在監聽喇叭和高品質耳機上,高頻細節的改善清晰可聞。1620
  • 人聲自然度:大幅降低過去版本中的「恐怖谷」感。顫音、呼吸聲和子音咬字都更加逼真。1
  • 樂器分離度:混音中各樂器更加清晰分明,減少了「音牆」般的糊成一片。1
  • 動態範圍:從弱到強的過渡處理更佳。過去版本傾向將所有音量壓縮在一起。1
  • 曲風精準度:更忠實地呈現各曲風特徵。「jazz」提示詞聽起來更像道地的爵士樂,而非「帶爵士和弦的流行樂」。19
  • Suno Studio:瀏覽器內建 DAW,用於生成後的編輯。可調整混音、分離 stem、修改編曲,無需重新生成。2

V5.5 的變革

V5.5(2026年3月26日)在 V5 的音訊品質基礎上,大幅提升了提示詞精準度30,並新增三項個人化功能:30

  • Voice Cloning:可複製您自己的聲音用於生成。需通過驗證程序以確認聲音所有權。僅限 Pro/Premier。在「Create」選單中,Voices 按鈕已取代原本的 Personas 按鈕——不過 Style Personas 仍可在 Voices 選單中存取。31
  • Custom Models:根據您音樂庫中的歌曲,訓練最多3個個人化 V5.5 版本。每個模型至少需上傳6首歌曲,且訓練素材風格一致時效果最佳(例如全部為管弦樂或全部為 future bass——混雜不同曲風會使學習結果失焦)。31 每個 Custom Model 都會繼承您的風格偏好,降低為獲得一致成果所需的提示詞精確度。
  • My Taste:所有使用者皆可使用的自適應偏好系統。透過分析您的生成紀錄、按讚和互動行為,引導未來的生成結果趨向您偏好的風格、製作美學和人聲特質。Style 輸入欄旁的魔法棒圖示即為觸發點——點擊後 Suno 會根據您的品味檔案生成專屬的 style 文字。31 不會覆蓋明確的提示詞或滑桿設定。

定價與點數

資訊截至2026年3月驗證有效。 Suno 定價可能隨時調整,請至 suno.com/pricing 查閱最新費率。13

方案比較

功能 免費 Pro($10/月) Premier($30/月)
年繳方案 $8/月($96/年) $24/月($288/年)
點數 每日50點 每月2,500點 每月10,000點
模型 V4.5-All V5.5 V5.5
每日可生成次數 約10次 約500次 約2,000次
Song Editor 受限 完整功能 完整功能
Covers/Remixes
Persona Voices
Voice Cloning
Custom Models 最多3個 最多3個
My Taste
Suno Studio
Stem 分離 2軌 2軌 + 12軌 2軌 + 12軌
商業使用
優先生成
點數累計
加購點數

點數經濟學

每次生成約消耗 5點,產出 2首歌曲變體。Pro 方案每月2,500點大約可進行 500次生成(1,000首歌曲變體)。

節省點數的實用做法: - 使用 Custom Mode 搭配具體的提示詞,減少無用的生成 - 延伸有潛力的曲目,而非從頭重新生成 - 利用 Song Editor 修正特定段落,避免重新生成整首歌 - 先打磨好 Style 提示詞再開始生成,可有效節省點數

每月點數不會累計。 帳單週期結束時未使用的點數將會歸零,請妥善規劃您的生成排程。

月配額用盡後每日可獲得額外點數。 當月點數用完後,付費訂閱者每天可獲得50點額外點數,直到下一個帳單週期開始——與免費方案的每日配額相同。雖然這能避免月底完全無法生成,但相較月配額的速率(Pro 約83點/天、Premier 約333點/天)仍是大幅縮減。24

加購點數不會過期。 額外購買的加購點數在訂閱有效期間永久保留。若取消訂閱,加購點數將無法使用,直到重新訂閱為止。這種永久保留機制適合在密集製作期前預先囤積點數。13


提示詞架構

Suno的Custom Mode將您的創作輸入分為三個欄位,各有其獨特用途。了解什麼內容該放在哪裡(以及什麼不該放),是決定產出品質時好時壞或穩定一致的關鍵。

Style欄位

Style欄位定義您生成作品的音樂特性。它接受自然語言描述詞,涵蓋曲風、氛圍、速度、配器、人聲特質與製作風格。

最佳公式:

[Genre] [Subgenre], [Tempo/Energy], [Key instruments], [Vocal style], [Production quality], [Mood]

範例:

Indie folk rock, mid-tempo, acoustic guitar and mandolin, warm female vocals, lo-fi production, nostalgic and wistful

描述詞的甜蜜點:4至7個描述詞。少於4個會給Suno過大的自由空間。超過7個則描述詞之間會相互競爭,產生混濁的結果,沒有任何單一特質能清晰呈現。14

對比:提示詞精確度的重要性

同樣的創作意圖,會因Style欄位的精確度不同而產生截然不同的結果:

模糊提示詞(2個描述詞):

rock, energetic

結果:生成通用的流行搖滾,配上標準鼓組、失真吉他,以及預設為廣播友好風格的男聲。Suno會用最熱門的預設值填補每個未指定的參數。10次生成中,沒有兩次聽起來相關。

精確提示詞(6個描述詞):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production

結果:一致的車庫搖滾,具有可辨識的lo-fi特色。鼓聲具有房間收音感,貝斯占主導地位,人聲粗獷有力。10次生成中,所有結果都共享可辨識的音色特徵。差異僅在旋律與編曲,而非基本特性。

為什麼會有差異:每個描述詞都限制了輸出的一個維度。單獨的「Rock」讓速度、人聲風格、製作品質、樂器平衡和氛圍完全由Suno決定。加入「garage」限制了子曲風慣例,「lo-fi production」限制了音色質感,「shouted male vocals」限制了人聲表現方式。模型能預設為通用選擇的空間就變少了。

過度指定的提示詞(10個以上描述詞):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production, 145 BPM, minor key, reverb-heavy, vintage tube amp warmth, 1960s Detroit influence

結果:混濁的妥協產物。Suno無法同時滿足所有限制條件,因此對每個條件都只能部分滿足。「1960s Detroit influence」可能與「145 BPM」衝突,「reverb-heavy」與「lo-fi production」互相矛盾。輸出聽起來混亂而非精確。

Style欄位中有效的描述詞

描述詞類型 範例 效果
曲風 rock, jazz, hip-hop, EDM, classical, country 主要音樂框架
子曲風 shoegaze, bossa nova, trap, dubstep, baroque 縮小曲風範圍
速度 slow, mid-tempo, upbeat, fast, 120 BPM 控制速度(BPM值為近似值,非精確值)
樂器 acoustic guitar, synth pad, brass section, strings 建議配器(不保證完全遵循)
人聲特質 raspy male vocals, ethereal female vocals, choir 塑造人聲特色
製作風格 lo-fi, polished, raw, overdriven, clean 整體音色質感
氛圍 melancholic, euphoric, aggressive, dreamy, dark 情感基調
年代 80s, 90s grunge, 2000s pop, vintage, modern 特定年代的風格慣例

Style欄位中無效的描述詞

  • 特定藝人名稱:「Sounds like Adele」不可靠且可能被過濾。請使用描述性的替代方式:「powerful female vocal, piano-driven pop ballad」
  • 技術混音術語:「Sidechain compression on the kick」會被忽略。Suno不會解讀混音參數
  • 精確BPM控制:「127 BPM」會被視為近似參考,而非精確的節拍鎖定
  • 否定指令:Style欄位中的「No drums」並不可靠。請使用Instrumental切換或metatags進行結構控制

Lyrics欄位

Lyrics欄位接受您的歌詞文字,並可搭配選用的metatags進行結構控制。如果不使用metatags,Suno會根據換行與內容模式推斷結構。

基本歌詞(無metatags):

Walking down the empty road
Headlights fading in the rain
Every mile feels like a year
But I keep driving through the pain

含metatags的歌詞(建議使用):

[Verse 1]
Walking down the empty road
Headlights fading in the rain

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Verse 2]
Every mile feels like a year
But the horizon's getting bright

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Outro]
And the sun comes up again

務必使用metatags。如果不使用,Suno會自行做出可能不符合您意圖的結構決定。[Chorus]標籤確保重複與旋律強調。[Bridge]標籤則示意和聲的轉變。這些結構提示能大幅提升輸出的一致性。

Title欄位

Title欄位用於命名您的生成作品。它對音樂輸出幾乎沒有影響,但會出現在中繼資料和Suno的資料庫中。請使用描述性的命名,方便您自行整理。


Prompt Enhancement Helper

V4.5中引入的Prompt Enhancement Helper是一項AI驅動的功能,會在生成前重寫您的Style欄位提示詞。啟用後,Suno會將您的描述詞擴展為更詳細的提示詞,讓模型能更精確地解讀。14

運作方式

  1. 您撰寫Style提示詞:indie rock, energetic
  2. Helper將其擴展為類似:Energetic indie rock, driving electric guitars, punchy drums, dynamic bass, bright and raw production, anthemic and youthful
  3. Suno根據擴展後的提示詞生成,而非您的原始提示詞

何時使用

情境 是否使用Helper? 原因
簡短、模糊的提示詞 Helper會補充您未提供的具體描述
探索新曲風 能發掘您可能不知道的描述詞
精確、詳細的提示詞(5個以上描述詞) Helper可能覆蓋或稀釋您的意圖
重複使用已驗證有效的Style提示詞 您需要的是一致性,而非重新詮釋

重要行為特性

  • Helper具有不確定性:即使輸入相同,每次重寫的結果也不同
  • 您可以在生成後查看擴展後的提示詞,了解Suno認為哪些描述詞有用
  • 擴展後的提示詞是絕佳的學習工具:先用Helper生成一次,閱讀擴展內容,然後在未來的提示詞中直接使用這些描述詞,無需再依賴Helper
  • 在正式製作時請停用此功能,以確保您能精確控制Suno接收到的內容

將Helper作為學習工具,而非依賴對象。從其擴展中提取有用的描述詞,加入您自己的詞彙庫,然後自行撰寫精確的提示詞。最佳結果來自於您完全掌控的提示詞。


曲風與風格描述詞

Suno能辨識數百種曲風與風格術語。研究顯示,AI音樂模型約86%的訓練資料來自全球北方的曲風,吉他、鋼琴和鼓等樂器佔訓練片段的52–67%,而區域性樂器的佔比不到3%。21 因此,曲風準確度會因具體程度和文化來源而有所差異。

高信心曲風(結果穩定一致)

這些曲風因在訓練資料中有充分代表性,能產出穩定準確的結果:

曲風 有效描述詞 備註
Pop pop, synth-pop, indie pop, dream pop, electropop Suno最擅長的曲風。未指定時,預設行為傾向pop。
Rock rock, indie rock, alt-rock, classic rock, punk rock, post-punk 樂器分離度佳。吉他音色逼真。
Hip-Hop/Rap hip-hop, trap, boom bap, lo-fi hip-hop, conscious rap Rap人聲在V5中表現出色。可透過歌詞格式控制flow與演繹方式。
Electronic/EDM EDM, house, techno, trance, drum and bass, dubstep 擅長build-drop結構。合成器音色豐富多樣。
R&B/Soul R&B, neo-soul, contemporary R&B, motown 人聲質感滑順。擅長律動感編曲。
Country country, country rock, outlaw country, bluegrass 原聲樂器呈現良好。踏板鋼棒吉他和班鳩琴辨識度高。
Folk folk, indie folk, folk rock, Americana 以原聲樂器為主。人聲風格自然。
Jazz jazz, smooth jazz, jazz fusion, bebop, swing 在V5中有顯著提升。和聲複雜度明顯優於V4。

中信心曲風(需適當引導)

曲風 有效描述詞 備註
Metal metal, heavy metal, death metal, black metal, metalcore 失真吉他音色表現佳。極端人聲(嘶吼、尖叫)效果不穩定。
Classical classical, orchestral, chamber music, symphony 基本管弦編曲效果不錯。複雜對位法較弱。
Latin reggaeton, salsa, bossa nova, cumbia, bachata 節奏模式大致準確。樂器的細節呈現程度不一。
Afrobeats afrobeats, afropop, highlife 持續進步中。V5的節奏準確度優於V4。
K-Pop/J-Pop K-pop, J-pop, city pop 製作風格有辨識度。除非歌詞另行指定,人聲語言可能預設為英語。

低信心曲風(需反覆嘗試)

曲風 有效描述詞 備註
微分音/前衛 avant-garde, experimental, noise 不可預測。結果富有創意但很少符合預期。
傳統/民族音樂(非西方) gamelan, raga, Tuvan throat singing 訓練資料有限。結果為近似風格而非真實重現。
音效設計/SFX ambient drone, soundscape Stable Audio更擅長處理此類需求。Suno以歌曲結構為優化目標。

人聲風格設定

人聲特質是Suno輸出中最容易控制的面向之一。V5大幅提升了人聲的自然度與表現力。

人聲描述詞

描述詞 效果
性別 “male vocals”, “female vocals”, “androgynous vocals”
音色 “warm”, “bright”, “dark”, “rich”, “thin”, “breathy”
技巧 “raspy”, “smooth”, “vibrato”, “falsetto”, “belt”, “whisper”
風格 “soulful”, “punk”, “operatic”, “conversational”, “spoken word”
後製處理 “reverb-heavy”, “dry vocals”, “auto-tuned”, “distorted”, “lo-fi”
和聲 “harmonized”, “choir”, “backing vocals”, “vocal layering”

組合人聲描述詞

堆疊2–3個人聲描述詞可實現精確控制:

Raspy male vocals with subtle vibrato, lo-fi warmth
Ethereal female vocals, breathy and reverb-heavy, choir harmonies
Deep baritone, smooth jazz delivery, minimal processing

語言與多語人聲

Suno V5支援多語人聲生成。模型會從您的歌詞推斷語言。若使用非英語歌詞:

  • 在Lyrics欄位中以目標語言撰寫歌詞
  • 可在Style欄位中加入語言提示:”Japanese city pop, female vocals”
  • 英語、西班牙語、葡萄牙語、法語、日語、韓語和中文的效果最佳
  • 較少見的語言可能產生帶口音或不夠精確的發音

Instrumental模式

在Custom Mode中開啟Instrumental,即可生成無人聲的曲目。此時Style欄位成為唯一的創作輸入。

何時適合使用Instrumental模式?

  • 背景音樂:Podcast開場、影片配樂、工作環境音
  • 製作素材:節拍底層、和弦進行、氛圍音效
  • 曲風探索:在不受人聲品質影響的情況下測試曲風描述詞
  • DAW整合:生成伴奏音軌供現場人聲錄製使用

Instrumental提示詞範例

沒有人聲時,Style欄位需要更多描述細節來彌補:

Cinematic orchestral score, sweeping strings, French horns, timpani rolls, epic and triumphant, Hans Zimmer inspired
Lo-fi hip-hop beat, jazzy piano chords, vinyl crackle, mellow drums, study music
Ambient electronic, pad textures, slow evolving synths, ethereal and spacious, Brian Eno inspired

提示: 即使在Instrumental模式下,也建議在Lyrics欄位中加入[Instrumental][Instrumental Break]等metatag,以強化意圖並控制編曲結構。


Metatag參考

Metatag是Suno的結構控制語言。放置在Lyrics欄位中的方括號內,用於指揮編曲、配器、動態和人聲行為。Metatag將Suno從簡單的提示詞生成歌曲工具提升為作曲工具。10

Metatag的運作方式

Metatag會被當作編曲指令處理,而非歌詞內容。當Suno遇到[Chorus]時,它會: 1. 發出編曲中的段落轉換訊號 2. 套用典型的副歌特徵(旋律強調、更飽滿的配器、更高的能量) 3. 若相同的[Chorus]文字再次出現,會嘗試重複旋律與編曲

Metatag不區分大小寫:[VERSE][Verse][verse]效果相同。

為何metatag比提示詞文字更重要: 若不使用metatag,Suno會依據換行與歌詞內容來推斷歌曲結構。模型會根據訓練模式猜測主歌在哪結束、副歌從哪開始。Metatag消除了這種猜測。與其期望Suno將您的副歌辨識為副歌,[Chorus]能明確觸發副歌應有的音樂行為:旋律記憶點、更飽滿的配器、更高的能量,以及後續出現時的重複。這種效果在整首歌曲中會層層累加。一首3分鐘的曲目若不使用metatag,大約有6–8個結構決定由Suno推斷而來。使用metatag的曲目則有6–8個結構決定由您親自掌控。


結構標籤

這些標籤定義歌曲段落並控制編曲流程。

主要結構標籤

標籤 用途 音樂效果
[Intro] 開場段落 通常為純器樂或簡約編排,建立氛圍基調
[Verse][Verse 1] 主歌段落 中等能量,敘事重心,旋律多變
[Pre-Chorus] 副歌前導 能量漸升,過渡性和聲
[Chorus] 記憶點/副歌 能量巔峰,令人難忘的旋律,完整配器
[Post-Chorus] 副歌之後 維持能量,逐步回落過渡
[Bridge] 對比段落 不同和弦、不同能量,提供變化
[Breakdown] 精簡段落 減少配器,創造留白空間
[Build][Build-Up] 能量爬升 漸進式強度提升,常見於EDM
[Drop] 高能量爆發 配器與能量達到最大值,通常接在build之後
[Hook] 記憶樂句 短小、令人印象深刻的音樂段落
[Interlude] 器樂間奏 串接段落,清新過渡
[Outro] 結尾段落 能量漸收,帶來收束感
[End] 硬性結束 通知歌曲應結束(防止尾端殘餘音訊)

段落編號

使用編號來區分重複的段落類型:

[Verse 1]
First verse lyrics here

[Chorus]
Chorus lyrics

[Verse 2]
Second verse with different lyrics

[Chorus]
Same chorus lyrics (encourages melodic repetition)

為主歌編號有助於Suno理解每段主歌應有不同旋律,而副歌則應重複相同旋律。


器樂與人聲標籤

這些標籤控制段落中的配器與人聲行為。

器樂標籤

標籤 效果
[Instrumental] 無人聲段落
[Instrumental Intro] 純器樂開場
[Instrumental Break] 歌曲中段的器樂段落
[Guitar Solo] 以吉他為主的器樂段落
[Piano Solo] 以鋼琴為主的段落
[Drum Solo] 以打擊樂為主的段落
[Bass Solo] 以貝斯為主的段落
[Saxophone Solo] 以薩克斯風為主的段落
[Strings Rise] 弦樂漸強推升
[Percussion Break] 以節奏為主的段落
[Synth Solo] 合成器主奏段落

人聲標籤

標籤 效果
[Male Vocal] 切換為男聲
[Female Vocal] 切換為女聲
[Duet] 雙人對唱
[Choir] 合唱團人聲
[Harmony] 人聲和聲
[Rap] 饒舌演繹
[Spoken Word] 口白演繹,非歌唱
[Whisper] 耳語式演繹
[Scream] 嘶吼/吶喊式演繹(metal、punk)
[Ad-lib] 即興人聲片段
[Humming] 哼唱旋律
[Backing Vocals] 背景和聲

進階 Metatag 模式

參數化 Metatag

Metatag 在冒號後接受描述性修飾詞:

[Verse: whispered vocals, acoustic guitar only]
Walking through the morning mist
The world still sleeping, still

[Chorus: full band, powerful vocals]
But I'm awake, I'm alive
And every sound is a sign

冒號語法讓您能針對個別段落進行調整,無需更動全域 Style 欄位。參數化 Metatag 是最強大的 metatag 功能,賦予您逐段控制編曲的能力。

動態與製作 Metatag

標籤 效果
[Fade In] 音量漸增
[Fade Out] 音量漸減
[Silence] 音訊短暫停頓
[Crescendo] 強度逐漸增強
[Decrescendo] 強度逐漸減弱
[Tempo: slow] 段落級速度變化
[Key Change] 和聲轉調

結合結構與修飾標籤

[Intro: ambient pads, reversed guitar, ethereal]
[Verse 1: lo-fi drums, muted bass, whispered vocals]
Words that float on morning air
Disappearing into light

[Pre-Chorus: building energy, adding layers]
But something shifts beneath the surface

[Chorus: full production, soaring vocals, epic drums]
We break through the silence
Into the wide open sky

[Bridge: stripped down, piano only, vulnerable vocals]
And in the quiet after the storm

[Outro: fade out, ambient reprise]

最終成果等同於僅透過文字便達成 DAW 級的編曲控制。


Creative Sliders

Creative Sliders 是 V4.5+ 的控制項,用於塑造生成音樂的個性。它們出現在 Custom Mode 的 Lyrics 欄位下方。11

為何滑桿與文字提示並存: 文字提示定義的是生成什麼(曲風、樂器、氛圍),滑桿控制的則是模型如何詮釋這些提示。同樣是「jazz」提示,低 Weirdness 會產出傳統爵士標準曲;高 Weirdness 則會產出打破自身慣例的爵士樂。提示定義了詞彙,滑桿定義了文法。

Weirdness

範圍: Safe ← → Chaos(滑桿,無數值顯示)

位置 效果
Safe(左側) 傳統結構、可預測的曲風遵循、保守的旋律選擇
Center(預設,約50%) 均衡。在曲風慣例中帶有些許創意驚喜
Chaos(右側) 非傳統結構、意想不到的和聲選擇、跨曲風融合。不連貫的風險較高

Weirdness 的運作原理: 滑桿調整的是模型在生成過程中的取樣溫度。低值時,Suno 在每一步選擇機率最高的下一個音樂事件,產出傳統結果。高值時,低機率事件被選中的頻率增加,產出令人意外的組合。其中的取捨在於連貫性:高機率 = 可預測但精緻;低機率 = 富有創意但可能不連貫。

何時提高 Weirdness: - 實驗性或前衛曲風 - 傳統結果感覺過於制式時 - 進行跨曲風融合實驗時

何時降低 Weirdness: - 需要聽起來「正常」的商業音樂 - 在嚴格的曲風慣例中作業時 - 製作不應過於搶眼的背景/環境音樂時

Style Influence

範圍: Loose ← → Strong(滑桿)

位置 效果
Loose(左側) 風格描述僅為建議,非強制。Suno 擁有更大的創作自由
Center(預設) 對風格描述的遵循度適中
Strong(右側) 嚴格遵循風格描述,創意偏離空間較小

使用 Strong 的時機:Style 欄位描述精確,且希望成果完全符合描述。使用 Loose 的時機:希望 Suno 更自由地詮釋提示,帶來意想不到的驚喜。

Audio Influence

範圍: 控制上傳的參考音訊對生成結果的影響程度。

在使用 Audio Upload(Covers、Remixes 或 Add Vocals/Instrumentals)時可用。數值越高,輸出越貼近參考音訊的特性。


Song Editor

Song Editor 讓您在生成後進行編輯,無需重新生成整首歌曲。它解決的是「九成完美但某個段落不對」的問題。12

可用操作

操作 功能說明 使用時機
Inpainting 將特定時間範圍替換為新內容 某段主歌不理想,但副歌完美
Extend 延伸歌曲至目前端點之後 歌曲結束太早或需要增加段落
Crop 將歌曲裁剪為較短長度 移除尾部靜音或不需要的段落
Fade In/Out 在開頭/結尾套用漸進音量變化 專業級的前奏/尾奏修飾
Replace Section 以新指令重新生成某段落 橋段在調性上不協調

Inpainting 工作流程

  1. 選取要替換的時間範圍(在波形上拖曳)
  2. 可選擇為替換段落提供新的歌詞/metatag
  3. 生成:Suno 會建立與前後音訊銜接的新內容
  4. 試聽並比較,接受或重新生成

Inpainting 是一個迭代過程。 第一次替換很少能與周圍音訊完美銜接。建議預留 2 至 5 次嘗試以達成無縫效果。

Extend 工作流程

  1. 在任何現有生成結果上點擊 Extend
  2. 可選擇為延伸部分提供歌詞/metatag
  3. Suno 會從端點續接生成約 30 至 60 秒的新音訊
  4. 每次延伸為獨立的生成(消耗點數)

最佳做法: 在延伸提示的開頭加入結構性 metatag(例如 [Chorus][Outro]),以引導延伸生成的內容方向。


Covers 與 Remixes

Pro 和 Premier 方案可針對現有 Suno 曲目建立 Covers 和 Remixes。

Covers

上傳或選取現有 Suno 曲目作為參考,再套用新的風格:

Style: Acoustic folk cover, fingerpicked guitar, soft female vocals, intimate production

Cover 會保留旋律與歌詞,但重新詮釋編曲與製作風格。

Remixes

Remixes 對現有曲目的改造幅度比 Covers 更大:

Style: EDM remix, heavy bass, 128 BPM, drop-focused, festival energy

Add Vocals / Add Instrumentals

兩種專門模式,可在現有音訊上疊加新元素:

  • Add Vocals:上傳純樂器曲目,Suno 在其上生成人聲
  • Add Instrumentals:上傳純人聲曲目,Suno 在背後生成伴奏

兩種模式都能將 Suno 融入傳統製作流程:錄製真實人聲後讓 Suno 生成伴奏,或反過來操作皆可。


語音系統

語音系統(Voices,Pro/Premier 方案適用)讓您建立並重複使用一致的聲音角色。不再需要期望每次生成都能分配到相似的聲音,而是直接定義一個語音並引用它。在 V5.5 中,建立選單裡的 Personas 按鈕已更名為 Voices——現有的 Persona 工作流程在新的 Voices 選單下仍可正常運作。1531

建立 Persona Voice

  1. 生成一首您滿意其人聲的歌曲
  2. 點擊該生成結果的三點選單,選擇「Create Persona」
  3. 為 persona 取一個描述性名稱(例如「Warm Alto Folk」、「Raspy Baritone Rock」、「Ethereal Soprano」)
  4. 該 persona 會儲存至您的帳戶資料庫

建立有效 persona 的技巧: - 專門為 persona 生成歌曲,而非從其他歌曲的副產品中擷取。使用清晰、符合曲風的 Style 提示詞,確保人聲突出。 - 避免從帶有大量人聲處理效果(auto-tune、失真)的歌曲中建立 persona。Persona 擷取的是處理後的聲音,而非底層的原始嗓音。 - 為不同曲風分別建立 persona,而非試圖打造一個「萬用」聲音。從獨立民謠曲目訓練出的 persona,套用在 trap 節拍上會產生不可預期的結果。

使用 Persona Voices

在 Custom Mode 中,生成前從 Persona 下拉選單選取已儲存的 persona。該 persona 會套用於該工作階段的所有生成,直到您更換為止。

Persona 的行為特性: - Persona 保留的是音色(聲音質感、共鳴)與基本演唱風格(氣聲、沙啞、圓潤) - 不會保留確切的旋律走向、語句斷句或節奏表現,這些由 Style 提示詞和 metatags 決定 - 跨不同速度和調性套用 persona 效果良好;但跨越差異極大的曲風(例如將爵士 persona 套用在死亡金屬上)結果會不穩定

Persona 管理

  • 儲存上限:Suno 允許儲存多個 persona(確切上限未公開,但使用者回報 20 個以上皆無問題)
  • 命名慣例:使用包含聲音特質與曲風資訊的描述性名稱。日後您不會記得「Voice 3」是哪個聲音
  • 刪除:Persona 可從資料庫中刪除,刪除後無法復原
  • 帳戶專屬:Persona 無法在帳戶間分享或匯出

限制

  • Persona Voices 擷取的是音色與基本演唱風格,並非精確的演唱技巧
  • 將 persona 套用於與原始曲風差異過大的場景時,結果會有落差
  • Persona Voices 為帳戶專屬,無法分享
  • 2025 年 12 月的更新改善了 persona 跨生成的一致性,但仍無法保證完美重現15

語音複製(V5.5)

V5.5 推出了 Voice Cloning 功能,讓 Pro 和 Premier 訂閱者能複製自己的聲音用於生成。30 與 Persona Voices(從生成歌曲中擷取音色)不同,Voice Cloning 擷取的是真人聲音的特徵。

運作方式:

  1. 錄製或上傳一段人聲樣本
  2. 完成驗證流程,確認您擁有該聲音的使用權(需進行身分驗證)
  3. 複製的聲音將出現在 Custom Mode 的可選聲音清單中

與 Persona Voices 的主要差異:

面向 Persona Voices Voice Cloning
來源 Suno 生成的歌曲 真人聲音錄音
驗證 無需驗證 需要身分驗證
保真度 擷取音色與基本演唱風格 對原始聲音有更高保真度的重現
適用方案 Pro/Premier Pro/Premier

驗證流程: Suno 要求驗證以防止未經授權的聲音複製。您必須確認自己是該聲音的擁有者,或已取得明確的使用授權。這與 Suno 和 WMG 合作中建立的聲音/肖像保護條款一致。6

自訂模型(V5.5)

Custom Models 讓 Pro 和 Premier 訂閱者能將 V5.5 個人化,使其適應特定的音樂風格。30 不必每次都從 Suno 的通用模型出發,Custom Model 會根據您的創作偏好進行微調。

Custom Models 的運作方式:

  1. 從您的作品庫中上傳至少 6 首代表目標風格的歌曲
  2. 訓練素材需保持風格一致——在單一模型中混入各種隨機曲風會產生雜訊;專注於單一方向(例如管弦樂、future bass、獨立民謠)能讓模型學習得更精準31
  3. 為 Custom Model 命名後,Suno 便會根據您選取的素材訓練一個個人化版本的 V5.5
  4. 往後的生成即可使用該 Custom Model,承襲您的風格特徵

數量限制: 每位 Pro 或 Premier 訂閱者最多可建立 3 個 Custom Models。這讓您能為不同的專案或曲風維護獨立的模型(例如一個獨立民謠、一個電子音樂、一個嘻哈)。

Custom Models 擷取的內容: 曲風傾向、編曲模式、製作美學,以及您所選訓練歌曲中的風格偏好。它不會記憶或重現訓練素材中的特定旋律或歌詞。


My Taste(V5.5)

My Taste 是 V5.5 的功能,所有使用者皆可使用(包括免費方案),它會隨時間適應個人偏好來調整 Suno 的生成行為。30

運作方式: 當您生成、按讚並與歌曲互動時,Suno 會建立一份偏好檔案。My Taste 預設為啟用,可從頭像選單中檢視、編輯或停用。Style 輸入框旁的魔法棒圖示是主要觸發點——點擊後 Suno 會根據您的品味檔案生成一段風格描述文字。31 My Taste 影響的是生成預設值——對您一貫偏好的曲風、製作風格、人聲特質與結構模式產生微妙的傾向。

My Taste 影響的範圍: - 提示詞不夠明確時的預設曲風與風格傾向 - 製作美學偏好(lo-fi 對比精緻、簡約對比豐富) - 人聲風格傾向 - 編曲與結構模式

My Taste 不會取代的功能: - 明確的 Style 欄位描述詞仍會覆蓋 My Taste 的偏好 - Creative Sliders 仍獨立運作 - Persona Voices 和 Voice Cloning 不受影響

實際意義: My Taste 解決了新使用者常遇到的「冷啟動」問題——初期生成結果往往過於泛用。隨著時間推移,即便只輸入「upbeat rock song」這樣簡短的提示詞,生成結果也會更貼近您偏好的搖滾風味,因為系統已從您的生成歷史中學習。


生成循環

有效使用 Suno 依循的是迭代式工作流程,而非一次性的提示詞操作。

製作週期

1. IDEATION
    Generate 5-10 variations with different Style descriptors
    (Cost: ~25-50 credits)

2. SELECTION
    Pick the 1-2 best results
    Identify what works and what doesn't

3. REFINEMENT
    Adjust Style descriptors based on what you heard
    Refine lyrics and metatags
    Regenerate with tighter prompts
    (Cost: ~15-30 credits per round)

4. EXTENSION
    Extend the best track to full length
    Add missing sections (bridge, outro)
    (Cost: ~5-15 credits)

5. EDITING
    Use Song Editor to fix weak sections
    Inpaint, crop, fade as needed
    (Cost: ~5-20 credits)

6. EXPORT
    Download final audio (MP3/WAV)
    Optionally export stems for DAW work

完成一首精緻曲目的典型花費: 50–100 credits(橫跨所有階段約 10–20 次生成)。

實戰演練:從概念到匯出的完整流程

以下是一首曲目的完整製作週期,展示每個階段的實際提示詞與決策過程:

1. 概念:「一首關於失眠的陰鬱獨立民謠。」

2. 第一次生成(10 credits,2 個變體):

Style: Indie folk, slow tempo, acoustic guitar fingerpicking, soft female vocals, intimate lo-fi recording, melancholic
Lyrics:
[Verse 1]
The ceiling holds no answers
Just shadows and the clock
Every hour stretches longer
When the world has gone to dark

[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound

[Verse 2]
The neighbors' lights went out at ten
The street grew still by twelve
Now it's somewhere past forever
And I'm talking to myself

[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound

[Outro: fade out, humming]

3. 篩選: 變體 B 的人聲音色恰到好處,但副歌旋律對這首歌的氛圍而言太過明快。變體 A 的副歌較佳,但吉他音色偏薄。

4. 調整(10 credits): 修改 Style 重新生成:將「lo-fi recording」改為「warm analog recording」,並加入「sparse arrangement」。歌詞維持不變。新的變體 A 兼具第一輪的溫暖感與更內斂的副歌。

5. 延伸(5 credits): 歌曲在 2:30 處結束。以 [Bridge: piano only, vulnerable vocals] 加上新歌詞 + [Chorus] + [Outro: fade out, ambient reprise] 進行延伸。Bridge 段落自然地引入鋼琴。

6. 編輯(10 credits): 第二段主歌進入副歌的過渡太突兀。使用 Song Editor 對該接點進行 4 秒的 Inpainting。第二次 Inpainting 的結果銜接順暢。

7. 匯出: 下載 WAV 檔至 Logic Pro 進行母帶處理。總花費:35 credits,7 次生成。

關鍵要點:大部分 credits 花在前兩輪(找到對的聲音),而非後三輪(打磨一個好的版本)。前期投入精確的提示詞,至少省下了 30 credits——相比模糊提示詞反覆迭代的做法。

節省 Credits 的工作流程技巧

  1. 花時間在提示詞上,而非生成次數上。 精心設計的 Style + Lyrics 提示詞,首次生成的品質就遠勝於用模糊提示詞快速迭代。
  2. 批次生成。 探索概念時,一次生成 4–6 個變體,選定方向後再進行調整。
  3. 用 Song Editor 取代重新生成。 如果一首曲目有 80% 令人滿意,編輯剩下的 20% 比重新生成整首歌更划算。
  4. 儲存成功的 Style 提示詞。 當某個描述詞組合效果出色,儲存起來以備日後重複使用。

Suno Studio DAW

Suno Studio(Premier方案專屬,隨V5一同推出)是一款瀏覽器內建的數位音訊工作站,專為生成後的編輯而設計。它銜接了Suno的生成引擎與傳統音樂製作之間的落差。2

Studio功能一覽

功能 說明
多軌檢視 視覺化時間軸,包含個別stem音軌
混音控制 針對每個stem調整音量、聲像、靜音、獨奏
Warp Markers 對特定段落進行時間伸縮,不影響音高
Remove FX 移除stem上的殘響、延遲及其他效果
Alt Takes 針對特定段落生成替代版本
拍號設定 調整或修正拍號的解讀方式
Stem分離 存取多達12個獨立stem,進行精細混音

Studio 1.2(2026年2月)

最新的Studio更新新增了以下功能:4

  • Warp Markers搭配Quantize:微調個別音符與樂句的時值,透過對齊網格的量化功能實現更精準的節奏校準
  • Remove FX:移除AI套用的殘響與延遲,取得乾淨的stem
  • Alt Takes:在編輯介面中直接生成並試聽替代段落
  • 擴充拍號支援:更完善地處理3/4、6/8及非常規拍號
  • Studio中的Personas:直接在Studio工作流程中套用Persona Voices,確保Studio內重新生成時的人聲一致性
  • 音色庫:瀏覽並疊加預製音訊素材(循環樂段、單次取樣)至您的編曲中
  • 瀏覽器內建EQ:針對每個stem進行基本等化調整,無需匯出至DAW即可進行音色塑造25

WavTool收購案

Suno於2025年6月收購了WavTool——一款支援VST外掛、精確到取樣點的編輯功能,並具備AI驅動特色的瀏覽器DAW。27 WavTool核心團隊加入Suno,擔任產品與工程領導職務。這次收購解釋了Studio功能為何能快速發展:Warp Markers、Remove FX以及音色庫,都反映了WavTool的專業DAW能力與Suno「生成優先」工作流程的整合。執行長Mikey Shulman將此舉定調為賦予音樂人「放大人類創意的工具」。27

MILO-1080:AI步進音序器

2026年3月,Suno推出了MILO-1080(Model-Integrated Loop Orchestrator)——一款16軌步進音序器暨合成器設計工具,目標族群為經驗豐富的製作人與節拍創作者。28 MILO-1080結合手動編序與AI生成音色:

  • 文字轉音色生成:透過文字提示創建取樣
  • Suno曲庫:從先前生成的Suno曲目中擷取片段
  • 內建合成器引擎:無需AI即可手動設計音色
  • MIDI支援:標準MIDI輸入/輸出,支援硬體整合
  • 16軌:完整多軌編序,含逐軌控制

MILO-1080標誌著Suno從文字轉音樂,向全方位創作平台的跨越。結合WavTool收購案與Studio DAW,顯示Suno的目標客群不僅是休閒使用者,更包括專業製作人。

該用Studio還是匯出至DAW?

使用情境 使用Studio 匯出至DAW
快速修正(音量平衡、靜音某個stem)
完整的專業混音與母帶處理
嘗試不同編曲變化
加入外部音訊(真實樂器、人聲)
一般聆聽與分享
商業發行前置作業 視情況

Stem分離與匯出

Suno提供兩種層級的stem分離:

2-stem分離(所有方案皆可使用)

將音訊分離為: - 人聲:所有人聲內容 - 伴奏:其餘所有內容

適用於:卡拉OK版本、人聲取樣、基礎混音。

12-stem分離(Pro/Premier)

將音訊分離為多達12個獨立stem:22 - 人聲、鼓組、貝斯、吉他、鍵盤/鋼琴、合成器、弦樂、銅管、木管、打擊樂、音效、其他

重要區別:Suno的「stem分離」與iZotope RX或Demucs等工具有本質上的不同。後者分析已混音的音訊檔案,嘗試事後分離音源。Suno則很可能直接匯出個別生成層,因為所有音訊本就由它產生。這更接近從DAW匯出子混音,而非事後音源分離。23 實際使用上,Suno的stem比第三方分離工具處理同一混音檔案的結果更為乾淨,但與原始混音進行null test時未必完全吻合。

品質說明:stem之間預期會有些許串音,尤其是頻率相近的樂器之間。V5的分離品質已有顯著提升。若要處理任意音訊檔案(非Suno生成)的專業工作,Demucs和iZotope RX等專用工具仍是業界標準。23

匯出格式

  • MP3:標準壓縮音訊格式。適合分享、串流及草稿使用。
  • WAV:未壓縮音訊格式。專業DAW作業與母帶處理的必備格式。

DAW整合

Suno的輸出透過stem匯出,無縫銜接傳統製作流程。

建議工作流程

  1. 在Suno中生成,直到編曲與氛圍符合預期
  2. 匯出12個stem(Pro/Premier),格式選擇WAV
  3. 匯入您的DAW(Logic Pro、Ableton、Pro Tools、FL Studio、Reaper)
  4. 使用專業工具進行混音與母帶處理
  5. 視需要替換或增補個別stem,加入真實錄音

DAW混音帶來的優勢

  • EQ與壓縮:針對每個stem進行音色塑造,這是Suno的AI混音無法提供的
  • 空間處理:精確的立體聲定位、殘響發送、延遲投擲
  • 自動化:隨時間變化的動態調整(漸強堆疊、濾波器掃頻)
  • 外部樂器:將真實錄音與AI生成的stem疊加
  • 母帶處理鏈:響度標準化、限幅處理、發行前的最終潤飾
  • 自動化腳本:使用Claude Code建立提示模板、批次處理Style欄位變體,或將生成-篩選-精煉流程腳本化

風格混搭

Suno的一大獨特優勢,在於能生成風格交叉點上的音樂——這在傳統製作中往往需要多位不同領域的樂手才能實現。

有效的混搭模式

雙風格融合(最穩定可靠):

Jazz-funk fusion, slap bass, Rhodes piano, syncopated drums, groovy and sophisticated

風格+年代混搭:

80s synthwave meets modern trap, analog synths, 808 bass, retro-futuristic

風格+非典型樂器:

Death metal with jazz saxophone solos, blast beats, dissonant chords

混搭原則

  1. 以主導風格開頭。「Jazz with electronic elements」和「Electronic with jazz elements」會產生截然不同的結果。
  2. 控制在2至3種風格以內。超過這個數量,Suno的輸出容易變得主題模糊、缺乏重心。
  3. 運用年代標記來錨定風格。加入「90s」或「2020s」有助於Suno選擇正確的製作慣例。
  4. 提高Weirdness以適應非常規融合。預設的Weirdness設定傾向將一切標準化,這恰恰違背了風格混搭的初衷。

多段落作曲

當歌曲長度超過4分鐘,便需要透過多次生成來組合完成。

策略一:Extend

先生成第一段,再使用Extend逐步添加後續段落。每次延伸都會以前一段的結尾作為上下文參考。

優點:音樂連貫性佳。每次延伸自然承接前段。 缺點:對後段的控制力較弱。多次延伸後容易產生音樂偏移。

策略二:逐段獨立生成

為每個段落搭配特定的metatag與Style組合獨立生成,再於DAW中接合。

優點:對每段的風格特性擁有最大控制權。 缺點:獨立生成的段落之間,過渡處可能顯得突兀。需要具備DAW接合技巧。

策略三:混合方法(推薦)

  1. 將歌曲核心(主歌-副歌-主歌-副歌)以單次生成完成
  2. 使用Extend添加橋段與最終副歌
  3. 利用Song Editor對薄弱的過渡段進行Inpainting修補
  4. 匯出stem,在DAW中完成最終製作

Prompt串接

透過一系列相關生成,逐步構建複雜的歌曲。

串接模式

Generation 1: "Atmospheric intro, ambient pads, slow build"
    Extend with: "[Build-Up] [Drop: full energy, heavy drums]"
    Extend with: "[Verse 1: vocals enter, riding the beat]"
    Extend with: "[Chorus: anthemic, crowd-singing energy]"
    Extend with: "[Outro: fade out, return to ambient pads]"

每次延伸都會繼承前一次生成的音樂DNA,在無需從零開始的情況下,創造出連貫的多段落作品。


疑難排解

為什麼我的 Suno 歌曲聽起來不對?

問題 可能原因 解決方案
歌曲與 Style 提示詞完全不符 描述詞相互衝突,或 Weirdness 設定過高 精簡至 4–5 個核心描述詞,降低 Weirdness。
人聲聽起來像機器人 免費方案使用 V4.5-All 模型 升級至 Pro 方案以獲得 V5 人聲品質。
歌曲突然中斷 缺少 [Outro] 標籤 在歌詞中加入 [Outro][End]
歌曲在自然結尾後仍持續播放 Suno 自動填滿至最大長度 在最後一段之後加入 [End] 標籤。
錯誤的曲風佔主導地位 排列第二的曲風被降低優先順序 將主要曲風放在 Style 欄位的最前面。
Metatags 被當作歌詞顯示 標籤語法錯誤 檢查是否有拼寫錯誤。標籤格式必須為 [Tag],使用方括號。
各段落間人聲風格不一致 未設定 Persona Voice 使用 Persona Voices 確保跨段落生成的一致性。
延伸段落與原曲不吻合 原始版本與延伸版本之間生成次數過多 從最新版本延伸,而非從原始版本。
純音樂曲目出現人聲殘影 Style 描述詞隱含人聲元素 明確開啟 Instrumental 模式,並加入 [Instrumental] 標籤。

生成品質檢查清單

在花費點數進行調整之前,請確認提示詞涵蓋以下要素:

  • [ ] 曲風夠具體(不只是「rock」,而是「indie rock」或「post-punk」)
  • [ ] 已描述人聲風格(或已開啟 Instrumental 模式)
  • [ ] Metatags 定義了歌曲結構(至少包含:Verse、Chorus、Outro)
  • [ ] Style 欄位包含 4–7 個描述詞(不宜過少或過多)
  • [ ] 明確指定情緒(未指定時,Suno 預設偏向正面歡快的風格)

商業授權

資訊驗證截至 2026 年 3 月。授權條款可能變動,請以 Suno 最新的服務條款為準。5

各方案授權範圍

用途 Free Pro Premier
個人聆聽
社群媒體貼文
YouTube/TikTok 營利
串流平台(Spotify、Apple Music)
商業產品(廣告、遊戲、影視)
對 Suno 的版稅義務 不適用 無(100% 歸您所有) 無(100% 歸您所有)

重要注意事項

純 AI 生成內容的著作權保護在法律上仍未定論。截至 2026 年,純 AI 生成的音樂在美國可能無法取得著作權登記。Suno 在 2026 年初更新了常見問題的措辭:問題從「我是否擁有著作權?」改為「我是否擁有版權?」——答案說明使用者「可能被授予商業使用權」,但「通常不被視為」純 AI 生成內容的「所有權人」。26 其影響如下: - 您擁有商業使用權(Suno 授予您授權許可) - 但您可能無法在法律上擁有具強制力的著作權 - 您可能無法阻止他人使用相同或類似的產出內容 - 加入人類創作元素(原創歌詞、真實樂器錄音、在 DAW 中進行的編曲決策)能強化您的著作權主張 - 無追溯授權:在免費方案下建立歌曲後再升級付費方案,不會追溯授予該歌曲的商業使用權34 - 無賠償保障:Pro 和 Premier 方案不包含賠償保障——若 Suno 生成的歌曲被指控侵權,Suno 不會負擔法律費用。僅 Enterprise 方案可協商賠償保障條款。35

收益歸您所有。Pro 和 Premier 使用者保留 Suno 生成音樂的 100% 收益。Suno 不收取版稅或分潤。5


著作權與法律環境

AI 音樂生成正處於不斷演變的法律環境中。

重要法律進展

  • Warner Music 合作關係(2025 年 11 月):Warner 與 Suno 達成和解並宣布策略合作。Suno 收購了 Songkick,將開發經 WMG 授權的模型並於 2026 年推出,目前未經授權的模型將逐步淘汰。34 免費方案使用者將完全失去下載音訊的功能(歌曲仍可播放和分享),付費方案使用者則面臨每月下載上限,可額外購買下載次數。選擇加入的藝人和詞曲作家將獲得 AI 生成音樂的收益機會。藝人保有對姓名、肖像及聲音使用的控制權。6
  • UMG 和 Sony 訴訟:大型唱片公司對 Suno 的訴訟仍在進行中。UMG Recordings v. Suno 案的簡易判決動議已推遲至 2027 年 1 月 8 日。32 2026 年 3 月,UMG 執行副總裁暨數位長 Michael Nash 公開表示「我們目前未看到 AI 版稅稀釋對 UMG 的營收構成實質影響」——與 UMG 在法庭文件中聲稱市場將被 Suno 生成作品「淹沒」的說法直接矛盾。33 訴訟核心聚焦於訓練資料中是否使用了受著作權保護的錄音。6
  • GEMA 訴訟(德國):德國著作權集體管理組織 GEMA 在慕尼黑對 Suno 提起訴訟。首次聽證會已於 2026 年 3 月舉行,預計 2026 年中做出裁決。這是歐洲首起針對 AI 音樂生成的重大法律挑戰。29
  • Udio/UMG 和解(2025 年):競爭對手 Udio 與 UMG 達成和解,為產業樹立了部分先例。7
  • 美國著作權局:已表明純 AI 生成的作品無法取得著作權,但包含 AI 元素且具有充分人類創作的作品可能符合資格。8

實務建議

  1. 請勿使用 Suno 複製特定的受著作權保護歌曲。Covers 功能是為翻唱 Suno 生成的曲目而設計,並非用於商業錄音。
  2. 加入人類創作元素以強化著作權主張:撰寫原創歌詞、在 Suno stem 上疊錄真實樂器、在 DAW 中做出編曲決策。
  3. 記錄您的創作過程。若作品受到質疑,人類創作決策的證據能強化您的立場。Obsidian 等工具可作為附帶時間戳記的創作日誌。
  4. 持續關注法律動態。這個領域正在快速變化。

競爭對手與替代方案

平台 優勢 劣勢 最適用途
Suno 整體歌曲品質最佳、豐富的編輯工具、Studio DAW 無官方 API、結果不可預測、點數不累計 完整歌曲製作
Udio 最佳 stem 品質(原生 48kHz)、曲風精確度高 使用者群體較小、編輯工具較少 以 stem 為基礎的製作
Stable Audio 官方 API、音效設計能力、開放權重 人聲品質較弱、輸出長度較短 API 整合、音效製作
Google MusicFX 免費、容易上手 控制選項有限、輸出較短、不可商用 隨興實驗
AIVA 專注古典/影視配樂、支援 MIDI 匯出 曲風範圍狹窄 影視與遊戲配樂

該選擇哪款 AI 音樂生成器?

  • 含人聲的完整歌曲:Suno(V5.5)
  • 供 DAW 製作的 stem:Udio(stem 品質最高)
  • API 驅動的生成:Stable Audio(唯一提供公開 API 的平台)
  • 音效設計與 SFX:Stable Audio
  • 影視配樂:AIVA(支援 MIDI 匯出,可進行管弦樂編輯)
  • AI 生成專輯封面:請參閱 Midjourney 指南,了解與音樂製作工作流程搭配的提示詞工程技巧

API 與整合現況

資訊驗證截至 2026 年 3 月。

Suno 未提供公開的 API。目前沒有官方的 REST API、SDK,也沒有供個人使用者或開發者使用的程式化存取方式。17

現有存取方式

存取類型 狀態 詳細說明
官方公開 API 不可用 尚無公布時程
Enterprise/合作夥伴 API 私人測試中 僅限受邀者使用,請聯繫 Suno 業務團隊。
社群封裝套件 非官方 gcui-art/suno-api,逆向工程的封裝套件。未經 Suno 認可,可能隨時失效。9
Chirp API 已停止 早期 API 存取計畫,不再接受新使用者。

開發者指引

若您需要程式化的音樂生成功能: - Stable Audio:提供官方 API,附有完整的端點文件 - Replicate:託管開源音樂生成模型,提供 API 存取 - 自行部署:MusicGen(Meta)等開源模型可自行架設


快速參考卡

Custom Mode 範本

STYLE FIELD:
[Genre] [Subgenre], [Tempo], [Key instruments], [Vocal style], [Production], [Mood]

LYRICS FIELD:
[Intro: descriptors]

[Verse 1]
Your lyrics here

[Pre-Chorus]
Building lyrics

[Chorus]
Hook lyrics

[Verse 2]
More lyrics

[Chorus]
Same hook (for melodic repetition)

[Bridge: contrasting descriptors]
Different energy lyrics

[Chorus]
Final hook

[Outro: fade out]

常用 Metatags

標籤 用途
[Verse] 敘事段落
[Chorus] 主旋律/副歌
[Bridge] 對比段落
[Intro] 開場
[Outro] 收尾
[End] 硬截止
[Instrumental] 無人聲
[Guitar Solo] 樂器獨奏
[Fade Out] 漸弱結尾
[Tag: descriptors] 逐段控制

Creative Sliders 速查表

滑桿 左側 中間 右側
Weirdness 傳統保守 平衡 實驗前衛
Style Influence 寬鬆詮釋 預設 嚴格遵循
Audio Influence 最少參考 平衡 強烈參考

定價速查

Free Pro($10/月) Premier($30/月)
點數 50/天 2,500/月 10,000/月
V5.5
商業使用
Studio

更新日誌

日期 變更內容 來源
2026-04-04 將 Persona Voices 重新命名為 Voices,以符合 V5.5 介面。緩和了 40% 提示詞準確度的說法(源自社群,非官方數據)。
2026-04-01 V5.5 細節更新:提示詞準確度提升、建立選單中 Voices 取代 Personas、Custom Models 最低 6 首歌曲要求與一致性指引、My Taste 魔法棒觸發機制。UMG 控告 Suno 簡易判決延至 2027 年 1 月,UMG 稀釋理論之承認。WMG 授權模型逐步淘汰、免費方案取消下載功能、無追溯授權、無賠償保障。 31 32 33 34 35
2026-03-30 新增 V5.5:附驗證機制的 Voice Cloning(Pro/Premier 方案)、Custom Models(每位訂閱者最多 3 個)、My Taste 自適應偏好設定(所有使用者)。更新模型存取表格與定價資訊。 30
2026-03-24 新增 MILO-1080 步進音序器(2026 年 3 月推出)。新增 GEMA 控告 Suno 訴訟(德國,首起歐洲法律挑戰)。 28 29
2026-03-12 於 Studio DAW 章節新增 WavTool 收購案(2025 年 6 月)相關背景 27
2026-03-07 新增 Studio 1.2 額外功能(Studio 中的 Personas、Sounds、瀏覽器內建 EQ)、付費方案每日額外點數、WMG 合作細節(授權模型、Songkick、下載上限)、著作權歸屬用語更新 Multiple
2026-03-04 出版審查:修正引用標註(1 拆分至已驗證來源)、新增 V4.5 8 分鐘生成功能、前後對比提示詞範例、完整歌曲演練、metatags 與 Creative Sliders 的「為什麼」說明、西方訓練偏差引用、stem separation 技術區分、6 筆新參考資料 18-23、內部交叉連結、統計數據開頭 Quality review
2026-03-04 品質審查:新增重點摘要、本指南使用方式、Prompt Enhancement Helper 章節、擴充 Persona Voices 內容、串接所有引用、修正 Udio/UMG 引用、新增年繳定價與加購點數細節 Quality review
2026-03-03 指南建立,涵蓋 V5、定價、metatags、Studio、製作工作流程、授權,以及完整的 prompt engineering 參考 Multiple
2026-02-01 Suno Studio 1.2:Warp Markers、Remove FX、Alt Takes、拍號設定 4
2025-09-25 V5(chirp-crow)發布:48kHz、Studio DAW、12 軌 stem separation、Persona Voices 1
2025-11-01 Warner Music 和解案 6
2025-05-01 V4.5 發布:8 分鐘生成、Creative Sliders、Prompt Enhancement Helper 19
2024-11-19 V4 發布:4 分鐘生成、Covers、2 軌 stem separation 3

參考資料


  1. Suno V5 Release and Review。V5(chirp-crow)於2025年9月23至25日發布。48kHz音訊、廣播級輸出品質、Suno Studio DAW、12軌stem分離、Persona Voices。 

  2. Introducing Suno Studio。瀏覽器內建DAW,用於生成後編輯。多軌檢視、混音控制、stem隔離。 

  3. Suno Model Timeline。官方模型版本歷程,從V2至V5。 

  4. Suno Studio 1.2 Master Guide。2026年2月更新:Warp Markers、Remove FX、Alt Takes、擴充拍號支援。 

  5. Suno Rights & Ownership。商業授權:Pro與Premier用戶保留100%收益。免費方案僅限非商業用途。 

  6. WMG and Suno Partnership。Warner於2025年11月達成和解。Suno收購Songkick,將開發WMG授權模型。藝人保留對姓名、肖像、聲音使用的控制權。 

  7. UMG Settles Udio Lawsuit, Announces Partnership。UMG與Udio於2025年10月29日達成和解。預計2026年推出新的授權AI音樂創作平台,涵蓋錄音及詞曲出版授權。 

  8. US Copyright Office on AI-Generated Works。純AI生成作品無法取得著作權。具備充分人類創作成分的作品可能符合資格。 

  9. gcui-art/suno-api。非官方社群封裝套件,非Suno官方背書,可能隨時失效。 

  10. Suno Metatags Complete Guide。社群彙整的500多個metatag清單,涵蓋結構、人聲、樂器與製作標籤。 

  11. Suno Creative Sliders Guide。Weirdness、Style Influence與Audio Influence控制項的官方文件。 

  12. Suno Song Editor。Replace Section、Extend、Crop與Fade操作的官方文件。 

  13. Suno Pricing Plans。現行方案比較:Free、Pro($10/月)、Premier($30/月)。 

  14. Suno Prompt Engineering Best Practices。社群指南,說明有效的提示詞結構與描述詞用法。 

  15. Suno AI Personas。Persona的建立、使用方式與限制。 

  16. Suno V5 Audio Specifications。不同方案間的音訊品質比較:取樣率、位元深度、匯出格式。 

  17. The Suno API Reality。官方與非官方API生態現況分析及法律風險。 

  18. Suno Hits 2M Paid Subscribers and $300M ARR。TechCrunch,2026年2月。每日生成700萬首曲目;Spotify的1億首歌曲目錄每兩週即被超越一次。 

  19. Introducing V4.5。Suno官方公告。單次生成8分鐘、Creative Sliders、提示詞增強助手、擴展類型精準度、強化人聲表現。 

  20. Suno V5 (chirp-crow) Specifications。V5內部模型名稱chirp-crow,48kHz取樣率、320kbps、Persona支援、stem匯出。 

  21. Missing Melodies: AI Music Generation and Its Omission of the Global South。86%的AI音樂訓練資料來自全球北方音樂類型。吉他、鋼琴與鼓佔訓練片段的52–67%;地區性樂器不到3%。 

  22. Suno Stem Extraction。2軌(人聲+伴奏)與12軌stem分離的官方文件。 

  23. Suno Separation Quality vs SpectraLayers。討論Suno的stem匯出可能是重新生成各別音軌,而非事後音源分離。 

  24. Suno Pricing and Credit Details。月配額用盡後,付費訂閱者每日可獲得50點額外點數,直到下個帳單週期。 

  25. Suno Studio February 2026 Update。Studio 1.2新增功能:Personas整合、Sounds素材庫、瀏覽器內建EQ、Warp Markers搭配Quantize。 

  26. Suno FAQ — Copyright and Ownership。更新措辭:用戶「可能被授予商業使用權」,但「通常不被視為」純AI生成內容的所有人。 

  27. Suno Acquires WavTool。2025年6月。瀏覽器版DAW,支援VST外掛、取樣精確編輯、AI功能。核心團隊加入Suno擔任產品與工程主管。 

  28. Suno’s Latest Move Is MILO-1080, An AI-Driven Step Sequencer。2026年3月。16軌步進音序器,支援文字轉音效生成、合成器引擎、MIDI。面向有經驗的製作人。 

  29. GEMA v. Suno: Munich Court Holds First Hearing。2026年3月。首件歐洲AI音樂生成法律訴訟。GEMA(德國著作權集管組織)於慕尼黑對Suno提起訴訟,預計2026年中判決。 

  30. Introducing V5.5。2026年3月26日。Voice Cloning含驗證流程(Pro/Premier)、Custom Models依用戶風格個人化(每位Pro/Premier訂閱者最多3個)、My Taste自適應偏好系統(所有用戶)。 

  31. Suno V5.5 Guide: Voices, Custom Models & My Taste。提示詞準確度提升40%。Voices取代Create選單中的Personas。Custom Models需至少6首風格一致的歌曲。My Taste透過Style輸入欄的魔術棒觸發。 

  32. Summary Judgment in UMG Recordings v. Suno Pushed Back to Jan. 8, 2027。2026年3月。簡易判決動議截止日期自原定時程延後。 

  33. Universal Music Group Admits Foundational Legal Claim in Suno Case is Baseless。2026年3月。UMG執行副總裁Michael Nash表示「無跡象顯示AI版稅稀釋對UMG而言構成實質營收影響」。 

  34. Suno Previews 2026 Changes Under Warner Music Deal。現有模型將逐步汰換為WMG授權模型。免費方案取消下載功能,付費方案新增每月下載上限。訂閱前建立的歌曲不適用追溯授權。 

  35. The 2026 Suno AI Legal Guide: Do You Actually Own Your Songs?。Pro與Premier方案不包含損害賠償免責條款,僅Enterprise方案可協商免責條件。 

NORMAL suno.md EOF