suno:~/music$ cat suno.md

Suno AI Music Generation: The Definitive Technical Reference

#

words: 1795 read_time: 30m updated: 2026-03-05 08:24
$ less suno.md

更新于2026年3月4日

摘要: Suno通过文本提示生成完整歌曲(人声、乐器、编曲和混音)。V5以48kHz产出广播级音质,单次生成最长可达4分钟。掌握三大系统(提示文本 + metatags + Creative Sliders),Suno便能成为真正的制作工具,而非新奇玩物。使用Custom Mode获得精确控制,用metatags规划歌曲结构,通过Song Editor进行迭代优化。Pro套餐(每月10美元)可解锁V5及商业使用权。积分不会累积到下月。

Suno拥有200万付费订阅用户,每天生成700万首曲目,每两周的产出量便超过Spotify全部1亿首歌曲的总目录。18 V5跨越了早期版本无法企及的门槛:听众在不知情的情况下便会主动参与收听AI生成的内容。1 这不再是猎奇或占位之作,而是真正在制作场景中被使用的音乐。

“有趣的AI音乐”与”我真正愿意发行的音乐”之间的差距,取决于您对三大控制系统的理解:

  1. 提示文本:用自然语言描述流派、情绪、配器和人声风格
  2. Metatags:结构性指令,如[Verse][Chorus][Bridge],用于控制编曲走向
  3. Creative Sliders:Weirdness、Style Influence和Audio Influence,用于塑造生成内容的个性特征

默认的工作流程(输入一句话,点击生成)产出的结果时好时坏,因为Suno优化的是大众吸引力,而非您的具体需求。精准控制才是区分可用成品与随机结果的关键。

我已在Suno支持的每种流派中生成了数千首曲目,测试了所有已记录和未记录的metatag组合,并梳理了每个模型版本的优势与局限。本指南将这些经验凝练为一份权威的技术参考。


核心要点

  • Custom Mode是严肃创作的必备选项。Simple Mode会剥离使Suno成为制作工具的所有控制功能。本指南中的每项技术都基于Custom Mode,使用独立的Style、Lyrics和Title字段。
  • 三套控制系统,而非一套。提示文本定义音乐特征。Metatags(元标签)控制编排和结构。Creative Sliders塑造生成内容的个性。精通这三者是区分可用输出与随机结果的关键。
  • Metatags是影响最大的技能。使用[Verse]/[Chorus]/[Bridge]结构搭配参数化修饰符([Verse: whispered vocals, acoustic guitar only]),您可以获得逐段控制能力,仅通过文本就能实现接近DAW级别的编排效果。
  • V5跨越了制作门槛。从V4.5到V5的飞跃,是”有趣的AI音乐”与”我愿意发行的音乐”之间的差别。48kHz音频、自然人声和真实乐器分离。使用V5需要Pro套餐($10/月)。
  • 迭代,而非祈祷。生成循环(构思→筛选→优化→延展→编辑→导出)通常每首精制曲目消耗50–100积分。请为迭代做预算,而非寄望于一次完美生成。
  • 月度积分不可累积,但充值积分不会过期。月度积分在每个计费周期重置。购买的充值积分在订阅有效期内持续存在,因此在密集创作前囤积充值积分是明智之举。13

如何使用本指南

您的身份… 从这里开始 然后探索
Suno新手 入门指南提示架构 Metatags参考风格与流派描述符
希望获得更好效果的普通用户 提示架构Creative Sliders 高级Metatag模式故障排除
为发行制作音乐的创作者 生成循环Suno Studio DAW DAW集成商业许可
评估Suno与替代方案 什么是Suno?竞品与替代方案 API与集成状态版权与法律格局

目录

第1部分:基础

  1. 什么是Suno?
  2. 入门指南
  3. 模型与版本
  4. 定价与积分

第2部分:Prompt Engineering(提示工程)

  1. 提示架构
  2. 提示增强助手
  3. 风格与流派描述符
  4. 人声风格化
  5. 纯音乐模式

第3部分:歌曲结构

  1. Metatags参考
  2. 结构标签
  3. 乐器与人声标签
  4. 高级Metatag模式

第4部分:创作控制

  1. Creative Sliders
  2. Song Editor
  3. Covers与Remixes
  4. Persona Voices

第5部分:制作工作流

  1. 生成循环
  2. Suno Studio DAW
  3. Stem分离与导出
  4. DAW集成

第6部分:高级技术

  1. 流派融合
  2. 多段落作曲
  3. 提示链接
  4. 故障排除

第7部分:商业与法律

  1. 商业许可
  2. 版权与法律格局
  3. 竞品与替代方案

第8部分:参考资料

  1. API与集成状态
  2. 快速参考卡
  3. 更新日志
  4. 参考文献

什么是Suno?

Suno是一个生成式AI平台,能够从文本描述创建完整的歌曲。与DAW、采样库或基于循环的工具不同,Suno同时生成曲目的所有元素:旋律、和声、节奏、配器、人声(含歌词)、编排和混音。您描述想要的内容,Suno生成一首完整的歌曲。

Suno与传统音乐制作相比如何?

方面 Suno 传统制作
输入 文本提示+可选歌词 音符、MIDI、音频录制
输出 完整混音歌曲 需要混音的独立音轨
首次输出时间 约30秒 数小时至数天
所需音乐知识 描述性词汇 乐器演奏能力、乐理、混音技术
迭代方式 重新提示、编辑段落、调整滑块 重新录制、重新编排、重新混音
最大时长 每次生成4分钟(可延展) 无限制

您可以创建的内容:

  • 带人声的完整歌曲:任何流派、任何语言,原创歌词或AI生成
  • 纯音乐:背景音乐、配乐、氛围音轨
  • 流派实验:跨流派融合,传统制作需要多位专业乐手才能实现
  • 多版本变体:针对同一概念生成数十个版本,挑选最佳
  • 制作素材:用于传统DAW工作流的stem

Suno不是什么:

  • 不是DAW:您无法手动混音、母带处理或编排(尽管Studio增加了部分此类功能)
  • 不是确定性的:相同提示每次产生不同结果
  • 不是采样库:您无法精确地隔离和复用单个声音
  • 不是无限的:生成消耗积分,且不同尝试之间质量参差不齐

入门指南

快速上手(5分钟)

  1. 创建账户,访问suno.com。免费套餐每天提供50积分(约10次生成)。

  2. 先尝试Simple Mode。输入简短描述,例如”upbeat indie rock song about a road trip”,然后点击Create。Suno会自动生成歌词、旋律、编排和人声。

  3. 切换到Custom Mode以获得更多控制。Custom Mode将提示拆分为独立字段:

  4. Style of Music:流派、情绪、配器描述符
  5. Lyrics:包含metatags结构标记的歌词
  6. Title:歌曲标题

  7. 试听两个输出版本。Suno每次创建生成两个变体。选择更接近您意图的版本,然后优化。

  8. 使用Extend将歌曲延展至初始生成之后,或使用Song Editor替换特定段落。

界面概览

Suno的网页界面有两种主要创作模式:

Simple Mode:单一文本框。用自然语言描述歌曲。Suno推断流派、编写歌词并生成所有内容。适合探索,不适合精确创作。

Custom Mode:三个独立字段(Style、Lyrics、Title)加上Creative Sliders。Custom Mode是严肃创作的核心。Style字段接受流派和制作描述符。Lyrics字段接受带有metatags的文本。滑块控制生成的个性特征。

请从Custom Mode开始。Simple Mode虽然方便,但会剥离使Suno适用于制作工作的所有控制功能。本指南中的每项技术都基于Custom Mode。


模型与版本

Suno自发布以来迭代迅速。每个版本都带来了显著的质量提升,但不同订阅层级的访问权限有所不同。

版本时间线

版本 发布时间 关键改进
V2 2023年秋季 首个公开模型。短片段(约30秒),风格范围有限,AI痕迹明显。
V3 2024年3月 延长至2分钟。人声清晰度提升。风格覆盖范围扩大。
V3.5 2024年夏季 混音质量提升,瑕疵减少,人声更加自然。
V4 2024年11月19日 质量大幅跃升。支持4分钟生成,多语言人声,Covers功能,2轨stem分离。
V4.5 2025年5月1日 单次生成时长提升至8分钟(此前为4分钟),Creative Sliders(Weirdness、Style Influence),提示词增强助手,风格准确度提升,人声品质增强。19
V4.5-All 2025年末 免费层级模型。将V4.5的改进扩展至更广泛的用户群体。
V5 2025年9月 当前旗舰模型。48kHz音频20,广播级输出质量,Suno Studio DAW2,12轨stem分离22,Persona Voices15。内部代号:chirp-crow。20

当前模型访问权限

层级 可用模型 质量说明
免费 V4.5-All 质量良好,但在人声自然度和混音清晰度方面明显不及V5
Pro($10/月) V5 广播级品质。在人声真实感、乐器分离度和动态范围方面有显著提升
Premier($30/月) V5 + Studio 生成质量与Pro相同,另外提供Suno Studio DAW用于生成后编辑

V5相比V4.5是一次实质性升级。差异在以下方面最为明显:人声自然度(减少了”AI歌手”的生硬感),低频清晰度(低音与底鼓的分离),以及立体声成像。如果您正在评估Suno用于制作用途,请基于V5进行评估,而非免费层级。

V5带来的变化

V5(内部代号”chirp-crow”20)代表了Suno单个版本中最大幅度的改进:1

  • 48kHz采样率:从V4.5的44.1kHz提升。在监听音箱和高品质耳机上,高频细节有明显可闻的提升。1620
  • 人声自然度:减少了以往版本中的”恐怖谷”效应。颤音、气息声和辅音发音更加逼真。1
  • 乐器分离度:混音中各个乐器更加清晰可辨。减少了”声墙”式的混糊感。1
  • 动态范围:对轻柔到响亮的过渡处理更佳。此前版本倾向于压缩一切。1
  • 风格准确度:更好地遵循风格规范。”jazz”提示词生成的音乐听起来更像正宗的爵士乐,而非”带有爵士和弦的流行乐”。19
  • Suno Studio:浏览器内置DAW,用于生成后编辑。可进行混音调整、stem隔离和编曲修改,无需重新生成。2

定价与积分

截至2026年3月验证有效。Suno的定价可能随时调整,恕不另行通知。请访问suno.com/pricing查看最新价格。13

方案对比

功能 免费 Pro($10/月) Premier($30/月)
年付价格 不适用 $8/月($96/年) $24/月($288/年)
积分 每日50 每月2,500 每月10,000
模型 V4.5-All V5 V5
每日生成次数 约10次 约500次 约2,000次
Song Editor 受限 完整功能 完整功能
Covers/Remixes
Persona Voices
Suno Studio
Stem分离 2轨 2轨 + 12轨 2轨 + 12轨
商业使用
优先生成
积分结转 不适用
积分充值

积分经济学

每次生成大约消耗5个积分,产出2个歌曲变体。Pro订阅的每月2,500积分大约可进行500次生成(1,000个歌曲变体)。

节省积分的实用方法: - 使用Custom Mode并提供精确的提示词,减少废弃生成 - 对有潜力的曲目使用Extend延伸,而非从头重新生成 - 使用Song Editor修复特定段落,而非重新生成整首歌曲 - 在生成前反复推敲Style提示词以节省积分

每月积分不会结转。计费周期结束时未使用的积分将作废。请合理规划您的生成计划。

充值积分不会过期。购买的充值积分在订阅有效期内永久保留。如果您取消订阅,充值积分将无法使用,直到重新订阅。这种持久性使得充值积分适合在密集制作期之前囤积使用。13


提示词架构

Suno的Custom Mode将您的创意输入分为三个字段,每个字段服务于不同的目的。理解什么内容放在哪里(以及什么不该放)是产出时好时坏与稳定输出之间的关键区别。

Style字段

Style字段定义生成音乐的音乐特征。它接受自然语言描述符,涵盖曲风、情绪、速度、配器、人声质感和制作风格。

最佳公式:

[Genre] [Subgenre], [Tempo/Energy], [Key instruments], [Vocal style], [Production quality], [Mood]

示例:

Indie folk rock, mid-tempo, acoustic guitar and mandolin, warm female vocals, lo-fi production, nostalgic and wistful

描述符最佳数量:4–7个。少于4个会给Suno过多的自由发挥空间。超过7个则描述符之间会相互竞争,产生模糊的结果,没有任何一种特质能够清晰呈现。14

对比:提示词精确度的重要性

相同的创意意图会因Style字段的精确程度不同而产生截然不同的结果:

模糊提示词(2个描述符):

rock, energetic

结果:生成的是通用流行摇滚,带有标准鼓点、失真吉他和默认为电台风格的男声。Suno会用最常见的默认值填充每个未指定的参数。生成10次,没有两次听起来是相关的。

精确提示词(6个描述符):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production

结果:一致的车库摇滚,具有可辨识的lo-fi特征。鼓声听起来像是用室内麦克风录制的,贝斯占据主导地位,人声粗犷有力。生成10次,所有结果都具有可识别的统一音色特征。差异仅在旋律和编曲上,而非基本特征。

差异原因:每个描述符约束输出的一个维度。单独的”Rock”将速度、人声风格、制作质量、乐器平衡和情绪完全交由Suno决定。添加”garage”约束了子曲风规范,”lo-fi production”约束了音色质感,”shouted male vocals”约束了人声表达方式。模型可以默认为通用选择的空间就更小了。

过度指定的提示词(10+个描述符):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production, 145 BPM, minor key, reverb-heavy, vintage tube amp warmth, 1960s Detroit influence

结果:模糊的折中产物。Suno无法同时满足所有约束条件,因此只能部分满足每一个。”1960s Detroit influence”可能与”145 BPM”冲突,”reverb-heavy”与”lo-fi production”相互矛盾。输出听起来混乱而非精确。

Style字段中有效的内容

描述符类型 示例 效果
曲风 rock, jazz, hip-hop, EDM, classical, country 主要音乐框架
子曲风 shoegaze, bossa nova, trap, dubstep, baroque 缩小曲风范围
速度 slow, mid-tempo, upbeat, fast, 120 BPM 控制速度(BPM值为近似值,非精确值)
乐器 acoustic guitar, synth pad, brass section, strings 建议配器(不保证完全遵循)
人声质感 raspy male vocals, ethereal female vocals, choir 塑造人声特征
制作 lo-fi, polished, raw, overdriven, clean 整体音色质感
情绪 melancholic, euphoric, aggressive, dreamy, dark 情感基调
年代 80s, 90s grunge, 2000s pop, vintage, modern 特定时代的音乐风格

Style字段中无效的内容

  • 特定艺术家名称:”Sounds like Adele”不可靠且可能被过滤。请使用描述性替代语:”powerful female vocal, piano-driven pop ballad”
  • 专业混音术语:”Sidechain compression on the kick”会被忽略。Suno不会解读混音参数
  • 精确BPM控制:”127 BPM”被视为近似指引,而非精确的节拍器锁定
  • 否定指令:Style字段中的”No drums”不可靠。请使用Instrumental开关或metatags进行结构控制

Lyrics字段

Lyrics字段接受您的歌词文本,并支持可选的metatags进行结构控制。如果不使用metatags,Suno会根据换行和内容模式推断结构。

基础歌词(无metatags):

Walking down the empty road
Headlights fading in the rain
Every mile feels like a year
But I keep driving through the pain

带metatags的歌词(推荐):

[Verse 1]
Walking down the empty road
Headlights fading in the rain

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Verse 2]
Every mile feels like a year
But the horizon's getting bright

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Outro]
And the sun comes up again

务必使用metatags。如果不使用,Suno会自行做出可能不符合您意图的结构决定。[Chorus]标签确保重复和旋律强调。[Bridge]标签表示和声转变。这些结构提示能显著提高输出的一致性。

Title字段

Title字段为您的生成作品命名。它对音乐输出的影响微乎其微,但会出现在元数据和Suno的曲库中。建议使用描述性名称以便于自己整理管理。


Prompt Enhancement Helper

Prompt Enhancement Helper是V4.5中引入的AI驱动功能,在生成前重写您的Style字段提示词。启用后,Suno会将您的描述符扩展为更详细的提示词,使模型能够更精确地解读。14

工作原理

  1. 您编写Style提示词:indie rock, energetic
  2. Helper将其扩展为类似:Energetic indie rock, driving electric guitars, punchy drums, dynamic bass, bright and raw production, anthemic and youthful
  3. Suno根据扩展后的提示词生成,而非您的原始输入

何时使用

场景 是否使用Helper? 原因
简短、模糊的提示词 Helper会补充您未提供的具体细节
探索新曲风 帮助您发现可能不了解的描述符
精确、详细的提示词(5+个描述符) Helper可能覆盖或稀释您的意图
重复使用已验证的Style提示词 您需要一致性,而非重新解读

重要行为特征

  • Helper具有非确定性:即使输入相同,每次重写结果也不同
  • 您可以在生成后查看扩展后的提示词,了解Suno认为哪些描述符有用
  • 扩展后的提示词是很好的学习工具:先用Helper生成一次,阅读扩展内容,然后在后续提示词中直接使用这些描述符,无需再依赖Helper
  • 在需要精确控制Suno接收内容的正式制作中请禁用此功能

将Helper作为学习工具,而非依赖对象。从其扩展内容中提取有用的描述符,将它们纳入您自己的词汇库,然后自行编写精确的提示词。最佳结果来自您完全掌控的提示词。


曲风与风格描述词

Suno能够识别数百种曲风和风格术语。研究表明,AI音乐模型训练数据中约86%来自全球北方地区的曲风,吉他、钢琴和鼓等乐器占训练片段的52%至67%,而地方性乐器的占比不足3%。21 因此,曲风准确度因具体程度和文化来源的不同而有所差异。

高置信度曲风(结果稳定一致)

以下曲风因在训练数据中有充分的代表性,能够产生可靠且准确的输出:

曲风 有效描述词 备注
Pop pop, synth-pop, indie pop, dream pop, electropop Suno最擅长的曲风。未指定时,默认倾向于pop风格。
Rock rock, indie rock, alt-rock, classic rock, punk rock, post-punk 乐器分离度好,吉他音色逼真。
Hip-Hop/Rap hip-hop, trap, boom bap, lo-fi hip-hop, conscious rap V5中说唱人声效果出色。可通过歌词格式控制flow和演绎方式。
Electronic/EDM EDM, house, techno, trance, drum and bass, dubstep 擅长build-drop结构,合成器音色丰富多样。
R&B/Soul R&B, neo-soul, contemporary R&B, motown 人声质感顺滑,擅长律动感编曲。
Country country, country rock, outlaw country, bluegrass 原声乐器渲染效果好。踏板钢棒吉他和班卓琴辨识度高。
Folk folk, indie folk, folk rock, Americana 以原声为主,人声风格自然。
Jazz jazz, smooth jazz, jazz fusion, bebop, swing 在V5中有显著提升。和声复杂度明显优于V4。

中等置信度曲风(需要适当引导)

曲风 有效描述词 备注
Metal metal, heavy metal, death metal, black metal, metalcore 失真吉他音色效果好。极端人声(嘶吼、尖叫)效果不稳定。
Classical classical, orchestral, chamber music, symphony 基础管弦乐编曲表现良好,复杂对位较弱。
Latin reggaeton, salsa, bossa nova, cumbia, bachata 节奏型大体准确,乐器的具体表现因类型而异。
Afrobeats afrobeats, afropop, highlife 持续改进中。V5的节奏准确度优于V4。
K-Pop/J-Pop K-pop, J-pop, city pop 制作风格辨识度高。除非在歌词中另行指定,人声语言可能默认为英语。

低置信度曲风(需要反复迭代)

曲风 有效描述词 备注
微分音/先锋派 avant-garde, experimental, noise 结果不可预测。输出具有创意但很少符合预期。
传统/民间音乐(非西方) gamelan, raga, Tuvan throat singing 训练数据有限。结果是近似模仿而非真实再现。
声音设计/音效 ambient drone, soundscape Stable Audio更擅长处理此类需求。Suno针对歌曲结构进行优化。

人声风格设定

人声特征是Suno输出中可控性最强的方面之一。V5在人声自然度和表现力方面有了显著提升。

人声描述词

描述词 效果
性别 “male vocals”、”female vocals”、”androgynous vocals”
音色 “warm”、”bright”、”dark”、”rich”、”thin”、”breathy”
技巧 “raspy”、”smooth”、”vibrato”、”falsetto”、”belt”、”whisper”
风格 “soulful”、”punk”、”operatic”、”conversational”、”spoken word”
处理效果 “reverb-heavy”、”dry vocals”、”auto-tuned”、”distorted”、”lo-fi”
和声 “harmonized”、”choir”、”backing vocals”、”vocal layering”

组合人声描述词

叠加2至3个人声描述词可实现精确控制:

Raspy male vocals with subtle vibrato, lo-fi warmth
Ethereal female vocals, breathy and reverb-heavy, choir harmonies
Deep baritone, smooth jazz delivery, minimal processing

语言与多语种人声

Suno V5支持多语种人声生成。模型会从您的歌词中推断语言。对于非英语歌词:

  • 在Lyrics字段中以目标语言书写歌词
  • 可选择在Style字段中添加语言说明:”Japanese city pop, female vocals”
  • 英语、西班牙语、葡萄牙语、法语、日语、韩语和普通话的效果最佳
  • 代表性较低的语言可能出现口音偏差或发音不够精准

Instrumental模式

在Custom Mode中开启Instrumental选项,即可生成无人声的音轨。此时Style字段成为唯一的创意输入。

何时应使用Instrumental模式?

  • 背景音乐:播客片头、视频配乐、环境工作音乐
  • 制作素材:节拍底层、和弦进行、氛围音效
  • 曲风探索:在排除人声质量干扰的情况下测试曲风描述词
  • DAW集成:为现场人声录制生成伴奏音轨

Instrumental提示词模式

没有人声时,Style字段需要提供更详细的描述来弥补:

Cinematic orchestral score, sweeping strings, French horns, timpani rolls, epic and triumphant, Hans Zimmer inspired
Lo-fi hip-hop beat, jazzy piano chords, vinyl crackle, mellow drums, study music
Ambient electronic, pad textures, slow evolving synths, ethereal and spacious, Brian Eno inspired

提示: 即使在Instrumental模式下,也可以在Lyrics字段中添加[Instrumental][Instrumental Break]等metatags(元标签),以强化意图并控制编曲结构。


Metatags参考

Metatags(元标签)是Suno的结构控制语言。将其置于Lyrics字段中的方括号内,可以指导编曲、配器、动态变化和人声行为。Metatags将Suno从一个简单的提示词生成歌曲工具提升为真正的作曲工具。10

Metatags的工作原理

Metatags作为编曲指令被处理,而非作为歌词内容。当Suno遇到[Chorus]时,它会: 1. 在编曲中标记段落切换 2. 应用典型的副歌特征(旋律突出、配器更饱满、能量更高) 3. 如果相同的[Chorus]文本再次出现,会尝试重复旋律和编曲

Metatags不区分大小写:[VERSE][Verse][verse]是等效的。

为什么metatags比提示词文本更重要: 如果不使用metatags,Suno会根据换行符和歌词内容来推断歌曲结构。模型基于训练模式来猜测主歌在哪里结束、副歌在哪里开始。Metatags消除了这种猜测。与其寄希望于Suno能将您的副歌识别为副歌,不如用[Chorus]明确触发副歌所应有的音乐行为:记忆点旋律、更饱满的配器、更高的能量,以及后续出现时的重复。这种效果在整首歌曲中会逐步累积。一首3分钟的曲目如果不使用metatags,Suno的推断大约只能做出6至8个结构性决策。而使用了metatags的曲目,则是由您来做出这6至8个结构性决策。


结构标签

这些标签定义歌曲段落并控制编曲走向。

主要结构标签

标签 用途 音乐效果
[Intro] 开场段落 通常为纯器乐或简约编曲,奠定整体基调
[Verse][Verse 1] 主歌段落 中等能量,叙事为主,旋律多变
[Pre-Chorus] 副歌铺垫 能量上升,和声过渡
[Chorus] 副歌/重复段 能量峰值,旋律记忆点强,配器饱满
[Post-Chorus] 副歌之后 维持能量,逐步过渡回落
[Bridge] 对比段落 不同的和弦、不同的能量,增加变化
[Breakdown] 简化段落 配器精简,营造空间感
[Build][Build-Up] 能量递增 逐步增强的力度,常见于EDM
[Drop] 高能量释放 配器和能量达到最大值,紧跟在build之后
[Hook] 记忆点乐句 简短而令人印象深刻的音乐乐句
[Interlude] 器乐间奏 连接段落,调节听觉感受
[Outro] 结尾段落 能量逐渐消退,带来收束感
[End] 硬性结束 通知歌曲应在此结束(防止尾部多余音频)

编号段落

使用编号来区分重复的段落类型:

[Verse 1]
First verse lyrics here

[Chorus]
Chorus lyrics

[Verse 2]
Second verse with different lyrics

[Chorus]
Same chorus lyrics (encourages melodic repetition)

为主歌编号有助于Suno理解每段主歌应有不同的旋律,而副歌则应保持旋律的重复。


器乐与人声标签

这些标签控制段落内的配器和人声行为。

器乐标签

标签 效果
[Instrumental] 无人声段落
[Instrumental Intro] 纯器乐开场
[Instrumental Break] 歌曲中间的纯器乐段落
[Guitar Solo] 以吉他为主的器乐段落
[Piano Solo] 以钢琴为主的段落
[Drum Solo] 以打击乐为主的段落
[Bass Solo] 以贝斯为主的段落
[Saxophone Solo] 以萨克斯为主的段落
[Strings Rise] 弦乐声部渐强
[Percussion Break] 以节奏为主的段落
[Synth Solo] 合成器主奏段落

人声标签

标签 效果
[Male Vocal] 切换至男声
[Female Vocal] 切换至女声
[Duet] 双人对唱
[Choir] 合唱人声
[Harmony] 人声和声
[Rap] 说唱演绎
[Spoken Word] 口语演绎,非演唱
[Whisper] 耳语式演绎
[Scream] 嘶吼/呐喊式演绎(金属、朋克风格)
[Ad-lib] 即兴人声乐句
[Humming] 哼唱旋律
[Backing Vocals] 背景和声部分

高级Metatag模式

参数化metatag

Metatag在冒号后接受描述性修饰符:

[Verse: whispered vocals, acoustic guitar only]
Walking through the morning mist
The world still sleeping, still

[Chorus: full band, powerful vocals]
But I'm awake, I'm alive
And every sound is a sign

冒号语法允许您修改各个段落,而无需更改全局Style字段。参数化metatag是最强大的metatag功能,为您提供逐段落的编曲控制。

动态与制作metatag

标签 效果
[Fade In] 音量逐渐增大
[Fade Out] 音量逐渐减小
[Silence] 音频中的短暂停顿
[Crescendo] 强度逐渐增强
[Decrescendo] 强度逐渐减弱
[Tempo: slow] 段落级别的速度变化
[Key Change] 和声转调

结合结构标签与修饰标签

[Intro: ambient pads, reversed guitar, ethereal]
[Verse 1: lo-fi drums, muted bass, whispered vocals]
Words that float on morning air
Disappearing into light

[Pre-Chorus: building energy, adding layers]
But something shifts beneath the surface

[Chorus: full production, soaring vocals, epic drums]
We break through the silence
Into the wide open sky

[Bridge: stripped down, piano only, vulnerable vocals]
And in the quiet after the storm

[Outro: fade out, ambient reprise]

最终效果相当于仅通过文本实现DAW级别的编曲控制。


Creative Sliders

Creative Sliders是V4.5+中用于塑造生成个性的控制项。它们出现在Custom Mode中歌词字段的下方。11

为什么滑块与文本提示并存: 文本提示定义生成什么(流派、乐器、氛围)。滑块控制模型如何诠释这些提示。在低Weirdness下使用”jazz”提示会生成传统的爵士标准曲目。相同提示在高Weirdness下则会生成打破自身惯例的爵士乐。提示定义了词汇;滑块定义了语法。

Weirdness

范围: Safe ← → Chaos(滑块,无公开数值)

位置 效果
Safe(左) 传统结构,可预测的流派遵循,保守的旋律选择
居中(默认,约50%) 平衡。在流派惯例内有些许创意惊喜
Chaos(右) 非传统结构,意想不到的和声选择,流派融合。不连贯的风险较高

Weirdness的工作原理: 该滑块调整模型在生成过程中的采样温度。在低值时,Suno在每一步选择概率最高的下一个音乐事件,产生传统结果。在高值时,较低概率的事件被更频繁地选中,产生令人惊喜的组合。其中的权衡在于连贯性:高概率 = 可预测但精致;低概率 = 富有创意但可能不连贯。

何时提高Weirdness: - 实验性或前卫流派 - 传统结果感觉千篇一律时 - 进行流派融合实验时

何时降低Weirdness: - 需要听起来”正常”的商业音乐 - 在严格的流派惯例内创作时 - 制作不应引起注意的背景/环境音乐时

Style Influence

范围: Loose ← → Strong(滑块)

位置 效果
Loose(左) 风格描述仅作为建议而非硬性要求。Suno拥有更多创意自由
居中(默认) 对风格描述的遵循程度适中
Strong(右) 严格遵循风格描述。创意偏离较少

当您的Style字段描述精确且希望获得完全符合描述的结果时,使用Strong。当您希望Suno更自由地诠释提示并可能带来惊喜时,使用Loose

Audio Influence

范围: 控制上传的参考音频对生成结果的影响程度。

在使用Audio Upload(Covers、Remixes或Add Vocals/Instrumentals)时可用。数值越高,输出越接近参考音频的特征。


Song Editor

Song Editor支持在不重新创建整首歌曲的情况下进行后期编辑。Song Editor解决的是”90%完美但有一个段落不对”的问题。12

可用操作

操作 功能 适用场景
Inpainting 用新内容替换特定时间范围 副歌完美但主歌较弱
Extend 将歌曲延长至当前终点之后 歌曲结束过早或需要增加段落
Crop 将歌曲裁剪至更短的长度 移除尾部静音或不需要的段落
Fade In/Out 在开头/结尾添加渐变音量效果 专业的前奏/尾奏处理
Replace Section 使用新指令重新生成某个段落 桥段在调性上不协调

Inpainting工作流程

  1. 选择要替换的时间范围(在波形上拖动选择)
  2. 可选择为替换段落提供新的歌词/metatag
  3. 生成:Suno会创建与周围音频相匹配的新内容
  4. 试听并对比。接受结果或重新生成。

Inpainting是一个迭代过程。 第一次替换很少能与周围上下文完美衔接。预计需要2–5次尝试才能获得无缝的结果。

Extend工作流程

  1. 在任意已有生成上点击Extend
  2. 可选择为续写部分提供歌词/metatag
  3. Suno会生成约30–60秒的新音频,从端点处继续
  4. 每次延伸都是一次独立生成(消耗积分)

最佳实践: 在延伸提示的开头包含一个结构性metatag(如[Chorus][Outro]),以引导延伸内容的生成方向。


Covers与Remixes

Pro和Premier层级的用户可以基于已有的Suno曲目创建Covers和Remixes。

Covers

上传或选择一首已有的Suno曲目作为参考,然后应用新的风格:

Style: Acoustic folk cover, fingerpicked guitar, soft female vocals, intimate production

Cover保留原曲的旋律和歌词,但重新诠释编曲和制作。

Remixes

Remixes比Covers对原曲进行更大幅度的改造:

Style: EDM remix, heavy bass, 128 BPM, drop-focused, festival energy

Add Vocals / Add Instrumentals

两种专门的模式,用于在已有音频上叠加新的层次:

  • Add Vocals:上传纯乐器曲目,Suno为其生成人声
  • Add Instrumentals:上传人声曲目,Suno为其生成伴奏

这两种模式将Suno融入传统制作工作流程:录制真实人声并让Suno生成伴奏,或反过来。


Persona Voices

Persona Voices(Pro/Premier)允许您创建并在多次生成中复用一致的声音角色。无需寄希望于每次生成都分配类似的声音,您可以定义一个persona并直接引用它。15

创建Persona Voice

  1. 生成一首您喜欢其人声的歌曲
  2. 点击该生成上的三点菜单,选择”Create Persona”
  3. 为persona取一个描述性的名称(例如”Warm Alto Folk”、”Raspy Baritone Rock”、”Ethereal Soprano”)
  4. 该persona将保存到您的账户库中

创建有效persona的技巧: - 专门为创建persona而生成,而非其他歌曲的附带产物。使用清晰、符合流派的Style提示,确保人声突出。 - 避免从经过大量声音处理(auto-tune、失真等)的歌曲中创建persona。Persona捕获的是处理后的声音,而非底层原声。 - 创建针对特定流派的persona,而非一个”万能”声音。基于独立民谣曲目训练的persona用于trap节拍时会产生不可预测的结果。

使用Persona Voices

在Custom Mode中,生成前从Persona下拉菜单中选择已保存的persona。该persona将应用于当前会话中的所有生成,直到您更换为止。

Persona行为特征: - Persona保留音色(声音色调、共鸣)和基本演唱风格(气声、沙哑、圆润) - 它不会保留精确的旋律模式、乐句处理或节奏演绎。这些来自Style提示和metatag - 在不同的速度和调性间应用persona效果良好。但跨越差异极大的流派(例如将爵士persona用于死亡金属)会产生不一致的结果。

Persona管理

  • 存储限制:Suno允许保存多个persona(确切上限未公开记录,但用户报告保存20个以上没有问题)
  • 命名规范:使用包含音色特质和流派上下文的描述性名称。否则您会忘记”Voice 3”是哪个
  • 删除:Persona可从您的库中删除。删除操作不可逆。
  • 账户专属:Persona无法在账户之间共享或导出

局限性

  • Persona Voices捕获的是音色和基本演唱风格,而非精确的声乐技巧
  • 将persona应用于远离其原始流派的场景时,结果会有所不同
  • Persona Voices是账户专属的,无法共享
  • 2025年12月的更新改善了persona在多次生成间的一致性,但仍无法保证完美复制15

生成循环

高效使用Suno遵循的是迭代式工作流程,而非单次提示词方法。

制作周期

1. IDEATION
    Generate 5-10 variations with different Style descriptors
    (Cost: ~25-50 credits)

2. SELECTION
    Pick the 1-2 best results
    Identify what works and what doesn't

3. REFINEMENT
    Adjust Style descriptors based on what you heard
    Refine lyrics and metatags
    Regenerate with tighter prompts
    (Cost: ~15-30 credits per round)

4. EXTENSION
    Extend the best track to full length
    Add missing sections (bridge, outro)
    (Cost: ~5-15 credits)

5. EDITING
    Use Song Editor to fix weak sections
    Inpaint, crop, fade as needed
    (Cost: ~5-20 credits)

6. EXPORT
    Download final audio (MP3/WAV)
    Optionally export stems for DAW work

一首精制曲目的典型成本: 50–100积分(所有阶段共计10–20次生成)。

完整演练:从概念到导出的一首歌

以下是单首曲目的完整制作周期,展示了每个阶段的实际提示词和决策过程:

1. 概念: “关于失眠的忧郁独立民谣。”

2. 首次生成(10积分,2个变体):

Style: Indie folk, slow tempo, acoustic guitar fingerpicking, soft female vocals, intimate lo-fi recording, melancholic
Lyrics:
[Verse 1]
The ceiling holds no answers
Just shadows and the clock
Every hour stretches longer
When the world has gone to dark

[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound

[Verse 2]
The neighbors' lights went out at ten
The street grew still by twelve
Now it's somewhere past forever
And I'm talking to myself

[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound

[Outro: fade out, humming]

3. 筛选: 变体B的人声音色恰到好处,但副歌旋律对于整体情绪来说过于欢快。变体A的副歌更好,但吉他音色单薄。

4. 优化(10积分): 调整Style后重新生成:将”lo-fi recording”改为”warm analog recording”,并添加了”sparse arrangement”。歌词保持不变。新的变体A既有第一轮的温暖感,副歌也更为内敛。

5. 扩展(5积分): 歌曲在2:30处结束。使用[Bridge: piano only, vulnerable vocals] + 新歌词 + [Chorus] + [Outro: fade out, ambient reprise]进行扩展。桥段自然地引入了钢琴。

6. 编辑(10积分): 第二段主歌到副歌的过渡过于突兀。使用Song Editor对该衔接处进行了4秒窗口的Inpainting。第二次Inpainting尝试实现了平滑过渡。

7. 导出: 下载WAV文件用于在Logic Pro中母带处理。总成本:35积分,7次生成。

核心洞察: 大部分积分花在了前两轮(找到合适的音色),而非后三轮(打磨一个好的版本)。前期精确的提示词编写相比模糊提示词反复迭代的方法,至少节省了30积分。

节省积分的工作流程技巧

  1. 把时间花在提示词上,而非生成次数上。 精心编写的Style + Lyrics提示词比用模糊提示词快速迭代能产出更好的首轮结果。
  2. 批量生成。 探索一个概念时,一次性生成4–6个变体,选定最佳方向后再进行优化。
  3. 优先使用Song Editor而非重新生成。 如果一首曲目80%的部分已经不错,编辑剩余的20%比重新生成整首歌更高效。
  4. 保存成功的Style提示词。 当某个描述词组合效果良好时,保存下来以便复用。

Suno Studio DAW

Suno Studio(Premier层级,随V5推出)是一个浏览器内的数字音频工作站,用于生成后的编辑工作。它在Suno的生成引擎与传统音乐制作之间架起了桥梁。2

Studio功能

功能 说明
多轨视图 带有独立stem轨道的可视化时间线
混音控制 每个stem的音量、声像、静音、独奏
Warp Markers 对特定段落进行时间拉伸而不影响音高
Remove FX 从stem中去除混响、延迟和其他效果
Alt Takes 为特定段落生成替代版本
拍号 调整或校正拍号解析
Stem隔离 访问多达12个独立stem进行精细混音

Studio 1.2(2026年2月)

最新的Studio更新新增了:4

  • Warp Markers:微调单个音符和乐句的时间位置
  • Remove FX:去除AI添加的混响和延迟,获得干声stem
  • Alt Takes:在时间线内生成并试听替代段落
  • 扩展的拍号支持:更好地处理3/4、6/8和非常规拍号

应该使用Studio还是导出到DAW?

场景 使用Studio 导出到DAW
快速修复(音量平衡、静音某个stem)
完整的专业混音和母带处理
尝试编曲变化
添加外部音频(现场乐器、人声)
休闲试听和分享
商业发行准备 可能

Stem分离与导出

Suno提供两个级别的stem分离:

2-stem分离(所有层级)

将音频分离为: - 人声:所有人声内容 - 伴奏:其他所有内容

适用于:卡拉OK版本、人声采样、基础混音。

12-stem分离(Pro/Premier)

将音频分离为多达12个独立stem:22 - 人声、鼓、贝斯、吉他、键盘/钢琴、合成器、弦乐、铜管、木管、打击乐、效果、其他

一个重要区别: Suno的”stem分离”与iZotope RX或Demucs等工具有本质不同。那些工具分析的是混合音频文件,试图在事后分离音源。而Suno很可能是直接导出各个生成层,因为所有音频本身就是由它创建的。其结果更接近于从DAW导出子混音,而非事后音源分离。23 实际上,Suno的stem比第三方分离工具对同一混合文件处理的结果更干净,但与原始混音进行零差测试时可能无法完全对消。

质量说明: stem之间会有一定程度的串音,尤其是频率相近的乐器之间。V5显著提升了分离质量。对于专业处理任意音频文件(非Suno生成的),Demucs和iZotope RX等专用工具仍然是行业标准。23

导出格式

  • MP3:标准压缩音频。适合分享、流媒体和草稿。
  • WAV:无压缩音频。专业DAW工作和母带处理的必需格式。

DAW集成

Suno的输出通过stem导出与传统制作工作流程进行集成。

推荐工作流程

  1. 在Suno中生成,直到编曲和氛围达到理想状态
  2. 导出12个stem(Pro/Premier)为WAV文件
  3. 导入到您的DAW(Logic Pro、Ableton、Pro Tools、FL Studio、Reaper)
  4. 混音和母带处理,使用专业工具和处理链
  5. 替换或增强个别stem,如有需要可使用现场录音

DAW混音的优势

  • EQ和压缩:逐stem的音色塑造,这是Suno的AI混音无法提供的
  • 空间处理:精确的立体声定位、混响发送、延迟投送
  • 自动化:随时间变化的动态调整(渐强构建、滤波器扫频)
  • 外部乐器:将现场录音与AI生成的stem叠加
  • 母带处理链:响度标准化、限幅、发行前的最终润色
  • 自动化脚本:使用Claude Code构建提示词模板、批量处理Style字段变体,或编写生成-筛选-优化循环的脚本

风格融合

Suno的独特优势之一是能够在风格交叉点生成音乐,而在传统制作中这需要多位不同领域的专业音乐人。

有效的融合模式

双风格融合(最可靠):

Jazz-funk fusion, slap bass, Rhodes piano, syncopated drums, groovy and sophisticated

风格 + 年代混搭:

80s synthwave meets modern trap, analog synths, 808 bass, retro-futuristic

风格 + 意外乐器:

Death metal with jazz saxophone solos, blast beats, dissonant chords

融合规则

  1. 以主导风格开头。 “Jazz with electronic elements”和”Electronic with jazz elements”会产生不同的结果。
  2. 限制在2–3种风格。 超过这个数量,Suno的输出会变成缺乏焦点的折中产物。
  3. 使用年代标记来锚定风格。 “90s”或”2020s”有助于Suno选择正确的制作规范。
  4. 增加Weirdness值以实现非常规融合。默认的Weirdness设置会尝试将一切标准化,这恰恰违背了风格融合的目的。

多段落作曲

对于超过4分钟的歌曲,您需要通过多次生成来编写并拼接各个段落。

策略1:Extend

生成第一个段落,然后使用Extend添加后续段落。每次扩展都会以前一段落的结尾作为上下文。

优点: 音乐连贯性好。每次扩展自然衔接前一段落。 缺点: 对后续段落的控制较弱。多次扩展后可能出现音乐风格偏移。

策略2:逐段独立生成

使用特定的metatag + Style组合独立生成每个段落,然后在DAW中拼接。

优点: 对每个段落的特征拥有最大控制权。 缺点: 独立生成的段落之间过渡可能显得生硬。拼接需要DAW操作技能。

策略3:混合方法(推荐)

  1. 将歌曲核心部分(主歌-副歌-主歌-副歌)作为一次生成
  2. 使用Extend添加桥段和最终副歌
  3. 使用Song Editor对薄弱的过渡部分进行Inpainting
  4. 导出stem并在DAW中完成最终处理

Prompt Chaining(提示链)

通过一系列相关的生成步骤构建复杂歌曲。

链式模式

Generation 1: "Atmospheric intro, ambient pads, slow build"
    Extend with: "[Build-Up] [Drop: full energy, heavy drums]"
    Extend with: "[Verse 1: vocals enter, riding the beat]"
    Extend with: "[Chorus: anthemic, crowd-singing energy]"
    Extend with: "[Outro: fade out, return to ambient pads]"

每次扩展都会继承前一次生成的音乐基因,无需每次从头开始即可创建一首连贯的多段式作品。


故障排除

为什么我的Suno歌曲听起来不对?

问题 可能原因 解决方案
歌曲听起来与Style提示完全不同 描述词相互冲突,或Weirdness设置过高 精简至4–5个核心描述词。降低Weirdness。
人声听起来像机器人 免费层使用的是V4.5-All模型 升级至Pro以获得V5人声质量。
歌曲突然结束 缺少[Outro]标签 在歌词中添加[Outro][End]
歌曲在自然结束点后仍继续 Suno自动填充至最大时长 在最后一个段落后添加[End]标签。
错误的流派占主导 排在第二位的流派被降低了优先级 将您的主要流派放在Style字段的最前面。
Metatags作为歌词出现 标签语法错误 检查拼写错误。标签必须使用方括号格式[Tag]
各段落之间人声不一致 未设置Persona Voice 使用Persona Voices确保跨生成的一致性。
扩展内容与原始版本不匹配 原始版本与扩展之间相隔太多代 从最近的版本进行扩展,而不是从原始版本。
纯器乐轨道出现人声痕迹 Style描述词暗示了人声 明确开启Instrumental模式。添加[Instrumental]标签。

生成质量检查清单

在花费积分进行优化之前,请确认您的提示包含以下内容:

  • [ ] 流派足够具体(不只是”rock”,而是”indie rock”或”post-punk”)
  • [ ] 描述了人声风格(或已开启Instrumental模式)
  • [ ] Metatags定义了结构(至少包含:Verse、Chorus、Outro)
  • [ ] Style字段中有4–7个描述词(不要太少,也不要太多)
  • [ ] 明确指定了情绪(Suno在没有引导时默认生成欢快/正面的风格)

商业授权

截至2026年3月验证。 授权条款可能变更。请查阅Suno当前的服务条款获取具有约束力的条款。5

各层级允许的用途

用途 Free Pro Premier
个人收听
社交媒体发布
YouTube/TikTok变现
流媒体平台(Spotify、Apple Music)
商业产品(广告、游戏、影视)
向Suno支付版税义务 不适用 无(100%归您所有) 无(100%归您所有)

重要注意事项

100% AI生成内容的版权保护在法律上尚未明确。 截至2026年,纯AI生成的音乐可能无法在美国获得版权登记。这意味着: - 您拥有商业使用权(Suno授予您许可) - 但您可能无法阻止他人使用相同或相似的输出内容 - 添加人类创作元素(原创歌词、真实乐器录音、在DAW中的编曲决策)可以增强您的版权主张

收入归您所有。 Pro和Premier用户保留Suno生成音乐的100%收入。Suno不收取版税或收入分成。5


版权与法律环境

AI音乐生成处于不断演变的法律环境中。

重要法律进展

  • Warner Music和解(2025年11月):Warner就其对Suno的诉讼达成和解。条款未公开,但Suno继续运营。6
  • UMG和Sony诉讼:各大唱片公司对Suno的诉讼截至2026年初仍在进行中。诉讼核心是指控Suno在训练数据中使用了受版权保护的录音。6
  • Udio/UMG和解(2025年):竞争对手Udio与UMG达成和解,为行业树立了一定的先例。7
  • 美国版权局:已声明纯AI生成的作品不能获得版权,但包含AI元素且具有充分人类创作的作品可能符合条件。8

实用建议

  1. 不要使用Suno复制特定的受版权保护歌曲。 Covers功能旨在翻唱Suno生成的曲目,而非商业录音。
  2. 添加人类创作元素以增强版权主张:撰写原创歌词、在Suno stem上录制真实乐器、在DAW中进行编曲决策。
  3. 记录您的创作过程。 如果您的作品受到质疑,人类创作决策的证据将增强您的立场。Obsidian等工具可以作为带时间戳的创作日志。
  4. 关注法律动态。 这一领域正在快速变化。

竞品与替代方案

平台 优势 劣势 最适用于
Suno 最佳整体歌曲质量,丰富的编辑工具,Studio DAW 无官方API,非确定性,积分不累积 完整歌曲制作
Udio 最佳stem质量(原生48kHz),流派精准度高 用户群较小,编辑工具较少 基于stem的制作
Stable Audio 官方API,音效/声音设计能力,开放权重 人声质量较弱,输出时长较短 API集成,音效
Google MusicFX 免费,易于使用 控制有限,输出较短,不可商用 休闲体验
AIVA 专注古典/影视配乐,MIDI导出 流派范围较窄 影视和游戏配乐

您应该使用哪个AI音乐生成器?

  • 带人声的完整歌曲:Suno(V5)
  • 用于DAW制作的stem:Udio(最高stem质量)
  • API驱动的生成:Stable Audio(唯一提供公开API的平台)
  • 声音设计和音效:Stable Audio
  • 影视配乐:AIVA(MIDI导出支持管弦乐编辑)
  • AI图像生成用于专辑封面:请参阅Midjourney指南,了解与音乐制作工作流程搭配良好的prompt engineering技巧

API与集成状态

截至2026年3月验证。

Suno不提供公开API。 目前没有面向个人用户或开发者的官方REST API、SDK或编程访问接口。17

现有可用方式

访问类型 状态 详情
官方公开API 不可用 无已公布的时间线
企业/合作伙伴API 私有测试 仅限邀请使用。请联系Suno销售团队。
社区封装 非官方 gcui-art/suno-api,逆向工程封装。未获Suno官方认可。可能随时失效。9
Chirp API 历史遗留 早期API访问计划。不再接受新用户。

面向开发者

如果您需要编程方式生成音乐: - Stable Audio:拥有官方API和完整的端点文档 - Replicate:托管开源音乐生成模型,提供API访问 - 自行部署:MusicGen(Meta)等开源模型可自行托管


快速参考卡片

Custom Mode模板

STYLE FIELD:
[Genre] [Subgenre], [Tempo], [Key instruments], [Vocal style], [Production], [Mood]

LYRICS FIELD:
[Intro: descriptors]

[Verse 1]
Your lyrics here

[Pre-Chorus]
Building lyrics

[Chorus]
Hook lyrics

[Verse 2]
More lyrics

[Chorus]
Same hook (for melodic repetition)

[Bridge: contrasting descriptors]
Different energy lyrics

[Chorus]
Final hook

[Outro: fade out]

常用metatags

标签 用途
[Verse] 叙事段落
[Chorus] 副歌/重复段
[Bridge] 对比段落
[Intro] 开场
[Outro] 收尾
[End] 硬停止
[Instrumental] 无人声
[Guitar Solo] 乐器独奏
[Fade Out] 渐弱结束
[Tag: descriptors] 分段控制

Creative Sliders速查表

滑块
Weirdness 常规 平衡 实验性
Style Influence 宽松解读 默认 严格遵循
Audio Influence 最小参考 平衡 强参考

定价速查

Free Pro($10/月) Premier($30/月)
积分 50/天 2,500/月 10,000/月
V5
商用
Studio

更新日志

日期 变更 来源
2026-03-04 发布审核:修正引用归属(1拆分至经过验证的来源),添加V4.5的8分钟生成时长,提示前后对比示例,完整歌曲制作流程,metatags和Creative Sliders的”为什么”解释,西方训练偏差引用,stem分离技术区分,6个新参考文献18-23,内部交叉链接,统计数据开头 质量审核
2026-03-04 质量审核:添加要点总结、如何使用本指南、Prompt Enhancement Helper章节,扩展Persona Voices内容,连接所有引用,修正Udio/UMG引用,添加年度定价和额外积分详情 质量审核
2026-03-03 指南创建,涵盖V5、定价、metatags、Studio、制作工作流程、授权许可和完整的prompt engineering参考 多个来源
2026-02-01 Suno Studio 1.2:Warp Markers、Remove FX、Alt Takes、拍号设置 4
2025-09-25 V5(chirp-crow)发布:48kHz、Studio DAW、12轨stem分离、Persona Voices 1
2025-11-01 Warner Music和解 6
2025-05-01 V4.5发布:8分钟生成时长、Creative Sliders、Prompt Enhancement Helper 19
2024-11-19 V4发布:4分钟生成时长、Covers、2轨stem分离 3

参考文献


  1. Suno V5 Release and Review。V5(chirp-crow)于2025年9月23日至25日发布。48kHz音频,广播级输出质量,Suno Studio DAW,12轨stem分离,Persona Voices。 

  2. Introducing Suno Studio。浏览器内DAW,用于生成后编辑。多轨视图、混音控制、stem隔离。 

  3. Suno Model Timeline。从V2到V5的官方模型版本历史。 

  4. Suno Studio 1.2 Master Guide。2026年2月更新:Warp Markers、Remove FX、Alt Takes、扩展拍号支持。 

  5. Suno Rights & Ownership。商业授权:Pro和Premier用户保留100%收入。免费版仅限非商业用途。 

  6. WMG and Suno Partnership。Warner于2025年11月达成和解。Suno收购了Songkick,将开发WMG授权模型。艺术家保留对姓名、形象、肖像和声音使用的控制权。 

  7. UMG Settles Udio Lawsuit, Announces Partnership。UMG与Udio于2025年10月29日达成和解。计划于2026年推出新的授权AI音乐创作平台,包含录音音乐和出版授权。 

  8. US Copyright Office on AI-Generated Works。纯AI生成的作品不受版权保护。具有充分人类创作成分的作品可能符合版权条件。 

  9. gcui-art/suno-api。非官方社区封装库。未获Suno官方认可,可能随时失效。 

  10. Suno Metatags Complete Guide。社区整理的500多个metatag列表,涵盖结构、人声、乐器和制作相关标签。 

  11. Suno Creative Sliders Guide。Weirdness、Style Influence和Audio Influence控制的官方文档。 

  12. Suno Song Editor。Replace Section、Extend、Crop和Fade操作的官方文档。 

  13. Suno Pricing Plans。当前套餐对比:Free、Pro($10/月)、Premier($30/月)。 

  14. Suno Prompt Engineering Best Practices。关于有效提示词结构和描述符用法的社区指南。 

  15. Suno AI Personas。Persona的创建、使用和限制。 

  16. Suno V5 Audio Specifications。各套餐音频质量对比:采样率、位深度、导出格式。 

  17. The Suno API Reality。官方与非官方API生态及法律风险分析。 

  18. Suno Hits 2M Paid Subscribers and $300M ARR。TechCrunch,2026年2月。每天生成700万首曲目;每两周即超越Spotify的1亿首歌曲目录。 

  19. Introducing V4.5。Suno官方公告。8分钟单次生成、Creative Sliders、Prompt Enhancement Helper、扩展流派准确性、增强人声。 

  20. Suno V5 (chirp-crow) Specifications。V5内部模型名称chirp-crow,48kHz采样率,320kbps,Persona支持,stem导出。 

  21. Missing Melodies: AI Music Generation and Its Omission of the Global South。86%的AI音乐训练数据来自全球北方流派。吉他、钢琴和鼓占训练片段的52%至67%;地区性乐器不足3%。 

  22. Suno Stem Extraction。2轨(人声+伴奏)和12轨stem提取的官方文档。 

  23. Suno Separation Quality vs SpectraLayers。讨论Suno的stem导出如何可能是重新生成各个音轨层,而非进行事后音源分离。 

NORMAL suno.md EOF