suno:~/music$ cat suno.md

Suno AI Music Generation: The Definitive Technical Reference

#

words: 8884 read_time: 41m updated: 2026-03-05 07:26
$ less suno.md

Actualizado el 4 de marzo de 2026

TL;DR: Suno genera canciones completas (voces, instrumentos, arreglo y mezcla) a partir de indicaciones de texto. V5 produce audio con calidad de transmisión a 48kHz con hasta 4 minutos por generación. Domine tres sistemas (texto de indicación + metatags + Creative Sliders) y Suno se convierte en una herramienta de producción, no en una novedad. Use Custom Mode para el control, metatags para la estructura de la canción y el Song Editor para el refinamiento iterativo. El nivel Pro ($10/mes) habilita V5 y derechos comerciales. Los créditos no se acumulan.

Los 2 millones de suscriptores de pago de Suno generan 7 millones de pistas por día, superando el catálogo completo de 100 millones de canciones de Spotify cada dos semanas.18 V5 cruzó un umbral que las versiones anteriores no podían: producir audio con el que los oyentes interactúan sin darse cuenta de que fue generado por IA.1 No como una curiosidad o un sustituto temporal, sino como música real utilizada en contextos de producción.

La diferencia entre “música de IA interesante” y “música que realmente publicaría” se reduce a comprender tres sistemas de control:

  1. Texto de indicación: Género, estado de ánimo, instrumentación y estilo vocal descritos en lenguaje natural
  2. Metatags: Directivas estructurales como [Verse], [Chorus], [Bridge] que controlan el arreglo
  3. Creative Sliders: Weirdness, Style Influence y Audio Influence que dan forma a la personalidad de la generación

El flujo de trabajo predeterminado (escribir una frase, hacer clic en generar) produce resultados inconsistentes porque Suno optimiza para el atractivo general, no para lo que usted específicamente desea. La precisión es lo que separa un resultado utilizable de resultados aleatorios.

He generado miles de pistas en todos los géneros que Suno soporta, probado cada combinación de metatags documentada y no documentada, y mapeado los límites de lo que cada versión del modelo maneja bien y mal. Esta guía destila esa experiencia en la referencia técnica definitiva.


Puntos Clave

  • Custom Mode es obligatorio para trabajo serio. Simple Mode elimina los controles que hacen de Suno una herramienta de producción. Cada técnica en esta guía asume Custom Mode con campos separados de Style, Lyrics y Title.
  • Tres sistemas de control, no uno. El texto del prompt define el carácter musical. Los metatags controlan el arreglo y la estructura. Los Creative Sliders moldean la personalidad de la generación. Dominar los tres es lo que separa resultados utilizables de resultados aleatorios.
  • Los metatags son la habilidad de mayor impacto. Una estructura [Verse]/[Chorus]/[Bridge] con modificadores parametrizados ([Verse: whispered vocals, acoustic guitar only]) le otorga control por sección que se aproxima al nivel de arreglo de un DAW mediante texto únicamente.
  • V5 cruzó el umbral de producción. El salto de V4.5 a V5 es la diferencia entre “música de IA interesante” y “música que publicaría”. Audio a 48kHz, voces naturales y separación real de instrumentos. El nivel Pro ($10/mes) es necesario para acceder a V5.
  • Itere, no rece. El ciclo de generación (idear → seleccionar → refinar → extender → editar → exportar) típicamente cuesta entre 50 y 100 créditos por pista pulida. Planifique para la iteración, no para la perfección en un solo intento.
  • Los créditos no se acumulan, pero las recargas no expiran. Los créditos mensuales se reinician en cada ciclo de facturación. Los créditos de recarga comprados persisten mientras su suscripción esté activa, lo que hace las recargas útiles para acumular antes de sesiones intensivas.13

Cómo Usar Esta Guía

Usted es… Comience aquí Luego explore
Completamente nuevo en Suno Primeros Pasos, La Arquitectura del Prompt Referencia de Metatags, Descriptores de Género y Estilo
Usuario casual que busca mejores resultados La Arquitectura del Prompt, Creative Sliders Patrones Avanzados de Metatags, Solución de Problemas
Produciendo música para publicación El Ciclo de Generación, Suno Studio DAW Integración con DAW, Licencias Comerciales
Evaluando Suno frente a alternativas ¿Qué es Suno?, Competidores y Alternativas API y Estado de Integración, Derechos de Autor y Panorama Legal

Tabla de Contenidos

Parte 1: Fundamentos

  1. ¿Qué es Suno?
  2. Primeros Pasos
  3. Modelos y Versiones
  4. Precios y Créditos

Parte 2: Prompt Engineering

  1. La Arquitectura del Prompt
  2. Asistente de Mejora de Prompts
  3. Descriptores de Género y Estilo
  4. Estilización Vocal
  5. Modo Instrumental

Parte 3: Estructura de Canciones

  1. Referencia de Metatags
  2. Etiquetas Estructurales
  3. Etiquetas Instrumentales y Vocales
  4. Patrones Avanzados de Metatags

Parte 4: Controles Creativos

  1. Creative Sliders
  2. Song Editor
  3. Covers y Remixes
  4. Persona Voices

Parte 5: Flujos de Trabajo de Producción

  1. El Ciclo de Generación
  2. Suno Studio DAW
  3. Separación de Stems y Exportación
  4. Integración con DAW

Parte 6: Técnicas Avanzadas

  1. Fusión de Géneros
  2. Composición Multi-Sección
  3. Encadenamiento de Prompts
  4. Solución de Problemas
  1. Licencias Comerciales
  2. Derechos de Autor y Panorama Legal
  3. Competidores y Alternativas

Parte 8: Referencia

  1. API y Estado de Integración
  2. Tarjeta de Referencia Rápida
  3. Registro de Cambios
  4. Referencias

¿Qué es Suno?

Suno es una plataforma de IA generativa que crea canciones completas a partir de descripciones de texto. A diferencia de los DAW, bibliotecas de samples o herramientas basadas en loops, Suno genera todos los elementos de una pista simultáneamente: melodía, armonía, ritmo, instrumentación, voces (con letra), arreglo y mezcla. Usted describe lo que desea; Suno produce una canción terminada.

¿Cómo se compara Suno con la producción musical tradicional?

Aspecto Suno Producción Tradicional
Entrada Prompt de texto + letra opcional Notas, MIDI, grabaciones de audio
Salida Canción completa mezclada Pistas individuales que requieren mezcla
Tiempo hasta el primer resultado ~30 segundos Horas a días
Conocimiento musical requerido Vocabulario descriptivo Dominio de instrumentos, teoría, mezcla
Método de iteración Re-prompt, editar secciones, ajustar sliders Re-grabar, re-arreglar, re-mezclar
Duración máxima 4 minutos por generación (extensible) Ilimitada

Lo que puede crear:

  • Canciones completas con voces: Cualquier género, cualquier idioma, letras originales o generadas por IA
  • Instrumentales: Música de fondo, bandas sonoras, pistas ambientales
  • Experimentos de género: Fusiones entre géneros que requerirían múltiples músicos especializados
  • Variaciones: Genere decenas de versiones del mismo concepto, elija la mejor
  • Elementos de producción: Stems para usar en flujos de trabajo tradicionales con DAW

Lo que Suno no es:

  • No es un DAW: No mezcla, masteriza ni arregla manualmente (aunque Studio agrega parte de esto)
  • No es determinista: El mismo prompt produce resultados diferentes cada vez
  • No es una biblioteca de samples: No puede aislar y reutilizar sonidos individuales con precisión
  • No es ilimitado: La generación consume créditos, y la calidad varía entre intentos

Primeros Pasos

Inicio rápido (5 minutos)

  1. Cree una cuenta en suno.com. El nivel gratuito otorga 50 créditos por día (aproximadamente 10 generaciones).

  2. Pruebe Simple Mode primero. Escriba una descripción breve como “upbeat indie rock song about a road trip” y haga clic en Create. Suno genera letra, melodía, arreglo y voces automáticamente.

  3. Cambie a Custom Mode para tener control. Custom Mode separa el prompt en campos distintos:

  4. Style of Music: Descriptores de género, estado de ánimo e instrumentación
  5. Lyrics: Su letra con metatags para la estructura
  6. Title: Título de la canción

  7. Escuche ambos resultados. Suno genera dos variaciones por creación. Elija la más cercana a su intención y luego refine.

  8. Use Extend para continuar una canción más allá de su generación inicial, o Song Editor para reemplazar secciones específicas.

Descripción general de la interfaz

La interfaz web de Suno tiene dos modos principales de creación:

Simple Mode: Un campo de texto. Describa la canción en lenguaje natural. Suno infiere el género, escribe la letra y genera todo. Bueno para exploración, malo para precisión.

Custom Mode: Tres campos separados (Style, Lyrics, Title) más Creative Sliders. Custom Mode es donde ocurre el trabajo serio. El campo Style acepta descriptores de género y producción. El campo Lyrics acepta texto con metatags. Los sliders controlan la personalidad de la generación.

Comience con Custom Mode. Simple Mode es conveniente pero elimina los controles que hacen de Suno una herramienta útil para trabajo de producción. Cada técnica en esta guía asume Custom Mode.


Modelos y versiones

Suno ha iterado rápidamente desde su lanzamiento. Cada versión trae mejoras significativas en calidad, pero el acceso varía según el nivel de suscripción.

Cronología de versiones

Versión Lanzamiento Mejoras clave
V2 Otoño 2023 Primer modelo público. Clips cortos (~30s), rango de géneros limitado, artefactos de IA evidentes.
V3 Marzo 2024 Ampliado a 2 minutos. Mejor claridad vocal. Cobertura de géneros expandida.
V3.5 Verano 2024 Mejor mezcla, artefactos reducidos, naturalidad vocal mejorada.
V4 19 de noviembre de 2024 Salto importante en calidad. Generaciones de 4 minutos, voces multilingües, función Covers, separación de 2 stems.
V4.5 1 de mayo de 2025 Generación única de 8 minutos (antes 4 min), Creative Sliders (Weirdness, Style Influence), asistente de mejora de prompts, mayor precisión de géneros, voces mejoradas.19
V4.5-All Finales de 2025 Modelo para el nivel gratuito. Combina las mejoras de V4.5 con acceso más amplio.
V5 Septiembre 2025 Modelo insignia actual. Audio a 48kHz20, calidad de transmisión profesional, Suno Studio DAW2, separación de 12 stems22, Persona Voices15. Nombre interno: chirp-crow.20

Acceso actual a modelos

Nivel Acceso a modelos Notas de calidad
Free V4.5-All Buena calidad, notablemente inferior a V5 en naturalidad vocal y claridad de mezcla
Pro ($10/mes) V5 Calidad de transmisión profesional. Mejora significativa en realismo vocal, separación de instrumentos y rango dinámico
Premier ($30/mes) V5 + Studio Misma calidad de generación que Pro, más Suno Studio DAW para edición posterior a la generación

V5 es una mejora significativa respecto a V4.5. La diferencia es más audible en la naturalidad vocal (menos calidad de “cantante de IA”), la claridad en frecuencias bajas (separación de bajo y bombo) y la imagen estéreo. Si está evaluando Suno para uso en producción, evalúe con V5, no con el nivel gratuito.

Qué cambió V5

V5 (internamente llamado “chirp-crow”20) representa la mayor mejora en una sola versión de Suno:1

  • Frecuencia de muestreo de 48kHz: Aumentada desde 44.1kHz en V4.5. Detalle audiblemente superior en altas frecuencias con monitores de estudio y audífonos de calidad.1620
  • Naturalidad vocal: Reducción de la calidad de “valle inquietante” que caracterizaba versiones anteriores. El vibrato, los sonidos de respiración y la articulación de consonantes son más convincentes.1
  • Separación de instrumentos: Los instrumentos individuales en la mezcla son más definidos. Menos fusión tipo “muro de sonido”.1
  • Rango dinámico: Mejor manejo de transiciones de suave a fuerte. Las versiones anteriores tendían a comprimir todo.1
  • Precisión de géneros: Mejor adherencia a las convenciones de cada género. Un prompt de “jazz” suena más auténticamente jazz, no “pop con acordes de jazz”.19
  • Suno Studio: DAW en el navegador para edición posterior a la generación. Ajuste de mezcla, aislamiento de stems y cambios de arreglo sin necesidad de regenerar.2

Precios y créditos

Verificado a marzo de 2026. Los precios de Suno cambian sin previo aviso. Consulte suno.com/pricing para las tarifas actuales.13

Comparación de planes

Función Free Pro ($10/mes) Premier ($30/mes)
Facturación anual N/A $8/mes ($96/año) $24/mes ($288/año)
Créditos 50/día 2.500/mes 10.000/mes
Modelo V4.5-All V5 V5
Generaciones por día ~10 ~500 ~2.000
Song Editor Limitado Completo Completo
Covers/Remixes No
Persona Voices No
Suno Studio No No
Separación de stems 2 stems 2 stems + 12 stems 2 stems + 12 stems
Uso comercial No
Generación prioritaria No
Acumulación de créditos N/A No No
Créditos adicionales No

Economía de créditos

Cada generación cuesta aproximadamente 5 créditos y produce 2 variaciones de canción. Los 2.500 créditos mensuales de una suscripción Pro generan aproximadamente 500 generaciones (1.000 variaciones de canción).

Prácticas eficientes con los créditos: - Use Custom Mode con prompts específicos para reducir generaciones descartables - Extienda pistas prometedoras en lugar de regenerar desde cero - Use el Song Editor para corregir secciones en lugar de regenerar canciones completas - Ahorre créditos refinando su prompt de estilo antes de generar

Los créditos mensuales no se acumulan. Los créditos no utilizados al final de un ciclo de facturación se pierden. Planifique sus sesiones de generación en consecuencia.

Los créditos adicionales no expiran. Los créditos adicionales comprados persisten indefinidamente mientras su suscripción permanezca activa. Si cancela su suscripción, los créditos adicionales quedan inutilizables hasta que se suscriba nuevamente. Esta persistencia hace que los créditos adicionales sean útiles para acumular antes de sesiones de producción intensivas.13


La arquitectura del prompt

El Custom Mode de Suno divide su entrada creativa en tres campos, cada uno con un propósito distinto. Comprender qué va en cada campo (y qué no) es la diferencia entre resultados inconsistentes y una producción consistente.

El campo Style

El campo Style define el carácter musical de su generación. Acepta descriptores en lenguaje natural para género, estado de ánimo, tempo, instrumentación, calidad vocal y estilo de producción.

La fórmula óptima:

[Genre] [Subgenre], [Tempo/Energy], [Key instruments], [Vocal style], [Production quality], [Mood]

Ejemplo:

Indie folk rock, mid-tempo, acoustic guitar and mandolin, warm female vocals, lo-fi production, nostalgic and wistful

El punto ideal de descriptores: 4–7 descriptores. Menos de 4 le da a Suno demasiada libertad. Más de 7 y los descriptores comienzan a competir entre sí, produciendo resultados confusos donde ninguna cualidad individual se destaca con claridad.14

Antes y después: la precisión del prompt importa

La misma intención creativa produce resultados muy diferentes dependiendo de la precisión del campo Style:

Prompt vago (2 descriptores):

rock, energetic

Resultado: Pop-rock genérico con batería estándar, guitarra distorsionada y una voz masculina que adopta por defecto un tono apto para radio. Suno llena cada parámetro no especificado con su opción predeterminada más popular. En 10 generaciones, ninguna suena relacionada con las demás.

Prompt preciso (6 descriptores):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production

Resultado: Garage rock consistente con un carácter lo-fi identificable. La batería suena captada con micrófono de ambiente, el bajo es dominante, las voces son crudas. En 10 generaciones, todas comparten una identidad sonora reconocible. Las diferencias están en la melodía y el arreglo, no en el carácter fundamental.

Por qué la diferencia: Cada descriptor restringe una dimensión de la salida. “Rock” por sí solo deja el tempo, estilo vocal, calidad de producción, balance instrumental y estado de ánimo completamente a criterio de Suno. Agregar “garage” restringe las convenciones del subgénero, “lo-fi production” restringe la textura sonora, “shouted male vocals” restringe la entrega vocal. El modelo tiene menos espacio para recurrir a opciones genéricas.

Prompt sobre-especificado (10+ descriptores):

Garage rock, raw and aggressive, distorted bass, room mic drums, shouted male vocals, lo-fi production, 145 BPM, minor key, reverb-heavy, vintage tube amp warmth, 1960s Detroit influence

Resultado: Un compromiso confuso. Suno no puede honrar todas las restricciones simultáneamente, por lo que satisface parcialmente cada una. La “1960s Detroit influence” puede entrar en conflicto con “145 BPM”, y “reverb-heavy” pelea con “lo-fi production”. La salida suena desorientada en lugar de específica.

Qué funciona en el campo Style

Tipo de descriptor Ejemplos Efecto
Género rock, jazz, hip-hop, EDM, classical, country Marco musical principal
Subgénero shoegaze, bossa nova, trap, dubstep, baroque Acota las convenciones del género
Tempo slow, mid-tempo, upbeat, fast, 120 BPM Controla la velocidad (los valores de BPM son aproximados, no exactos)
Instrumentos acoustic guitar, synth pad, brass section, strings Sugiere instrumentación (no garantizada)
Calidad vocal raspy male vocals, ethereal female vocals, choir Da forma al carácter vocal
Producción lo-fi, polished, raw, overdriven, clean Textura sonora general
Estado de ánimo melancholic, euphoric, aggressive, dreamy, dark Tono emocional
Época 80s, 90s grunge, 2000s pop, vintage, modern Convenciones específicas del período

Qué no funciona en el campo Style

  • Nombres de artistas específicos: “Sounds like Adele” no es confiable y puede ser filtrado. Use equivalentes descriptivos: “powerful female vocal, piano-driven pop ballad”
  • Términos técnicos de mezcla: “Sidechain compression on the kick” es ignorado. Suno no interpreta parámetros de mezcla
  • Control exacto de BPM: “127 BPM” se trata como una guía aproximada, no como un bloqueo de metrónomo
  • Instrucciones negativas: “No drums” en el campo Style no es confiable. Use el interruptor Instrumental o metatags para control estructural

El campo Lyrics

El campo Lyrics acepta el texto de su canción con metatags opcionales para control estructural. Sin metatags, Suno infiere la estructura a partir de los saltos de línea y los patrones del contenido.

Letra básica (sin metatags):

Walking down the empty road
Headlights fading in the rain
Every mile feels like a year
But I keep driving through the pain

Letra con metatags (recomendado):

[Verse 1]
Walking down the empty road
Headlights fading in the rain

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Verse 2]
Every mile feels like a year
But the horizon's getting bright

[Chorus]
Keep driving, keep driving
Through the storm and through the night

[Outro]
And the sun comes up again

Use siempre metatags. Sin ellos, Suno toma decisiones estructurales que pueden no coincidir con su intención. Una etiqueta [Chorus] asegura repetición y énfasis melódico. Una etiqueta [Bridge] señala una desviación armónica. Estas señales estructurales mejoran drásticamente la consistencia de la salida.

El campo Title

El campo Title nombra su generación. Tiene un efecto mínimo en la salida musical, pero aparece en los metadatos y en la biblioteca de Suno. Manténgalo descriptivo para su propia organización.


Asistente de mejora de prompts

Introducido en V4.5, el Prompt Enhancement Helper es una función impulsada por IA que reescribe su prompt del campo Style antes de la generación. Cuando está habilitado, Suno expande sus descriptores en un prompt más detallado que el modelo puede interpretar con mayor precisión.14

Cómo funciona

  1. Usted escribe un prompt de Style: indie rock, energetic
  2. El asistente lo expande a algo como: Energetic indie rock, driving electric guitars, punchy drums, dynamic bass, bright and raw production, anthemic and youthful
  3. Suno genera a partir del prompt expandido, no del original

Cuándo usarlo

Escenario ¿Usar el asistente? Por qué
Prompts cortos y vagos El asistente agrega especificidad que usted no proporcionó
Explorando un género nuevo Revela descriptores que quizás no conozca
Prompts precisos y detallados (5+ descriptores) No El asistente puede anular o diluir su intención
Repitiendo un prompt de Style que ya funcionó No Usted quiere consistencia, no reinterpretación

Comportamiento importante

  • El asistente es no determinista: reescribe de forma diferente cada vez, incluso para la misma entrada
  • Puede ver el prompt expandido después de la generación para aprender qué descriptores Suno consideró útiles
  • El prompt expandido es una buena herramienta de aprendizaje: genere una vez con el asistente, lea la expansión y luego use esos descriptores directamente en futuros prompts sin el asistente
  • Desactívelo para trabajo de producción donde desee control exacto sobre lo que Suno recibe

Use el asistente para aprender, no para depender de él. Extraiga descriptores útiles de sus expansiones, agréguelos a su propio vocabulario y escriba prompts precisos usted mismo. Los mejores resultados provienen de prompts que usted controla completamente.


Descriptores de género y estilo

Suno reconoce cientos de términos de género y estilo. Las investigaciones muestran que aproximadamente el 86% de los datos de entrenamiento de modelos de música con IA proviene de géneros del Norte Global, con instrumentos como guitarra, piano y batería comprendiendo del 52 al 67% de los clips de entrenamiento, mientras que los instrumentos regionales representan menos del 3%.21 La precisión de los géneros varía según la especificidad y el origen cultural como consecuencia directa.

Géneros de alta confianza (resultados consistentes)

Estos géneros producen resultados confiablemente precisos porque están bien representados en los datos de entrenamiento:

Género Descriptores efectivos Notas
Pop pop, synth-pop, indie pop, dream pop, electropop El género más fuerte de Suno. El comportamiento predeterminado tiende hacia el pop si no se especifica.
Rock rock, indie rock, alt-rock, classic rock, punk rock, post-punk Buena separación de instrumentos. Los tonos de guitarra son convincentes.
Hip-Hop/Rap hip-hop, trap, boom bap, lo-fi hip-hop, conscious rap Las voces de rap funcionan bien en V5. El flujo y la interpretación son controlables mediante el formato de las letras.
Electronic/EDM EDM, house, techno, trance, drum and bass, dubstep Fuerte en estructuras de build-drop. Las texturas de sintetizador son variadas.
R&B/Soul R&B, neo-soul, contemporary R&B, motown Calidad vocal suave. Bueno en arreglos basados en groove.
Country country, country rock, outlaw country, bluegrass Los instrumentos acústicos están bien logrados. El pedal steel y el banjo son reconocibles.
Folk folk, indie folk, folk rock, Americana Enfoque acústico. Estilos vocales naturales.
Jazz jazz, smooth jazz, jazz fusion, bebop, swing Mejoró significativamente en V5. La complejidad armónica es audiblemente mejor que en V4.

Géneros de confianza media (utilizables con orientación)

Género Descriptores efectivos Notas
Metal metal, heavy metal, death metal, black metal, metalcore Los tonos de guitarra distorsionada funcionan bien. Las voces extremas (guturales, gritos) son inconsistentes.
Clásica classical, orchestral, chamber music, symphony Bueno en arreglos orquestales básicos. El contrapunto complejo es débil.
Latina reggaeton, salsa, bossa nova, cumbia, bachata Los patrones rítmicos son generalmente precisos. La especificidad de los instrumentos varía.
Afrobeats afrobeats, afropop, highlife En mejora. La precisión rítmica es mejor en V5 que en V4.
K-Pop/J-Pop K-pop, J-pop, city pop El estilo de producción es reconocible. El idioma vocal puede predeterminar al inglés a menos que las letras especifiquen lo contrario.

Géneros de baja confianza (requiere iteración)

Género Descriptores efectivos Notas
Microtonal/Avant-garde avant-garde, experimental, noise Impredecible. Los resultados son creativos pero rara vez coinciden con la intención.
Tradicional/Folk (no occidental) gamelan, raga, Tuvan throat singing Datos de entrenamiento limitados. Los resultados son aproximaciones en lugar de recreaciones auténticas.
Diseño sonoro/SFX ambient drone, soundscape Mejor manejado por Stable Audio. Suno optimiza para la estructura de canciones.

Estilización vocal

El carácter vocal es uno de los aspectos más controlables de la salida de Suno. V5 mejoró significativamente la naturalidad y expresividad vocal.

Descriptores vocales

Descriptor Efecto
Género “male vocals”, “female vocals”, “androgynous vocals”
Tono “warm”, “bright”, “dark”, “rich”, “thin”, “breathy”
Técnica “raspy”, “smooth”, “vibrato”, “falsetto”, “belt”, “whisper”
Estilo “soulful”, “punk”, “operatic”, “conversational”, “spoken word”
Procesamiento “reverb-heavy”, “dry vocals”, “auto-tuned”, “distorted”, “lo-fi”
Armonía “harmonized”, “choir”, “backing vocals”, “vocal layering”

Combinación de descriptores vocales

Apile 2–3 descriptores vocales para un control preciso:

Raspy male vocals with subtle vibrato, lo-fi warmth
Ethereal female vocals, breathy and reverb-heavy, choir harmonies
Deep baritone, smooth jazz delivery, minimal processing

Idioma y voces multilingües

Suno V5 soporta generación vocal multilingüe. El modelo infiere el idioma a partir de las letras. Para letras en idiomas distintos al inglés:

  • Escriba las letras en el idioma deseado en el campo Lyrics
  • Opcionalmente agregue el idioma al campo Style: “Japanese city pop, female vocals”
  • Los mejores resultados se obtienen en inglés, español, portugués, francés, japonés, coreano y mandarín
  • Los idiomas menos representados pueden producir pronunciación con acento o imprecisa

Modo Instrumental

Active Instrumental en Custom Mode para generar pistas sin voces. El campo Style se convierte en la única entrada creativa.

¿Cuándo debería usar el modo instrumental?

  • Música de fondo: Intros de podcasts, bandas sonoras de video, música ambiental para trabajar
  • Elementos de producción: Bases de beats, progresiones de acordes, texturas atmosféricas
  • Exploración de géneros: Pruebe descriptores de género sin la calidad vocal como variable
  • Integración con DAW: Genere pistas de acompañamiento para grabación vocal en vivo

Patrones de prompts instrumentales

Sin voces, el campo Style necesita más detalle descriptivo para compensar:

Cinematic orchestral score, sweeping strings, French horns, timpani rolls, epic and triumphant, Hans Zimmer inspired
Lo-fi hip-hop beat, jazzy piano chords, vinyl crackle, mellow drums, study music
Ambient electronic, pad textures, slow evolving synths, ethereal and spacious, Brian Eno inspired

Consejo: Incluso en modo instrumental, agregue metatags [Instrumental] o [Instrumental Break] en el campo Lyrics para reforzar la intención y controlar la estructura del arreglo.


Referencia de Metatags

Los metatags son el lenguaje de control estructural de Suno. Colocados en el campo Lyrics dentro de corchetes, dirigen el arreglo, la instrumentación, la dinámica y el comportamiento vocal. Los metatags transforman a Suno de un juguete de prompt-a-canción en una herramienta de composición.10

Cómo funcionan los metatags

Los metatags se procesan como directivas de arreglo, no como letras. Cuando Suno encuentra [Chorus]: 1. Señala un cambio de sección en el arreglo 2. Aplica características típicas de coro (énfasis melódico, instrumentación más completa, mayor energía) 3. Si el mismo texto [Chorus] aparece nuevamente, intenta repetir la melodía y el arreglo

Los metatags no distinguen entre mayúsculas y minúsculas: [VERSE], [Verse] y [verse] son equivalentes.

Por qué los metatags importan más que el texto del prompt: Sin metatags, Suno infiere la estructura de la canción a partir de los saltos de línea y el contenido de las letras. El modelo adivina dónde termina un verso y dónde comienza un coro basándose en patrones de entrenamiento. Los metatags eliminan las conjeturas. En lugar de esperar que Suno reconozca su coro como un coro, [Chorus] activa explícitamente el comportamiento musical apropiado para un coro: ganchos melódicos, instrumentación más completa, mayor energía y repetición en apariciones posteriores. El efecto se acumula a lo largo de una canción completa. Una pista de 3 minutos sin metatags tiene quizás 6–8 decisiones estructurales tomadas por la inferencia de Suno. Una pista con metatags tiene 6–8 decisiones estructurales tomadas por usted.


Tags estructurales

Estos tags definen las secciones de la canción y controlan el flujo del arreglo.

Tags estructurales primarios

Tag Propósito Efecto musical
[Intro] Sección de apertura Generalmente instrumental o dispersa, establece el tono
[Verse] o [Verse 1] Sección de verso Energía moderada, enfoque narrativo, melodía variada
[Pre-Chorus] Construye hacia el coro Energía ascendente, armonía transicional
[Chorus] Gancho/estribillo Energía máxima, melodía memorable, instrumentación completa
[Post-Chorus] Después del coro Mantiene la energía, transiciona hacia abajo
[Bridge] Sección contrastante Acordes diferentes, energía diferente, proporciona variedad
[Breakdown] Sección reducida Instrumentación reducida, crea espacio
[Build] o [Build-Up] Rampa de energía Aumento progresivo de intensidad, común en EDM
[Drop] Clímax de alta energía Máxima instrumentación y energía, sigue a un build
[Hook] Frase pegadiza Frase musical corta y memorable
[Interlude] Pausa instrumental Conecta secciones, limpia el paladar sonoro
[Outro] Sección de cierre Reduce la energía, proporciona cierre
[End] Parada abrupta Señala que la canción debe terminar (evita audio residual)

Secciones numeradas

Use números para distinguir tipos de secciones repetidas:

[Verse 1]
First verse lyrics here

[Chorus]
Chorus lyrics

[Verse 2]
Second verse with different lyrics

[Chorus]
Same chorus lyrics (encourages melodic repetition)

Numerar los versos ayuda a Suno a entender que cada verso debe tener una melodía diferente mientras que los coros deben repetir su melodía.


Tags instrumentales y vocales

Estos tags controlan la instrumentación y el comportamiento vocal dentro de las secciones.

Tags instrumentales

Tag Efecto
[Instrumental] Sección sin voces
[Instrumental Intro] Apertura instrumental
[Instrumental Break] Sección instrumental a mitad de canción
[Guitar Solo] Pasaje instrumental enfocado en guitarra
[Piano Solo] Pasaje enfocado en piano
[Drum Solo] Pasaje enfocado en percusión
[Bass Solo] Pasaje enfocado en bajo
[Saxophone Solo] Pasaje enfocado en saxofón
[Strings Rise] Crescendo de sección de cuerdas
[Percussion Break] Desglose enfocado en ritmo
[Synth Solo] Pasaje de sintetizador principal

Tags vocales

Tag Efecto
[Male Vocal] Cambia a voz masculina
[Female Vocal] Cambia a voz femenina
[Duet] Dos partes vocales
[Choir] Voces corales
[Harmony] Armonías vocales
[Rap] Interpretación de rap
[Spoken Word] Interpretación hablada, no cantada
[Whisper] Interpretación susurrada
[Scream] Interpretación gritada (metal, punk)
[Ad-lib] Frases vocales improvisadas
[Humming] Melodía tarareada
[Backing Vocals] Partes vocales de fondo

Patrones avanzados de metatags

Metatags parametrizados

Los metatags aceptan modificadores descriptivos después de dos puntos:

[Verse: whispered vocals, acoustic guitar only]
Walking through the morning mist
The world still sleeping, still

[Chorus: full band, powerful vocals]
But I'm awake, I'm alive
And every sound is a sign

La sintaxis con dos puntos le permite modificar secciones individuales sin cambiar el campo Style global. Los metatags parametrizados son la función más poderosa de los metatags, ya que ofrecen control por sección sobre el arreglo.

Metatags dinámicos y de producción

Tag Efecto
[Fade In] Aumento gradual de volumen
[Fade Out] Disminución gradual de volumen
[Silence] Pausa breve en el audio
[Crescendo] Intensidad creciente
[Decrescendo] Intensidad decreciente
[Tempo: slow] Cambio de tempo a nivel de sección
[Key Change] Modulación armónica

Combinación de tags estructurales y modificadores

[Intro: ambient pads, reversed guitar, ethereal]
[Verse 1: lo-fi drums, muted bass, whispered vocals]
Words that float on morning air
Disappearing into light

[Pre-Chorus: building energy, adding layers]
But something shifts beneath the surface

[Chorus: full production, soaring vocals, epic drums]
We break through the silence
Into the wide open sky

[Bridge: stripped down, piano only, vulnerable vocals]
And in the quiet after the storm

[Outro: fade out, ambient reprise]

El resultado es un control de arreglo comparable al de un DAW, logrado únicamente mediante texto.


Creative Sliders

Los Creative Sliders son controles de V4.5+ que moldean la personalidad de la generación. Aparecen en Custom Mode debajo del campo de letras.11

Por qué los sliders existen junto con los prompts de texto: Los prompts de texto definen qué generar (género, instrumentos, atmósfera). Los sliders controlan cómo el modelo interpreta esos prompts. Un prompt de “jazz” con Weirdness bajo produce un estándar de jazz convencional. El mismo prompt con Weirdness alto produce jazz que rompe sus propias convenciones. El prompt define el vocabulario; los sliders definen la gramática.

Weirdness

Rango: Safe ← → Chaos (slider, sin valores numéricos expuestos)

Posición Efecto
Safe (izquierda) Estructura convencional, adherencia predecible al género, elecciones melódicas seguras
Centro (predeterminado, ~50%) Equilibrado. Algunas sorpresas creativas dentro de las convenciones del género
Chaos (derecha) Estructuras no convencionales, elecciones armónicas inesperadas, fusión de géneros. Mayor riesgo de incoherencia

Por qué Weirdness funciona de esta manera: El slider ajusta la temperatura de muestreo del modelo durante la generación. Con valores bajos, Suno elige el evento musical más probable en cada paso, produciendo resultados convencionales. Con valores altos, los eventos de menor probabilidad se seleccionan con más frecuencia, produciendo combinaciones sorprendentes. La compensación es la coherencia: alta probabilidad = predecible pero pulido; baja probabilidad = creativo pero potencialmente incoherente.

Cuándo aumentar Weirdness: - Géneros experimentales o de vanguardia - Cuando los resultados convencionales se sienten genéricos - Para experimentos de fusión de géneros

Cuándo disminuir Weirdness: - Música comercial que necesita sonar “normal” - Cuando se trabaja dentro de convenciones estrictas de género - Para música ambiental o de fondo que no debe llamar la atención sobre sí misma

Style Influence

Rango: Loose ← → Strong (slider)

Posición Efecto
Loose (izquierda) Los descriptores de estilo son sugerencias, no mandatos. Suno toma más libertad creativa
Centro (predeterminado) Adherencia equilibrada a los descriptores de estilo
Strong (derecha) Adherencia estricta a los descriptores de estilo. Menos desviación creativa

Use Strong cuando su campo Style es preciso y desea exactamente lo que describió. Use Loose cuando quiera que Suno interprete su prompt con más libertad y potencialmente le sorprenda.

Audio Influence

Rango: Controla cuánto influye cualquier audio de referencia subido en la generación.

Disponible al usar Audio Upload (Covers, Remixes o Add Vocals/Instrumentals). Valores más altos hacen que la salida siga más de cerca las características del audio de referencia.


Song Editor

El Song Editor permite la edición posterior a la generación sin necesidad de recrear la canción completa. El Song Editor resuelve el problema de “el 90% es perfecto, pero una sección está mal”.12

Operaciones disponibles

Operación Qué hace Cuándo usarla
Inpainting Reemplaza un rango de tiempo específico con contenido nuevo Un verso es débil pero el coro es perfecto
Extend Continúa la canción más allá de su punto final actual La canción termina demasiado pronto o necesita otra sección
Crop Recorta la canción a una duración más corta Eliminar silencio final o secciones no deseadas
Fade In/Out Aplica cambios graduales de volumen al inicio/final Pulido profesional de intro/outro
Replace Section Regenera una sección con nuevas instrucciones Un puente no funciona tonalmente

Flujo de trabajo de Inpainting

  1. Seleccione el rango de tiempo a reemplazar (arrastre sobre la forma de onda)
  2. Opcionalmente proporcione nuevas letras/metatags para la sección de reemplazo
  3. Genere: Suno crea contenido nuevo que coincide con el audio circundante
  4. Escuche y compare. Acepte o regenere.

Inpainting es iterativo. Rara vez el primer reemplazo coincide perfectamente con el contexto circundante. Prevea de 2 a 5 intentos para obtener resultados sin costuras.

Flujo de trabajo de Extend

  1. Haga clic en Extend en cualquier generación existente
  2. Opcionalmente proporcione letras/metatags para la continuación
  3. Suno genera ~30–60 segundos de audio nuevo que continúa desde el punto final
  4. Cada extensión es una generación separada (consume créditos)

Mejor práctica: Incluya un metatag estructural al inicio de su prompt de extensión (por ejemplo, [Chorus] o [Outro]) para guiar lo que genera la extensión.


Covers y Remixes

Los niveles Pro y Premier pueden crear covers y remixes de pistas existentes de Suno.

Covers

Suba o seleccione una pista existente de Suno como referencia, luego aplique un nuevo estilo:

Style: Acoustic folk cover, fingerpicked guitar, soft female vocals, intimate production

El cover mantiene la melodía y las letras, pero reimagina el arreglo y la producción.

Remixes

Los remixes toman una pista existente y la transforman de manera más agresiva que los covers:

Style: EDM remix, heavy bass, 128 BPM, drop-focused, festival energy

Add Vocals / Add Instrumentals

Dos modos especializados que se superponen al audio existente:

  • Add Vocals: Suba una pista instrumental, Suno genera vocales sobre ella
  • Add Instrumentals: Suba una pista vocal, Suno genera instrumentación detrás de ella

Ambos modos integran Suno en flujos de trabajo de producción tradicionales: grabe vocales reales y deje que Suno genere la pista de acompañamiento, o viceversa.


Persona Voices

Persona Voices (Pro/Premier) le permite crear y reutilizar personajes vocales consistentes a lo largo de las generaciones. En lugar de esperar que cada generación asigne una voz similar, usted define una persona y la referencia.15

Crear una Persona Voice

  1. Genere una canción con vocales que le gusten
  2. Haga clic en el menú de tres puntos en esa generación y seleccione “Create Persona”
  3. Nombre la persona de forma descriptiva (por ejemplo, “Warm Alto Folk”, “Raspy Baritone Rock”, “Ethereal Soprano”)
  4. La persona se guarda en la biblioteca de su cuenta

Consejos para crear personas efectivas: - Genere específicamente para la persona, no como efecto secundario de otra canción. Use un prompt de Style claro y apropiado para el género, con vocales prominentes. - Evite crear personas a partir de canciones con procesamiento vocal intenso (auto-tune, distorsión). La persona captura el sonido procesado, no la voz subyacente. - Cree personas específicas por género en lugar de una voz “universal”. Una persona entrenada con una pista de indie folk produce resultados impredecibles en un beat de trap.

Uso de Persona Voices

En Custom Mode, seleccione su persona guardada desde el menú desplegable Persona antes de generar. La persona se aplica a todas las generaciones en esa sesión hasta que la cambie.

Comportamiento de la persona: - La persona preserva el timbre (tono vocal, resonancia) y el estilo de interpretación básico (susurrante, rasposo, suave) - No preserva patrones melódicos exactos, fraseo ni interpretación rítmica. Esos provienen del prompt de Style y los metatags - Aplicar una persona en diferentes tempos y tonalidades funciona bien. Aplicarla en géneros muy diferentes (por ejemplo, una persona de jazz en death metal) produce resultados inconsistentes.

Gestión de personas

  • Límite de almacenamiento: Suno permite guardar múltiples personas (el límite exacto no está documentado públicamente, pero los usuarios reportan más de 20 sin problemas)
  • Convención de nombres: Use nombres descriptivos que incluyan la calidad vocal y el contexto del género. Olvidará cuál era “Voice 3”
  • Eliminación: Las personas pueden eliminarse de su biblioteca. La eliminación es irreversible.
  • Específicas por cuenta: Las personas no pueden compartirse entre cuentas ni exportarse

Limitaciones

  • Persona Voices captura el timbre y el estilo de interpretación básico, no la técnica vocal exacta
  • Los resultados varían al aplicar una persona muy fuera de su género original
  • Persona Voices son específicas por cuenta y no pueden compartirse
  • La actualización de diciembre de 2025 mejoró la consistencia de las personas entre generaciones, pero la reproducción perfecta aún no está garantizada15

El ciclo de generación

El uso efectivo de Suno sigue un flujo de trabajo iterativo, no un enfoque de un solo prompt.

El ciclo de producción

1. IDEACIÓN
    Genere 5-10 variaciones con diferentes descriptores de Style
    (Costo: ~25-50 créditos)

2. SELECCIÓN
    Elija los 1-2 mejores resultados
    Identifique qué funciona y qué no

3. REFINAMIENTO
    Ajuste los descriptores de Style según lo que escuchó
    Refine las letras y los metatags
    Regenere con prompts más precisos
    (Costo: ~15-30 créditos por ronda)

4. EXTENSIÓN
    Extienda la mejor pista a duración completa
    Agregue secciones faltantes (bridge, outro)
    (Costo: ~5-15 créditos)

5. EDICIÓN
    Use Song Editor para corregir secciones débiles
    Aplique Inpainting, Crop, Fade según sea necesario
    (Costo: ~5-20 créditos)

6. EXPORTACIÓN
    Descargue el audio final (MP3/WAV)
    Opcionalmente exporte stems para trabajo en DAW

Costo típico de una pista pulida: 50–100 créditos (10–20 generaciones en todas las etapas).

Ejemplo práctico: una canción desde el concepto hasta la exportación

A continuación se muestra un ciclo de producción completo para una sola pista, con los prompts reales y las decisiones en cada etapa:

1. Concepto: “Canción indie folk melancólica sobre el insomnio.”

2. Primera generación (10 créditos, 2 variaciones):

Style: Indie folk, slow tempo, acoustic guitar fingerpicking, soft female vocals, intimate lo-fi recording, melancholic
Lyrics:
[Verse 1]
The ceiling holds no answers
Just shadows and the clock
Every hour stretches longer
When the world has gone to dark

[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound

[Verse 2]
The neighbors' lights went out at ten
The street grew still by twelve
Now it's somewhere past forever
And I'm talking to myself

[Chorus]
Sleep won't come, sleep won't come
I'm counting every sound

[Outro: fade out, humming]

3. Selección: La variación B tiene el tono vocal adecuado, pero la melodía del estribillo es demasiado alegre para el ambiente. La variación A tiene un mejor estribillo pero un sonido de guitarra delgado.

4. Refinamiento (10 créditos): Se regeneró con el Style ajustado: se cambió “lo-fi recording” por “warm analog recording” y se agregó “sparse arrangement.” Se mantuvieron las mismas letras. La nueva variación A tiene la calidez de la primera ronda y un estribillo más contenido.

5. Extensión (5 créditos): La canción termina a los 2:30. Se extendió con [Bridge: piano only, vulnerable vocals] + nuevas letras + [Chorus] + [Outro: fade out, ambient reprise]. El bridge introduce el piano de forma natural.

6. Edición (10 créditos): La transición del verso 2 al estribillo es abrupta. Se usó Song Editor para aplicar Inpainting en una ventana de 4 segundos en esa unión. El segundo intento de Inpainting encaja de forma fluida.

7. Exportación: Se descargó WAV para masterización en Logic Pro. Costo total: 35 créditos, 7 generaciones.

La idea clave: la mayor parte de los créditos se destinaron a las dos primeras rondas (encontrar el sonido adecuado), no a las tres últimas (refinar una buena toma). Invertir en la precisión del prompt desde el inicio ahorró al menos 30 créditos en comparación con enfoques de prompt vago e iteración.

Consejos para un flujo de trabajo eficiente en créditos

  1. Dedique tiempo al prompt, no a las generaciones. Un prompt de Style + Lyrics bien elaborado produce mejores primeros resultados que la iteración rápida con prompts vagos.
  2. Genere en lotes. Al explorar un concepto, genere 4–6 variaciones a la vez y luego elija la mejor dirección antes de refinar.
  3. Use Song Editor en lugar de regenerar. Si el 80% de una pista es bueno, edite el 20% restante en lugar de regenerar la canción completa.
  4. Guarde los prompts de Style exitosos. Cuando una combinación particular de descriptores funcione bien, guárdela para reutilizarla.

Suno Studio DAW

Suno Studio (nivel Premier, lanzado con V5) es una estación de trabajo de audio digital en el navegador para edición posterior a la generación. Cierra la brecha entre el motor de generación de Suno y la producción musical tradicional.2

Capacidades de Studio

Función Qué hace
Vista multipista Línea de tiempo visual con pistas de stems individuales
Controles de mezcla Volumen, paneo, silencio y solo por stem
Warp Markers Ajuste temporal de secciones específicas sin afectar la afinación
Remove FX Elimina reverb, delay y otros efectos de los stems
Alt Takes Genera versiones alternativas de secciones específicas
Compases Ajusta o corrige la interpretación del compás
Aislamiento de stems Acceso a hasta 12 stems individuales para mezcla detallada

Studio 1.2 (febrero de 2026)

La última actualización de Studio agregó:4

  • Warp Markers: Microajuste del timing de notas y frases individuales
  • Remove FX: Eliminación del reverb y delay aplicado por IA para obtener stems secos
  • Alt Takes: Generación y audición de secciones alternativas en línea
  • Soporte ampliado de compases: Mejor manejo de compases 3/4, 6/8 y compases irregulares

¿Debería usar Studio o exportar a un DAW?

Escenario Usar Studio Exportar a DAW
Correcciones rápidas (balance de volumen, silenciar un stem) No
Mezcla y masterización profesional completa No
Probar variaciones de arreglo No
Agregar audio externo (instrumentos en vivo, voces) No
Escucha casual y compartir No
Preparación para lanzamiento comercial Posiblemente

Separación de stems y exportación

Suno ofrece dos niveles de separación de stems:

Separación de 2 stems (todos los niveles)

Separa el audio en: - Vocals: Todo el contenido vocal - Instrumental: Todo lo demás

Útil para: versiones de karaoke, muestreo vocal, remixing básico.

Separación de 12 stems (Pro/Premier)

Separa el audio en hasta 12 stems individuales:22 - Vocals, drums, bass, guitar, keys/piano, synths, strings, brass, woodwinds, percussion, effects, other

Una distinción importante: La “separación de stems” de Suno es fundamentalmente diferente de herramientas como iZotope RX o Demucs. Esas herramientas analizan un archivo de audio mezclado e intentan aislar fuentes después del hecho. Suno probablemente exporta las capas individuales de generación directamente, ya que creó todo el audio en primer lugar. El resultado se asemeja más a exportar submezclas desde un DAW que a una separación de fuentes posterior.23 En la práctica, los stems de Suno son más limpios que lo que las herramientas de separación de terceros producen con el mismo archivo mezclado, pero es posible que no pasen perfectamente una prueba de anulación contra la mezcla original.

Notas de calidad: Espere cierta filtración entre stems, especialmente entre instrumentos de frecuencias similares. La calidad de separación mejoró significativamente en V5. Para trabajo profesional con archivos de audio arbitrarios (no generados por Suno), las herramientas especializadas como Demucs e iZotope RX siguen siendo el estándar.23

Formatos de exportación

  • MP3: Audio comprimido estándar. Bueno para compartir, streaming y borradores.
  • WAV: Audio sin comprimir. Necesario para trabajo profesional en DAW y masterización.

Integración con DAW

La salida de Suno se integra en flujos de trabajo de producción tradicionales mediante la exportación de stems.

Flujo de trabajo recomendado

  1. Genere en Suno hasta que el arreglo y la atmósfera sean los correctos
  2. Exporte 12 stems (Pro/Premier) como archivos WAV
  3. Importe en su DAW (Logic Pro, Ableton, Pro Tools, FL Studio, Reaper)
  4. Mezcle y masterice con herramientas y procesamiento profesionales
  5. Reemplace o complemente stems individuales con grabaciones en vivo si es necesario

Lo que gana con la mezcla en DAW

  • EQ y compresión: Modelado tonal por stem que la mezcla de IA de Suno no proporciona
  • Procesamiento espacial: Colocación estéreo precisa, envíos de reverb, lanzamientos de delay
  • Automatización: Cambios dinámicos a lo largo del tiempo (crescendos, barridos de filtro)
  • Instrumentos externos: Superponga grabaciones en vivo con stems generados por IA
  • Cadena de masterización: Normalización de volumen, limitación, pulido final para el lanzamiento
  • Scripts de automatización: Use Claude Code para crear plantillas de prompts, procesar por lotes variaciones del campo Style, o automatizar el ciclo de generación-selección-refinamiento

Fusión de géneros

Una de las fortalezas únicas de Suno es generar música en intersecciones de géneros que requerirían múltiples músicos especialistas en la producción tradicional.

Patrones de fusión efectivos

Fusión de dos géneros (más confiable):

Jazz-funk fusion, slap bass, Rhodes piano, syncopated drums, groovy and sophisticated

Género + combinación de era:

80s synthwave meets modern trap, analog synths, 808 bass, retro-futuristic

Género + instrumento inesperado:

Death metal with jazz saxophone solos, blast beats, dissonant chords

Reglas de fusión

  1. Comience con el género dominante. “Jazz with electronic elements” produce resultados diferentes que “Electronic with jazz elements.”
  2. Límite a 2–3 géneros. Más que eso y la salida de Suno se convierte en un compromiso sin foco.
  3. Use marcadores de era para anclar el estilo. “90s” o “2020s” ayuda a Suno a elegir las convenciones de producción correctas.
  4. Aumente Weirdness para fusiones inusuales. La configuración predeterminada de Weirdness intenta normalizar todo, lo que anula el propósito de la fusión de géneros.

Composición multisección

Para canciones de más de 4 minutos, es necesario componer en múltiples generaciones y unirlas.

Estrategia 1: Extend

Genere la primera sección y luego use Extend para agregar secciones posteriores. Cada extensión utiliza el final de la sección anterior como contexto.

Ventajas: Continuidad musical. Cada extensión sigue naturalmente a la anterior. Desventajas: Menos control sobre las secciones posteriores. Desviación musical a lo largo de múltiples extensiones.

Estrategia 2: Generación sección por sección

Genere cada sección de forma independiente con combinaciones específicas de metatags + Style, y luego únalas en un DAW.

Ventajas: Máximo control sobre el carácter de cada sección. Desventajas: Las transiciones entre secciones generadas de forma independiente pueden sonar abruptas. Requiere habilidades de DAW para la unión.

Estrategia 3: Enfoque híbrido (recomendado)

  1. Genere el núcleo de la canción (verso-estribillo-verso-estribillo) como una sola generación
  2. Use Extend para el bridge y el estribillo final
  3. Use Song Editor para aplicar Inpainting en las transiciones débiles
  4. Exporte stems y finalice en un DAW

Encadenamiento de Prompts

Construya canciones complejas a través de una secuencia de generaciones relacionadas.

Patrón de encadenamiento

Generation 1: "Atmospheric intro, ambient pads, slow build"
    Extend with: "[Build-Up] [Drop: full energy, heavy drums]"
    Extend with: "[Verse 1: vocals enter, riding the beat]"
    Extend with: "[Chorus: anthemic, crowd-singing energy]"
    Extend with: "[Outro: fade out, return to ambient pads]"

Cada extensión hereda el ADN musical de la generación anterior, creando una composición coherente de múltiples secciones sin necesidad de empezar desde cero cada vez.


Solución de Problemas

¿Por qué mi canción de Suno suena mal?

Problema Causa Probable Solución
La canción no se parece al prompt de Style Descriptores contradictorios, o Weirdness demasiado alto Reduzca a 4–5 descriptores principales. Baje Weirdness.
Las voces suenan robóticas Modelo V4.5-All en el nivel gratuito Actualice a Pro para la calidad vocal de V5.
La canción termina abruptamente Sin etiqueta [Outro] Agregue [Outro] o [End] a las letras.
La canción continúa después del final natural Suno llena hasta la duración máxima Agregue la etiqueta [End] después de su sección final.
El género incorrecto es dominante El género listado en segundo lugar está siendo despriorizando Coloque su género principal primero en el campo Style.
Los metatags aparecen como letras Error de sintaxis en la etiqueta Verifique errores tipográficos. Las etiquetas deben usar [Tag] con corchetes.
Voces inconsistentes entre secciones Sin Persona Voice configurada Use Persona Voices para consistencia entre generaciones.
La extensión no coincide con el original Demasiadas generaciones entre el original y la extensión Extienda desde la versión más reciente, no desde la original.
La pista instrumental tiene artefactos vocales Los descriptores de estilo implican voces Active explícitamente el modo Instrumental. Agregue la etiqueta [Instrumental].

Lista de verificación de calidad de generación

Antes de gastar créditos en refinamiento, verifique que su prompt cubra:

  • [ ] El género es específico (no solo “rock” sino “indie rock” o “post-punk”)
  • [ ] El estilo vocal está descrito (o Instrumental está activado)
  • [ ] Los metatags definen la estructura (como mínimo: Verse, Chorus, Outro)
  • [ ] 4–7 descriptores en el campo Style (ni muy pocos, ni demasiados)
  • [ ] El estado de ánimo es explícito (Suno genera contenido alegre/positivo por defecto sin orientación)

Licencias Comerciales

Verificado a marzo de 2026. Los términos de licencia cambian. Consulte los Términos de Servicio actuales de Suno para el lenguaje vinculante.5

Lo que permite cada nivel

Uso Free Pro Premier
Escucha personal
Publicaciones en redes sociales
YouTube/TikTok monetizado No
Plataformas de streaming (Spotify, Apple Music) No
Productos comerciales (anuncios, videojuegos, cine) No
Obligaciones de regalías hacia Suno N/A Ninguna (100% suyo) Ninguna (100% suyo)

Advertencias importantes

La protección de derechos de autor para contenido 100% generado por IA es legalmente incierta. A partir de 2026, la música puramente generada por IA podría no calificar para el registro de derechos de autor en EE. UU. Las implicaciones: - Usted tiene derechos comerciales (Suno le otorga una licencia) - Pero podría no poder impedir que otros utilicen el mismo resultado o uno similar - Agregar elementos creativos humanos (letras originales, grabaciones de instrumentos en vivo, decisiones de arreglo en un DAW) fortalece su reclamo de derechos de autor

Los ingresos son suyos. Los usuarios Pro y Premier conservan el 100% de los ingresos de la música generada con Suno. Suno no reclama regalías ni participación en los ingresos.5


La generación de música con IA existe en un entorno legal en evolución.

Desarrollos legales clave

  • Acuerdo con Warner Music (noviembre de 2025): Warner llegó a un acuerdo en su demanda contra Suno. Los términos no fueron divulgados, pero Suno continúa operando.6
  • Demandas de UMG y Sony: Las demandas de los grandes sellos contra Suno permanecen activas a principios de 2026. Los reclamos se centran en el presunto uso de grabaciones protegidas por derechos de autor en los datos de entrenamiento.6
  • Acuerdo Udio/UMG (2025): El competidor Udio llegó a un acuerdo con UMG, estableciendo cierto precedente para la industria.7
  • Oficina de Derechos de Autor de EE. UU.: Ha declarado que las obras puramente generadas por IA no pueden ser protegidas por derechos de autor, aunque las obras con suficiente autoría humana que contengan elementos de IA podrían calificar.8

Orientación práctica

  1. No use Suno para replicar canciones específicas protegidas por derechos de autor. La función Covers está diseñada para versionar pistas generadas en Suno, no grabaciones comerciales.
  2. Agregue elementos creativos humanos para fortalecer los reclamos de derechos de autor: escriba letras originales, grabe instrumentos en vivo sobre los stems de Suno, tome decisiones de arreglo en un DAW.
  3. Documente su proceso creativo. Si su trabajo es cuestionado, la evidencia de decisiones creativas humanas fortalece su posición. Herramientas como Obsidian pueden servir como diarios creativos con marca de tiempo para este propósito.
  4. Manténgase al día con los desarrollos legales. Esta área está cambiando rápidamente.

Competidores y Alternativas

Plataforma Fortalezas Debilidades Ideal Para
Suno Mejor calidad general de canciones, herramientas de edición extensas, Studio DAW Sin API oficial, no determinístico, los créditos no se acumulan Producción completa de canciones
Udio Mejor calidad de stems (48kHz nativo), fuerte precisión de género Base de usuarios más pequeña, menos herramientas de edición Producción basada en stems
Stable Audio API oficial, capacidad de SFX/diseño sonoro, pesos abiertos Calidad vocal más débil, salidas más cortas Integración con API, efectos de sonido
Google MusicFX Gratuito, accesible Control limitado, salidas más cortas, sin uso comercial Experimentación casual
AIVA Enfoque en música clásica/bandas sonoras, exportación MIDI Rango de géneros limitado Bandas sonoras para cine y videojuegos

¿Qué generador de música con IA debería usar?

  • Canciones completas con voces: Suno (V5)
  • Stems para producción en DAW: Udio (mayor calidad de stems)
  • Generación basada en API: Stable Audio (única plataforma con un API público)
  • Diseño sonoro y SFX: Stable Audio
  • Bandas sonoras para cine: AIVA (exportación MIDI para edición orquestal)
  • Generación de imágenes con IA para portadas de álbumes: Consulte la guía de Midjourney para técnicas de prompt engineering que complementan los flujos de trabajo de producción musical

Estado de API e Integración

Verificado a marzo de 2026.

Suno no ofrece un API público. No existe un API REST oficial, SDK, ni acceso programático para usuarios individuales o desarrolladores.17

Lo que existe

Tipo de Acceso Estado Detalles
API público oficial No disponible Sin fecha anunciada
API empresarial/socios Beta privada Disponible solo por invitación. Contacte al equipo de ventas de Suno.
Wrappers de la comunidad No oficiales gcui-art/suno-api, un wrapper de ingeniería inversa. No respaldado por Suno. Puede dejar de funcionar sin previo aviso.9
Chirp API Histórico Programa de acceso temprano al API. Ya no acepta nuevos usuarios.

Para desarrolladores

Si necesita generación de música programática: - Stable Audio: Tiene un API oficial con endpoints documentados - Replicate: Aloja modelos de generación musical de código abierto con acceso por API - Implementación propia: Modelos de código abierto como MusicGen (Meta) pueden ser autoalojados


Tarjeta de Referencia Rápida

Plantilla de Custom Mode

STYLE FIELD:
[Genre] [Subgenre], [Tempo], [Key instruments], [Vocal style], [Production], [Mood]

LYRICS FIELD:
[Intro: descriptors]

[Verse 1]
Your lyrics here

[Pre-Chorus]
Building lyrics

[Chorus]
Hook lyrics

[Verse 2]
More lyrics

[Chorus]
Same hook (for melodic repetition)

[Bridge: contrasting descriptors]
Different energy lyrics

[Chorus]
Final hook

[Outro: fade out]

Metatags esenciales

Etiqueta Propósito
[Verse] Sección narrativa
[Chorus] Estribillo/gancho
[Bridge] Sección contrastante
[Intro] Apertura
[Outro] Cierre
[End] Parada definitiva
[Instrumental] Sin voces
[Guitar Solo] Destacado instrumental
[Fade Out] Final gradual
[Tag: descriptors] Control por sección

Hoja de referencia de Creative Sliders

Slider Izquierda Centro Derecha
Weirdness Convencional Equilibrado Experimental
Style Influence Interpretación libre Predeterminado Adherencia estricta
Audio Influence Referencia mínima Equilibrado Referencia fuerte

Referencia rápida de precios

Free Pro ($10/mes) Premier ($30/mes)
Créditos 50/día 2.500/mes 10.000/mes
V5 No
Comercial No
Studio No No

Registro de Cambios

Fecha Cambio Fuente
2026-03-04 Revisión de publicación: se corrigieron atribuciones de citas (1 dividida entre fuentes verificadas), se agregó generación de 8 minutos de V4.5, ejemplos de prompts antes/después, recorrido completo de canción, explicaciones del “por qué” para metatags y Creative Sliders, cita sobre sesgo de entrenamiento occidental, distinción técnica de separación de stems, 6 nuevas referencias 18-23, enlaces cruzados internos, apertura estadística Revisión de calidad
2026-03-04 Revisión de calidad: se agregaron Puntos Clave, Cómo Usar Esta Guía, sección de Prompt Enhancement Helper, se expandieron Persona Voices, se conectaron todas las citas, se corrigió cita de Udio/UMG, se agregaron precios anuales y detalles de créditos adicionales Revisión de calidad
2026-03-03 Guía creada cubriendo V5, precios, metatags, Studio, flujos de trabajo de producción, licencias y referencia completa de prompt engineering Múltiples
2026-02-01 Suno Studio 1.2: warp markers, remove FX, alt takes, compases 4
2025-09-25 V5 (chirp-crow) lanzado: 48kHz, Studio DAW, separación de 12 stems, Persona Voices 1
2025-11-01 Acuerdo con Warner Music 6
2025-05-01 V4.5 lanzado: generación de 8 minutos, Creative Sliders, Prompt Enhancement Helper 19
2024-11-19 V4 lanzado: generaciones de 4 minutos, Covers, separación de 2 stems 3

Referencias


  1. Suno V5 Release and Review. V5 (chirp-crow) lanzado entre el 23 y 25 de septiembre de 2025. Audio a 48kHz, calidad de transmisión profesional, Suno Studio DAW, separación de 12 stems, Persona Voices. 

  2. Introducing Suno Studio. DAW en el navegador para edición posterior a la generación. Vista multipista, controles de mezcla, aislamiento de stems. 

  3. Suno Model Timeline. Historial oficial de versiones del modelo desde V2 hasta V5. 

  4. Suno Studio 1.2 Master Guide. Actualización de febrero de 2026: Warp Markers, Remove FX, alternativas, soporte ampliado de compases. 

  5. Suno Rights & Ownership. Licencias comerciales: los usuarios Pro y Premier retienen el 100% de los ingresos. El nivel gratuito es solo para uso no comercial. 

  6. WMG and Suno Partnership. Warner llegó a un acuerdo en noviembre de 2025. Suno adquirió Songkick y desarrollará modelos con licencia de WMG. Los artistas conservan el control sobre nombre, imagen, apariencia y uso de voz. 

  7. UMG Settles Udio Lawsuit, Announces Partnership. UMG y Udio llegaron a un acuerdo el 29 de octubre de 2025. Nueva plataforma de creación musical con IA y licencia planificada para 2026. Incluye licencias de música grabada y publicación. 

  8. US Copyright Office on AI-Generated Works. Las obras generadas exclusivamente por IA no pueden tener derechos de autor. Las obras con autoría humana suficiente pueden calificar. 

  9. gcui-art/suno-api. Wrapper comunitario no oficial para Suno. No respaldado por Suno. Puede dejar de funcionar sin previo aviso. 

  10. Suno Metatags Complete Guide. Lista compilada por la comunidad de más de 500 metatags para estructura, voces, instrumentos y producción. 

  11. Suno Creative Sliders Guide. Documentación oficial de los controles Weirdness, Style Influence y Audio Influence. 

  12. Suno Song Editor. Documentación oficial de las operaciones Replace Section, Extend, Crop y Fade. 

  13. Suno Pricing Plans. Comparación de niveles actuales: Free, Pro ($10/mes), Premier ($30/mes). 

  14. Suno Prompt Engineering Best Practices. Guía comunitaria para estructuras de prompts efectivas y uso de descriptores. 

  15. Suno AI Personas. Creación, uso y limitaciones de Persona Voices. 

  16. Suno V5 Audio Specifications. Comparación de calidad de audio entre niveles: frecuencia de muestreo, profundidad de bits, formatos de exportación. 

  17. The Suno API Reality. Análisis del panorama de API oficiales vs. no oficiales y los riesgos legales. 

  18. Suno Hits 2M Paid Subscribers and $300M ARR. TechCrunch, febrero de 2026. 7 millones de pistas generadas por día; el catálogo de 100 millones de canciones de Spotify superado cada dos semanas. 

  19. Introducing V4.5. Anuncio oficial de Suno. Generación única de 8 minutos, Creative Sliders, Prompt Enhancement Helper, mayor precisión de género musical, voces mejoradas. 

  20. Suno V5 (chirp-crow) Specifications. Nombre interno del modelo V5: chirp-crow, frecuencia de muestreo de 48kHz, 320kbps, soporte de Persona Voices, exportación de stems. 

  21. Missing Melodies: AI Music Generation and Its Omission of the Global South. El 86% de los datos de entrenamiento de música con IA proviene de géneros del Norte Global. Guitarra, piano y batería comprenden entre el 52% y el 67% de los clips de entrenamiento; los instrumentos regionales representan menos del 3%. 

  22. Suno Stem Extraction. Documentación oficial para la extracción de stems de 2 pistas (Vocals+Instrumental) y de 12 pistas. 

  23. Suno Separation Quality vs SpectraLayers. Discusión sobre cómo la exportación de stems de Suno probablemente regenera las capas individuales en lugar de realizar una separación de fuentes posterior. 

NORMAL suno.md EOF