취향은 인프라다
에이전트는 몇 분 만에 기능적인 인터페이스를 만들 수 있어요. 올바른 HTML, 유효한 CSS, 작동하는 인터랙티비티. 결과물은 모든 자동화 검사를 통과해요. 하지만 2019년 위원회가 디자인한 것처럼 보이기도 하죠.
문제는 능력이 아니에요. 에이전트는 여러분이 설명하는 어떤 레이아웃, 어떤 색상 조합, 어떤 타이포그래피 페어링이든 생성할 수 있어요. 문제는 여러분이 직접 설명해야 한다는 거예요. 에이전트는 무엇이 좋아 보이는지에 대한 의견이 없어요. 기본값에 의존하죠: 시스템 폰트, 균일한 간격, 무난한 색상, 전부 가운데 정렬. 결과물은 작동해요. 하지만 숙고된 느낌은 없어요.
이것이 취향 격차예요. 기능적인 것과 좋은 것 사이의 거리. 올바른 것과 숙고된 것 사이의 거리. 유효성 검사를 통과하는 인터페이스와 디자이너가 존중할 만한 인터페이스 사이의 거리.
취향은 프롬프팅으로 확장되지 않아요. 모든 프롬프트에 모든 미적 판단을 기술할 수는 없어요. “전문적으로 보이게 해줘”는 평범한 결과물을 만들어요. “본문 폰트 크기의 1.5배를 섹션 간격으로, Inter와 Source Serif Pro를 페어링하고, 보조 텍스트에 4:1 명암비를 적용해줘”는 더 나은 결과물을 만들지만, 모든 결정을 직접 내려야 하므로 에이전트를 쓰는 의미가 없어져요. 이것은 제 취향 인프라 논지의 일부예요: 품질 시스템은 서술되는 게 아니라 인코딩되어야 한다는 것이죠.
취향은 인프라가 될 때 확장돼요.
취향이란 실제로 무엇인가
취향은 미적 품질에 적용되는 패턴 인식이에요. 수천 개의 레이아웃을 검토한 디자이너는 무엇이 효과적인지에 대한 직관을 발전시켜요: 어떤 폰트 페어링이 긴장감을 만들고, 어떤 간격 비율이 균형 잡혀 보이며, 어떤 색상 분포가 시선을 이끄는지. 이 직관은 신비로운 게 아니에요. 통계적인 거예요. 이것은 제 품질 철학의 핵심 통찰과 같아요: 장인정신은 마법이 아니라, 무엇이 효과적인지에 대한 축적된 증거예요. 디자이너는 충분히 좋은 작업을 봐왔기에 그것을 좋게 만드는 패턴을 인식할 수 있는 거예요.
패턴은 구조적이기 때문에 학습 가능해요. 타이포그래피 관례, 간격 비율, 색상 관계, 위계의 깊이, 컴포넌트 구성 규칙. 이것들은 임의적인 취향이 아니에요. 모든 디자인 영역에서 반복되는 지각적 문제에 대한 해결책이에요. 제목은 본문과 시각적으로 구별되어야 해요. 카드에는 숨 쉴 여백이 필요해요. 색상 팔레트에는 주색, 보조색, 강조색이 필요해요. 구체적인 값은 달라져요. 구조적 관계는 일관돼요.
패턴이 구조적이고 일관적이라면, 전문 작업에서 추출하고, 쿼리 가능한 형식으로 인코딩하여, 생성 시점에 에이전트가 적용할 수 있어요.
LICA의 통찰
한 연구팀이 1,550,244개의 다층 그래픽 디자인 컴포지션을 구조화된 JSON 레이어 트리로 공개했어요.1 이미지가 아니에요. 픽셀이 아니에요. 모든 디자인 결정이 쿼리 가능한 필드인 JSON 객체예요: 폰트 패밀리, 폰트 크기, 줄 높이, 자간, 색상, 위치, 불투명도, z-order, 부모-자식 관계.
이 데이터셋에는 20개 디자인 카테고리에 걸친 971,850개의 고유 템플릿, 2,700개의 개별 폰트 패밀리, 그리고 컴포넌트별 키프레임 데이터가 포함된 27,261개의 애니메이션 레이아웃이 있어요. 각 컴포지션은 풍부한 요소별 메타데이터를 갖춘 타입화된 컴포넌트(텍스트, 이미지, 벡터, 그룹) 트리예요.
핵심 통찰은 디자인 결정이 픽셀이 아닌 데이터로 표현될 때 취향이 계산 가능해진다는 거예요. 소셜 미디어 레이아웃에서 전문가들이 제목에 어떤 폰트 크기를 쓰는지 분석하는 데 컴퓨터 비전이 필요 없어요. 데이터베이스를 쿼리하면 돼요.
세 가지 레이어
취향을 인프라로 인코딩하려면 세 가지 레이어가 필요하고, 각각은 이전 레이어 위에 구축돼요.
레이어 1: 디자인 지식 그래프. 전문 레이아웃 트리를 쿼리 가능한 데이터베이스로 파싱해요. 단순 통계가 아니에요. 관계예요: 디자이너가 48px 볼드 산세리프 제목을 사용할 때, 본문에는 무엇을 페어링하나요? 부모-자식 컴포넌트 사이에 어떤 간격 비율이 나타나나요? 포스터 레이아웃은 소셜 미디어 레이아웃과 구조적으로 어떻게 다른가요? 결과물은 쿼리할 수 있는 데이터베이스예요: “32px 산세리프 제목이 주어졌을 때, 전문 레이아웃에서 본문 텍스트 속성은 어떻게 나타나나요?”
레이어 2: 레이아웃 임베더. Apple Silicon에서 학습된 소형 모델로, 레이아웃의 컴포넌트 트리를 받아 벡터 임베딩을 생성해요. 대조 학습을 사용하여 훈련해요: 실제 전문 레이아웃을 양성 샘플로, 변형된 레이아웃(무작위 간격, 교체된 폰트, 깨진 위계)을 음성 샘플로 사용해요. 모델은 전문 레이아웃이 모이고 깨진 레이아웃이 멀리 떨어지는 임베딩 공간을 학습해요. 에이전트가 레이아웃을 생성하면 임베딩하고, 가장 가까운 5개의 전문 레이아웃을 찾아요. 모든 전문 레이아웃에서 멀리 떨어져 있다면, 무언가 잘못된 거예요.
레이어 3: 취향 심판. Claude가 임베더 출력, 가장 가까운 전문 레이아웃, 관련 지식 그래프 패턴을 읽어요. 전문적 선례에 근거한 판단을 내려요: “이 간격이 어색해 보인다”가 아니라 “이 카테고리의 전문 레이아웃은 섹션 간격에 본문 폰트 크기의 1.5배를 사용하는데, 당신의 레이아웃은 0.8배를 사용하고 있다”라고 말해요.
서빙 패턴은 시맨틱 검색과 동일해요: 쿼리를 임베딩하고, 벡터 인덱스에서 최근접 이웃을 찾고, 구조화된 컨텍스트를 반환해요. 인프라는 같아요. 도메인이 다를 뿐이에요.
통계만으로는 부족한 이유
150만 개 레이아웃에 걸친 폰트 크기 빈도 분포는 무엇이 일반적인지 알려줘요. 무엇이 좋은지는 알려주지 않아요. 가장 인기 있는 폰트 페어링이 최고의 폰트 페어링은 아니에요. 가장 안전한 페어링일 뿐이에요. 빈도 통계를 가진 에이전트는 중간값 수준의 작업을 생산해요. 중간값은 취향이 아니에요.
취향은 디자인 선택이 맥락 속에서 왜 효과적인지 이해하는 것이지, 모든 맥락에서 얼마나 자주 등장하는지가 아니에요. 48px 볼드 산세리프 제목은 포스터 레이아웃에서 효과적이에요. 시청 거리가 멀고 위계가 즉시 읽혀야 하기 때문이에요. 같은 제목이 모바일 카드 레이아웃에 있다면 압도적일 거예요. 빈도 통계는 이런 맥락적 추론을 포착할 수 없어요. 특정 카테고리에서 전문 레이아웃과 변형된 버전의 차이를 학습하는 대조 모델은 할 수 있어요.
대조적 접근법은 네거티브 스페이스도 다뤄요. 전문 레이아웃은 종종 무엇을 빼냈느냐 때문에 효과적이에요: 리듬을 만드는 여백, 존재하지 않는 요소들. 빈도 통계는 존재하는 것만 세요. 대조 모델은 부재의 구조를 포함한 전체 구조에서 학습해요.
경쟁 우위로서의 취향
AI 에이전트로 인터페이스를 생성하는 모든 팀이 같은 취향 격차에 직면해요. 모든 에이전트의 기본 출력은 동일한 평범한 미적 감각이에요. 이 격차를 먼저 좁히는 팀이 같은 속도로 눈에 띄게 더 나은 결과물을 생산할 거예요. 제가 계속 돌아오는 원칙이 있어요: 품질이 유일한 변수라는 것 — 속도와 비용은 그 안에서 작업하는 상수이지, 당기는 레버가 아니에요.
이 격차는 더 나은 프롬프팅으로 좁혀지지 않아요. 더 나은 모델로도 좁혀지지 않아요. 모델은 추론, 코드 생성, 지시 따르기에서 발전해요. 미적 판단에서는 발전하지 않아요. 미적 판단이 학습 목표에 없기 때문이에요. 다음 토큰을 예측하도록 훈련된 모델은 가장 가능성 높은 출력으로 수렴하고, 그것은 중간값 미적 감각이에요.
격차는 인프라를 통해 좁혀져요: 전문 디자인 결정을 인코딩하는 데이터셋, 구조적 품질을 학습하는 모델, 에이전트 출력을 전문적 선례에 기반하여 평가하는 심판 시스템. 심판 패턴은 미학에 적용된 증거 게이트예요 — 코드 리뷰를 이끄는 것과 같은 원칙이, 다른 도메인에 있을 뿐이에요. 이 인프라를 구축하는 팀은 프로젝트를 거듭할수록 우위를 복리로 키워요. 지식 그래프가 성장하고, 임베더가 개선되고, 심판이 더 정밀해지기 때문이에요.
이것은 디자인에 적용된 복리 컨텍스트예요. 분석된 각 전문 레이아웃이 패턴을 축적해요. 각 패턴이 다음 생성을 더 좋게 만들어요. 디자인 지식의 포트폴리오는 처음에는 천천히 성장하다가, 결국 여러분의 결과물이 다른 모든 사람의 것과 달라 보이는 이유가 돼요.
FAQ
이것은 그냥 디자인 시스템 아닌가요?
디자인 시스템은 토큰과 컴포넌트를 정의해요. 취향 인프라는 그 토큰과 컴포넌트를 사용한 컴포지션이 미적으로 성공적인지 평가해요. 디자인 시스템은 어떤 색상을 사용할지 알려줘요. 취향 인프라는 그 색상을 조합한 방식이 효과적인지 알려줘요. 제약과 브루탈리즘의 아름다움 사이의 관계는 별도의 글에서 다루고 있어요.
150만 개의 레이아웃이 필요한가요?
아니요. LICA 데이터셋 전체는 150만 개 컴포지션이지만, 공개된 서브셋은 전체 JSON 트리가 포함된 1,183개 레이아웃이에요. 특정 도메인(소셜 미디어, 프레젠테이션, 문서)에서 의미 있는 패턴을 추출하기에 충분해요. 지식 그래프는 분석하는 레이아웃이 늘어날 때마다 성장해요.
소형 모델이 정말로 취향을 학습할 수 있나요?
이 모델은 디자인을 생성할 필요가 없어요. 전문 레이아웃과 변형된 레이아웃을 구별할 수 있으면 돼요. 이것은 생성 작업이 아니라 분류/임베딩 작업이에요. 구조화된 컴포넌트 트리에 대해 대조 학습으로 훈련된 2-5M 파라미터 모델이면 최근접 이웃 품질 평가에 충분해요.
심판은 어떻게 작동하나요?
Claude는 세 가지 입력을 읽어요: 에이전트가 생성한 레이아웃(스크린샷이 아닌 구조화된 데이터), 임베더에서 나온 가장 가까운 5개의 전문 레이아웃, 지식 그래프의 관련 패턴. 전문적 선례에 근거한 구체적인 수정사항을 생성해요. 심판은 생성된 레이아웃과 전문 참조 세트 사이의 격차를 추론해요. 이 접근법은 비판적이되 친절한 피드백을 요구해요 — 무엇이 잘못되었는지 정확하게, 어떻게 고칠지 건설적으로, 시도 자체를 절대 폄하하지 않으면서요.
출처
-
Elad Hirsch, Shubham Yadav, Mohit Garg, Purvanshi Mehta, “LICA: Layered Image Composition Annotations for Graphic Design Research,” arXiv:2603.16098, March 2026. 1,550,244 compositions, 971,850 templates, 27,261 animated layouts. Dataset: github.com/purvanshi-lica/lica-dataset. ↩