llms.txt 완벽 가이드: 필수 구조부터 복붙 템플릿까지

1. llms.txt란 무엇인가

llms.txt는 LLM이 웹사이트를 더 잘 사용하도록 돕기 위한, 루트 경로(/llms.txt)의 표준화 제안 파일입니다.
핵심은 답변 생성 시점에 LLM/에이전트가 참고할 신뢰 가능한 맥락을 빠르게 찾도록 안내하는 데 있습니다.

llms.txt를 한 줄로 정의하면?

  • 사람이 아니라, LLM을 위한 사이트 안내판
  • ‘이 사이트에서 무엇을, 어떤 순서로, 어떤 링크로 보라’를 작성자가 직접 큐레이션해서 적어두는 방식

왜 이 파일이 중요한가요?

오늘날 LLM이 어떤 사이트를 참고하려면 보통 세 가지 중 하나를 택해야 합니다.

  1. 사이트맵을 다 긁어가기
  2. 일부 페이지만 골라서 넣기
  3. 내부/외부 링크를 섞어 넣기
    그런데 어떤 게 적절한 인용인지 애매하죠.
    이 문제를 ‘사이트 작성자가 가장 잘 안다’는 전제에서, 작성자가 ‘이걸 봐라’라고 목록을 제공하자는 게 llms.txt의 포인트입니다.

형식은 어떤게 좋을까요?

llms.txt는 보통 마크다운 기반이며, 사람도 읽을 수 있지만 동시에 정해진 포맷으로 파싱 가능한 구조를 지향합니다.
(파서/정규식 등 고전적인 방식으로도 처리 가능하다고 명시되고 있음)

llms.txt vs llms-full.txt

  • llms.txt: 링크 인덱스에 가깝습니다. 짧은 설명 + 링크를 제공하고, LLM/에이전트가 필요하면 링크를 따라가 상세를 가져옵니다.
  • llms-full.txt: 반대로 전체 텍스트를 한 파일로 모아두는 방식입니다. 다만 문서가 너무 크면 컨텍스트 윈도우 한계를 초과할 수 있다는 점을 주의해야 합니다.

LLMS.txt 는 표준이 될까? 누가 누가 쓰고 있나?

llms.txt는 현재 공식적으로 반드시 작성해야하는 문서는 아닙니다.

그러나 robots.txt도 기존에는 공식적으로 인정받는 문서가 아니었죠.

이처럼 llms.txt.는 현재 관행적으로 떠오르는 문서이며, LLM의 부흥에 선제적으로 대응할 수 있는 몇 안되는 조치 중에 하나라고 생각하시면 좋을 것 같습니다.

저만 그렇게 생각하는게 아니겠죠?

이미 각종 저명한 도구와 플랫폼 에서도 자동 생성 기능을 지원하고 있습니다.

  • Yoast SEO는 루트에 llms.txt 생성 + 주간 업데이트 동작을 기능 명세로 공개합니다.
  • Mintlify는 /llms.txt와 /llms-full.txt를 자동 생성·호스팅한다고 밝힙니다.
  • GitBook도 llms.txt를 떠오르는 관행 으로 보며, 퍼블리싱 시 자동 생성한다고 말합니다.

실무 관점 한 문장:

llms.txt는 우리가 보여주고 싶은 페이지가 아니라, LLM이 정확하게 인용할 수 있는 정본을 모아 둔 문서다.


2. 왜 지금 llms.txt가 필요한가: SEO에서 GEO로의 전환 포인트

(여기서 말하는 GEO는 AI가 요약·답변·인용하는 흐름이 강해지는 환경을 가리키는 실무 용어로 쓸게요.)

GEO 관련 글은 아래에 🔻

[🔗GEO 실전 가이드: 생성형 AI에 내 콘텐츠가 인용되는 방법]

사용자 행동이 바뀌었다: 찾아 읽기 → 물어보고 받아먹기

GitBook은 지금 콘텐츠 소비 방식이 이렇게 바뀐다고 설명합니다.

  • 예전: 페이지 탐색 → 헤딩 스캔 → 필요한 콘텐츠 찾기
  • 지금: LLM에게 질문요약/설명/인용까지 기대

즉, 이제 콘텐츠는 검색엔진에 노출만으로 끝나지 않습니다.
AI가 답을 만들 때 참고하는 ‘답변의 재료’가 되는 구조가 중요해집니다.

기존 SEO 자산만으로는 AI 인용을 보장하기 어렵다

LLM이 사이트를 참고할 때 제일 큰 문제는 이겁니다:

‘사이트 전체에서 무엇을 가져와야 정확한 답을 만들 수 있는지’가 애매하다.

Answer.AI는 이런 애매함을 아주 직설적으로 적고 있는데요.
(사이트맵을 다 긁을지, 외부 링크를 섞을지, 소스코드까지 포함할지 등에 대한 고찰이 담겨 있어서 참고하기 좋습니다.)

여기에 실무에서 자주 겹치는 리스크가 더 붙습니다.

  • 중복 페이지/오래된 페이지가 섞여 들어감
  • canonical은 있는데, AI가 그걸 따라준다는 보장은 약함(그래서 정본 목록이 필요하다는게 주요 주장)

HTML을 잘 만드는 것만으로는 부족하다: LLM이 읽기 힘든 웹이 너무 많다

Mintlify는 llms.txt가 하는 역할을 이렇게 요약합니다.

  • 사이트를 구조화된, 간결한 포맷으로 distill(압축)해서
  • LLM이 복잡한 HTML/광고/JavaScript 파싱을 우회하도록 돕는다

이건 GEO에서 특히 크리티컬합니다.
사람은 UI를 보면서 문맥을 파악하지만, LLM은 크롤해온 텍스트 묶음에서 스스로 답을 만들어야 하니까요.
그래서 처음부터 LLM에 친화적인 가이드를 제공하는 게 실무적으로 유리합니다.

컨텍스트 윈도우라는 물리적 한계가 있다

“그럼 그냥 전체 문서를 한 번에 주면 되지 않나?”
→ llms-full.txt가 그 발상입니다.

하지만 LangGraph 문서는 llms-full.txt가 너무 커지면 컨텍스트 윈도우에 못 들어갈 수 있다고 명시합니다.

그래서 실무에서는 보통 이렇게 나뉩니다.

  • llms.txt로 무엇이 정본인지를 빠르게 안내
  • 필요할 때만 링크를 따라가서 필요한 만큼만 가져가게 하기

이 구조는 SEO의 사이트맵과 닮았지만, 목적이 다릅니다.
SEO가 페이지 발견과 색인 중심이라면, llms.txt는 답변 재료(컨텍스트) 구성중심에 더 가깝습니다.

실무 팁(이 문장만 기억해도 방향이 잡힘):

“GEO에서의 최적화”는 새로운 트릭이 아니라, AI가 틀리기 쉬운 지점을 ‘정본 링크’로 먼저 잠가두는 작업이다. (llms.txt는 그 잠금장치 후보 중 하나)

데이터 관점: 그래서 진짜로 인용이 늘었나?

최근에는 “해봤더니 진짜 되냐?”를 데이터로 본 글들이 나왔고, 대표적으로 SE Ranking 분석이 자주 인용됩니다.

  • Search Engine Journal은 30만 도메인 분석에서 llms.txt 유무와 AI 인용 빈도 사이에 ‘측정 가능한 연관’이 없었다고 요약합니다.
  • SE Ranking 원문도 도입률(약 10%)이 낮고, 인용과 상관관계가 없었다는 결론을 명시합니다.

즉, 오늘 기준으로 llms.txt 하나 추가해서 인용이 오른다는 식의 공식 효과를 말하기는 어렵다는 거죠.

그럼에도 ‘왜 지금 하냐?’에 대한 현실적인 답

실무자로써 결론은 이겁니다.

  • 검색/AI 노출의 공식으로 보면 실망할 수 있다.
  • 하지만 내가 통제 가능한 정본 링크 묶음을 제공하는 관점에서는 비용 대비 시도 가치가 있다
    (특히 문서/정책/지원센터 같이 정확히 인용돼야 하는 영역에 좋음).

3. llms.txt 기본 구조와 필수 구성요소

llmstxt.org가 제시한 스펙(형식 규칙)을 기준으로 설명할게요.

파일 위치

  • 기본은 루트 경로: /llms.txt
    (옵션으로 서브패스도 가능하다고 하지만, 기본은 루트가 전제입니다.)

필수는 딱 1개

스펙이 말하는 유일한 필수 섹션은 이것입니다.

  • H1(제목): 프로젝트/사이트 이름 (# Site Name)

그 외는 권장/선택이지만, 실제로는 H1만 두고 끝내면 아무 의미가 없어요.
llms.txt.org의 의도가 링크로 큐레이션된 개요이기 때문이죠.

권장 구조(순서)

image

[예시 이미지 출처 : answer.ai]

llmstxt.org는 아래 순서를 명시합니다.

  1. H1 (필수)
  2. blockquote 요약: 짧은 핵심 설명(사이트 이해에 필요한 키 정보)
  3. (헤딩 없는) 추가 설명 섹션: 문단/리스트 등 자유 형식(단, “헤딩은 제외”)
  4. H2 섹션들: 여기부터가 핵심 — 파일 리스트
    • 각 항목은 - [name](url): 설명 형태
  5. (선택) Optional 섹션(H2로 작성): 짧은 컨텍스트가 필요할 때 생략 가능한 2순위 링크들

운영 가이드

llmstxt.org는 좋은 llms.txt 만들기로 아래를 권장합니다.

  • 간결하고 명확한 언어
  • 링크마다 짧고 정보가 있는 설명
  • 애매한 용어/설명 없는 전문용어 피하기

이 부분은 아래 예시 템플릿에서도 그대로 적용해보겠습니다

출처 링크

https://llmstxt.org/

4. 실전 템플릿: 바로 복붙 가능한 llms.txt 예시

아래 예시는 전부 llmstxt.org 스펙(구조/순서/Optional )을 따릅니다.
그냥 복붙 후, URL만 사이트에 맞게 갈아끼우면 됩니다.

5-1) “블로그/개인 브랜드”용

# NOA Branding

> SEO와 GEO(생성형 검색) 관점에서 브랜드가 해야하는 마케팅을 제안하는 기업입니다.

이 문서의 목적:
- AI/에이전트가 이 웹사이트의 핵심 글과 정책을 빠르게 찾도록 돕습니다.
- 중복 글/캠페인 URL 대신, 대표 URL만 제공합니다.

## Start Here
- [블로그 소개](https://example.com/about): 블로그 목적, 다루는 주제, 독자 대상
- [연락하기](https://example.com/contact): 협업/문의 채널

## GEO / AI Search
- [GEO 개념 정리](https://example.com/geo/what-is-geo): GEO 정의와 SEO와의 차이
- [GEO 측정 프레임](https://example.com/geo/metrics): Visibility/Citation/Readability 프레임

## Technical SEO
- [테크니컬 SEO 체크리스트](https://example.com/seo/technical-checklist): 크롤링/인덱싱/렌더링 점검 항목
- [스키마 마크업 가이드](https://example.com/seo/schema-guide): FAQ/HowTo/VideoObject 등 적용 기준

## Proof / Case Studies
- [실험 모음](https://example.com/lab): 실험 설계와 결과 아카이브
- [케이스 스터디](https://example.com/case-studies): 개선 전/후 및 배운 점

## Policies
- [이용약관](https://example.com/terms)
- [개인정보처리방침](https://example.com/privacy)

## Optional
- [태그 아카이브](https://example.com/tags): 탐색용(정본 인용엔 비권장)
- [검색 페이지](https://example.com/search): 탐색용

커머스용 (정책/지원/제품 이해가 핵심인 사이트)

# ExampleStore (E-commerce)

> 제품 정보와 구매/배송/환불 정책의 ‘대표 페이지’를 모았습니다. 아래 링크가 최신 정책과 대표 제품 정보를 담고 있습니다.

중요:
- 캠페인 파라미터 URL 대신 대표 URL만 사용합니다.
- 정책/지원 문서는 최신 버전을 우선합니다.

## Products
- [제품 카테고리](https://example.com/products): 전체 제품 탐색(대표 카테고리 )
- [베스트셀러](https://example.com/best-sellers): 대표 제품군
- [신제품](https://example.com/new): 최신 출시 제품

## Policies (Source of Truth)
- [배송 정책](https://example.com/shipping): 배송비/지역/리드타임
- [반품·환불 정책](https://example.com/returns): 반품 조건/절차
- [보증 정책](https://example.com/warranty): 보증 범위/기간

## Support
- [고객센터 홈](https://example.com/support): 지원 허브
- [자주 묻는 질문(FAQ)](https://example.com/support/faq): 질문/답변
- [문제 해결 가이드](https://example.com/support/troubleshooting): 증상별 조치

## Brand
- [브랜드 소개](https://example.com/brand): 브랜드/회사 정보
- [공식 공지](https://example.com/announcements): 정책 변경/중요 업데이트

## Optional
- [프로모션](https://example.com/promotions): 기간 한정(컨텍스트 생략 가능)
- [블로그](https://example.com/blog): 참고용

개발자 문서/프로덕트 Docs용

# Example API Documentation

> API 문서의 핵심 진입점과 레퍼런스를 정리했습니다. 아래 링크가 공식 문서의 대표 페이지입니다.

## Docs
- [빠른 시작(Quickstart)](https://example.com/docs/quickstart): 최소 예제로 시작
- [가이드](https://example.com/docs/guides): 개념/흐름 중심
- [튜토리얼](https://example.com/docs/tutorials): 단계별 실습

## API Reference
- [API 레퍼런스](https://example.com/docs/api): 엔드포인트/파라미터/응답
- [인증(Authentication)](https://example.com/docs/auth): 인증 방식/키 관리
- [에러 코드](https://example.com/docs/errors): 공통 에러와 해결

## Changelog
- [릴리즈 노트](https://example.com/docs/changelog): 변경 사항 최신 기록

## Optional
- [블로그](https://example.com/blog): 배경 설명
- [커뮤니티](https://example.com/community): 토론/참고

5.결론

결국 llms.txt는추가하면 바로 인용이 늘어나는 공식적인 문서라기보다, AI가 사이트를 참고할 때 정확한 정본을 빠르게 찾도록 돕는 저비용 컨텍스트 인덱스에 가깝습니다.

아직 모든 AI/검색 시스템이 일관되게 이를 사용한다고 보기 어렵고, 대규모 분석에서도 인용 상승이 뚜렷하게 확인되지 않았다는 점은 분명히 기억해야 합니다

그럼에도 틀리면 치명적인 페이지를 중심으로 대표 링크를 큐레이션해 두면, 크롤링·요약·인용 과정에서 발생하는 혼선을 줄이는 데 실무적으로 의미가 있습니다.


[함께읽으면 좋은 글]

댓글 남기기