원천 자료 계층
웹 페이지, PDF, 책, 메모, 일기, 메시지, 논문, 회의록, 이미지, 코드 저장소 같은 불변 근거다. 위키는 원천 자료를 대체하지 않고, 해석과 정리의 결과로 남는다.
GeekNews의 LLM-Wiki 소개 글을 바탕으로, LLM을 일회성 답변기가 아니라 원천 자료를 지속 가능한 Markdown 지식 저장소로 바꾸는 편집 파트너로 사용하는 방법을 분석한 페이지다.
GeekNews의 LLM-Wiki 글은 LLM을 단순 질의응답 도구로 쓰는 방식을 넘어, 원천 자료를 바탕으로 지속적으로 축적되는 Markdown 지식 저장소를 만들고 관리하게 하는 접근을 한국어 독자에게 소개하는 큐레이션이다.
이 페이지의 핵심은 RAG와 LLM Wiki의 차이를 분명히 하는 데 있다. 일반적인 RAG는 사용자가 질문할 때마다 원본 파일에서 관련 조각을 찾아 답변을 만든다. 반면 LLM Wiki는 LLM이 원천 자료를 읽고, 요약하고, 서로 연결하고, 필요하면 기존 문서를 갱신해 영속적인 지식 산출물을 만든다.
즉, 매번 임시 답변을 새로 조립하는 것이 아니라, 시간이 지날수록 더 촘촘해지는 문서 체계를 만든다는 관점이다. 이 저장소는 Markdown 파일, 색인, 로그, 개념 페이지, 인물 또는 프로젝트 페이지, 비교표, 시각화 자료 등으로 확장될 수 있다.
GeekNews 글의 성격은 구현 튜토리얼이라기보다 한국어 독자를 위한 개념 해설과 토론 지도에 가깝다. Karpathy의 원 아이디어를 요약하면서, 개인 위키, 팀 위키, 연구 노트, 경쟁 분석, 여행 계획, 건강 기록 같은 적용 범위를 보여주고, 댓글을 통해 장점과 우려를 함께 드러낸다.
LLM-Wiki의 중심 개념은 원천 자료와 생성된 지식 저장소를 분리하는 것이다. 원천 자료는 바뀌지 않는 근거로 보존하고, LLM은 그 위에 구조화된 Markdown 문서를 쌓는다.
RAG는 질문 시점의 검색과 답변 생성에 초점이 있다. 사용자가 묻고, 시스템이 관련 조각을 찾고, 모델이 답변을 만든다. 이 방식은 빠르고 유연하지만, 매 질문마다 같은 문맥 추출과 재해석이 반복될 수 있다.
LLM Wiki는 지식을 사전에 또는 점진적으로 컴파일한다. 새 자료가 들어오면 LLM이 기존 위키 구조와 비교해 새 페이지를 만들거나 기존 페이지를 갱신한다. 질문이 들어왔을 때는 원본 조각만 찾는 것이 아니라 이미 정리된 위키 구조를 활용할 수 있다.
| 구분 | 일반 RAG | LLM Wiki |
|---|---|---|
| 중심 동작 | 질문 시점 검색과 답변 생성 | 자료를 지속 문서로 정리하고 갱신 |
| 산출물 | 대화형 답변 | Markdown 페이지, 색인, 로그, 비교표, 차트 |
| 지식 축적 | 약하거나 별도 설계 필요 | 위키 자체가 누적 산출물 |
| 모순 처리 | 답변마다 임시 판단 | 문서 간 충돌과 오래된 정보를 점검 가능 |
| 사람의 역할 | 질문자와 검토자 | 자료 큐레이터, 방향 설정자, 최종 검증자 |
| 장점 | 빠른 질의응답 | 장기 기억, 소유권, 구조화, 재사용성 |
| 약점 | 반복 추출, 맥락 손실 | 문서 품질 관리와 검증 비용 필요 |
가장 중요한 차이는 결과물이 답변인지 저장소인지에 있다. LLM Wiki는 대화 결과를 휘발시키지 않고 파일 시스템에 남겨 다음 작업의 입력으로 만든다.
웹 페이지, PDF, 책, 메모, 일기, 메시지, 논문, 회의록, 이미지, 코드 저장소 같은 불변 근거다. 위키는 원천 자료를 대체하지 않고, 해석과 정리의 결과로 남는다.
개별 소스 요약, 주제별 페이지, 인물 또는 조직 페이지, 개념 정의, 비교표, 색인, 변경 로그가 포함된다. 하나의 새 자료가 여러 문서를 동시에 갱신할 수 있다.
AGENTS.md나 CLAUDE.md 같은 지침 파일이 폴더 구조, 문서 형식, 링크 규칙, 인용 방식, 갱신 정책, 검증 루틴을 정의한다.
새 글을 읽은 뒤 소스별 요약 페이지, 관련 개념 페이지, 인물 또는 조직 페이지, index, log, 충돌 표시, 후속 조사 목록을 함께 갱신할 수 있다.
새 자료가 들어오면 LLM은 원문을 읽고 핵심 내용을 뽑는다. 중요한 것은 단순 요약이 아니라 기존 위키와 관계를 맺는 것이다. 새 자료가 어떤 주제와 연결되는지, 기존 문서의 어느 부분을 갱신해야 하는지, 새 개념 페이지가 필요한지 판단한다.
인입된 자료는 소스별 페이지로 정리되고, 필요하면 주제별 페이지나 색인도 함께 수정된다. 좋은 시스템은 하나의 자료를 하나의 파일로만 저장하지 않는다.
사용자는 위키를 대상으로 질문할 수 있다. 답변은 단순 텍스트뿐 아니라 Markdown 문서, 비교표, 슬라이드 초안, 차트, 캔버스형 시각 자료 등으로 만들어질 수 있다. 우수한 답변은 다시 위키에 편입되어 다음 질의의 기반이 된다.
LLM은 오래된 문서, 서로 모순되는 주장, 끊어진 링크, 고립된 페이지, 빠진 출처, 데이터 공백을 찾아낼 수 있다.
index는 탐색 지도 역할을 하고 log는 시간순 처리 기록을 맡는다. 평범한 텍스트 로그는 Unix 도구로 검색, 필터링, 집계하기 쉬우며, LLM 기반 지식 시스템이 반드시 복잡한 데이터베이스에서 시작할 필요는 없다는 메시지를 준다.
GeekNews 글과 관련 논의에서 언급되는 도구들은 LLM Wiki가 특정 제품이 아니라 파일 중심 워크플로임을 보여준다.
목표, 건강 기록, 습관, 자기 추적 데이터, 일기, 독서 노트를 연결해 시간이 지나며 패턴을 찾는 데 강하다.
논문, 책, 강의 노트, 코스 자료를 읽고 개별 요약과 개념 간 관계를 함께 정리할 수 있다.
결정 기록, 회의록, 제품 요구사항, 운영 지식, 장애 회고가 흩어지는 문제를 줄이고 관련 문서를 지속 갱신할 수 있다.
기업, 제품, 시장, 경쟁사를 기업별, 기능별, 리스크별로 재정리하고 변화 로그를 남길 수 있다.
선호도, 제약, 과거 경험, 일정, 비용을 연결해 재사용 가능한 계획 저장소를 만들 수 있다.
긍정적 반응은 명시성, 데이터 소유권, 파일 중심 기억, BYOAI 관점에 집중된다. LLM이 작성한 결과물이 닫힌 서비스 내부에만 남는 것이 아니라 사용자가 소유한 Markdown 파일로 남는다는 점이 중요하게 받아들여진다.
Farzapedia처럼 일기, 노트, 메시지에서 개인 위키를 만드는 사례와 한국어권 구현 또는 유사 사례 언급은 이 아이디어가 추상적 제안을 넘어 실제 적용 가능성을 검토받고 있음을 보여준다.
비판은 품질 drift와 유지보수 가능성에 집중된다. LLM이 만든 문서가 시간이 지나며 부정확해지거나, 과도한 요약 때문에 원문의 뉘앙스가 손실될 수 있다는 우려가 있다.
작은 개인 위키에서는 구조 유지가 쉽지만, 큰 위키에서는 중복, 모순, 오래된 정보, 링크 관리가 어려워질 수 있다. 결론은 LLM에게 전권을 맡기는 것이 아니라 사람이 구조와 기준을 정하고 LLM이 반복 작업을 수행하게 하자는 쪽에 가깝다.
LLM Wiki는 자동화 수준을 높일수록 검증 체계가 중요해진다. 문서에는 출처 링크, 근거 범위, 불확실성 표시가 필요하고, 원천 자료는 불변 계층으로 보존해야 한다.
Discord-Codex형 지식 워크플로에서는 LLM Wiki 아이디어가 특히 실용적이다. Discord 대화는 빠르게 흐르고, 좋은 결정과 분석이 스레드 안에 묻히기 쉽다. Codex 작업 결과도 터미널 출력, 임시 요약, PR 설명, 런타임 로그 등으로 흩어진다. LLM Wiki는 이런 산출물을 파일 기반 지식 저장소로 묶는 방법을 제공한다.
Discord에서 나온 중요한 분석, 결정, 회고, 운영 지침은 대화창에만 남기지 말고 Markdown 문서로 편입할 수 있다. 장기 프로젝트에서는 특정 날짜의 답변보다 지속 갱신되는 주제 페이지가 더 유용하다.
Discord 메시지, Codex 로그, Git diff, 테스트 결과, 런타임 DB는 원천 자료로 남기고, LLM이 만든 요약 문서는 별도 위키로 유지하는 것이 바람직하다. 이렇게 해야 나중에 요약이 틀렸을 때 원천으로 되돌아가 검증할 수 있다.
write_agent_handoff 구조는 작업 요청, 산출물 path, 허용 파일 형식이 명시되어 있어 LLM Wiki와 궁합이 좋다. 위키 생성 작업을 권한과 경로가 통제된 방식으로 수행하게 한다.
문서마다 출처, 관찰 사실, 추론, 리스크, 검증 상태, 후속 작업을 분리해야 한다. 이렇게 해야 모델이 자연어를 임의로 해석해 권한이나 상태를 판단하는 일을 줄일 수 있다.
봇 운영, background job, thread persistence, approval, write-agent routing 같은 주제는 시간이 지나며 구현이 바뀔 수 있다. 문서마다 마지막 검증 시점과 근거 로그를 남기고, 오래된 문서는 lint 대상으로 삼아야 한다.
GeekNews의 LLM-Wiki 페이지는 Karpathy의 아이디어를 한국어 사용자에게 압축적으로 소개하면서, 실제 도입 시 고려해야 할 커뮤니티 쟁점까지 보여주는 안내서 역할을 한다. 가장 중요한 메시지는 LLM을 질문에 답하는 도구로만 쓰지 말고, 사람이 소유하고 검증할 수 있는 지식 저장소를 유지하는 편집 파트너로 쓰자는 것이다.
다만 성공 조건은 자동화 그 자체가 아니라 구조다. 원천 자료 보존, Markdown 스키마, 변경 로그, 검증 루틴, 사람의 리뷰가 함께 있어야 한다. 이 조건이 충족되면 LLM Wiki는 개인 지식관리뿐 아니라 Discord-Codex 같은 장기 작업형 에이전트 환경에서도 매우 실용적인 운영 모델이 될 수 있다.