원문과 확인 범위
- 장 원문: 5장. 자료를 넣고 다시 쓰기 좋은 지식으로 바꾸기
- 원천 도서: LLM위키 완벽 가이드
- 하위 원문: 5.1 자료를 넣기 전에 정할 기준, 5.2 자료 수집하기, 5.3 위키 문서로 정리하기
- 참고 자료: Andrej Karpathy LLM Wiki Gist, nvk/llm-wiki, nvk/llm-wiki Releases, OpenAI Codex AGENTS.md 문서, Anthropic Claude Code memory 문서, Obsidian Web Clipper 도움말, WiCER
장 랜딩은 세 절 목록 중심의 짧은 입구이며, 실질 내용은 5.1의 투입 기준, 5.2의 수집 카드와 처리 이력, 5.3의 주제별 문서화와 링크 구조를 함께 읽어야 완성된다.
핵심 요지
4장에서 첫 업무 주제와 첫 질문을 정했다면, 5장은 그 질문에 답할 자료를 선별하고 정리하는 단계다. 자료는 raw/에 원천 카드 또는 원문으로 남고, 정리된 지식은 wiki/에 별도 문서로 들어간다. 모든 자료 투입은 log.md에서 원천 자료와 결과 문서가 연결되어야 한다.
5장의 핵심은 수집량이 아니라 재사용 가능한 근거 구조다. 자료를 넣기 전에 기준을 세우고, 원천 자료와 요약문을 분리하고, 자료 유형별 신뢰도와 최신성을 표시하고, 수집 범위와 제외 범위를 정한 뒤, 실제 수집 자료를 주제별 문서로 재구성해야 한다.
원문 구조
| 원문 | 역할 | 핵심 내용 | 다음 단계 산출물 |
|---|---|---|---|
| 5장 랜딩 | 자료화 장의 입구 | 5.1, 5.2, 5.3으로 구성됨을 안내한다. | 세 절을 순서대로 읽는 탐색 경로 |
| 5.1 자료를 넣기 전에 정할 기준 | 투입 기준 설계 | 원천과 요약 분리, 신뢰도, 최신성, 포함/제외 범위, 민감 정보 기준을 정한다. | 수집 기준 카드, 신뢰도 표, 최신성 표시, 보류 기준 |
| 5.2 자료 수집하기 | 원천 카드와 처리 이력 | 웹 문서, 회의록, 업무 메모를 raw/와 wiki/로 나누고 log.md에 연결한다. | 웹 문서 수집 카드, 회의록 요약, 결정/실행/확인 필요 분리, 처리 이력 |
| 5.3 위키 문서로 정리하기 | 주제별 문서화 | 흩어진 자료를 다시 물을 질문 기준으로 나누고, 중복/모순/링크/index를 관리한다. | 주제별 문서, 기준 문서, 모순 후보, 관련 링크, index/log 갱신 |
세 절은 하나의 파이프라인이다. 5.1 없이 5.2를 하면 URL과 회의록이 기준 없이 쌓인다. 5.2 없이 5.3을 하면 주제 문서는 근거 경로가 약한 요약문이 된다. 5.3 없이 5.2에서 멈추면 raw와 source note는 있어도 다음 질문에서 무엇을 참고해야 할지 찾기 어렵다.
장 수준 합성
1. 자료 투입은 질문에서 시작한다
자료를 넣기 전에는 이 위키가 답해야 할 질문을 한 문장으로 고정한다. 업무 자동화나 회사 지식처럼 넓은 범위는 고객 문의 분류 자동화, 주간 회의록 실행 항목 추출처럼 작은 질문으로 줄여야 한다.
- 이 위키가 답할 질문을 한 문장으로 쓴다.
- 그 질문에 필요한 자료 유형을 정한다.
- 포함할 범위와 제외할 범위를 동시에 정한다.
- 민감 정보 처리 기준을 정한다.
- 범위가 넓으면 자료를 넣기 전에 질문을 다시 줄인다.
2. raw/와 wiki/ 분리는 첫 번째 신뢰 경계다
| 자료 상태 | 둘 위치 | 문서 책임 |
|---|---|---|
| 회의록 원문, 웹 문서 원천 카드, PDF 추출문, 인터뷰 메모 | raw/ | 원문, 출처, 확인 날짜, 자료 성격을 보존한다. |
| 결정 사항, 반복 기준, 요약, 질문 후보, 확인 필요 | wiki/ | 다음 질문과 산출물에 쓰기 쉽게 재구성한다. |
| 보고서 초안, 실행 계획, 공유용 문서 | output/ | 검증된 위키 지식을 독자와 행동에 맞게 변환한다. |
| 날짜, 작업, 원천, 결과, 상태, 다음 행동 | log.md | 어떤 원천이 어떤 위키 문서로 바뀌었는지 추적한다. |
원천 자료와 요약문이 섞이면 LLM이 만든 문장이 원문처럼 보이고, 오래된 요약이 최신 사실처럼 쓰이며, 나중에 답변을 검증할 기준이 사라진다.
3. 좋은 수집 기준 카드는 보류할 자료를 분명하게 만든다
| 기준 | 포함 신호 | 제외 또는 보류 신호 |
|---|---|---|
| 질문 직접성 | 현재 위키 질문의 답변 근거가 된다. | 배경지식일 뿐 지금 질문에 직접 답하지 않는다. |
| 검증 가능성 | 출처, 날짜, 작성자, 원문 위치가 있다. | 전달자만 있고 원문으로 돌아갈 수 없다. |
| 민감 정보 | 익명화와 권한 확인이 끝났다. | 이름, 연락처, 주문번호, 계약 정보가 그대로 있다. |
| 신뢰도 | 공식 문서, 릴리스 노트, 최신 내부 정책, 회의 결정이다. | 개인 추정, 오래된 블로그, 확인 안 된 구두 전달이다. |
| 최신성 | 다시 확인할 시점이 적혀 있다. | 버전, 정책, 가격, 보안 기준인데 확인 날짜가 없다. |
4. 자료 신뢰도는 문장 강도를 정하는 장치다
공식 문서와 릴리스 노트는 기능, 명령, 정책 설명의 강한 근거가 될 수 있다. 회의록은 결정과 맥락을 보여 주지만 발언과 결정을 분리해야 한다. 개인 메모와 블로그는 문제 발견, 경험 사례, 보조 설명에는 쓸 수 있지만 공식 사실처럼 단정하면 안 된다.
| 등급 | 넣을 수 있는 자료 | 문서에서의 표현 | 다음 검증 |
|---|---|---|---|
| 높음 | 공식 문서, 릴리스 노트, 최신 내부 정책, 원문 회의록의 확정 결정 | 공식 문서 기준, 회의록 원문 기준, 정책 문서 기준 | 버전, 날짜, 적용 범위 확인 |
| 중간 | 내부 메모, 경험 사례, 블로그, 튜토리얼, 소수 표본 | 보조 자료 기준, 제한적 확인, 추가 확인 필요 | 강한 근거와 대조 |
| 낮음 | 개인 추정, 아이디어, 미확인 전언, LLM 답변 초안 | 가설, 참고 의견, 확인 필요 | 원천 자료 수집 전까지 결정 근거로 쓰지 않음 |
5. 웹 문서 수집은 감사 가능한 원천 카드 작성이다
- 웹 문서를 발견한다.
- 현재 위키 질문에 직접 답하는지 판단한다.
- 넣을 가치가 있으면
raw/web/에 원천 카드를 만든다. wiki/sources/에 다시 질문하기 좋은 정리 문서를 만든다.index.md에 필요한 링크를 추가한다.log.md에 날짜, 원천 자료, 결과 문서, 상태를 기록한다.- 나중에 질문이나 산출물에서 해당 source note를 참고한다.
6. 회의록과 업무 메모는 결정, 실행, 확인 필요로 분리한다
| 원문에 섞인 것 | wiki/에서의 분리 | 처리 원칙 |
|---|---|---|
| 참석자의 발언과 의견 | 논의 또는 배경 | 결정처럼 쓰지 않는다. |
| 확정된 결론 | 결정 | 결정, 이유, 근거를 남긴다. |
| 다음 행동 | 실행 항목 | 담당자, 기한, 완료 기준이 불명확하면 확인 필요로 둔다. |
| 불확실한 조건 | 확인 필요 | 삭제하지 말고 다음 자료 수집 후보로 남긴다. |
| 고객명, 개인정보, 계약 정보 | 민감 정보 처리 | 익명화, 제외, 권한 확인 후 사용한다. |
7. 처리 이력은 위키의 근거 지도다
log.md는 작업 일지가 아니라 감사 장치다. 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동을 연결해 어떤 raw가 어떤 wiki 문서를 만들었는지 추적하게 한다.
8. 주제별 문서화는 다음 질문 기준의 분해다
| 다시 물을 질문 | 적합한 문서 | 판단 기준 |
|---|---|---|
| 어떤 문의부터 자동화해야 하는가? | wiki/inquiry-types.md | 문의 유형, 빈도, 우선순위, 확인 필요를 다룬다. |
| 자동 응답에서 상담사에게 넘길 조건은 무엇인가? | wiki/escalation-rules.md | 예외, 환불, VIP, 민감 정보 기준을 다룬다. |
| 이번 주 실험은 무엇부터 시작하는가? | wiki/automation-experiment.md | 실험 대상, 성공 기준, 측정 항목을 다룬다. |
| 환불 문의를 어떻게 처리해야 하는가? | wiki/refund-policy-summary.md | 자동화 가능, 상담사 확인, 정책 확인 필요를 나눈다. |
9. 중복과 모순은 삭제보다 표시와 기준 문서화가 먼저다
- 비슷한 문장을 찾는다.
- 같은 사실인지 확인한다.
- 조건이나 날짜가 다른지 비교한다.
- 같은 사실이면 기준 문서 하나로 모으고 다른 문서에서 링크한다.
- 조건이나 날짜가 다르면 삭제하지 않고 조건, 확인 날짜, 현재 판단을 분리한다.
- 근거가 부족한 단정은 확인 필요로 남긴다.
- 다음 조사 질문을 만든다.
10. 링크와 인덱스는 다음 행동 안내다
index.md는 파일 목록이 아니라 사용자가 어느 질문을 어디서 시작해야 하는지 알려 주는 안내판이다. 좋은 링크는 근거, 예외, 다음 행동 중 하나로 이어진다.
실무 적용 절차
- 4장에서 정한 첫 위키 주제와 첫 질문을 다시 쓴다. 질문이 넓으면 자료를 넣기 전에 줄인다.
- 수집 기준 카드를 만든다. 위키 주제, 답해야 할 질문, 포함 범위, 제외 범위, 민감 정보 처리, 신뢰도 표시, 요약문 작성 규칙을 둔다.
- 자료 후보 5개를 적고 자료 유형과 신뢰도를 붙인다. 공식 문서, 릴리스 노트, 내부 정책, 회의록, 개인 메모, 블로그를 같은 무게로 두지 않는다.
- 최신성이 중요한 자료를 표시한다. 도구 명령, API, 가격, 보안 정책, 법률, 내부 정책은 확인 날짜와 다시 확인할 시점을 둔다.
- 애매한 자료는 바로 넣지 않는다. 현재 질문에 직접 답하는가, 원문 검증이 가능한가, 민감 정보 처리가 끝났는가를 확인한다.
- 웹 문서를 넣을 때는
raw/web/에 원천 카드를 만든다. 제목, URL, 발행자 또는 출처, 확인 날짜, 자료 성격, 수집 이유, 원문에서 확인할 내용을 남긴다. - 웹 문서의 정리본은
wiki/sources/에 둔다. 한 문장 요약, 근거, 확인된 내용, 확인 필요를 남기고 raw 카드로 돌아가는 링크를 둔다. - 회의록과 업무 메모는 원래 상태를 먼저 보존한다. 회의일, 참석자, 안건, 원문 기록, 자료 성격을 남긴다.
- 회의록 정리본에서는 결정, 실행 항목, 확인 필요를 분리한다. 담당자나 기한이 불명확한 항목은 실행 항목으로 확정하지 않는다.
- 자료를 넣을 때마다
log.md에 처리 이력을 남긴다. 최소 항목은 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동이다. - raw에 있는 자료가 log에 언급되는지 점검한다. 누락되면 자료를 믿기 전에 처리 이력부터 보강한다.
- 수집한 자료를 한 파일 요약으로 끝내지 않는다. 다시 물을 질문을 기준으로 주제 문서를 나눈다.
- 같은 원천 자료가 여러 질문에 쓰이면 여러 위키 문서에 연결한다. 단, 각 문서마다 원천 경로와 확인 날짜를 남긴다.
- 중복 문장을 찾으면 기준 문서로 모으고 다른 문서에서는 링크한다.
- 충돌 후보를 발견하면 바로 삭제하지 않는다. 조건, 날짜, 자료 성격을 비교하고 확인 필요와 다음 조사 질문을 남긴다.
index.md에는 핵심 질문과 먼저 볼 문서, 확인 필요를 둔다. 단순 파일 목록이 아니라 사용자의 다음 행동을 안내하게 한다.- 관련 문서 링크는 근거, 예외, 다음 행동 중 하나로 설명 가능할 때만 붙인다.
- 6장으로 넘어가기 전, 각 주제 문서가 질문에 다시 쓰기 쉬운지, 근거가 raw와 log로 추적되는지 확인한다.
예시와 체크리스트
자료 수집 기준 카드 템플릿
| 항목 | 작성할 내용 | 합격 기준 |
|---|---|---|
| 위키 주제 | 작고 반복되는 업무 주제 | 다음 주 실제 질문에 쓰인다. |
| 답해야 할 질문 | 이 위키가 답할 핵심 질문 | 자료 목록보다 질문이 먼저다. |
| 포함 범위 | 기간, 자료 유형, 정책, 회의록, 샘플 | 질문에 직접 답하는 자료만 들어간다. |
| 제외 범위 | 오래된 자료, 민감 원문, 무관 문서, 미확인 전언 | 넣지 않을 자료가 분명하다. |
| 민감 정보 처리 | 익명화, 권한, 외부 전송, 보류 기준 | 기준이 불명확하면 수집하지 않는다. |
| 신뢰도 표시 | 높음/중간/낮음 또는 공식/보조/가설 | 자료 성격에 따라 문장 강도가 달라진다. |
| 요약문 규칙 | 원천 경로, 확인 날짜, 확인된 내용, 확인 필요 | raw와 wiki가 섞이지 않는다. |
웹 문서 원천 카드 최소 항목
| 항목 | 작성 내용 | 실패 신호 |
|---|---|---|
| 제목 | 나중에 같은 자료를 찾을 수 있는 이름 | URL만 있고 무엇인지 모른다. |
| URL | 원문으로 돌아갈 링크 | 복사본만 있고 출처가 없다. |
| 발행자 또는 출처 | 공식 문서, 조직, 저자, 저장소 | 공식 문서인지 블로그인지 모른다. |
| 확인 날짜 | 실제 확인한 날짜 | 최신성 판단이 불가능하다. |
| 자료 성격 | 공식 문서, 릴리스, 도움말, 사례, 보조 자료 | 강한 근거와 참고 의견이 섞인다. |
| 수집 이유 | 현재 위키 질문과의 연결 | 수집 이유 없이 자료가 쌓인다. |
| 확인 필요 | 버전, 갱신일, 적용 환경, 권한 | 오래된 내용이 현재 기준처럼 쓰인다. |
회의록 수집과 정리 체크리스트
- 회의록 원문은
raw/meetings/에 남아 있다. - 회의일, 참석자, 안건, 자료 성격이 기록되어 있다.
- 회의 발언과 확정 결정을 구분했다.
- 실행 항목에 담당자, 기한, 완료 기준이 없으면 확인 필요로 낮췄다.
- 고객명, 이메일, 전화번호, 주문번호, 계약 조건, 내부 금액은 그대로 복사하지 않았다.
- 정리 문서에는 원천 자료 경로와 확인 날짜가 있다.
log.md에 원천 자료와 결과 문서가 한 줄로 연결되어 있다.
중복과 모순 처리표
| 발견 상태 | 바로 하지 말 것 | 안전한 처리 | 다음 질문 |
|---|---|---|---|
| 같은 기준이 여러 문서에 반복된다. | 모든 문서에서 임의로 삭제 | 기준 문서 하나를 만들고 다른 문서에서 링크 | 대표 문서는 어디인가? |
| 결론이 서로 달라 보인다. | 최신 문장만 남기고 이전 판단 삭제 | 조건, 날짜, 원천 자료를 비교하고 모순 후보로 표시 | 어떤 조건에서 달라지는가? |
| 근거 없는 강한 단정이 있다. | 표현만 부드럽게 바꿈 | 확인 필요로 내리고 원천 자료 요청 | 어떤 raw가 필요할까? |
| 오래된 문서와 새 문서가 충돌한다. | 오래된 문서를 조용히 폐기 | 최신 판단, 이전 판단, 변경 이유를 분리 | 언제부터 기준이 바뀌었나? |
| 링크가 너무 많다. | 모든 문서에 전체 목록 반복 | 근거, 예외, 다음 행동을 설명하는 링크만 유지 | 이 링크를 눌러 무엇을 확인하나? |
5장 완료 산출물
질문, 포함/제외, 민감 정보, 신뢰도, 최신성을 담아 넣을 자료와 보류할 자료를 판단한다.
웹 문서, 회의록, 메모의 제목, 출처, 확인 날짜, 수집 이유를 남겨 원문으로 돌아갈 수 있게 한다.
한 문장 요약, 근거, 확인된 내용, 확인 필요를 남기고 raw를 덮어쓰지 않는다.
날짜, 작업, 원천, 결과, 상태, 다음 행동을 연결한다.
자료 종류가 아니라 질문별로 나누어 문서 제목만 보고 쓰임을 알 수 있게 한다.
처음 보는 사람이 질문별 시작점과 근거, 예외, 다음 행동을 찾게 한다.
검증 질문
- 자료를 넣기 전에 이 위키가 답해야 할 질문을 한 문장으로 썼는가?
- 포함 범위와 제외 범위를 모두 적었는가?
- 개인정보, 계약 정보, 고객 원문, 내부 기밀을 그대로 넣지 않도록 기준을 세웠는가?
- 원천 자료와 요약문이 서로 다른 위치에 있는가?
- 요약문에 원천 자료 경로, 확인 날짜, 확인된 내용, 확인 필요가 있는가?
- 자료 유형별 신뢰도를 표시했는가?
- 최신성이 중요한 자료에 다시 확인할 시점을 남겼는가?
- 웹 문서는 제목, URL, 발행자 또는 출처, 확인 날짜, 수집 이유를 갖는가?
- 회의록과 업무 메모에서 결정, 실행 항목, 확인 필요를 분리했는가?
log.md에 모든 raw 자료와 결과 wiki 문서가 연결되어 있는가?- 주제 문서가 자료 종류가 아니라 다시 물을 질문 기준으로 나뉘었는가?
- 중복과 모순을 삭제로 숨기지 않고 기준 문서, 조건, 날짜, 확인 필요로 처리했는가?
- 관련 링크가 근거, 예외, 다음 행동 중 하나로 설명되는가?
- 6장에서 답변을 검증할 수 있도록 주장과 근거와 확인 필요가 분리되어 있는가?
관련 문서 연결
- 통합 루트: 책 전체를
raw -> wiki -> output -> review흐름으로 통합한 안내 문서다. - 4장. 첫 번째 주제 위키 만들기: 자료를 넣기 전에 첫 주제, 첫 질문, 초기 구조를 준비한다.
- 4.3 첫 질문으로 방향 잡기: 자료 수집 기준의 출발점이 되는 첫 질문을 설계한다.
- 5.1 자료를 넣기 전에 정할 기준: 원천/요약 분리, 신뢰도, 최신성, 포함/제외 범위, 민감 정보 기준을 세운다.
- 5.2 자료 수집하기: 웹 문서, 회의록, 업무 메모를 원천 카드와 정리 문서와 처리 이력으로 연결한다.
- 5.3 위키 문서로 정리하기: 흩어진 자료를 질문별 주제 문서, 기준 문서, 링크, index/log로 재구성한다.
- 6장. 위키에 질문하고 답을 검증하기: 5장에서 만든 문서에 질문하고 답변 문장별 근거를 검증한다.
- 6.1 좋은 질문 만들기: 5장의 자료 범위와 주제 문서를 업무 질문의 자료 범위로 사용한다.
- 6.2 답변의 근거 확인하기: 5장에서 남긴 raw, source note, log를 바탕으로 문장별 근거 라벨을 붙인다.
- 7장. 위키에서 업무 산출물 만들기: 5장에서 정리한 지식을 보고서와 실행 항목으로 바꾼다.
- 8장. 오래 믿고 쓰는 LLM위키 운영법: 5장에서 남긴 기준 카드, 처리 이력, index/link 구조를 장기 감사 대상으로 삼는다.
누락 또는 주의사항
- 이 문서는 장 랜딩만이 아니라 5.1-5.3 세부 원문을 함께 반영해 장 수준으로 재구성했다.
- 원문에는 Bash/Zsh와 Python 기반 실습 명령, 예제 파일 내용, Mermaid 도해가 나오지만, 이 HTML은 실습의 성공 기준과 운영 원칙을 절차와 체크리스트 중심으로 정리했다.
- 외부 도구와 구현체는 2026-05-16 KST 확인 자료 기준이다. 실제 도입 전에는 현재 공식 문서, 설치된 도움말, 릴리스 노트, 조직 보안 기준을 다시 확인해야 한다.
AGENTS.md,CLAUDE.md,rules.md같은 지침 파일은 LLM 행동을 유도하는 기준이지 결과를 강제하는 보안 장치가 아니다. raw 보존, 출처 표기, 확인 필요, log 갱신은 결과물에서 다시 검토해야 한다.- 웹 문서 전체 저장, 회의 녹취, 고객 문의 원문, 사내 문서, 유료 문서, 개인정보 포함 자료는 공개 여부와 권한과 보안 기준을 먼저 확인해야 한다.
- WiCER는 원문에서 제한된 근거로 언급된 프리프린트다. 검증 없는 지식 컴파일의 위험을 설명하는 참고로만 사용하고, 연구 결과를 확정된 운영 규칙처럼 단정하지 않는다.