raw: 원천 보존
회의록, 웹 문서 저장본, PDF 추출문, 업무 메모처럼 결론의 근거로 다시 돌아갈 수 있는 자료를 보존한다. 제목, 출처, 확인 날짜, 자료 성격이 최소 메타데이터다.
LLM위키를 단순한 폴더 묶음이 아니라 원천, 해석, 작업 기준을 분리하는 신뢰 구조로 이해하기 위한 page-level 분석이다.
data/runtime/write-agents/LLM wiki reference analyses/md/wikidocs/pages/02-01-three-layers.md이 절의 핵심은 LLM위키의 기본 구조를 raw, wiki, AGENTS.md 또는 CLAUDE.md라는 세 층으로 나누어 이해하라는 것이다. 세 층은 정리 취향이 아니라 문장의 신뢰 등급을 분리하기 위한 장치다. 원본, 요약, 사람의 판단, 보고서 초안이 한 공간에 섞이면 어떤 문장이 실제 근거이고 어떤 문장이 추정인지 추적하기 어렵다.
raw: 원천 보존회의록, 웹 문서 저장본, PDF 추출문, 업무 메모처럼 결론의 근거로 다시 돌아갈 수 있는 자료를 보존한다. 제목, 출처, 확인 날짜, 자료 성격이 최소 메타데이터다.
wiki: 재사용 지식raw를 그대로 반복하지 않고 질문, 보고서, 작업 계획에 다시 쓰기 쉬운 파생 지식으로 재구성한다. 확인된 내용, 근거, 확인 필요, 다음 질문을 분리한다.
Codex의 AGENTS.md나 Claude Code의 CLAUDE.md처럼 LLM이 raw와 wiki를 어떤 기준으로 다룰지 정한다. raw 수정 금지, 출처 표기, 충돌 처리, 민감 정보 제한을 명시한다.
| 원문 절 | 핵심 내용 | 실무 의미 |
|---|---|---|
| 도입부와 세 층 정의 | 원본, 정리 문서, 작업 규칙이 섞이면 신뢰하기 어렵고, LLM위키는 raw, wiki, 규칙 파일로 나뉜다. | 폴더 이름보다 역할을 먼저 정해야 한다. 구조는 장식이 아니라 검증 가능한 업무 지식의 전제다. |
| 세 층이 필요한 이유 | 한 폴더에 모든 자료를 넣으면 원본, LLM 요약, 사람 판단, 산출물이 같은 검색 결과에 섞인다. | 검색 가능성과 검증 가능성은 다르다. 검색되는 문서라도 근거 등급이 불명확하면 위험하다. |
raw 설명 | 회의록 원문, 웹 문서 저장본, PDF 추출문, 업무 메모를 원본 상태로 보존한다. | raw는 많이 모으는 창고가 아니라 나중에 다시 확인할 증거 위치다. |
wiki 설명 | 자주 읽히고 질문과 산출물에 활용되는 정리 지식이다. | wiki는 원문 복사본이 아니라 여러 원천의 반복 개념과 결정을 묶는 업무 지식이어야 한다. |
| 규칙 파일 | 도구별로 읽는 파일이 다르며 Codex는 AGENTS.md, Claude Code는 CLAUDE.md를 확인해야 한다. | 작업 기준을 매번 대화로 설명하지 않고 문서화하되, 결과 검토를 생략하지 않는다. |
| 작은 실습과 검증 포인트 | raw/meeting-notes, wiki/concepts, output, 규칙 파일을 만들고 역할을 구분한다. | 2.2 폴더 구조와 2.3 문서 품질 기준으로 넘어가기 전의 이해 게이트다. |
원문은 모든 자료를 docs/ 같은 한 폴더에 두는 방식을 완전히 부정하지 않는다. 문제는 그렇게 모아 둔 문서가 검색은 되더라도 신뢰 등급이 분리되지 않는다는 점이다. 회의록 원문에 개인 판단이 덧붙고, LLM 요약문이 raw처럼 저장되고, 보고서 초안이 결정 기록처럼 보이면 LLM도 사람도 근거와 추정을 구분하기 어렵다.
| 층 | 핵심 질문 | 좋은 상태 | 실패 신호 |
|---|---|---|---|
raw | 이 결론의 원천은 어디인가? | 제목, 출처, 확인 날짜, 자료 성격이 있고 원본 상태가 보존된다. | 회의록 원문에 개인 판단이나 LLM 요약이 덧붙어 있다. |
wiki | 이 원천을 다음 질문과 산출물에 어떻게 쓸 것인가? | 확인된 내용, 근거, 확인 필요, 다음 질문이 분리되어 있다. | 출처 없는 단정문과 그럴듯한 추정이 지식처럼 남는다. |
| rules | LLM은 이 위키를 어떤 기준으로 다룰 것인가? | raw 수정 금지, 출처 표기, 충돌 처리, 민감 정보 제한이 명시되어 있다. | 요청마다 처리 방식이 달라지고 원본을 덮어쓸 수 있다. |
이 분리는 뒤 장의 전제가 된다. 5장에서 자료를 넣을 때는 무엇이 원천인지 판단해야 하고, 6장에서 답변을 검증할 때는 raw와 wiki의 근거 라벨이 필요하며, 7장에서 보고서를 만들 때는 output이 raw와 wiki로 되돌아갈 수 있어야 한다.
raw 운영 기준raw는 자료 창고가 아니라 검증 anchor다. 회의록 원문, 공개 웹 문서 저장본, PDF 추출 텍스트, 업무 메모, 조사 자료는 raw 후보가 될 수 있다. 그러나 LLM 요약문, 개인 해석, 보고서 초안, 민감 정보는 그대로 raw에 넣기 전에 성격과 보안 기준을 판단해야 한다.
| 자료 유형 | 처리 | 후속 조치 |
|---|---|---|
| 회의록 원문 | raw 후보 | 회의 날짜, 참석 범위, 작성자 또는 기록 책임을 남긴다. |
| 공개 웹 문서 저장본 | raw 후보 | URL, 발행자, 확인일, 수집 이유를 기록한다. |
| PDF 추출 텍스트 | raw 후보이나 한계 표시 필요 | 파일명, 버전, 추출 범위, 누락 가능성을 남긴다. |
| LLM 요약문 | wiki 또는 output 후보 | 요약의 원천 raw와 확인 필요를 연결한다. |
| 개인 해석 | wiki, log, 확인 필요 후보 | 해석의 근거와 상태를 표시한다. |
| 고객 개인정보, 계약 조건, 비공개 코드 | 보류 또는 별도 통제 | 익명화, 접근 권한, 조직 정책, 도구 데이터 처리 범위를 확인한다. |
wiki 문서의 기본 골격wiki는 raw를 줄인 요약문이 아니라 질문 가능한 파생 지식이다. 원문의 좋은 wiki 문서 기준은 한 문장 요약, 확인된 내용, 근거, 확인 필요, 다음 질문을 갖추는 것이다. 이 구조를 지키면 LLM에게 가장 작은 실험 후보, 개인정보 위험이 낮은 후보, 보고서에 넣을 주장 같은 후속 질문을 더 좁고 검증 가능하게 던질 수 있다.
| 구성 요소 | 역할 | 빠지면 생기는 문제 |
|---|---|---|
| 한 문장 요약 | 문서가 어떤 업무 판단에 쓰이는지 밝힌다. | 자료 목록인지 판단 문서인지 알기 어렵다. |
| 확인된 내용 | raw나 검토된 wiki에서 확인되는 사실과 결정을 분리한다. | 임시 추정이 운영 기준처럼 굳어진다. |
| 근거 | raw 경로, URL, 확인일, 자료 성격을 남긴다. | 문장별 검증을 할 수 없다. |
| 확인 필요 | 측정 전 효과, 미정 담당자, 보안 기준을 보류한다. | 모르는 내용을 아는 것처럼 쓰게 된다. |
| 다음 질문 | 비교, 실험 계획, 보고서, 실행 항목으로 이어진다. | 위키가 읽고 끝나는 메모가 된다. |
| 관련 문서 | 상위 개념, 비슷한 후보, 위험 기준, output으로 연결한다. | 문서가 고립되어 중복과 모순이 늘어난다. |
규칙 파일은 반복 설명을 줄이는 운영 계약이다. 단, 파일이 있다는 사실만으로 결과가 자동 보장되지는 않는다. LLM이 실제로 해당 파일을 읽는지, 산출물이 그 기준을 지켰는지 별도로 검토해야 한다.
| 항목 | 최소 기준 | 검증 질문 |
|---|---|---|
| 폴더 역할 | raw는 원본, wiki는 정리된 지식, output은 산출물이라고 명시한다. | LLM이 위치별 책임을 설명할 수 있는가? |
| 원본 보호 | raw 파일을 임의로 덮어쓰지 않는다. | 수정 필요 시 별도 메모나 log.md를 쓰는가? |
| 출처 표시 | wiki 핵심 주장에는 근거 위치를 남긴다. | 문장마다 raw 또는 원문 위치를 찾을 수 있는가? |
| 불확실성 | 근거 부족 시 확인 필요, 추정, 현재 자료 기준으로 제한한다. | 자연스러운 단정문으로 바뀐 추정이 없는가? |
| 충돌 처리 | 서로 다른 원천이 충돌하면 조용히 합치지 않는다. | 충돌 사실과 확인 필요가 남는가? |
| 민감 정보 | 외부 전송, 웹 검색, 플러그인 사용 전 보안 기준을 확인한다. | 개인정보, 계약 조건, 비공개 코드가 무심코 raw나 output에 들어가지 않았는가? |
raw에 들어갈 자료의 제목, 출처, 확인 날짜, 자료 성격을 정한다.wiki 문서 템플릿에 한 문장 요약, 확인된 내용, 근거, 확인 필요, 다음 질문, 관련 문서를 포함한다.log.md 갱신 기준을 넣는다.raw가 보존해야 할 원천 자료 유형을 설명할 수 있다.확인 필요, 추정, 현재 자료 기준으로 제한되어 있다.AGENTS.md 또는 CLAUDE.md에 raw 보존과 근거 표시 기준이 들어 있다.이 절을 실제 업무에 적용할 때 LLM에게 던질 질문은 raw와 wiki를 구분하도록 만들어야 한다. 예를 들어 “아래 raw 원천 자료에서 wiki 문서 후보를 만들되 raw를 수정하지 말고, 확인된 내용, 근거, 확인 필요, 다음 질문을 분리해 주세요”처럼 요청한다.
검증 질문은 “이 문장은 원문에서 나온 사실인가, LLM이 만든 정리인가, 내가 덧붙인 판단인가?”, “wiki 문서가 원본의 조건과 예외를 생략하지 않았는가?”, “도구가 AGENTS.md 또는 CLAUDE.md를 실제로 읽는가?”처럼 문장 단위와 운영 단위를 함께 점검한다.
index.md, log.md, output으로 배치한다.raw, wiki, output, index.md, log.md, AGENTS.md가 최종적으로 어떤 구조로 남는지 예고한다.이 페이지는 2026-06-06 KST에 작성된 Markdown 분석을 HTML로 변환한 산출물이다. 원문이 제시한 외부 참고 자료의 최신성은 이 페이지에서 별도로 확정하지 않았다. 실제 조직 자료에는 고객명, 계약 조건, 개인정보, 비공개 코드, 내부 정책이 포함될 수 있으므로 raw 보관 전 익명화, 접근 권한, 외부 LLM 전송 여부, 삭제와 감사 기준을 확인해야 한다.
세 층 구조는 최소 운영 기준이다. 위키가 커지면 2.2의 index.md, log.md, output과 8장의 감사 루틴을 함께 운영해야 한다.