자료 수집은 파일을 많이 넣는 일이 아니라, 나중에 의심하고 다시 검증할 수 있는 원천과 처리 이력을 만드는 일이다. 이 페이지는 WikiDocs 5.2 절의 웹 문서 수집, 회의록 분리, LLM 작업 요청, log.md 기록 방식을 실무 절차로 재구성한다.
5.2의 핵심은 URL, 파일, 회의록을 저장하는 행위보다 원천 자료, 확인 날짜, 수집 이유, 처리 이력을 남기는 데 있다. 그래야 LLM이 만든 요약을 6장과 8장에서 다시 검증할 수 있다.
웹 자료는 raw/web의 원천 카드와 wiki/sources의 source note로 분리한다. 제목, URL, 발행자, 확인일, 수집 이유, 확인 필요가 있어야 원문 변경과 최신성 위험을 추적할 수 있다.
업무 메모와 회의록은 지저분하지만 실제 맥락을 담는다. 원래 상태는 raw/meetings에 보존하고, 결정 사항, 실행 항목, 확인 필요는 wiki/meetings에서 해석 문서로 분리한다.
| 원문 절 | 핵심 내용 | 실무 의미 |
|---|---|---|
| 도입부 | 자료 수집은 LLM위키의 첫 단추이며 원천 자료, 확인 날짜, 처리 이력이 있어야 한다. | ingest는 많이 넣는 작업이 아니라 신뢰 가능한 근거를 만드는 작업이다. |
| 웹 문서 넣기 | 제목, URL, 발행자, 확인 날짜, 수집 이유를 함께 남긴다. | URL 저장과 source card 작성을 구분한다. |
| 웹 문서 수집 흐름 | 가치 판단, raw/web 저장, wiki/sources 정리, index.md 링크, log.md 기록으로 이어진다. | 수집 자료는 raw와 wiki와 index와 log로 이어져야 한다. |
| 웹 전체 저장의 주의 | 웹 클리퍼 도구를 쓰더라도 공개, 사내, 유료, 고객 자료는 권한이 다르다. | 본문 저장은 권한과 보안 기준이 확실할 때만 한다. |
| 업무 메모와 회의록 넣기 | 메모는 불완전하고 추정과 결정이 섞이지만 실제 맥락이 남는다. | 지저분함은 raw 가치지만, 해석은 분리해야 한다. |
| 회의록을 위키 지식으로 바꾸는 흐름 | 회의 중 메모를 raw에 저장하고 결정, 실행 항목, 확인 필요를 wiki 요약으로 만든다. | 결정은 보고서 근거, 실행 항목은 할 일, 확인 필요는 다음 수집의 출발점이다. |
| LLM에게 맡길 때의 요청 예시 | 특정 raw만 근거로 쓰고, 실제 결정만 정리하며, 개인정보를 복사하지 말고, log를 갱신하게 한다. | LLM 요청은 좋은 글 작성 요청이 아니라 신뢰 경계와 출력 위치 지정이다. |
| 처리 이력 남기기 | 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동을 남긴다. | log.md는 raw와 wiki와 후속 질문을 연결하는 감사 경로다. |
| 5.2의 검증 포인트 | raw 보존, wiki 분리, 확인 날짜, 출처 경로, 결정/추정 구분, 처리 이력을 점검한다. | 완료 기준은 파일 수가 아니라 검증 가능성이다. |
5.2가 말하는 수집의 품질은 원천성, 확인 가능성, 연결성으로 요약된다. 원천성은 raw에 원문 또는 원천 카드가 남는 상태다. 확인 가능성은 URL, 확인일, 자료 성격, 수집 이유가 있는 상태다. 연결성은 정리 문서와 log가 raw를 가리키는 상태다.
| 품질 기준 | 좋은 상태 | 실패 신호 | 후속 영향 |
|---|---|---|---|
| 원천성 | raw에 원문 또는 원천 카드가 남는다. | LLM 요약문이 원본처럼 저장된다. | 6.2의 문장별 근거 검증이 불가능해진다. |
| 확인 가능성 | URL, 확인일, 자료 성격, 수집 이유가 있다. | 언제 왜 넣었는지 모른다. | 8.1에서 오래된 주장과 출처 누락을 찾기 어렵다. |
| 연결성 | 정리 문서와 log가 raw를 가리킨다. | raw가 쌓였지만 wiki와 output에서 돌아갈 길이 없다. | 7장의 보고서와 실행 계획이 근거를 잃는다. |
이 관점은 5.1 자료를 넣기 전에 정할 기준의 포함/제외 기준과 5.3 위키 문서로 정리하기의 주제별 문서화 사이를 연결한다.
웹 문서는 시간이 지나며 바뀌거나 사라질 수 있고, 같은 URL 안에서도 섹션과 문맥이 바뀔 수 있다. 그래서 웹 자료를 위키에 넣을 때는 URL만 붙이지 말고 제목, URL, 발행자, 확인 날짜, 수집 이유를 기록해야 한다.
| 위치 | 목적 | 남길 내용 | 피해야 할 일 |
|---|---|---|---|
raw/web/... | 원천 카드 또는 저장본 | 제목, URL, 발행자, 확인 날짜, 자료 성격, 수집 이유, 확인할 항목, 확인 필요 | LLM 해석이나 결론을 원문처럼 섞기 |
wiki/sources/... | 다시 질문하기 쉬운 source note | 한 문장 요약, 근거 raw 경로, 확인된 내용, 확인 필요, 관련 문서 | 원문 전체를 장문 복제하거나 근거 없는 결론 확정하기 |
index.md | 탐색 출발점 | 수집한 원천 자료와 정리 문서 링크 | 긴 원문이나 보고서 본문 저장하기 |
log.md | 처리 이력 | 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동 | 자료가 들어온 이유와 상태를 비워 두기 |
업무 메모와 회의록은 공식 문서보다 문장이 불완전하고 추정, 제안, 결정, 실행 후보가 섞인다. 하지만 바로 그 이유로 실제 업무 맥락을 담는다. 핵심은 원문을 예쁘게 고치는 것이 아니라 원래 상태를 보존하고 해석을 따로 만드는 것이다.
| 자료 종류 | raw/에 남길 것 | wiki/에 정리할 것 | 검증 질문 |
|---|---|---|---|
| 개인 업무 메모 | 작성일, 작성자, 원문 메모, 떠오른 질문 | 반복 업무 규칙, 문제 패턴, 다음 질문 | 개인 생각을 확인된 사실로 쓰지 않았는가? |
| 회의록 | 회의일, 참석 범위, 안건, 원문 기록 | 결정 사항, 실행 항목, 확인 필요 | 논의 중인 의견을 결정으로 승격하지 않았는가? |
| 인터뷰 메모 | 인터뷰 대상, 맥락, 발언 요지, 인용 가능 여부 | 요구사항, 불만, 사용 조건, 확인 필요 | 인용 가능성과 개인정보 기준이 확인됐는가? |
| 결정 기록 | 결정일, 참여자, 대안, 결론 | 채택 이유, 포기한 대안, 재검토 조건 | 결정과 제안, 보류를 분리했는가? |
회의록을 wiki 지식으로 바꿀 때는 결정 사항, 실행 항목, 확인 필요를 따로 뽑는다. 결정 사항은 보고서 근거가 되고, 실행 항목은 할 일 목록이 되며, 확인 필요는 다음 자료 수집과 질문의 출발점이 된다.
LLM에게 회의록이나 웹 자료 정리를 맡길 때는 단순 요약 요청으로 시작하지 않는다. 사용할 raw 파일, 결정과 실행 항목의 판정 기준, 개인정보 복사 금지, 결과 문서 경로, log.md 갱신 방식, 근거 부족 단정 금지를 명시해야 한다.
| 요청 요소 | 왜 필요한가 | 약한 요청의 위험 |
|---|---|---|
| 사용할 raw 범위 지정 | 위키 밖 일반론과 다른 자료 혼입을 줄인다. | LLM이 관련 없어 보이지만 그럴듯한 배경지식을 섞는다. |
| 결정/실행/확인 필요 분리 | 회의록의 신뢰 등급을 보존한다. | 논의, 제안, 결정이 같은 문장으로 합쳐진다. |
| 민감 정보 복사 금지 | raw와 output의 보안 경계를 지킨다. | 고객 원문, 개인정보, 계약 정보가 파생 문서로 확산된다. |
| 출력 경로 지정 | raw와 wiki와 output 책임을 유지한다. | 요약이 원천 위치에 저장되거나 파일이 흩어진다. |
| log 갱신 요구 | 처리 이력과 후속 검증을 남긴다. | 어떤 raw가 어떤 wiki를 만들었는지 모른다. |
| 근거 부족 단정 금지 | 추정을 업무 지식으로 굳히지 않는다. | 미확정 담당자, 일정, 효과가 확정문처럼 남는다. |
log.md는 위키의 lineage를 유지하는 최소 장부다log.md는 열심히 정리했다는 기록이 아니라 raw와 wiki와 나중의 질문을 연결하는 lineage 기록이다. 좋은 처리 이력은 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동을 짧게라도 담는다.
| 필드 | 예시 방향 | 쓰임 |
|---|---|---|
| 날짜 | 자료를 확인하거나 처리한 날짜 | 최신성 판단, 감사 순서 확인 |
| 작업 | ingest, update, review, lint | 무엇을 했는지 구분 |
| 원천 자료 | raw/web/..., raw/meetings/... | 원문으로 돌아가기 |
| 결과 문서 | wiki/sources/..., wiki/meetings/... | 파생 문서 찾기 |
| 상태 | 초안, 확인 필요, 검토 완료 | 신뢰 수준 판단 |
| 다음 행동 | 승인자 확인, 최신 문서 재확인 | 후속 작업 연결 |
| 실패 사례 | 왜 위험한가 | 수정 방향 |
|---|---|---|
| URL만 저장하고 제목, 확인일, 수집 이유를 남기지 않는다. | 원문 변경과 최신성, 수집 목적을 추적할 수 없다. | 웹 원천 카드에 제목, URL, 발행자, 확인일, 수집 이유를 남긴다. |
| 웹 문서 전체를 권한 확인 없이 복사한다. | 유료 문서, 사내 문서, 고객 자료의 저장 권한 문제가 생긴다. | 권한이 불확실하면 메타데이터와 짧은 메모만 두고 본문 저장은 보류한다. |
| 회의록을 깔끔한 요약으로 덮어쓴다. | 실제 발언과 결정, 추정의 경계가 사라진다. | 원문은 raw/meetings, 해석은 wiki/meetings에 둔다. |
| 논의 중인 의견을 결정 사항으로 정리한다. | 보고서와 실행 항목이 잘못된 근거 위에 만들어진다. | 결정, 실행 항목, 확인 필요를 별도 섹션으로 나눈다. |
| 개인정보가 포함된 문의 원문을 wiki에 복사한다. | 민감 정보가 파생 문서와 output으로 퍼진다. | 익명화, 제외, 접근 권한, 동의 기준을 먼저 확인한다. |
| LLM에게 요약만 요청한다. | 근거 범위, 출력 위치, 금지 사항, log 갱신이 빠진다. | raw 범위, 결정 기준, 개인정보 금지, 결과 경로, log 갱신을 요청에 넣는다. |
log.md를 작성하지 않는다. | 어떤 raw에서 어떤 wiki가 나왔는지 시간이 지나면 모른다. | ingest/update/review/lint 기록을 한 줄이라도 남긴다. |
raw/web/에 둔다. 파일명에는 확인 날짜와 주제를 넣어 나중에 찾기 쉽게 한다.wiki/sources/의 source note로 정리한다. 한 문장 요약, 근거 raw 경로, 확인된 내용, 확인 필요, 관련 문서를 포함한다.raw/meetings/ 또는 적절한 raw 위치에 보존한다.wiki/meetings/에 만든다. 원천 자료 경로와 확인 날짜를 반드시 남긴다.index.md에는 수집한 원천 자료와 정리 문서 링크를 짧게 추가한다. 긴 본문은 index에 넣지 않는다.log.md에 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동을 남긴다.| 항목 | 작성 내용 | 검증 질문 |
|---|---|---|
| 제목 | 웹 문서 제목 | 나중에 같은 자료를 찾을 수 있는가? |
| URL | 원문 주소 | 원문으로 돌아갈 수 있는가? |
| 발행자 | 조직, 작성자, 사이트 | 자료 성격과 신뢰 범위를 판단할 수 있는가? |
| 확인 날짜 | YYYY-MM-DD | 최신성 판단이 가능한가? |
| 자료 성격 | 공식 문서, 블로그, 도움말, 내부 문서 등 | 공식성이나 한계를 표시했는가? |
| 수집 이유 | 어떤 위키 질문에 쓰이는지 | 수집 이유가 없으면 제외 또는 보류할 수 있는가? |
| 원문에서 확인할 항목 | 섹션, 기능, 정책, 제한, 예외 | 나중에 검증할 위치가 보이는가? |
| 확인 필요 | 최신성, 권한, 버전, 저장 가능 범위 | 단정하지 말아야 할 항목이 남았는가? |
| 섹션 | 포함할 내용 | 5.2와의 연결 |
|---|---|---|
| 한 문장 요약 | 이 웹 문서가 어떤 업무 질문에 쓰이는지 | wiki/sources는 다시 질문하기 쉬운 정리 문서다. |
| 근거 | raw/web/..., URL, 확인 날짜, 자료 성격 | 원천 자료 경로가 남아야 나중에 표현을 고칠 수 있다. |
| 확인된 내용 | 원문에서 확인되는 내용만 정리 | 웹 문서 요약이 추정으로 커지는 것을 막는다. |
| 확인 필요 | 버전, 최신성, 실제 설치 환경, 권한 | 근거 부족 항목을 단정하지 않는다. |
| 관련 문서 | 상위 wiki, 질문, output, log | index와 log 흐름으로 이어진다. |
| 항목 | 작성 내용 | 주의 |
|---|---|---|
| 회의일 | YYYY-MM-DD | 최신성과 처리 순서를 판단한다. |
| 회의명 | 회의 이름 | 같은 날짜의 여러 회의를 구분한다. |
| 참석 범위 | 팀 또는 역할 단위 | 개인정보가 필요 없으면 개인명 대신 역할명을 쓴다. |
| 기록자 | 기록 담당 | 기록 책임과 신뢰 범위를 판단한다. |
| 자료 성격 | 내부 회의 메모, 자동 전사본, 공식 회의록 등 | 자동 전사본은 오류와 동의 기준을 확인한다. |
| 원문 메모 | 발언, 논의, 결정 후보를 가능한 한 원래 상태로 둔다. | LLM 요약이나 사람 해석을 섞지 않는다. |
| 민감 정보 | 고객명, 계약 정보, 개인정보, 내부 전략 포함 여부 | 포함되면 익명화 또는 보류한다. |
| 섹션 | 작성 내용 | 검증 질문 |
|---|---|---|
| 한 문장 요약 | 회의에서 실제로 확인된 중심 결정 또는 주제 | 원문보다 강한 결론으로 바뀌지 않았는가? |
| 근거 | raw/meetings/..., 확인 날짜, 자료 성격 | 원천으로 돌아갈 수 있는가? |
| 결정 | 실제로 결정된 내용만 | 의견이나 제안을 결정으로 쓰지 않았는가? |
| 실행 항목 | 행동, 담당자, 기한, 확인 방법 | 담당자나 기한이 없으면 확인 필요로 뒀는가? |
| 확인 필요 | 미정인 유형, 승인자, 기준, 자료 | 다음 질문과 수집의 출발점이 되는가? |
| 다음 질문 | 이 회의 요약으로 할 수 있는 후속 질문 | 6.1의 업무 질문으로 이어지는가? |
| 날짜 | 작업 | 원천 자료 | 결과 문서 | 상태 | 다음 행동 |
|---|---|---|---|---|---|
| YYYY-MM-DD | ingest/update/review/lint | raw/... | wiki/... 또는 output/... | 초안/확인 필요/검토 완료 | 승인자 확인, 최신성 재확인, 다음 질문 작성 |
[raw 경로]만 근거로 사용하세요.
다음 작업을 해 주세요.
1. 원문에서 실제로 확인되는 내용만 정리하세요.
2. 결정, 실행 항목, 확인 필요를 분리하세요.
3. 담당자, 기한, 효과, 기준이 원문에서 확인되지 않으면 확인 필요로 표시하세요.
4. 개인정보, 고객 원문, 계약 정보, 비공개 코드는 새 문서에 복사하지 마세요.
5. 결과는 [wiki 경로] 형식으로 작성하세요.
6. log.md에 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동을 남길 항목을 제안하세요.
근거가 약한 내용은 단정하지 마세요.
raw/web/ 또는 이에 해당하는 raw 위치에 있다.wiki/sources/ 또는 이에 해당하는 wiki 위치에 있다.log.md 갱신을 요청했다.AGENTS.md나 CLAUDE.md가 있다는 이유로 결과 검토를 생략하지 않았다.log.md에 한 줄 이상 처리 이력이 있다.wiki/sources용 source note로 바꿔 주세요. 원천 경로, 확인 날짜, 확인된 내용, 확인 필요, 관련 문서를 분리하고 원문에 없는 내용은 추정하지 마세요.log.md를 보고 raw 자료 중 처리 이력이 없는 파일을 찾아 주세요. 누락된 log 항목 초안을 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동으로 제안해 주세요.log.md만 보고 어떤 자료가 어떤 문서를 만들었는지 알 수 있는가?이 문서는 2026-06-06 KST에 WikiDocs 원문을 직접 열람해 작성된 Markdown 분석을 HTML로 변환한 것이다. 원문 자체의 최신 수정 여부와 세부 표현은 WikiDocs 원문에서 다시 확인해야 한다.
nvk/llm-wiki, Obsidian Web Clipper, OpenAI Codex AGENTS.md 문서, Anthropic Claude Code memory 문서, WiCER 프리프린트는 원문 확인일 기준의 참고 근거다. 이 HTML은 해당 외부 자료의 현재성을 별도로 확정하지 않는다.index.md, log.md, raw/wiki 문서를 덮어쓰거나 섞을 수 있으므로 경로와 기존 파일 존재 여부를 먼저 확인해야 한다.log.md는 완벽한 감사 시스템이 아니지만 원천 자료와 정리 문서와 후속 질문을 연결하는 최소 기록이다. 생략하면 6장과 8장의 검증이 약해진다.raw/web과 wiki/sources처럼 분리할 수 있다.log.md에 날짜, 작업, 원천 자료, 결과 문서, 상태, 다음 행동을 남길 수 있다.