WikiDocs page analysis · Chapter 5.1

자료를 넣기 전에 정할 기준

소스 경로: md/wikidocs/pages/05-01-ingest-criteria.md
원문: WikiDocs 5.1 자료를 넣기 전에 정할 기준 · 확인일: 2026-06-06 KST

핵심 요약

5.1의 핵심은 자료를 많이 넣는 것이 아니라, 나중에 믿고 다시 쓸 수 있는 상태로 넣을 기준을 먼저 정하는 것이다. 원문은 원본, 요약, 추측, 오래된 정보가 섞이면 답변 검증이 어려워진다고 설명한다.

원천과 요약 분리

회의록 원문, 웹 문서 캡처, PDF 추출 텍스트, 인터뷰 메모는 raw 성격이다. 결정 요약, 핵심 개념, 도입 검토 요약은 wiki 성격의 파생 문서이며 반드시 원천으로 돌아갈 경로가 있어야 한다.

신뢰도 표시

공식 문서와 릴리스 노트는 기능, 명령, 정책의 강한 근거가 될 수 있지만 블로그와 개인 메모는 보조 사례나 가설로 다룬다. 등급은 높음, 중간, 낮음 정도면 충분하다.

포함과 제외 기준

수집은 자료에서 시작하지 않고 현재 위키가 답해야 할 질문에서 시작한다. 개인정보 미처리 원문, 질문과 무관한 자료, 원문 검증이 불가능한 전달 내용은 보류한다.

상세 분석

자료 투입 기준은 위키 품질의 첫 방어선이다

LLM위키에서 자료는 한 번 들어오면 이후 질문, 산출물, 결정 로그의 근거가 된다. 기준 없이 자료를 넣으면 원문, LLM 요약, 개인 추정, 오래된 정보가 같은 무게로 검색되고 어떤 문장을 믿어야 하는지 알기 어려워진다.

실패 신호실제 모습대응
자료가 많은데 답변이 흐리다고객 지원, 개발 환경, 마케팅 자료가 함께 들어 있다.포함 범위와 제외 범위를 다시 쓴다.
답변 근거가 불명확하다보고서 문장이 어느 원문에서 왔는지 찾을 수 없다.wiki 핵심 주장마다 원천 경로와 확인일을 붙인다.
오래된 정보가 현재 사실처럼 쓰인다예전 설치 명령이나 정책이 최신 기준처럼 남아 있다.마지막 확인 날짜와 재확인 조건을 둔다.
약한 자료가 강한 결론이 된다개인 메모나 블로그 경험담이 공식 기능 설명처럼 쓰인다.높음, 중간, 낮음으로 근거 성격을 표시한다.

raw는 원본 기준점이고 wiki는 검증 가능한 파생 문서다

위치넣을 것넣지 말 것검증 기준
raw/회의록 원문, 웹 문서 저장본, PDF 추출문, 인터뷰 메모LLM 요약문, 사람의 사후 판단, 보고서 초안원본 상태와 출처, 확인일이 남아 있는가
wiki/요약, 개념, 결정 사항, 반복 질문의 답, 업무 규칙raw 원문 전체 복제, 출처 없는 단정, 검증 전 정책핵심 주장마다 원천 경로가 있는가
output/보고서, 실행 계획, 체크리스트, 공유용 초안원천의 유일한 사본, 검증 전 최종 결정wikiraw 근거로 돌아갈 수 있는가
rulesAGENTS.md, CLAUDE.md, rules.md의 수집 기준보안 정책을 대신한다는 착각결과물이 규칙을 실제로 지켰는가

좋은 요약문은 검증 구조를 가진다

좋은 요약문은 짧은 문장이 아니라 원천 자료, 확인 날짜, 확인된 내용, 확인 필요를 갖춘 문서다. 특히 확인 필요는 결함이 아니라 품질 필드다.

요약문 항목역할빠지면 생기는 문제
한 문장 요약문서의 용도와 범위를 빠르게 파악한다.문서가 어떤 질문에 쓰이는지 흐려진다.
원천 자료검증할 기준점을 남긴다.요약 오류가 생겨도 원문으로 돌아가기 어렵다.
확인 날짜정보가 어느 시점 기준인지 드러낸다.오래된 정보가 현재 사실처럼 보인다.
확인된 내용원문에서 근거를 찾을 수 있는 내용을 분리한다.추정과 사실이 섞인다.
확인 필요아직 단정하면 안 되는 내용을 남긴다.불확실성이 단정문으로 숨는다.

신뢰도 표시는 쓰임을 정하는 장치다

등급문서에 쓰는 표현LLM 답변에서 허용할 말투
높음공식 문서 기준, 회의록 원문 기준, 내부 정책 기준비교적 강하게 말할 수 있지만 확인일과 적용 범위를 붙인다.
중간보조 자료 기준, 현재 자료 기준, 추가 확인 필요조건부로 말하고 공식 근거 대조를 요구한다.
낮음가설, 참고 의견, 확인 필요결정이나 보고서 단정문으로 승격하지 않는다.

최신성은 별도 필드로 남겨야 한다

도구 설치 방법, API 명령, 제품 가격, 법적 기준, 보안 정책, 내부 승인 기준은 빠르게 바뀔 수 있다. 따라서 마지막 확인 날짜와 다시 확인할 시점을 분리해 둔다.

## 최신성
- 최신성 중요도: 높음 / 중간 / 낮음
- 마지막 확인 날짜: YYYY-MM-DD
- 다시 확인할 시점: 도구 업그레이드 전, 보고서 배포 전, 정책 적용 전
- 확인할 원천: 공식 문서, 릴리스 노트, 내부 정책, 회의록

실무 적용 절차

  1. 현재 위키가 답해야 할 업무 질문을 한 문장으로 쓴다.
  2. 질문이 너무 넓으면 4.1 업무 주제 정하기 기준으로 다시 줄인다.
  3. 질문에 필요한 자료 유형을 회의록, 웹 문서, 공식 문서, 정책, 고객 문의 샘플, 내부 메모 등으로 나눈다.
  4. 각 자료 유형이 raw, wiki, output, rules 중 어디에 속할지 정한다.
  5. 요약문 최소 필드인 한 문장 요약, 원천 자료, 확인 날짜, 확인된 내용, 확인 필요, 최신성을 정한다.
  6. 자료 유형별 신뢰도를 높음, 중간, 낮음으로 표시한다.
  7. 최신성이 중요한 자료에는 재확인 조건을 둔다.
  8. 포함 범위와 제외 범위를 함께 적는다.
  9. 민감 정보 처리 기준을 쓴다.
  10. 애매한 자료를 둘 inbox/, review-needed/, hold/ 위치를 만든다.
  11. 수집 기준 카드를 AGENTS.md, CLAUDE.md, 또는 rules.md에 넣는다.
  12. 수집 후 raw가 보존됐는지, wiki에 근거가 남았는지, 확인 필요와 최신성이 분리됐는지 확인한다.

실무 템플릿

자료 수집 기준 카드

항목작성 내용검증 질문
위키 주제한 문장 업무 질문으로 좁혀졌는가?
이 위키가 답해야 할 질문자료 수집 판단의 기준으로 쓸 수 있는가?
포함 범위기간, 자료 유형, 독자, 산출물 목적이 보이는가?
제외 범위질문과 직접 관련 없는 자료가 명시되어 있는가?
민감 정보 처리개인정보와 내부 기밀을 그대로 넣지 않게 하는가?
신뢰도 표시공식 근거, 보조 근거, 가설을 구분하는가?
요약문 작성 규칙원천 경로, 확인 날짜, 확인된 내용, 확인 필요가 포함되는가?
보류 위치애매한 자료를 바로 섞지 않을 곳이 있는가?

요약문 최소 골격

# 문서 제목

## 한 문장 요약

## 근거
- 원천 자료:
- 확인 날짜:
- 자료 성격:
- 신뢰도:

## 확인된 내용

## 확인 필요

## 최신성
- 최신성 중요도:
- 다시 확인할 시점:

## 다음 질문

검증 체크리스트

raw/wiki 분리

  • 원천 자료와 요약문을 다른 위치 또는 다른 상태로 분리했다.
  • raw에는 원천만 둔다.
  • wiki 문서는 raw를 그대로 복제하지 않고 업무 질문에 맞게 정리한다.
  • wiki 핵심 주장마다 원천 자료 경로, URL, 확인 날짜 중 하나 이상이 있다.

요약문 품질

  • 한 문장 요약이 업무 용도와 범위를 드러낸다.
  • 원천 자료와 확인 날짜가 남아 있다.
  • 자료 성격과 신뢰도 라벨이 있다.
  • 확인된 내용과 확인 필요가 분리되어 있다.
  • 최신성이 중요한 내용에는 재확인 시점이 있다.

신뢰도

  • 공식 문서, 릴리스 노트, 내부 정책처럼 강한 근거를 우선했다.
  • 회의록에서는 발언, 논의, 결정, 실행 항목을 구분했다.
  • 개인 메모는 가설이나 질문 후보로 표시했다.
  • 블로그와 튜토리얼은 공식 변경 사항의 단독 근거로 쓰지 않았다.

수집 범위와 민감 정보

  • 위키가 답해야 할 질문을 먼저 썼다.
  • 포함 범위와 제외 범위를 함께 적었다.
  • 이름, 전화번호, 이메일, 주문번호, 고객명, 계약 금액, 비공개 코드를 표시했다.
  • 조직 보안 기준이 불명확한 자료는 보류했다.

관련 문서

한계와 완료 기준

이 문서는 2026-06-06 KST에 WikiDocs 원문을 직접 열람해 작성한 Markdown 분석을 HTML로 변환한 것이다. 원문 표현과 최신 수정 여부는 WikiDocs 원문에서 다시 확인해야 한다.

AGENTS.md, CLAUDE.md, rules.md에 수집 기준을 적어도 raw 보호, 민감 정보 제한, 출처 표시가 자동으로 보장되지는 않는다. 실제 결과물과 저장 위치를 사람이 검토해야 한다.

  1. 원천 자료와 요약문을 rawwiki 성격으로 분리할 수 있다.
  2. 요약문에 한 문장 요약, 원천 자료, 확인 날짜, 확인된 내용, 확인 필요, 최신성 필드를 남길 수 있다.
  3. 자료 유형별 신뢰도를 높음, 중간, 낮음으로 표시할 수 있다.
  4. 최신성이 중요한 자료에 마지막 확인 날짜와 재확인 시점을 남길 수 있다.
  5. 포함 범위와 제외 범위를 모두 적은 수집 기준 카드를 만들었다.
  6. 민감 정보가 있는 자료를 익명화, 보류, 별도 권한 검토 중 하나로 처리했다.
  7. 애매한 자료를 inbox 또는 review-needed에 보류하고 보류 이유를 남길 수 있다.