🎯 핵심 3줄 요약
- CLAUDE_CODE_GLOB_NO_IGNORE는 반드시 false로 (node_modules 유입 방지)
- 출력 제한 설정: BASH_MAX_OUTPUT_LENGTH=10000, MAX_MCP_OUTPUT_TOKENS=8000
- 작업 패턴에 맞게 선택 적용 — 일괄 적용 시 품질 저하
도입
Claude Code와 Codex를 쓸수록 토큰이 생각보다 빠르게 찬다는 걸 체감했습니다. 한 세션에 10만 토큰을 쓴다면, 이 중 3~4만 토큰이 설정 때문일 수 있습니다. 분석 프롬프트로 내 설정을 점검하고, 품질 저하 없이 적용 가능한 설정들을 실제로 반영한 과정을 공유합니다.
1. 설정 파일 위치
Claude Code
| 파일 | 역할 |
|---|---|
~/.claude/settings.json |
글로벌 설정 |
.claude/settings.json |
프로젝트 설정 |
Codex
| 파일 | 역할 |
|---|---|
~/.codex/config.toml |
글로벌 설정 |
.codex/config.toml |
프로젝트 설정 |
2. 토큰이 새는 주요 항목
Claude Code
| 항목 | 기본값 | 영향 |
|---|---|---|
CLAUDE_CODE_GLOB_NO_IGNORE |
false | true 시 node_modules 탐색 → 토큰 폭증 |
BASH_MAX_OUTPUT_LENGTH |
무제한 | Bash 출력 전량 유입 |
MAX_MCP_OUTPUT_TOKENS |
무제한 | MCP 응답 전량 유입 |
includeGitInstructions |
true | 매 세션 git 지침 주입 |
Codex
| 항목 | 기본값 | 영향 |
|---|---|---|
model_reasoning_effort |
medium | high 시 추론 토큰 2~3배 |
web_search |
enabled | 자동 웹 검색 활성화 |
tool_output_token_limit |
무제한 | 툴 응답 전량 유입 |
3. 내가 적용한 설정
~/.claude/settings.json

선택 이유
CLAUDE_CODE_GLOB_NO_IGNORE: "false"
- 모노리포에서 검색 1번이 연쇄 Read를 부름
.gitignore존중으로 불필요한 파일 원천 차단
BASH_MAX_OUTPUT_LENGTH: "10000"
- npm/pip 장황한 로그 제한
- 오류 메시지는 보존
MAX_MCP_OUTPUT_TOKENS: "8000"
- Confluence 등 긴 문서 응답 제한
- 요약본만 가져오도록 유도
4.CLAUDE.md vs 환경변수 — 뭐가 다른가?
"CLAUDE.md에 'node_modules 읽지 마'라고 적으면 되는 거 아닌가?"
환경변수 설정 (CLAUDE_CODE_GLOB_NO_IGNORE: "false")
- 작동 시점: 툴 실행 전
- 효과: node_modules가 검색 결과에 아예 포함 안 됨
- 토큰: 검색 결과 10개 → 500 토큰
CLAUDE.md 지침
- 작동 시점: 세션 시작 시 자동 로드 + 응답 생성 시 참조
- 효과:
- CLAUDE.md 자체가 매번 컨텍스트에 추가됨 (예: 200 토큰)
- node_modules가 검색 결과엔 포함됨, Claude가 읽지 않도록 무시
- 토큰: CLAUDE.md 200 토큰 + 검색 결과 1000개 5000 토큰 = 총 5200 토큰
실제 토큰 소비 비교
| 방법 | 총 토큰 소비 |
|---|---|
| 환경변수만 | 500 토큰 |
| CLAUDE.md만 | 5200 토큰 |
| 둘 다 사용 | 700 토큰 |
권장: 역할 분담
- 환경변수: 명확한 제외 대상 (node_modules, dist 등) → 근본 차단
- CLAUDE.md: 프로젝트별 세부 지침 (legacy/ 폴더는 deprecated, 특정 파일 수정 금지 등) → 행동 유도
핵심: 환경변수로 걸러낼 수 있는 건 환경변수로 처리하고, CLAUDE.md는 정말 필요한 프로젝트 컨텍스트만 간결하게 작성하세요.
5. 적용 안 한 것 — 이유
| 항목 | 이유 |
|---|---|
includeGitInstructions: false |
커밋 작업 많아서 켜둠 |
CLAUDE_CODE_FILE_READ_MAX_OUTPUT_TOKENS 제한 |
대형 파일 전체 분석 필요 |
Codex model_reasoning_effort: medium |
복잡한 작업 비중 높음 |
마무리
설정 하나하나가 작아 보여도 세션이 쌓이면 20~30% 토큰 절감 가능합니다. 본인 작업 패턴에 맞게 한 번에 하나씩 테스트하며 적용하세요.
참고 글
이 글이 도움이 되셨다면 공감❤️ 부탁드립니다!
'AI' 카테고리의 다른 글
| GitHub 100k+ 스타 받은 AI 코딩 지침 : claude.md에 직접 적용해서 비교해보기 (0) | 2026.05.13 |
|---|---|
| 코딩할 때 Claude 컨텍스트가 꽉 찼다면? 오염 없는 효율적인 세션 전환 가이드 (0) | 2026.04.30 |
| Claude에 "코드 리뷰해줘"만 입력하는 당신을 위한 프롬프트 작성법 (0) | 2026.04.24 |
| Compound Engineering — 알고 보면 이미 하고 있는 AI 개발 방법론 (0) | 2026.04.09 |
| 매일 아침 IT 뉴스를 자동으로 받아보다— Claude Cowork 사용 후기 (0) | 2026.04.09 |