AI

Claude Code · Codex 살살 녹는 토큰 낭비 없이 쓰는 법 - 내가 실제로 적용한 환경 설정

포도쿵야 2026. 4. 23. 17:00

🎯 핵심 3줄 요약

  • CLAUDE_CODE_GLOB_NO_IGNORE는 반드시 false로 (node_modules 유입 방지)
  • 출력 제한 설정: BASH_MAX_OUTPUT_LENGTH=10000, MAX_MCP_OUTPUT_TOKENS=8000
  • 작업 패턴에 맞게 선택 적용 — 일괄 적용 시 품질 저하

도입

Claude Code와 Codex를 쓸수록 토큰이 생각보다 빠르게 찬다는 걸 체감했습니다. 한 세션에 10만 토큰을 쓴다면, 이 중 3~4만 토큰이 설정 때문일 수 있습니다. 분석 프롬프트로 내 설정을 점검하고, 품질 저하 없이 적용 가능한 설정들을 실제로 반영한 과정을 공유합니다.


1. 설정 파일 위치

Claude Code

파일 역할
~/.claude/settings.json 글로벌 설정
.claude/settings.json 프로젝트 설정

Codex

파일 역할
~/.codex/config.toml 글로벌 설정
.codex/config.toml 프로젝트 설정

2. 토큰이 새는 주요 항목

Claude Code

항목 기본값 영향
CLAUDE_CODE_GLOB_NO_IGNORE false true 시 node_modules 탐색 → 토큰 폭증
BASH_MAX_OUTPUT_LENGTH 무제한 Bash 출력 전량 유입
MAX_MCP_OUTPUT_TOKENS 무제한 MCP 응답 전량 유입
includeGitInstructions true 매 세션 git 지침 주입

Codex

항목 기본값 영향
model_reasoning_effort medium high 시 추론 토큰 2~3배
web_search enabled 자동 웹 검색 활성화
tool_output_token_limit 무제한 툴 응답 전량 유입

3. 내가 적용한 설정

~/.claude/settings.json

선택 이유

CLAUDE_CODE_GLOB_NO_IGNORE: "false"

  • 모노리포에서 검색 1번이 연쇄 Read를 부름
  • .gitignore 존중으로 불필요한 파일 원천 차단

BASH_MAX_OUTPUT_LENGTH: "10000"

  • npm/pip 장황한 로그 제한
  • 오류 메시지는 보존

MAX_MCP_OUTPUT_TOKENS: "8000"

  • Confluence 등 긴 문서 응답 제한
  • 요약본만 가져오도록 유도

4.CLAUDE.md vs 환경변수 — 뭐가 다른가?

"CLAUDE.md에 'node_modules 읽지 마'라고 적으면 되는 거 아닌가?"

환경변수 설정 (CLAUDE_CODE_GLOB_NO_IGNORE: "false")

  • 작동 시점: 툴 실행
  • 효과: node_modules가 검색 결과에 아예 포함 안 됨
  • 토큰: 검색 결과 10개 → 500 토큰

CLAUDE.md 지침

  • 작동 시점: 세션 시작 시 자동 로드 + 응답 생성 시 참조
  • 효과:
    • CLAUDE.md 자체가 매번 컨텍스트에 추가됨 (예: 200 토큰)
    • node_modules가 검색 결과엔 포함됨, Claude가 읽지 않도록 무시
  • 토큰: CLAUDE.md 200 토큰 + 검색 결과 1000개 5000 토큰 = 총 5200 토큰

실제 토큰 소비 비교

방법 총 토큰 소비
환경변수만 500 토큰
CLAUDE.md만 5200 토큰
둘 다 사용 700 토큰

권장: 역할 분담

  • 환경변수: 명확한 제외 대상 (node_modules, dist 등) → 근본 차단
  • CLAUDE.md: 프로젝트별 세부 지침 (legacy/ 폴더는 deprecated, 특정 파일 수정 금지 등) → 행동 유도

핵심: 환경변수로 걸러낼 수 있는 건 환경변수로 처리하고, CLAUDE.md는 정말 필요한 프로젝트 컨텍스트만 간결하게 작성하세요.


5. 적용 안 한 것 — 이유

항목 이유
includeGitInstructions: false 커밋 작업 많아서 켜둠
CLAUDE_CODE_FILE_READ_MAX_OUTPUT_TOKENS 제한 대형 파일 전체 분석 필요
Codex model_reasoning_effort: medium 복잡한 작업 비중 높음

마무리

설정 하나하나가 작아 보여도 세션이 쌓이면 20~30% 토큰 절감 가능합니다. 본인 작업 패턴에 맞게 한 번에 하나씩 테스트하며 적용하세요.


참고 글


이 글이 도움이 되셨다면 공감❤️ 부탁드립니다!