쉽게 배우는 Claude Code ③ /model·/effort — 문제 난이도에 맞춰 두뇌 고르기
같은 도구라도 어떤 AI 모델을 쓰고 얼마나 깊게 생각하게 할지는 내가 정합니다. /model과 /effort로 문제 난이도에 맞춰 속도·비용·품질을 조절하는 법을 입문자 눈높이로 설명합니다.
Claude Code로 일을 시킬 때, “어떤 AI에게 시킬지”와 “그 AI를 얼마나 깊게 생각하게 할지”는 /model과 /effort 두 명령으로 내가 직접 고를 수 있습니다.
한 줄로
/model은 어떤 두뇌(AI 모델) 를 쓸지 고르고, /effort는 그 두뇌를 얼마나 깊게 굴릴지(사고량) 를 정합니다. 문제가 어려우면 더 똑똑하게·더 깊게, 간단하면 더 가볍게·더 얕게.
언제 쓰나
말로만 보면 둘이 비슷해 보이지만, 실제로 일을 시켜 보면 차이가 또렷합니다. 상황별로 살펴볼게요.
1) 까다로운 버그를 잡을 때 — 똑똑하게 + 깊게
여러 작업이 동시에 얽혀서 가끔씩만 터지는 동시성 버그(concurrency bug)처럼 머리를 많이 써야 하는 문제가 있습니다. 이럴 땐 가장 똑똑한 모델로 바꾸고, 사고량도 높게 올립니다.
/model opus
/effort high
opus는 가장 똑똑한(그만큼 무거운) 모델이고, high는 답을 내기 전에 더 오래·더 깊게 따져 보라는 뜻입니다. 시간과 비용은 더 들지만, 어려운 문제에서 정답에 도달할 확률이 올라갑니다.
2) 단순한 오타 수정이나 로그 읽기 — 가볍게 + 얕게
오타 하나 고치기, 로그 한 줄 읽고 알려주기 같은 단순 작업에 가장 똑똑한 모델을 깊게 굴리는 건 낭비입니다. 빠르고 싸게 끝내는 게 낫습니다.
/model haiku
/effort low
haiku는 가볍고 빠른 모델, low는 사고량을 낮춰 빠르게 응답하라는 뜻입니다. 답이 거의 뻔한 일이라면 이 조합이 가장 효율적입니다.
3) 평소엔 중간, 막히는 부분만 잠깐 올리기
매번 두 값을 만지작거릴 필요는 없습니다. 평소엔 적당한 중간 설정으로 작업하다가, 유독 안 풀리는 부분에서만 잠깐 /effort를 올려 깊게 생각하게 하고, 풀리면 다시 내리는 방식이 실전에서 가장 편합니다. 작업의 난이도가 한 세션 안에서도 들쭉날쭉하기 때문입니다.
어떻게
두 명령 모두 사용법은 같습니다. 인자 없이 입력하면 선택 메뉴가 뜨고, 값을 함께 적으면 바로 적용됩니다.
/model은 이 세션이 쓰는 AI 모델을 바꿉니다.
/model (인자 없이 → 모델 선택 메뉴)
/model opus (별칭으로 바로 지정)
별칭으로 opus(가장 똑똑함), sonnet(균형), haiku(가장 가벼움) 등을 고를 수 있습니다. 어려운 문제는 똑똑한 쪽으로, 간단·빠른 작업은 가벼운 쪽으로 고르면 됩니다.
/effort는 모델이 얼마나 깊게 생각할지(추론량)를 정합니다.
/effort (인자 없이 → 수준 선택 메뉴)
/effort high (수준 바로 지정)
수준은 대략 low → medium → high → xhigh → max 순으로 깊어집니다. 복잡한 리팩터링처럼 정확함이 중요하면 높게(xhigh 등), 비용·속도가 중요하면 낮게(low) 두면 됩니다.
팁 & 함정
/model과 /effort는 별개입니다. 가장 헷갈리기 쉬운 부분이라 다시 정리하면 이렇습니다.
| 명령 | 무엇을 정하나 | 비유 |
|---|---|---|
/model | 어떤 두뇌(모델 종류)를 쓸지 | 누구에게 일을 맡길지 |
/effort | 그 두뇌를 얼마나 굴릴지(사고량) | 그 사람이 얼마나 공들일지 |
둘은 함께 조절하는 값입니다. 예를 들어 가벼운 모델(haiku)에 높은 사고량(high)을 줄 수도 있고, 똑똑한 모델(opus)을 얕게(low) 쓸 수도 있습니다. 문제의 성격에 맞춰 두 손잡이를 따로 돌린다고 생각하면 쉽습니다.
모델은 자주 토글하지 마세요. 대화 도중에 모델을 바꾸면, 새 모델이 지금까지의 대화 내용(히스토리)을 처음부터 다시 읽어야 합니다. 그래서 한 번 확인을 거치게 되고, 이전까지 쌓아둔 효율(캐시 효과)도 줄어듭니다. 자주 왔다 갔다 하기보다는 정말 필요할 때만 바꾸는 게 좋습니다.
아주 높은 effort는 그 세션에만 적용될 수 있습니다. max 같은 아주 높은 사고량은 보통 지금 작업 중인 세션에만 적용되고, 다음에 작업을 이어 열(resume) 때는 유지되지 않을 수 있습니다. 이어서 작업할 때 다시 깊게 생각하게 하고 싶다면 한 번 더 올려 주면 됩니다.
한 장 정리
| 상황 | /model | /effort |
|---|---|---|
| 까다로운 동시성 버그 | opus | high |
| 단순 오타 수정·로그 읽기 | 가벼운 모델(haiku) | low |
| 평소 작업 | 중간 | 중간 |
| 막히는 한 부분만 | 그대로 | 잠깐 올렸다 내리기 |
/model= 어떤 두뇌(모델 종류)를 쓸지/effort= 그 두뇌를 얼마나 깊게 굴릴지(사고량)- 인자 없이 쓰면 선택 메뉴, 값을 적으면 바로 적용
- 둘은 별개이며 함께 조절합니다
다음 편: plan mode — 큰 작업 전에 계획부터 받기.