Claude Opus 4.8 출시: 4.7 대비 코드 결함 4배 감소, Fast 모드는 3배 저렴해졌다
한줄평
성능 자랑보다 신뢰성에 집중한 업데이트. 코드 결함을 놓칠 확률이 4.7 대비 4배 낮아지고 Fast 모드가 3배 싸져서, 에이전트에 일을 맡기는 사람일수록 체감이 큽니다.
안녕하세요, Tom입니다.
Anthropic이 5월 28일에 Claude Opus 4.8을 출시했어요. Opus 4.7이 나온 게 4월 20일이었으니까 한 달 조금 넘은 셈인데, 이 회사 릴리스 주기는 정말 숨 쉴 틈을 안 주네요. 이번 버전은 화려한 신기능보다는 신뢰성과 판단력을 끌어올린 쪽이라, 매일 Claude Code로 일하는 저 같은 사람한테는 오히려 더 반가운 업데이트였어요.
가격은 그대로, 그런데 Fast 모드가 3배 싸졌어요
먼저 가격부터 보면, 기본 모드는 입력 $5/M 토큰, 출력 $25/M 토큰으로 Opus 4.7과 동일해요. 성능을 올리면서 가격을 안 올린 건 늘 환영할 일이죠.
이번에 눈에 띄는 건 Fast 모드예요. 입력 $10/M, 출력 $50/M인데, 이게 이전 Fast 모드보다 3배 저렴해진 가격이에요. 빠른 응답이 필요한 작업에서 부담이 확 줄어든 거죠. API에서는 claude-opus-4-8로 호출하면 돼요.
가장 체감되는 변화: 코드 신뢰성
개인적으로 이번 릴리스에서 가장 와닿은 수치는 이거예요. Opus 4.8은 Opus 4.7보다 코드의 결함을 놓칠 확률이 약 4배 낮아요.
Claude Code로 리팩토링이나 버그 수정을 맡기다 보면, 가끔 명백한 문제를 그냥 지나치는 경우가 있었어요. "이거 분명히 잡았어야 하는데" 싶은 순간들이요. 그 빈도가 4분의 1로 줄었다는 건 단순한 벤치마크 숫자보다 훨씬 실용적인 개선이에요.
여기에 더해서 모델이 모르는 걸 모른다고 솔직하게 말하는 방향으로 바뀌었어요. 이전에는 확신 없는 내용도 자신 있게 답하는 경우가 있었는데, 이제는 불확실한 부분을 정직하게 표시해줘요. 에이전트한테 작업을 위임할 때 이 부분이 의외로 중요해요. 틀린 걸 맞다고 우기는 것보다 "이건 확실치 않아요"라고 말해주는 쪽이 훨씬 신뢰가 가거든요.
도구 호출(tool calling)도 더 효율적으로 바뀌어서, 같은 작업을 더 적은 단계로 끝내요. 긴 컨텍스트 작업 관리, 법률·금융 문서 분석에서도 강점을 보인다고 해요.
Effort 컨트롤과 Dynamic Workflows
Opus 4.7에서 xhigh effort level이 추가됐었는데, 4.8에서는 effort 컨트롤이 좀 더 사용자 친화적으로 정리됐어요. 높은 effort로 설정하면 더 깊이 사고하고 더 나은 답을 주고, 낮게 설정하면 속도와 레이트 리밋을 아끼는 식이에요. 작업 성격에 따라 골라 쓰면 돼요.
또 하나 흥미로운 건 Dynamic Workflows예요. Claude Code의 Enterprise/Team/Max 플랜에서 쓸 수 있는 기능인데, 수백 개의 서브에이전트를 병렬로 돌려서 대규모 작업을 처리해요. 수십만 줄짜리 코드베이스 마이그레이션 같은 작업을 염두에 둔 거예요. 혼자 다 읽기 힘든 규모의 작업을 여러 에이전트가 나눠서 처리하는 그림인데, 실제로 얼마나 잘 동작하는지는 직접 돌려봐야 알 것 같아요.
API 쪽에서는 대화 중간에 시스템 엔트리를 삽입할 수 있게 됐어요. 프롬프트 캐시를 깨거나 사용자 턴을 추가하지 않고도 시스템 메시지를 끼워 넣을 수 있는 건데, 긴 에이전트 세션을 운영할 때 중간에 지침을 주입하는 용도로 유용할 거예요.
정렬(Alignment)도 같이 좋아졌어요
이번 릴리스에서 Anthropic이 강조한 부분 중 하나가 정렬 평가예요. Opus 4.8은 친사회적 특성에서 "새로운 최고치"를 기록했고, Opus 4.7보다 오정렬(misaligned) 행동 비율이 크게 낮아졌다고 해요.
성능과 안전성을 같이 끌어올리는 건 말처럼 쉬운 일이 아닌데, 이 두 가지를 한 릴리스에서 동시에 개선했다고 주장하는 점은 눈여겨볼 만해요. 파트너사들도 "더 나은 판단력", "가장 강력한 컴퓨터 사용 능력", "일관된 도구 사용"을 언급했고요. 특히 자율 워크플로우에서 도구를 일관되게 따라간다는 평가는 에이전트 활용도가 높아진다는 뜻이라 반가워요.
Claude Code 사용자 입장에서
매일 Claude Code를 쓰는 입장에서 정리하면, 이번 업데이트의 핵심은 "더 화려해졌다"가 아니라 "더 믿을 만해졌다"예요. 코드 결함을 덜 놓치고, 모르는 걸 솔직하게 말하고, 도구를 더 효율적으로 쓰고. 에이전트한테 일을 맡기는 빈도가 늘어날수록 이런 신뢰성 개선이 결국 가장 크게 와닿더라고요.
Fast 모드가 3배 싸진 것도 실무에서는 꽤 큰 의미예요. 빠른 반복 작업을 부담 없이 돌릴 수 있게 됐으니까요.
Opus 4.7에서 4.8로 넘어오는 한 달 사이의 변화를 보면, Anthropic이 지금 어디에 힘을 주고 있는지가 보여요. 성능 경쟁도 중요하지만, 결국 에이전트 시대의 핵심은 "맡겨도 되는가"거든요. 다음 버전은 또 어떤 방향으로 올지 궁금해지네요.
Claude Code, OpenCode 같은 AI 코딩 도구를 직접 쓰면서 AI 업계의 변화를 개발자 관점에서 기록합니다. 단순 번역이 아니라 써본 경험과 해석을 함께 남기려고 해요.
관련 글
Claude Opus 4.7 출시: 비전 3배 강화, 시스템 프롬프트는 어떻게 바뀌었나
Anthropic이 Opus 4.7을 출시했습니다. 비전 해상도 3배 증가, 코딩 성능 13% 향상과 함께, 시스템 프롬프트 변경 사항을 분석해봤어요.
Anthropic, 한국 대표에 최기영 선임: 서울 오피스 개설과 인구 대비 3.5배 높은 Claude 사용률
Anthropic이 서울 오피스 개설을 앞두고 최기영 한국 대표를 선임했어요. 한국은 인구 대비 Claude 사용률이 3.5배 높은 시장이에요. 글로벌 영문 매체가 잘 안 다루는 이 소식을 한국 개발자 관점에서 정리했어요.
Claude 사용량 한도 2배 인상 + SpaceX 컴퓨팅 파트너십
Anthropic이 Claude Code 사용량을 두 배로 늘리고, 피크 시간대 제한도 해제했어요. 여기에 SpaceX Colossus 1 데이터센터와 컴퓨팅 파트너십까지 — GPU 22만 개가 추가되는 거예요.