Claude Sonnet 5 — '중급이 플래그십을 따라잡는다'는 말, 이번엔 가격표까지 바꿨다

Claude Sonnet 5 — '중급이 플래그십을 따라잡는다'는 말, 이번엔 가격표까지 바꿨다

6분 읽기원문 보기

한줄평

Sonnet 5의 핵심은 벤치마크가 아니라 가격이에요. Opus 4.8에 근접한 성능을 프로모션 $2/$10에 제공하면서 'Opus급 지능'의 단가를 끌어내렸어요. 이제 기본 모델을 Sonnet으로 두고 Opus는 정말 어려운 일에만 아껴 쓰는 게 합리적이에요.

안녕하세요, Tom입니다.

새 모델이 나올 때마다 반복되는 문장이 있어요. "중급 모델이 플래그십을 따라잡았다." 사실 이 블로그에서도 2월에 Sonnet 4.6을 다루며 "Opus급 성능을 Sonnet 가격에"라고 썼거든요. 그래서 이번 Sonnet 5 발표를 봤을 때 처음엔 "또 그 말이네" 싶었어요. 그런데 숫자를 보고 생각이 바뀌었어요. 이번엔 성능만 따라잡은 게 아니라 가격표를 같이 내렸어요. 저는 그게 이번 발표의 진짜 헤드라인이라고 봐요.

무엇이 나왔나

Anthropic 발표에 따르면 Sonnet 5는 계획, 도구 사용(브라우저·터미널), 자율 실행, 추론, 코딩, 지식 작업 같은 에이전트 작업에서 Sonnet 4.6 대비 폭넓게 개선됐어요. Anthropic의 표현을 그대로 옮기면 "성능이 Opus 4.8에 근접하지만 더 낮은 가격"이고, 에이전트 검색·컴퓨터 사용 평가에서는 중간(medium) 수준의 추론 노력만으로도 Opus급에 닿는다고 해요.

가격이 핵심이에요. 8월 31일까지 프로모션으로 입력 100만 토큰당 $2, 출력 100만 토큰당 $10이에요. 정가로 돌아가도 $3 / $15고요. 여기에 Claude Code는 이미 Sonnet 5를 기본 모델로 바꿨고, 네이티브 100만 토큰 컨텍스트를 제공해요. 접근성도 넓어서 Free·Pro의 기본 모델이자 Max·Team·Enterprise에서도 쓸 수 있고, API에서는 claude-sonnet-5로 부르면 돼요.

비교 기준을 하나 잡아 볼게요. 지난달 Opus 4.8은 정가가 입력 $5 / 출력 $25였어요. Sonnet 5의 프로모션 $2 / $10과 나란히 놓으면, "Opus에 근접한 성능"을 입력 기준 절반 이하 가격에 쓰는 셈이에요.

그래서 무엇이 달라졌나

저는 이 발표를 성능 경쟁이 아니라 가격 붕괴의 신호로 읽어요.

작년까지 모델 티어의 논리는 단순했어요. 똑똑한 걸 원하면 비싼 플래그십(Opus), 싼 걸 원하면 성능을 좀 포기한 중급(Sonnet). 그런데 Sonnet 4.6이 그 경계를 흐리기 시작했고, Sonnet 5는 아예 "플래그십에 근접한 성능 + 플래그십보다 싼 가격"을 한 줄에 붙여 버렸어요. 이러면 티어를 나누던 축이 성능에서 시간으로 바뀌어요. Opus의 우위는 "더 똑똑하다"가 아니라 "몇 달 먼저 그 수준에 도달했다"가 되는 거예요. 그리고 그 몇 달의 프리미엄이 지금 $5에서 $2로 깎이고 있고요.

한 가지 더 눈에 띄는 건 안전성 쪽 서술이에요. Anthropic은 Sonnet 5가 Sonnet 4.6보다 바람직하지 않은 행동 비율이 전반적으로 낮고 에이전트 맥락에서 더 안전하다고 하면서, 동시에 "현재 Opus 모델들보다 사이버보안 작업 수행 능력은 훨씬 낮다"고 명시했어요. 저는 이게 의도된 포지셔닝이라고 봐요. 위험한 능력은 비싼 상위 티어에 가둬 두고, 널리 뿌릴 기본 모델에서는 그 능력을 일부러 낮춰 두는 거죠. 능력과 배포 범위를 분리하는 설계인데, 값싼 모델이 모든 곳에 깔릴수록 이런 구분은 더 중요해질 거예요.

이렇게 볼 수도 있어요

과장은 경계할게요. "Opus 4.8에 근접"이라는 건 Anthropic 본인의 표현이고, 구체적 벤치마크 표로 뒷받침된 걸 제가 다 확인한 건 아니에요. "근접"과 "동등"은 어려운 작업에서 꽤 벌어질 수 있어요. 특히 medium 노력에서 Opus급이라는 건 뒤집으면 가장 어려운 일에는 여전히 높은 추론 노력이나 Opus가 필요하다는 뜻이기도 하고요.

프로모션 가격이라는 점도 감안해야 해요. $2 / $10은 8월 말까지의 값이고, 정가 $3 / $15로 돌아가면 체감이 달라져요. 그래도 정가 기준으로도 Opus보다 확실히 싸다는 사실은 남아요. "역대급 혁명" 같은 말을 붙일 발표는 아니지만, 가격 방향만큼은 또렷하다고 봐요.

한국 개발자 입장에서

실무적으로는 기본값을 다시 정하라는 신호예요. 그동안 "중요한 작업엔 Opus, 나머진 Sonnet" 식으로 나눠 쓰던 분이 많았을 텐데, Sonnet 5는 그 기본선을 위로 끌어올려요. 저라면 이제 기본을 Sonnet 5로 두고, Opus는 정말 실패 비용이 큰 작업(복잡한 리팩터링, 긴 자율 실행, 놓치면 큰일 나는 판단)에만 아껴 쓰는 쪽으로 잡겠어요.

특히 에이전트를 돌리는 팀이라면 토큰 단가 차이가 곧바로 운영비로 돌아와요. 백그라운드로 에이전트를 여러 개 돌리는 흐름(지난주 코딩 에이전트 백그라운드화에서 다룬)이 현실이 될수록, "충분히 좋은데 절반 값인 모델"이 있느냐가 그 워크플로우를 굴릴 수 있느냐를 가르거든요. Sonnet 5는 그 계산을 꽤 바꿔 놓을 거예요. 반대로 사내 보안 정책이 빡빡한 조직이라면, 사이버 능력을 낮춘 기본 모델이라는 포지셔닝이 오히려 도입 명분이 될 수도 있고요.

한 줄로 줄이면, 이번 뉴스는 "더 똑똑한 모델이 나왔다"가 아니라 "Opus급 지능이 싸졌다"예요. 그리고 값이 싸지는 건 성능이 오르는 것보다 우리 일상 워크플로우를 더 빨리 바꿔요.


근거가 된 소식: Introducing Claude Sonnet 5 (Anthropic), Claude Code v2.1.197 — Sonnet 5 기본 모델화 (GitHub)

T
TomAI 코딩 도구를 매일 쓰는 개발자

Claude Code, OpenCode 같은 AI 코딩 도구를 직접 쓰면서 AI 업계의 변화를 개발자 관점에서 기록합니다. 단순 번역이 아니라 써본 경험과 해석을 함께 남기려고 해요.

AI 소식칼럼

이제 모델이 아니라 'SI 채널'을 사들인다 — TCS·DXC 합류가 보여주는 다음 전장

이번 주 Anthropic은 TCS와 DXC를 같은 패턴으로 끌어들였어요. 개발자에게 직접 파는 게 아니라, 규제산업을 이미 점유한 시스템 통합업체(SI)를 채널로 삼는 거예요. OpenAI도 같은 주에 컨설팅 파트너망을 모집했고요. 엔터프라이즈 AI의 경쟁축이 모델 성능에서 '누가 규제산업의 배관을 깔아주느냐'로 옮겨가는 흐름을 짚었어요.

AI 소식칼럼

내가 칭찬한 그 안전 설계를, 정부가 닷새 만에 막았다 — Fable 5 접근 중단이 말하는 것

닷새 전 저는 Fable 5의 진짜 뉴스가 '위험 능력을 거부가 아니라 라우팅으로 가둔 자체 설계'라고 썼어요. 그런데 미국 정부가 그 설계를 인정하지 않고 모델 접근 자체를 끊었습니다. 같은 날 나온 여론조사는 미국인의 15%만 AI 기업의 자율 판단을 믿는다고 말하고요. 잘 만든 자율 안전이 충분조건이 아니라는 신호를 따라가 봤어요.

AI 소식칼럼

Claude Fable 5: '가장 센 모델'보다 '위험을 가두는 방식'이 진짜 뉴스

Fable 5의 헤드라인은 '역대 최강 SOTA'지만, 정작 읽어야 할 건 벤치마크가 아니라 Mythos→Fable로 이어지는 안전 라우팅 설계예요. 위험한 능력을 거부로 막는 대신 약한 모델로 흘려보내고, 진짜 위험 능력은 Mythos 5로 분리해 인가받은 파트너에게만 여는 구조가 이번 발표의 본론이라고 봐요.