Claude Opus 4.7 출시: 비전 3배 강화, 시스템 프롬프트는 어떻게 바뀌었나
안녕하세요, Tom입니다.
Anthropic이 Claude Opus 4.7을 정식 출시했어요. Opus 4.6이 나온 지 두 달이 조금 넘었는데, 이번 릴리스는 단순 성능 향상에 그치지 않고 비전 능력 대폭 강화와 함께 내부 시스템 프롬프트 구조까지 꽤 크게 바뀌었어요. Claude Code를 매일 쓰는 입장에서 이번 변경 사항이 특히 눈에 띄었어요.
Opus 4.7의 핵심 변화
가장 큰 변화는 비전 해상도 3배 증가예요. 기존 Opus 4.6이 처리하던 이미지 해상도에서 3배 높은 해상도를 지원해서, 복잡한 다이어그램이나 스크린샷 기반 작업의 품질이 크게 올라갔어요. 개인적으로 코드 리뷰할 때 Figma 스크린샷을 첨부하는 경우가 종종 있는데, 이 부분에서 체감 차이가 클 것 같아요.
코딩 성능도 주목할 만해요. SWE-bench 기준 13% 향상이라는 수치가 나왔는데, 이게 단순히 숫자만 좋아진 게 아니라 실제 작업 흐름에서도 차이가 느껴진다고 해요. Cursor 벤치마크에서는 58%에서 70%로 올라갔고, Notion 내부 평가에서도 14% 향상을 기록했어요. GDPval-AA 벤치마크에서는 현재 SOTA를 달성했고요.
새로운 기능으로 xhigh effort level이 생겼어요. 기존 low/medium/high 세 단계였던 effort 설정에 최고 수준인 xhigh가 추가된 거예요. 복잡한 멀티스텝 작업을 더 깊이 처리할 수 있게 됐는데, 그만큼 토큰 소비가 늘어날 수 있으니 용도에 맞게 선택해야 해요.
가격은 변화 없어요. 입력 $5/M 토큰, 출력 $25/M 토큰으로 Opus 4.6과 동일해요.
새로운 기능들: /ultrareview와 태스크 버짓
이번 릴리스에서 Claude Code와 함께 쓸 수 있는 새 기능도 추가됐어요. /ultrareview 커맨드는 코드 변경 사항을 세밀하게 검토해주는 기능인데, 단순히 오류를 찾는 게 아니라 아키텍처 관점에서의 리뷰까지 해줘요. 실제로 PR 전에 한 번 돌려보기에 유용할 것 같아요.
태스크 버짓(task budgets)도 새로 생겼어요. 에이전트가 태스크를 수행할 때 토큰이나 시간 등의 예산을 미리 설정해서 오버런을 방지하는 기능이에요. Claude Code로 큰 리팩토링을 맡기다 보면 생각보다 훨씬 많은 토큰을 소비하는 경우가 있는데, 이 기능으로 어느 정도 제어가 가능해질 것 같아요.
시스템 프롬프트 변경 분석
이번 릴리스에서 가장 흥미로웠던 부분은 내부 시스템 프롬프트의 변화예요. 커뮤니티에서 시스템 프롬프트 diff가 공유됐는데, 몇 가지 주목할 만한 변경이 있었어요.
플랫폼 이름 변경이 먼저 눈에 띄었어요. 내부적으로 플랫폼을 지칭하는 명칭이 변경됐어요. 이 변화는 외부적으로는 크게 드러나지 않지만, 시스템 전체의 일관성을 위한 정비 작업으로 보여요.
새 빌트인 도구 추가도 있었어요. Chrome 브라우저 제어, Excel, PowerPoint 파일 처리 도구가 새로 추가됐어요. 컴퓨터 사용(computer use) 기능과 자연스럽게 연계되는 부분이에요. Anthropic이 지난 3월 Vercept 인수로 컴퓨터 사용 능력을 72.5%까지 끌어올린 게 이번 릴리스에서 구체적인 도구로 드러난 거예요.
응답 동작도 일부 변경됐어요. 특히 긴 태스크를 수행할 때 중간 체크포인트를 더 자주 요청하는 방향으로 바뀌었어요. 에이전트가 혼자 오래 달리다가 엉뚱한 방향으로 가는 걸 방지하는 안전장치 성격이에요.
tool_search 메커니즘도 업데이트됐어요. 사용 가능한 도구 목록이 많아졌을 때 어떤 도구를 선택할지 결정하는 방식이 개선됐어요. 이전에는 단순 매칭 수준이었다면, 이제는 컨텍스트를 더 잘 반영하는 방향으로 바뀐 것 같아요.
Claude Code 사용자 관점에서
매일 Claude Code를 쓰는 입장에서 이번 업데이트가 가장 반가운 부분은 역시 코딩 성능 향상이에요. 특히 복잡한 리팩토링이나 여러 파일에 걸친 변경 작업에서 판단 품질이 올라간다면 체감이 클 거예요.
비전 강화는 Claude Code의 UI 컴포넌트 작업에서 빛을 발할 것 같아요. Figma 디자인을 보고 코드를 작성하거나, 기존 화면 스크린샷을 기반으로 수정 작업을 할 때 해상도가 높아지면 놓치는 디테일이 줄어들겠죠.
태스크 버짓 기능은 특히 자동화 파이프라인에서 유용할 거예요. 배포 파이프라인에 Claude Code를 붙여 쓰는 경우에 예산 초과 없이 안정적으로 운영할 수 있을 것 같아요.
Opus 4.6 출시 이후 두 달 사이에 이 정도 변화가 있었다는 건 Anthropic의 개발 속도가 여전히 빠르다는 걸 보여줘요. 다음 버전이 어떤 방향으로 올지 벌써 궁금해지네요.
원문: Claude Opus 4.7
관련 글
Claude Sonnet 4.6 출시: Opus급 성능을 Sonnet 가격에
Anthropic이 Claude Sonnet 4.6을 출시했어요. 코딩, 컴퓨터 사용, 장문 맥락 추론 등 전방위 업그레이드된 중급 모델입니다.
Anthropic $30B 시리즈 G 펀딩: AI 역사상 최대 규모
Anthropic이 $30B(약 43조원) 시리즈 G 펀딩을 받았어요. $380B 밸류에이션, 연매출 $14B, Claude Code만 $2.5B — 숫자가 경이롭습니다.
Claude Opus 4.6 출시: Anthropic의 가장 강력한 모델이 왔어요
Anthropic이 Claude Opus 4.6을 출시했습니다. 코딩, 추론, 장문 컨텍스트 등 거의 모든 영역에서 업계 최고 수준의 성능을 보여주는 모델입니다.