AI 뉴스 | 신모델 분석

Claude Opus 4.7 출시:
코딩·비전·자체검증, 무엇이 달라졌나

Anthropic이 4월 16일 공개한 최신 플래그십 모델 — 핵심 변화 5가지를 정리합니다.

2026년 4월 21일 작성 · Anthropic 공식 발표 기준

📋 이 글에서 알 수 있는 것

Claude Opus 4.7이 정확히 무엇이 바뀌었는지 (공식 발표 기준 5가지 핵심 변화)
코딩·비전·자체 검증 능력이 얼마나 향상됐는지 (벤치마크 수치 포함)
GPT-5.4·Gemini 3.1 Pro와 비교한 현재 위치
가격, 접근 방법, 그리고 비개발자에게 어떤 의미가 있는지
업그레이드 시 알아둬야 할 토큰 사용량 변화

한 줄로 보는 변화 — Opus 4.7은 무엇인가

Anthropic은 2026년 4월 16일, 새 플래그십 모델 Claude Opus 4.7을 공식 발표했습니다. 직전 모델인 Opus 4.6의 후속 버전이며, 모든 Claude 제품과 API, 그리고 Amazon Bedrock·Google Cloud Vertex AI·Microsoft Foundry에서 같은 날부터 사용할 수 있습니다.

이번 업데이트는 "차세대 모델"이라기보다는, 직전 버전의 약점을 정밀하게 다듬은 점진적이지만 의미 있는 업그레이드에 가깝습니다. 가장 주목할 변화는 어려운 코딩 작업, 비전(이미지 인식), 그리고 모델이 자기 결과물을 스스로 검증하는 능력입니다.

⚡ 핵심 5가지를 한눈에

코딩 능력 강화 — 어려운 작업 위주로 확연한 성능 향상
비전 3배 강화 — 최대 약 3.75메가픽셀 이미지까지 고해상도 처리
자체 검증 — 출력 결과를 스스로 점검 후 보고
xhigh 추론 모드 — high와 max 사이의 새로운 노력 단계
가격 동결 — Opus 4.6과 동일 (입력 100만 토큰당 $5, 출력 $25)

Anthropic은 동시에 자사의 더 강력한 모델인 Claude Mythos Preview는 사이버보안 위험 통제를 이유로 여전히 제한적으로만 공개한다고 밝혔습니다. 일반 사용자가 만날 수 있는 가장 강력한 Claude는 당분간 Opus 4.7이라는 의미입니다.

변화 1 · 코딩이 한 단계 더 강해졌다

이번 업데이트의 가장 두드러진 변화는 코딩 능력입니다. Anthropic은 "이전에는 가까이서 지켜봐야 했던 가장 어려운 코딩 작업까지 안심하고 맡길 수 있게 됐다"라고 공식 블로그에서 설명했습니다.

데이터 1

외부 파트너들이 발표한 실제 벤치마크

Anthropic 공식 발표에는 여러 파트너 기업이 자체 측정한 수치가 포함되어 있습니다. 모두 Opus 4.6 대비 Opus 4.7의 향상폭을 비교한 결과입니다.

회사 · 벤치마크	Opus 4.6	Opus 4.7
Cursor (CursorBench)	58%	70% 이상
GitHub (93개 코딩 과제)	기준값	+13%p 해결률
Rakuten (Rakuten-SWE-Bench)	1배	3배 더 많은 production 작업 해결
XBOW (시각적 정확도 벤치마크)	54.5%	98.5%
Notion (멀티스텝 워크플로우)	기준값	+14% 정확도 · 도구 오류 1/3 수준

*출처: Anthropic 공식 발표 (2026.04.16) — 각 사 자체 평가 기준

특히 흥미로운 부분은 "자기 코드를 스스로 검증한다"는 점입니다. Vercel의 시니어 엔지니어는 "시스템 코드 작업을 시작하기 전에 모델이 직접 증명을 한다"고 평가했는데, 이전 Claude 모델에서는 보지 못했던 행동이라고 덧붙였습니다.

Replit은 같은 작업을 더 적은 비용으로 처리한다는 점을, Hex는 데이터가 부족할 때 그럴듯한 가짜 답변 대신 "데이터가 없다"고 정직하게 보고하는 점을 핵심 개선 포인트로 꼽았습니다.

📖

Claude를 코딩에 처음 써보고 싶다면 →
Claude Code 사용법 — 비개발자 도전기를 먼저 읽어보세요.

변화 2 · 비전 능력이 3배 이상 향상됐다

Opus 4.7은 이미지 인식 능력에서 가장 큰 폭의 점프를 보여줍니다. Anthropic은 이번 모델이 긴 변 기준 최대 2,576픽셀(약 3.75 메가픽셀)까지의 이미지를 처리할 수 있다고 밝혔습니다. 이는 이전 Claude 모델 대비 3배 이상의 해상도입니다.

💡 왜 중요한가
해상도가 올라간다는 건 단순히 "큰 이미지를 읽는다"가 아니라, 스크린샷의 작은 글씨, 복잡한 도표의 숫자, 차트의 미세한 라벨, 특허 문서의 화학 구조식까지 정확히 읽어낼 수 있다는 의미입니다. 컴퓨터 화면을 보고 작업을 수행하는 AI 에이전트, 데이터 추출, 디자인 검토 같은 영역에서 활용도가 크게 늘어납니다.

이 부분에 대한 가장 인상적인 외부 평가는 자율 침투 테스트 회사 XBOW가 내놓은 수치입니다. 이 회사의 시각 정확도 벤치마크에서 Opus 4.6은 54.5%, Opus 4.7은 98.5%를 기록했습니다. 같은 회사의 CEO는 "Opus의 가장 큰 약점이 사실상 사라졌다"고 표현했습니다.

특허 분석 스타트업 Solve Intelligence도 화학 구조나 복잡한 기술 도면 해석 능력이 향상됐다고 보고했습니다. 비개발자 입장에서는, 영수증·계약서·손글씨 노트 같은 일상 이미지를 Claude에 분석시킬 때 정확도가 더 올라갈 것으로 기대할 수 있습니다.

변화 3 · 새로운 xhigh 모드와 Claude Code 신기능

모델 자체의 변화 외에도, 이번 발표에는 개발자 도구 측면의 업데이트가 함께 포함됐습니다. 비개발자에게도 영향을 주는 부분이 있어 정리해두면 좋습니다.

신기능 1

xhigh — 새로운 추론 노력 단계

기존에는 추론 강도(effort)를 low / medium / high / max 4단계로만 조절할 수 있었습니다. 이번에 high와 max 사이에 xhigh(extra high)가 추가됐습니다. "max만큼 깊이 생각하지는 않지만, high보다는 한 단계 더 신중하게" 답변하는 절충안입니다.

Anthropic은 코딩이나 에이전트 용도에서 high나 xhigh부터 시작할 것을 권장하고 있고, Claude Code의 기본값을 모든 요금제에서 xhigh로 상향했습니다.

신기능 2

/ultrareview — 시니어 엔지니어급 코드 리뷰

Claude Code 안에서 /ultrareview 명령을 입력하면, 모델이 마치 시니어 개발자처럼 코드를 깊이 검토하고 버그·설계 결함을 찾아냅니다. Pro·Max 사용자에게는 무료 체험 3회가 제공됩니다.

신기능 3

auto mode 확장 — 더 긴 자율 작업

auto mode는 Claude가 사용자의 매번 허락 없이 일정 범위 내에서 결정을 내리며 작업을 이어가는 모드입니다. 기존에는 일부 요금제만 쓸 수 있었는데, 이번에 Max 플랜 사용자에게도 확장됐습니다. 야간 장기 작업이나 여러 단계로 이어지는 작업에서 중간 개입을 줄여줍니다.

여기에 더해 API에서는 task budgets 기능이 퍼블릭 베타로 공개됐습니다. 자율적으로 움직이는 에이전트가 토큰을 무한정 쓰지 않도록 상한을 설정하는 기능입니다. 비용 통제가 필요한 자동화 환경에 직접적인 도움이 됩니다.

GPT-5.4·Gemini 3.1 Pro와 비교한 위치

현재 일반 공개된 최상위 AI 모델 시장은 사실상 3파전입니다. Claude Opus 4.7, OpenAI GPT-5.4, Google Gemini 3.1 Pro. Anthropic은 이번 발표에서 직접 비교 차트를 함께 공개했습니다.

💡 한 줄 요약
에이전틱 코딩, 도구 사용, 컴퓨터 사용, 금융 분석 같은 "길게 일하고 검증하는" 영역에서는 Opus 4.7이 우위입니다. 반대로 검색 기반 에이전트, 다국어 Q&A, 일부 터미널 코딩 영역은 GPT-5.4가 여전히 우세하다고 Anthropic 스스로도 인정했습니다.

VentureBeat의 분석에 따르면 직접 비교 가능한 벤치마크에서 Opus 4.7과 GPT-5.4의 격차는 7대 4 수준으로, "근소한 우위"로 표현됩니다. 즉, 어떤 작업이냐에 따라 답은 달라집니다.

🎯 작업별 추천 매핑

장시간 코딩, 자동화 워크플로우 → Opus 4.7이 유리
실시간 검색·다국어 응답 → GPT-5.4 우세
대용량 컨텍스트, Google 생태계 연동 → Gemini 3.1 Pro 강점

한국어 사용자 입장에서 흥미로운 부분은, Anthropic이 다국어 Q&A는 GPT-5.4가 더 낫다고 명시적으로 인정한 점입니다. 한국어 자연스러움이 중요한 작업에서는 두 모델을 직접 비교해보는 게 안전합니다.

가격·접근 방법, 비개발자에게 의미는?

가장 반가운 소식 하나는 가격이 그대로라는 점입니다. Opus 4.6과 동일하게 입력 100만 토큰당 $5, 출력 100만 토큰당 $25입니다. 모델은 더 똑똑해졌는데 단가는 동결한 셈입니다.

접근 경로

지금 어디서 쓸 수 있나

Opus 4.7은 발표 당일부터 다음 채널에서 사용할 수 있습니다.

Claude.ai — Pro·Max 등 유료 플랜에서 모델 선택 가능
Claude API — 모델 식별자 claude-opus-4-7
Amazon Bedrock, Google Cloud Vertex AI, Microsoft Foundry 등 클라우드 마켓
Claude Code — CLI 환경에서 기본 모델로 즉시 적용

비개발자 입장에서 직접적으로 체감할 만한 변화는 세 가지입니다. ① 긴 작업의 안정성 — 여러 단계가 이어지는 자료 정리, 보고서 작성, 데이터 분석 같은 작업이 중간에 흐트러지지 않을 가능성이 높아졌습니다. ② 이미지 분석의 디테일 — 스크린샷·차트·문서 사진을 분석시킬 때 더 정확한 결과를 기대할 수 있습니다. ③ "그럴듯한 거짓말"이 줄어든다 — 데이터가 부족하면 솔직하게 부족하다고 말하는 경향이 강해졌다는 평가가 여러 파트너에게서 일관되게 나왔습니다.

업그레이드 시 주의할 점 — 토큰 사용량 변화

"가격은 그대로, 모델은 똑똑해졌다"는 좋은 소식이지만, Anthropic이 솔직하게 밝힌 두 가지 주의사항이 있습니다.

⚠️ 새 토크나이저 영향
Opus 4.7은 텍스트를 토큰으로 쪼개는 방식이 일부 바뀌었습니다. 같은 입력이라도 콘텐츠 종류에 따라 토큰 수가 1.0~1.35배 늘어날 수 있습니다. 무료 플랜이 아닌 API 사용자는 청구액이 약간 변동될 수 있으니, 실제 트래픽으로 한 번 비교 측정해보는 것이 안전합니다.

⚠️ 추론 깊이가 깊어진 만큼 출력 토큰도 늘어남
특히 높은 effort 단계에서는 모델이 더 깊이 생각하고 더 많은 출력 토큰을 사용합니다. 비용 통제가 필요하다면 effort 파라미터를 조정하거나 task budgets를 활용하라고 Anthropic은 안내하고 있습니다.

또 하나, Anthropic은 "Opus 4.7이 이전 모델보다 지시를 훨씬 더 문자 그대로 따른다"고 밝혔습니다. 즉, 이전 모델용으로 작성해둔 프롬프트가 예상과 다르게 작동할 수 있다는 뜻입니다. 잘 돌아가던 자동화 워크플로우가 갑자기 결과가 달라졌다면, 모델 변경이 원인일 가능성이 큽니다. 프롬프트를 한 번 다듬어볼 필요가 있습니다.

✏️

프롬프트를 다시 정비하고 싶다면 →
Cursor 사용법 초보 가이드 A to Z도 참고할 만합니다.

📚 출처 · Anthropic 공식 발표(2026.04.16, anthropic.com/news/claude-opus-4-7), VentureBeat(2026.04.16), MarkTechPost(2026.04.18), Axios(2026.04.16), CNBC(2026.04.16). 가격·기능 수치는 Anthropic 공식 발표 시점 기준이며 추후 변경될 수 있습니다.

VIBELAB 한 줄 총평

Opus 4.7은 "혁명적 신모델"이 아니라 "믿고 맡기는 횟수를 늘려주는 업그레이드"입니다. 코딩과 비전, 자체 검증이라는 실전 영역에서 한 단계 진보했고, 가격은 그대로입니다. 이미 Claude를 쓰고 있다면 망설일 이유가 없습니다.

AI 모델은 빠르게 진화하지만, 결국 내 일에 정말 도움이 되는가가 가장 중요한 기준입니다.

Opus 4.7도 새로운 모습을 직접 써보면서 감을 잡아보시기를 권합니다.

VibeLab이었습니다.

Claude Opus 4.7 출시:코딩·비전·자체검증, 무엇이 달라졌나