DeepSeek V4 완전 분석
GPT-5.5의 1/7 가격, 진짜 쓸 만한가
2026년 4월 24일 출시된 오픈소스 신규 모델. V4-Pro와 V4-Flash의 실제 성능, GPT-5.5·Claude Opus 4.7과의 비교, 한국 사용자가 알아야 할 주의사항까지.
📋 이 글에서 알 수 있는 것
- DeepSeek V4의 핵심 변화 — V4-Pro와 V4-Flash 두 모델 동시 출시
- SWE-bench Verified 80.6% 등 공식 벤치마크 성능
- GPT-5.5·Claude Opus 4.7 대비 1/6~1/7 가격의 실제 의미
- 화웨이 Ascend 칩으로 학습한 전략적 의의
- 한국 사용자가 반드시 확인해야 할 개인정보·접근 이슈
DeepSeek V4가 왜 다시 화제인가
DeepSeek는 2025년 1월 R1 모델을 공개해 미국 빅테크 주가에 영향을 줄 정도의 충격을 줬던 중국 AI 스타트업이다. V3 출시 이후 484일 만인 2026년 4월 24일, V4-Pro와 V4-Flash 두 모델을 동시에 공개했다. 공교롭게도 OpenAI가 GPT-5.5를 출시한 다음 날이었다.
이번 V4 출시가 다시 주목받는 이유는 단순한 성능 갱신이 아니다. 핵심은 세 가지다.
⚡ V4 출시의 3가지 핵심 의미
- ① 가격 파격: V4-Pro는 GPT-5.5의 약 1/7, Claude Opus 4.7의 약 1/6 수준 가격
- ② 완전 오픈소스: MIT 라이선스로 가중치 공개 — 상업적 사용도 가능
- ③ 화웨이 Ascend 칩 학습: NVIDIA GPU 의존도를 낮춘 첫 주요 프론티어급 모델
DeepSeek 자체 기술 보고서는 V4가 GPT-5.4·Gemini 3.1 Pro 대비 약 3~6개월 뒤처진 수준이라고 솔직히 인정했다. 다만 이 가격 차이를 감안하면 "약간 뒤처져도 충분히 매력적"이라는 평가가 일반적이다.
V4-Pro와 V4-Flash, 두 모델 스펙 비교
이번 V4는 한 모델이 아니라 용도가 다른 두 모델을 동시에 출시한 게 특이점이다. 둘 다 Mixture-of-Experts(MoE) 아키텍처와 1M 토큰 컨텍스트를 공유하지만, 규모와 활용 시나리오가 완전히 다르다.
| 항목 | V4-Pro | V4-Flash |
|---|---|---|
| 총 파라미터 | 1.6T (1조 6천억) | 284B (2,840억) |
| 활성 파라미터 | 49B | 13B |
| 학습 토큰 | 33T | 32T |
| 컨텍스트 윈도우 | 1M | 1M |
| 최대 출력 | 384K | 384K |
| 입력 가격 (1M, cache miss) | $1.74 | $0.14 |
| 출력 가격 (1M) | $3.48 | $0.28 |
| chat.deepseek.com | Expert Mode | Instant Mode |
| 주 용도 | 고난도 추론·코딩 | 대량 처리·실시간 |
*출처: DeepSeek 공식 발표 (2026.04.24)
V4-Pro는 "현재 가장 우수한 오픈소스 모델"이라고 DeepSeek가 자평하는 플래그십이다. V4-Flash는 활성 파라미터가 13B로 작지만 284B 규모의 전문가 네트워크에서 필요한 부분만 선택적으로 호출하는 구조라, 일반적인 13B급 모델보다 훨씬 풍부한 지식을 활용할 수 있다.
DeepSeek 공식 안내는 "신규 프로젝트는 V4-Flash로 시작하고, 특정 작업에서 품질 차이가 명확할 때만 V4-Pro로 업그레이드"하는 방식을 권장한다. 비용 차이가 12배에 달하기 때문.
벤치마크로 본 실제 성능
DeepSeek 공식 발표 기준 V4-Pro의 주요 벤치마크 점수는 아래와 같다. 비교 기준은 V4 학습 시점에 가장 최신이었던 Claude Opus 4.6이다(Opus 4.7은 V4 출시 8일 전인 4월 16일에 나왔다).
Claude Opus 4.6 vs DeepSeek V4-Pro
| SWE-bench Verified (코딩) | 80.8% vs 80.6% |
| Terminal-Bench 2.0 (CLI) | 65.4% vs 67.9% |
| LiveCodeBench (실시간 코딩) | 88.8% vs 93.5% |
| HLE (전문가 평가) | 40.0% vs 37.7% |
| HMMT 2026 (수학) | 96.2% vs 95.2% |
SWE-bench Verified에서 단 0.2점 차이로 Claude Opus 4.6에 근접한 게 특히 인상적이다. 코딩 워크플로우에서는 V4-Pro가 폐쇄형 프론티어 모델과 거의 같은 품질을 7배 저렴한 가격으로 제공한다는 의미다.
다만 DeepSeek 자체 보고서는 더 어려운 추론 벤치마크에서 GPT-5.4·Gemini 3.1 Pro에 약 3~6개월 정도 뒤처진다고 솔직히 인정했다. "프론티어 직전" 정도 위치라는 게 정확한 평가다.
아키텍처 측면에서 V4는 1M 토큰 컨텍스트 추론 시 V3.2 대비 단일 토큰 추론 FLOPs 27%, KV 캐시 10%만 사용한다. 긴 문서·대형 코드베이스를 다루는 워크플로우에서 비용 절감 효과가 구조적으로 보장된다.
GPT-5.5 완전 분석: 6주 만의 후속, 무엇이 달라졌나도 함께 읽어보세요.
GPT-5.5·Claude Opus 4.7과 가격·성능 비교
실제 의사결정에서 가장 의미 있는 비교는 같은 시점의 3대 플래그십과의 가격·성능 매트릭스다. V4-Pro의 진짜 무기는 가격이다.
| 항목 | DeepSeek V4-Pro | GPT-5.5 | Claude Opus 4.7 |
|---|---|---|---|
| 출시일 | 2026.04.24 | 2026.04.23 | 2026.04.16 |
| 입력 가격 ($/1M) | $1.74 | $5.00 | $5.00 |
| 출력 가격 ($/1M) | $3.48 | $30.00 | $25.00 |
| 1M+1M 합계 | $5.22 | $35.00 | $30.00 |
| 컨텍스트 | 1M | 1M | 1M |
| 오픈소스 | 예 (MIT) | 아니오 | 아니오 |
| 가중치 공개 | 예 (Hugging Face) | 아니오 | 아니오 |
| 한국 직접 접근 | 제한 가능 ⚠️ | 가능 | 가능 |
*출처: DeepSeek·OpenAI·Anthropic 공식 가격표 (2026년 4월 기준)
입력 1M + 출력 1M 토큰 작업 기준으로 V4-Pro는 $5.22, GPT-5.5는 $35, Opus 4.7은 $30이다. 캐시 적중 시 V4-Pro 입력 가격은 $0.145로 떨어져 격차가 더 벌어진다.
다만 가격만으로 결정할 수 없는 영역이 있다. 한국어 다국어 성능에서는 Opus 4.7과 Gemini 3.1 Pro가 더 우위에 있고, 멀티스텝 에이전트 워크플로우에서는 GPT-5.5의 Terminal-Bench 82.7%가 더 강력하다. 작업이 무엇이냐에 따라 답이 달라진다.
누구에게 적합한 모델인가
가격 매력에도 불구하고 V4가 모든 사용자에게 정답은 아니다. 사용 시나리오별로 권장 여부가 다르다.
코딩 에이전트·대량 처리 워크플로우 (개발자)
→ SWE-bench Verified 80.6%로 Opus 4.6 수준 코딩 품질을 7배 저렴하게 사용 가능. API 비용이 누적되는 자동화 파이프라인일수록 효과 큼.
실험·학습 목적 사용자 (비개발자 포함)
→ V4-Flash($0.14/$0.28)는 GPT-5.5 대비 거의 100분의 1 가격이라 부담 없이 다양한 시도 가능. 다만 한국어 응답 품질은 직접 테스트 권장.
한국어 중심 업무·민감 데이터 다루는 사용자
→ 한국어 다국어 성능은 Claude·Gemini 대비 약함. 또한 개인정보 이슈(아래 PART 06 참고)로 회사·개인 민감 데이터 사용은 신중해야 함.
기업 보안 정책상 중국 서비스 제한 환경
→ 정부 기관·금융권 등 중국발 서비스 사용 제한 정책이 있는 환경에서는 셀프호스팅(Hugging Face 가중치 다운로드 후 자체 서버 구동)만이 옵션.
한국 사용자 주의사항
한국 사용자가 DeepSeek를 사용할 때 반드시 확인해야 할 두 가지 이슈가 있다.
한국 개인정보보호위원회(PIPC)는 2025년 2월 DeepSeek 앱이 국내 개인정보 보호법을 일부 준수하지 못한 점을 확인하고 신규 다운로드를 일시 중단시킨 바 있다. 이후 DeepSeek 측이 개선 조치를 약속했지만, 한국 사용자라면 현재 시점의 앱 스토어 가용성과 이용 약관을 별도 확인하는 게 안전하다.
DeepSeek 공식 웹·앱·API를 사용하면 입력 데이터가 중국 내 서버에 저장될 가능성이 있다. 회사 기밀, 고객 정보, 코드 등 민감 데이터는 입력하지 않는 게 좋다.
1) 민감하지 않은 일반 질문·코딩 학습용으로 chat.deepseek.com 사용
2) API 사용 시 Hugging Face·OpenRouter 같은 제3자 게이트웨이 활용 (데이터 라우팅 정책 별도 확인 필수)
3) 가장 안전한 방법은 Hugging Face에서 가중치 다운로드 후 자체 서버에서 셀프호스팅 — V4-Flash는 약 160GB 용량으로 고사양 데스크톱·서버에서 실행 가능
자주 묻는 질문
DeepSeek V4는 무료로 쓸 수 있나요?
chat.deepseek.com 웹 채팅은 기본적으로 무료입니다. API 사용 시에는 토큰 단위로 과금되지만, V4-Flash는 입력 1M에 $0.14로 GPT-5.5의 약 100분의 1 수준이라 사실상 무료에 가까운 수준이에요. Hugging Face에서 가중치를 다운로드해 자체 서버에서 실행하면 API 비용 없이 무료 사용도 가능합니다.
V4-Pro와 V4-Flash 중 어느 걸 써야 하나요?
일반 작업은 V4-Flash로 충분한 경우가 대부분입니다. DeepSeek 공식 권장도 "신규 프로젝트는 Flash로 시작, 품질 차이가 명확한 작업만 Pro로 업그레이드"입니다. 가격 차이가 12배에 달하기 때문이에요. 코딩 에이전트나 복잡한 추론 작업이라면 V4-Pro 검토 가치가 있습니다.
한국에서 DeepSeek를 사용해도 되나요?
2025년 2월 신규 다운로드가 일시 중단됐던 적이 있어 현재 앱 스토어 상태는 확인이 필요합니다. 웹사이트 접근은 가능하지만, 회사 기밀이나 고객 정보 같은 민감 데이터는 입력하지 마세요. 정부 기관·금융권 등 보안 정책상 중국 서비스 사용이 제한되는 환경에서는 사용을 피하는 게 안전합니다.
한국어 응답 품질은 어떤가요?
중국어·영어 중심으로 학습된 모델이라 한국어 응답은 Claude나 Gemini보다 자연스러움이 떨어진다는 평이 있습니다. 한국어 중심 업무라면 비용 차이가 크더라도 Claude나 Gemini를 함께 검토하는 게 좋습니다. 단순 번역·요약 같은 작업은 V4도 무리 없이 처리합니다.
화웨이 칩으로 학습됐다는 게 왜 중요한가요?
지금까지 거의 모든 프론티어 AI 모델은 NVIDIA GPU로 학습됐습니다. V4가 화웨이 Ascend 칩만으로 1.6T 모델을 학습해낸 건 미국의 대중국 AI 반도체 수출 규제 환경에서도 중국이 자체 하드웨어로 프론티어급 모델을 만들 수 있다는 시그널이에요. AI 산업의 지정학적 균형이 바뀔 수 있다는 점에서 의미가 큽니다.
가격 파괴와 오픈소스, 두 카드를 동시에 들고 나온 V4는 "AI는 비싼 폐쇄형 모델만의 영역이 아니다"라는 신호예요.
다만 한국 사용자는 성능과 비용만큼 데이터 보안도 함께 따져봐야 합니다.
VibeLab이었습니다.