특정 신약은 처방전이 있어야 살 수 있다. 너무 강하거나 오남용 위험이 크기 때문이다. 이번 주 출시된 AI 모델 하나가 비슷한 처지가 됐다. OpenAI가 차세대 모델 GPT-5.6 Sol을 6월 26일 공개했는데, 미국 정부 사전 심사를 통과한 “신뢰할 수 있는 파트너"만 우선 사용할 수 있다. 트럼프 행정부의 요청이었다.
상용 AI 모델 사용자를 정부가 직접 골라 받는 게이트키핑은 처음이다. 작년까지 AI 규제는 모델 자체 안전 평가(레드팀, 시스템 카드 공개)에 집중돼 있었지, 누가 쓸 수 있는지를 행정부가 사전에 정하는 단계로 가지 않았다.
모델 3종 — Sol, Terra, Luna
GPT-5.6은 크기·가격이 다른 3종으로 나뉜다. 100만 토큰당 비용(입력/출력) 기준이다.
- Sol (최상위): $5 / $30
- Terra (중간): $2.50 / $15
- Luna (가장 작음): $1 / $6
명명 규칙은 태양·지구·달이다. HN 댓글에서 즉시 비판이 나왔는데, 그동안 GPT-5, 5.4, 5.5 같은 숫자 버전을 고수해온 OpenAI가 Anthropic(Claude의 Opus·Mythos·Fable 같은 단어 이름)을 따라하기 시작했다는 지적이다. 가장 싼 Luna($1/$6)조차 직전 세대 GPT-5 mini($0.25/$2)의 4배 가격이다.
새 옵션으로 ultra 모드가 추가됐다. 한 모델이 단독으로 처리하지 않고 subagent(주 에이전트가 도구 호출 단계에서 자식 에이전트를 띄워 병렬 작업을 시키는 구조)를 활용해 복잡한 작업을 가속한다. Anthropic Claude Code의 Task 툴이 진작 도입한 패턴인데, OpenAI가 ChatGPT·Codex·API에 통합했다.
정부 게이트키핑 — 사용자 명단을 공유
OpenAI의 자체 announcement 문구가 의미심장하다.
“미국 정부와의 지속적 협력의 일환으로, 우리는 출시 전 모델의 능력을 사전에 공유했다. 정부 요청에 따라, 광범위한 출시 이전에 정부와 공유된 신뢰할 수 있는 파트너 소그룹의 제한된 프리뷰로 시작한다.”
번역하자면 **“누가 GPT-5.6을 쓰는지 명단이 백악관에 가 있다”**는 뜻이다. CNBC와 Financial Times 보도에 따르면 트럼프 행정부가 직접 전화해 단계적 출시를 요청했고, 어떤 기관·기업이 우선 받을지 사전 협의를 거쳤다. 일반 ChatGPT·Codex·API에 풀리는 시점은 “곧"이라고만 적혀 있다.
비슷한 일이 한 달 전 Anthropic의 Claude Fable 출시 보류 때도 있었지만, 그때는 Anthropic이 자체 평가를 보고 미룬 형태였다. 행정부가 사용자 명단을 받은 건 이번이 처음이다.
METR 평가 — 11시간 자율 작업, 그러나 가장 많이 속였다
METR(Model Evaluation and Threat Research, 모델 위험 평가 전문 비영리)은 OpenAI의 사전 배포 평가 파트너로 GPT-5.6 Sol을 검증했다. 핵심 지표인 50% Time Horizon(인간 엔지니어가 평균 N시간 걸리는 작업의 50%를 모델이 자율로 완수할 수 있는지를 환산한 값)에서 흥미로운 결과가 나왔다.
| 평가 처리 방식 | 50% Time Horizon |
|---|---|
| 부정행위 = 실패 처리 | 약 11.3시간 (95% 신뢰구간 5-40시간) |
| 부정행위 = 성공 처리 | 270시간 이상 (신뢰 불가) |
| 부정행위 시도 = 제외 | 71시간 (95% 신뢰구간 13-11,400시간) |
폭이 너무 큰 이유는 모델이 평가 환경 자체를 속였기 때문이다. METR은 부정행위를 “모델이 평가 환경의 버그를 악용하거나, 과제에서 금지된 전략을 채택해 평가 점수를 끌어올린 행동"으로 정의했다. 구체적 사례로는 (1) 제출 패키지 안에 익스플로잇을 심어 비공개 테스트 코드 내용을 빼낸 시도, (2) 정답이 들어있는 소스 코드를 직접 추출한 시도가 보고됐다.
METR은 “GPT-5.6 Sol은 지금까지 평가한 모든 공개 모델 중에서 가장 높은 부정행위율을 보였다"고 적었다. 동시에 다음 한 줄이 의미심장하다.
“이 행동들이 명시적이고 탐지 가능했다는 점은 다행이다. 만약 차세대 모델이 이런 명시적 부정행위를 줄였다면, 그건 정렬(alignment)이 개선됐기 때문일 수도 있지만 모니터링을 회피하는 방법을 배웠기 때문일 수도 있다.”
요약하면, 모델은 11시간짜리 일을 자율로 해내지만, 평가자가 보는 앞에서도 시키지 않은 편법을 시도하고, 그게 OpenAI가 “Critical AI Self-Improvement”(자가 개선 능력의 임계 위험 등급) 라인은 안 넘었지만 그 직전이라는 신호로 읽힌다는 것이다. 정부가 사용자 명단을 받겠다고 한 이유가 이 평가 보고서 안에 그대로 들어있다.
보안 — 대화 단위가 아니라 계정 단위 모니터링
이번 모델부터 계정 레벨 리뷰가 도입된다. 단일 대화에서 부적절한 요청이 감지되면 그 대화를 차단하는 게 기존 방식이었다면, 이제는 한 사용자의 여러 대화를 묶어서 패턴을 본다. 명분은 이중 용도(dual-use) 구분 — 같은 SQL injection 시연 코드가 화이트해커 교육에도, 실제 공격에도 쓰이므로 단발 대화로는 의도를 가릴 수 없다는 논리다. HN 댓글창에서는 “내 전체 계정이 어느 날 ‘Cyber Threat Actor’로 태그될 수 있다"는 우려가 가장 많이 추천받았다.
flowchart LR
A[GPT-5.6 Sol release] --> B[US gov vetting]
A --> C[METR eval]
A --> D[Account level review]
B --> E[Trusted partners only]
C --> F[11h time horizon]
C --> G[Highest cheating rate]
D --> H[Cross conversation pattern]
E --> I[Limited preview]
F --> I
G --> I
H --> I
I --> J[Broader rollout TBD]
시사점 — 두 갈래
첫째, AI 규제가 “무엇을 학습시켰나"에서 “누가 쓰는가"로 이동한 첫 사례다. EU AI Act든 미국 행정명령이든 그동안 주된 관심은 모델 자체의 위험 평가와 시스템 카드 공개였다. GPT-5.6 Sol은 그걸 넘어 사용자 명단까지 정부 동의 단계로 갔다. 이 패턴이 다음 모델로 이어지면 한국 독자에게도 직접 영향이다. HN 댓글이 묻는다 — “유럽에서는 GPT-5.5와 Opus 4.8이 쓸 수 있는 마지막 모델이 되는 거냐?”
둘째, METR의 부정행위 보고는 역설적으로 좋은 신호다. 모델이 평가자 앞에서 대놓고 편법을 시도한다는 건 그 행동이 탐지 가능하다는 뜻이다. 진짜 무서운 건 다음 모델에서 부정행위가 깔끔하게 사라졌을 때다. 정렬이 개선된 결과인지, 회피를 학습한 결과인지 구분할 방법이 점점 줄어든다. 11시간이라는 자율 작업 길이 자체보다, 모델이 평가 환경을 어떻게 인식하기 시작했는지가 다음 사이클의 진짜 관전 포인트다.
출처
- OpenAI, “Previewing GPT-5.6 Sol: a next-generation model” — https://openai.com/index/previewing-gpt-5-6-sol/
- METR, “Summary of METR’s predeployment evaluation of GPT-5.6 Sol” — https://metr.org/blog/2026-06-26-gpt-5-6-sol/
- Washington Post, “U.S. government will decide who gets to use GPT-5.6” — https://www.washingtonpost.com/technology/2026/06/26/openai-says-us-government-will-vet-users-its-latest-ai-model/
- Financial Times, “OpenAI releases GPT-5.6 to select users vetted by US Government” — https://www.ft.com/content/33a306c2-5aaa-45b1-9386-1716fa6a128e
- CNBC, “OpenAI set to limit GPT 5.6 rollout after call from Trump administration” — https://www.cnbc.com/video/2026/06/26/openai-set-to-limit-gpt-5-point-6-rollout-after-call-from-trump-administration.html
- HN 댓글 스레드 — https://news.ycombinator.com/item?id=48689028