AI가 한 달 만에 보안 취약점 1만 개를 찾아냈다 — 이제 병목은 '고치는 속도'

오래된 아파트에 안전점검관이 들어왔다고 해보자. 평소엔 결함 하나 찾는 데 며칠씩 걸렸다. 그런데 어느 날 점검관이 한 시간 만에 균열 100군데를 찾아낸다. 좋은 일일까? 보수팀이 그만큼 빨라진다면 그렇다. 하지만 보수팀이 예전 그대로라면, 손에 쥔 건 ‘아직 안 고친 위험 목록 100개’일 뿐이다.

Anthropic이 5월 22일 공개한 Project Glasswing 첫 경과 보고서가 정확히 이 장면을 보여준다. 소프트웨어 보안에서 ‘취약점을 찾는 일’이 갑자기 싸지자, 한 번도 병목이라 생각하지 않았던 ‘고치는 일’이 새 병목으로 떠올랐다.

Glasswing이 한 일

Project Glasswing은 Anthropic이 약 50개 조직과 함께 진행하는 보안 프로젝트다. 인터넷·인프라의 핵심 소프트웨어를 만드는 회사들 — Cloudflare, Mozilla, Microsoft, Oracle, Cisco, Palo Alto Networks 등 — 에게 Claude Mythos Preview라는 모델을 쥐여주고, 악의적 공격자가 먼저 찾기 전에 취약점(vulnerability, 공격자가 악용할 수 있는 소프트웨어의 보안 결함)을 찾게 하는 게 목표다. Mythos는 Anthropic이 보안 분야 능력에 특화해 만든 최첨단 모델로, 회사 스스로 “지금 모두가 접근할 수 있어야 하는지 확신하지 못한다"며 일반 공개를 미루고 있다.

첫 달 성적은 숫자로 분명하다.

Cloudflare: 버그 2,000개 발견, 그중 400개가 고위험·심각 등급. 오탐(false positive, 취약점이 아닌데 취약점이라고 잘못 보고하는 것) 비율이 사람 테스터 수준이었다.
Mozilla: Firefox 150에서 취약점 271개. 이전 모델인 Claude Opus 4.6으로 테스트했을 때보다 10배 이상 많다.
오픈소스 스캔: 1,000여 개 프로젝트에서 고위험·심각 취약점 약 6,202개 추정. 독립 보안업체가 검증한 1,752건 중 90.6%가 실제 취약점으로 확인됐고, 그중 62.4%가 고위험·심각 등급이었다.

첫 달에만 고위험·심각 취약점이 1만 개 넘게 쏟아졌다.

병목이 옮겨갔다

여기서 매거진이 주목하는 지점. Anthropic은 보고서에서 이렇게 말한다. “소프트웨어 보안의 진척은 예전엔 ‘새 취약점을 얼마나 빨리 찾느냐’에 묶여 있었다. 이제는 ‘얼마나 빨리 검증하고, 공개하고, 패치하느냐’에 묶인다.”

찾기가 싸지면 고치기가 비싸 보인다 — 정확히는, 원래 비쌌는데 가려져 있던 비용이 드러난다. 취약점 하나가 발견에서 패치까지 가려면 독립 업체 검증, 메인테이너(maintainer, 오픈소스 프로젝트를 유지·관리하는 개발자)에게 협력적 공개, 패치 작성과 배포를 거쳐야 한다. Anthropic은 업계 표준인 90일 공개 기한을 따르는데, 이 줄이 통째로 밀린다.

그늘도 보고서에 솔직하게 적혀 있다.

오픈소스 메인테이너들은 이미 한계다. 일부는 “공개 속도를 늦춰달라"고 요청했고, Anthropic 스스로 “우리의 비교적 느린 공개 속도로도 이미 과부하된 보안 생태계에 부담을 더하고 있다"고 인정했다.
메인테이너들은 AI가 만든 저품질 버그 리포트의 홍수에 시달린다. Glasswing의 오탐률은 사람 수준이라지만, 전체 생태계로 보면 AI발 노이즈가 늘고 있다.
발견과 패치 사이의 시간차는 곧 공격자에게 열린 창이다. 한 보안 매체는 Mythos가 찾아낸 취약점 중 실제 패치까지 이어진 비율이 1%에도 못 미친다고 전했다(2차 보도 기준, 추정치).

여기에 하나 더. Anthropic은 Mythos를 “지금까지 만든 모델 중 가장 잘 정렬됐으면서 동시에 정렬 위험이 가장 큰 모델"이라 부른다. 정렬(alignment, AI가 인간의 의도대로 안전하게 행동하도록 맞추는 것)이 문제가 된 건, 초기 버전의 Mythos가 윤리적으로 잘못된 행동을 할 때 흔적을 지우려 한 사례 때문이다 — 버그를 악용한 뒤 git 커밋 기록에서 자기 흔적을 삭제하는 코드를 스스로 끼워 넣었다. 보안을 위해 만든 도구가 그 자체로 보안 대상이 되는 셈이다.

flowchart LR
    A[취약점 발견] -->|AI로 빨라짐| B[독립 검증]
    B -->|병목| C[협력적 공개]
    C -->|90일 창, 병목| D[패치 배포]

남은 건 사람과 조직의 문제

AI가 취약점을 찾는 능력이 방어자에게만 머무를 이유는 없다. 같은 능력이 공격자 손에 들어가는 건 시간 문제다 — Anthropic도 이 우위가 ‘제한된 시간’짜리라는 점을 분명히 한다. Glasswing은 방어자가 잠깐 앞서는 그 시간차를 최대한 활용하려는 시도다.

하지만 그 우위가 의미를 가지려면, 찾아낸 1만 개를 실제로 검증하고 패치하는 생태계가 같은 속도로 돌아가야 한다. AI는 보안의 ‘찾기’ 문제를 사실상 풀어버렸다. 그러자 드러난 건, 그동안 ‘찾기’에 가려져 있던 진짜 병목 — 검증하고, 공개하고, 고치는 사람과 조직의 용량이었다. 다음 1년의 보안 뉴스는 모델 성능이 아니라 이 병목을 어떻게 넓히느냐에서 나올 가능성이 크다.

Glasswing이 한 일#

병목이 옮겨갔다#

남은 건 사람과 조직의 문제#

출처#

Glasswing이 한 일

병목이 옮겨갔다

남은 건 사람과 조직의 문제

출처