Posts

Claude 안에 조용한 '작업 공간'이 있다 — Anthropic J-공간 연구

사람의 뇌에는 “의식이 접근할 수 있는 곳"과 “그 바깥"이 있다. 숨쉬기·걷기 같은 건 무의식적으로 처리되지만, 계획을 세우거나 문제를 풀 때는 뇌 여러 영역이 하나의 “작업대(workspace)“에 정보를 올려놓고 함께 굴린다. 인지과학에서 오래 논의된 **글로벌 워크스페이스 이론(Global Workspace Theory, 뇌 안의 다양한 처리 모듈이 하나의 공용 공간에 정보를 올려 놓아야 의식적으로 활용된다는 가설)**이다. Anthropic이 어제 발표한 연구는 Claude 안에서도 비슷한 것을 발견했다고 주장한다. 이름은 J-공간(J-space). 이 공간은 모델의 전체 신경 활동 중 10분의 1도 안 되는 좁은 슬롯이지만, 여기에 무엇이 올라오느냐가 이후 추론 방향을 결정한다. 관찰 도구는 새로 만든 Jacobian lens(J-lens, 야코비안 렌즈: 모델 내부의 현재 활동 패턴이 “앞으로 어떤 단어를 말할 확률"에 얼마나 기여하는지 역추적하는 해석가능성 기법). ...

Claude Code 세션에 웬 마인크래프트 사원? — Anthropic 컨텍스트 유출 의심 정리

7월 4일 새벽, 한 개발자가 Anthropic의 claude-code 저장소에 이슈 #74066을 열었다. Enterprise ZDR(Zero Data Retention, 세션 데이터를 저장하지 않고 다른 워크스페이스와 격리하겠다는 기업용 계약) 워크스페이스에서 Claude Code로 업무를 진행하던 중, 갑자기 Claude가 “마인크래프트 사원 벽돌은 무엇으로 할까요?“라고 자신 있게 물어왔다는 것이다. 화면 히스토리 어디에도 그런 얘기를 한 적이 없다. 리포트한 사용자는 세 가지 시나리오를 의심했다. 같은 팀 동료 세션이 새어들어온 것인지, 컨슈머 플랜의 다른 사용자 데이터가 Enterprise 격리를 뚫고 넘어온 것인지, 아니면 뭔가 다른 문제인지. ...

애플이 사파리에 AI 에이전트용 서버를 붙였다 — 브라우저가 AI 손아귀에 들어오는 방식

7월 첫째 주에 애플과 구글이 나란히 같은 방향의 발표를 냈다. 애플은 7월 1일 Safari Technology Preview 247에 “Safari MCP 서버"를 넣었고, 같은 시기 구글 크롬 팀의 chrome-devtools-mcp는 GitHub 트렌딩에 오르며 4만 5천 스타를 넘겼다. 두 진영이 각자의 브라우저에 AI 에이전트가 페이지를 직접 조작·검사할 수 있는 창구를 하나씩 낸 것이다. 여기서 등장하는 MCP(Model Context Protocol, Anthropic이 2024년 말 공개한 오픈 표준. AI 모델이 외부 도구·데이터에 접근하도록 도구 카탈로그를 서버 형태로 노출하는 프로토콜)는 원래 파일 시스템·데이터베이스·API 같은 백엔드 자원을 대상으로 시작했다. 이번엔 그 서버 대상이 브라우저 그 자체로 옮겨왔다. 사용자가 보고 있는 웹 페이지, 열려 있는 탭, 방금 발생한 네트워크 요청 — 이런 라이브 상태를 AI에게 전부 넘기는 구조다. ...

Z.AI ZCode 등장 — GLM팀이 코딩 에이전트 시장에 들어오다

터미널이나 IDE 안에서 개발자 대신 코드를 읽고 고치고 실행까지 해주는 프로그램을 “코딩 에이전트"라고 부른다. 대표적으로 Anthropic이 만든 Claude Code(클로드 코드, 터미널에서 돌아가는 AI 코딩 비서)와 OpenAI가 만든 Codex CLI가 있다. 지난 6월 30일 여기에 세 번째 주자가 합류했다. 중국 Z.AI(구 Zhipu AI, 오픈 가중치 LLM 시리즈인 GLM을 만드는 칭화대 출신 회사)가 자체 코딩 에이전트인 ZCode를 공개한 것이다. 커뮤니티 반응이 뜨거워 Hacker News 상위권에 하루 이상 걸려 있다. 무엇이 나왔나 ZCode는 GUI(그래픽 인터페이스) 데스크톱 앱이다. macOS·Windows·Linux 3종을 하루에 같이 냈다. Claude Code처럼 순수 CLI(터미널 명령어 기반)는 아니고, 겉모습은 OpenAI Codex의 데스크톱 UI에 더 가깝다. HN 댓글에서는 “손 아이콘, 텍스트 입력창 사용법, 사이드바 스타일이 Codex와 1:1로 똑같다"는 지적이 나왔다. ...

Claude Sonnet 5 — Opus 4.8에 근접한 중간 모델의 의미

Anthropic이 2026년 6월 30일 Claude Sonnet 5(클로드 소넷 5, Anthropic의 중간급 LLM)를 공개했다. Anthropic의 모델은 보통 3개 라인으로 나뉜다 — Haiku(작고 빠른 모델), Sonnet(균형형 중간 모델), Opus(최상위 모델). 이번 발표의 핵심은 새 Sonnet의 성능이 같은 회사의 최상위 모델인 Opus 4.8에 근접했다는 점이다. 같은 가격대(중간급)는 그대로 두고 능력만 끌어올린 것이라, “어느 티어를 골라야 하나"라는 사용자 결정 자체를 흔드는 변화다. 성능: Opus 4.8을 따라잡았다는 주장 Anthropic의 공식 발표문은 두 가지 agentic 벤치마크를 콕 집어 언급했다. ...

1년 안에 내 일 대부분을 AI가 한다 — Anthropic 설문 응답자 35%

“내 일 1년 안에 AI가 대신할까?” 직장인이라면 한 번쯤 자문해 본 질문이다. Anthropic이 2026년 6월 26일 공개한 Economic Index June 2026 리포트가 이 질문에 직접 답한다. Claude(앤트로픽이 만든 대형 언어 모델 챗봇 — 한국에서도 SK텔레콤 협력 등으로 인지도가 빠르게 올라간 모델) 사용자 약 9,700명을 설문한 결과, **3명 중 1명 이상(35%+)이 “12개월 안에 AI가 내 업무 대부분 또는 거의 전부를 처리할 수 있을 것”**이라고 답했다. 작년만 해도 같은 질문에 “5년 뒤"라고 답하던 사람이 다수였다. 1년 만에 “5년” → “1년"으로 인식이 압축된 셈이다. ...

한 모델이 여러 모델을 부린다 — Sakana Fugu가 GPT-5.5를 SWE-Bench에서 넘은 방식

식당 주방에는 보통 셰프 한 명이 한 요리를 끝까지 책임진다. 그런데 일부 호텔 주방은 다르다. 한 명이 야채를 썰고, 다른 한 명이 굽고, 또 다른 한 명이 마지막에 맛을 본다. 누구를 어디에 배치할지 결정하는 사람도 따로 있다. 결과적으로 한 사람이 다 하는 것보다 빠르고 안정적이다. 도쿄 스타트업 Sakana AI가 6월 27일 공개한 Fugu가 그런 호텔 주방 방식을 AI에 적용했다. 사용자는 API 호출 한 번을 보내지만, 뒤에서는 여러 모델이 역할을 나눠 일한다. 그리고 코드 작성 벤치마크 SWE-Bench Pro(실제 GitHub 이슈를 모델이 풀게 시키고 단위 테스트로 채점하는 평가)에서 GPT-5.5보다 25% 가까이 높은 점수를 받았다. 이게 지금 핫한 이유는 Anthropic 수출 금지 2주 만의 첫 비미국 frontier 대안 모델이기 때문이다. ...

GPT-5.6 Sol — 미국 정부가 사용자를 골라 받는 첫 AI

특정 신약은 처방전이 있어야 살 수 있다. 너무 강하거나 오남용 위험이 크기 때문이다. 이번 주 출시된 AI 모델 하나가 비슷한 처지가 됐다. OpenAI가 차세대 모델 GPT-5.6 Sol을 6월 26일 공개했는데, 미국 정부 사전 심사를 통과한 “신뢰할 수 있는 파트너"만 우선 사용할 수 있다. 트럼프 행정부의 요청이었다. 상용 AI 모델 사용자를 정부가 직접 골라 받는 게이트키핑은 처음이다. 작년까지 AI 규제는 모델 자체 안전 평가(레드팀, 시스템 카드 공개)에 집중돼 있었지, 누가 쓸 수 있는지를 행정부가 사전에 정하는 단계로 가지 않았다. ...

ChatGPT 좌, Grok 우, Gemini 중앙 — AI 챗봇의 정치 편향을 측정한 두 보고서

AI 챗봇에게 “최저임금을 더 올려야 할까"라고 물으면 어떤 답이 돌아올까. 같은 질문이라도 ChatGPT, Claude, Gemini, Grok, Llama, DeepSeek 여섯 모델은 조금씩 다른 답을 한다. 6월 같은 주에 발표된 워싱턴포스트와 trakkr.ai의 두 보고서가 그 차이를 숫자로 측정했다. 핵심 발견은 두 가지다. 대부분 모델이 좌측으로 기울어 있고, Gemini만 거의 한가운데, Grok이 가장 오른쪽이다. 그리고 흥미롭게도 모델이 스스로 “나는 중립"이라고 말할 때, 실제 측정값은 그 주장과 크게 다르다. 두 보고서가 본 같은 풍경 trakkr.ai는 6월 중순 6개 모델에 정치적 질문 묶음을 던져 4,400개 답변을 모으고, 응답을 “경제 좌-우 축"과 “사회 자유-권위 축” 위에 점으로 찍었다. 핵심 수치(경제 축, −1 완전 좌에서 +1 완전 우 사이로 정규화): ...

OpenAI도 자체 칩으로 — Jalapeño 발표로 완성된 빅4 NVIDIA 탈피

AI 모델을 돌리려면 그래픽 카드(GPU)가 필요하다. 사람의 뇌가 신호를 동시에 수십억 군데 전달해야 하는 일을 컴퓨터로 흉내 내려면 평범한 CPU 한 개로는 한참 모자라고, 작은 계산을 수천 개씩 동시에 처리하는 GPU가 있어야 한다. 그 GPU 시장의 95% 이상을 차지하는 회사가 NVIDIA다. ChatGPT를 한 번 돌릴 때마다 OpenAI는 NVIDIA에 돈을 낸다. 그 구도가 어제(2026-06-24) 한 단계 흔들렸다. OpenAI가 자기 손으로 설계한 첫 칩 **Jalapeño(할라피뇨)**를 발표했다. 제조 파트너는 Broadcom. 학습용이 아니라 추론(inference) 전용 칩이고, 회사 표현으로는 “현존하는 최고 수준 칩 대비 와트당 성능이 훨씬 좋다"고 한다(TechCrunch). 구체적인 숫자는 아직 공개되지 않았고, 칩은 테스트 단계다. ...