Anthropic의 사이버보안 전용 초강력 모델 공개, TPU 확보 경쟁, 중국·메타의 신모델 공세까지 겹치며 AI 경쟁축이 성능에서 보안·인프라·에이전트 실행력으로 이동했다.
- Anthropic이 Claude Mythos Preview와 Project Glasswing을 공개하며 AI-사이버보안 리스크를 방어형 배치로 전환했다.
- Anthropic의 3.5GW급 TPU 계약은 AI 경쟁의 병목이 모델보다 전력·패키징·메모리·클라우드 계약으로 옮겨갔음을 보여준다.
- GLM-5.1, Tencent Hunyuan, Meta Muse Spark가 각각 코딩·로보틱스·소비자 AI에서 새 전선을 열었다.
- 에이전트 운영툴, 마케팅 자동화, 논문 검토 워크플로우 등 응용 계층도 빠르게 제품화되고 있다.
Anthropic이 Claude Mythos Preview 기반 Project Glasswing을 공개하며 'AI가 최상위 보안 연구자급 취약점 탐지·익스플로잇' 시대를 공식화했다.
주요 사건
Anthropic은 미공개 범용 모델 Claude Mythos Preview가 고급 소프트웨어 취약점을 찾고 익스플로잇까지 작성할 수 있다고 밝히며, AWS·Microsoft·Google·NVIDIA 등과 함께 방어 목적 프로그램 Project Glasswing을 시작했다. 핵심은 모델을 대중 공개하기보다 주요 소프트웨어 공급망을 먼저 패치하는 데 쓰겠다는 것이다.
배경
- 2017-06-01Transformer 논문 발표
- 2023-11-01SWE-bench가 코드 문제 해결 벤치마크로 확산
- 2025-03-01프런티어 모델의 보안·코드 리서치 성능이 산업 화두로 부상
- 2026-04-07Anthropic이 Project Glasswing과 Claude Mythos Preview 공개
주요 입장
전망
- · Anthropic 기술문서는 Mythos가 모든 주요 OS와 브라우저에서 제로데이 탐지·익스플로잇 능력을 보였다고 주장한다.
- · 기술 보고서에 따르면 27년 된 OpenBSD 버그와 20-gadget ROP chain 사례까지 다뤄 기존 코드 생성 모델과 질적으로 다른 수준을 시사한다.
한국 영향
- 국내 CSP와 보안벤더의 LLM 기반 취약점 스캐닝 출시 여부
- 국정원·KISA 차원의 AI 사이버안전 가이드라인 개정
- 오픈소스 유지보수 생태계 지원 확대 여부
참고 자료
Anthropic이 Google·Broadcom과 3.5GW급 차세대 TPU 계약을 맺으며 AI 경쟁의 핵심이 모델 성능에서 전력·칩 확보전으로 이동했다.
주요 사건
Anthropic은 2027년부터 다중 기가와트급 차세대 Google TPU 용량을 확보하는 계약을 체결했다고 밝혔다. 같은 발표에서 연간화 매출(run-rate)이 300억달러를 넘었다고 공개했다. 이는 프런티어 모델 사업의 경쟁력이 연구 인력뿐 아니라 장기 전력·패키징·메모리 공급망 계약에 달려 있음을 보여준다.
배경
- 2023-03-01생성형 AI 확산으로 대규모 가속기 부족 심화
- 2025-11-12Anthropic의 대규모 미국 컴퓨트 인프라 투자 계획 공개
- 2026-04-06Anthropic이 Google·Broadcom TPU 계약과 300억달러 run-rate 공개
주요 입장
전망
- · Tom's Hardware와 TechCrunch는 3.5GW 규모를 차세대 TPU 기반으로 해석하며, AI 사업이 사실상 에너지 계약 사업으로 변하고 있다고 봤다.
- · 300억달러 run-rate 공개는 수요 증명이자 더 큰 컴퓨트 선계약을 정당화하는 신호다.
한국 영향
- HBM4/고급 패키징 수율
- 국내 AI 데이터센터 전력 정책
- 한국 기업의 TPU/ASIC 활용 확대 여부
참고 자료
GLM-5.1이 MIT 라이선스로 공개되며 SWE-Bench Pro 58.4점으로 오픈모델 코딩 경쟁을 다시 흔들었다.
주요 사건
큐레이션 계정 @_akhaliq를 통해 확산된 Z.ai의 GLM-5.1은 754B급 오픈웨이트 에이전트 모델로, 코딩·툴사용에 최적화됐고 MIT 라이선스로 공개됐다. 핵심 포인트는 오픈모델이 프런티어 폐쇄형 모델에 근접한 소프트웨어 엔지니어링 성능을 내기 시작했다는 점이다.
배경
- 2023-07-01Llama 기반 오픈모델 생태계 확산
- 2024-11-01SWE-bench 계열이 에이전트 코딩 성능 비교의 핵심 지표화
- 2026-04-08GLM-5.1 공개 및 SWE-Bench Pro 58.4 주장 확산
주요 입장
전망
- · VentureBeat는 GLM-5.1이 SWE-Bench Pro 58.4로 GPT-5.4 57.7, Opus 4.6을 앞섰다고 전했다.
- · 같은 보도에 따르면 장시간 자율 실행과 6,000회 이상 툴 호출 사례가 강조돼 단순 챗봇보다 에이전트 지향성이 강하다.
한국 영향
- 국내 기업의 MIT 라이선스 오픈모델 채택
- 코딩 벤치마크와 실제 업무 성능 간 차이
- 국산 모델의 에이전트 툴체인 경쟁력
참고 자료
Tencent가 2B 파라미터 Hunyuan Embodied AI 모델을 공개하며 로보틱스용 소형 멀티모달 모델 경쟁에 들어갔다.
주요 사건
Tencent의 Hunyuan Embodied AI는 2B급 시각-언어 모델로, 로봇·에이전트가 카메라 입력과 명령을 동시에 이해하는 데 초점을 둔 공개 모델이다. 거대 범용 모델이 아니라 작은 파라미터로 실시간 embodied AI를 겨냥했다는 점이 중요하다.
배경
- 2023-07-28Google RT-2가 vision-language-action 흐름을 대중화
- 2025-01-01온디바이스·로봇용 소형 VLM 경쟁 본격화
- 2026-04-08Tencent Hunyuan Embodied AI 모델 공개
주요 입장
전망
- · 공개된 소개는 2B 파라미터 VLM과 MoE 요소를 강조하며, 대형 범용 모델보다 배포 친화성을 전면에 둔다.
- · Tencent의 기존 Hunyuan 대형 모델 계열과 분리된 embodied 라인 출시는 로보틱스 전용 최적화 흐름을 반영한다.
한국 영향
- 국내 제조 로봇의 VLM 통합 사례
- 온디바이스 NPU/AI 반도체와 결합 가능성
- 실제 로봇 행동 벤치마크 공개 여부
SemiAnalysis는 Nvidia의 200억달러급 Groq IP 라이선스 딜이 'GPU 대체'가 아니라 초저지연 추론 보완 전략이라고 해석했다.
주요 사건
SemiAnalysis는 Nvidia가 Groq의 LPU IP를 라이선스하고 팀을 영입한 구조를 상세히 설명하며, 핵심은 GPU를 버리는 것이 아니라 초저지연 디코드/토큰 생성용 전용 경로를 확보하는 데 있다고 분석했다. 즉 추론 시장이 '한 가지 칩이 모든 것을 처리'하는 단계에서 워크로드 분할 단계로 간다는 뜻이다.
배경
- 2020-01-01Groq 1세대 LPU 공개
- 2025-12-24Nvidia-Groq IP 라이선스 딜 체결 보도
- 2026-04-08SemiAnalysis가 LP30/LP35/LP40 로드맵과 경제성 해설 공개
주요 입장
전망
- · SemiAnalysis 스레드는 LP30이 500MB SRAM, 1.2 PF FP8을 제공한다고 요약했다.
- · EE Times는 Nvidia가 Rubin과 Groq LPX를 조합해 에이전트형 추론 경제성을 높이려 한다고 해설했다.
한국 영향
- 국내 스타트업의 SRAM 중심 추론칩 전략
- 삼성/TSMC 첨단 패키징 수주 흐름
- 에이전트형 워크로드에서 latency premium 형성 여부
참고 자료
OpenAI는 Prism에 'Paper Review' 워크플로우를 넣으며 논문 검토 자체를 에이전트 작업으로 제품화하기 시작했다.
주요 사건
OpenAI는 Prism에 기술·과학 논문 검토용 워크플로우를 추가했다. 이는 단순 요약이 아니라, 논문 선별·평가·의견 정리까지 구조화된 연구 보조 에이전트로 제품을 확장하는 움직임이다.
배경
- 2023-01-01논문 요약용 LLM 도구 대중화
- 2025-01-01연구 워크플로우형 AI 툴 경쟁 본격화
- 2026-04-07OpenAI Prism Paper Review 발표
주요 입장
전망
- · 최근 AI 리서치 도구 시장은 단순 챗보다 문서 작업의 구조화된 단계 자동화로 이동 중이다.
- · 긴 컨텍스트와 툴 사용이 결합되며 '읽고 판단하는 에이전트'가 제품화 가능한 단계에 도달했다.
한국 영향
- 국내 학술·특허 검토 도구 도입
- 기업 내부 지식베이스와의 통합
- 검토 결과 감사 로그 제공 여부
Meta가 Muse Spark를 출시하며 Llama 이후 처음으로 '멀티에이전트 추론형 소비자 AI' 재도전에 나섰다.
주요 사건
Meta는 Muse Spark를 공개하며 Meta Superintelligence Labs의 첫 결과물이라고 소개했다. 여러 에이전트가 병렬로 문제를 푸는 'Contemplating' 모드를 예고했고, 웹과 Meta AI 앱에 탑재했다. 이는 Llama 부진 이후 폐쇄형 고성능 제품으로 선회하려는 신호로 읽힌다.
배경
- 2023-02-01Meta가 Llama 계열로 오픈모델 전략 강화
- 2025-06-10Meta Superintelligence Labs 설립 보도
- 2026-04-08Muse Spark 공개
주요 입장
전망
- · Fortune은 Muse Spark가 Humanity's Last Exam, ARC AGI 2, GPQA Diamond 등 벤치마크 성적을 앞세워 메타의 복귀 신호라고 평가했다.
- · TechCrunch는 병렬 에이전트 기반 Contemplating 모드가 추론 시간을 늘리면서 지연을 낮추려는 설계라고 짚었다.
한국 영향
- Muse Spark의 독립 벤치마크 검증
- Meta의 오픈소스 vs 폐쇄형 전략 변화
- 개인정보 활용 범위 공개 수준
Canva가 Simtheory와 Ortto를 동시에 인수하며 '디자인툴'에서 '에이전트 기반 업무·마케팅 플랫폼'으로 확장하고 있다.
주요 사건
Canva는 AI 협업/에이전트 관리 플랫폼 Simtheory와 고객데이터·마케팅 자동화 플랫폼 Ortto를 동시 인수했다. 이는 생성형 디자인 기능을 넘어 캠페인 계획, 실행, 최적화까지 한 플랫폼에서 묶겠다는 뜻이다.
배경
- 2023-01-01Canva가 생성형 디자인 기능을 본격 통합
- 2025-01-01기업용 마케팅 자동화와 AI 협업 툴 결합 수요 확대
- 2026-04-08Canva가 Simtheory·Ortto 동시 인수 발표
주요 입장
전망
- · TechCrunch는 Ortto가 190개국 11,000개 고객을 확보했다고 전했다.
- · TNW는 이번 거래를 Canva가 AI-first 업무 플랫폼으로 전환하는 신호라고 해석했다.
한국 영향
- Canva Grow의 한국 시장 확장
- 국내 CRM·마케팅툴과의 통합 경쟁
- 에이전트 기반 캠페인 자동화 실제 성과
참고 자료
OpenAI의 AI 경제 정책 제안은 내용보다 'OpenAI를 신뢰할 수 있나'라는 정치 문제를 더 크게 불러냈다.
주요 사건
The Verge는 OpenAI가 발표한 13페이지 분량의 AI 경제 정책 문서를 두고 워싱턴 반응을 전했다. 문서는 공공부 펀드, 기업 AI 대체세 성격의 자본이득 과세, 4일 근무제 같은 제안을 담았지만, 실제 정치권과 비평가들은 제안의 참신성보다 OpenAI와 Sam Altman의 신뢰성을 더 문제 삼고 있다.
배경
- 2023-03-01생성형 AI 규제 논쟁 본격화
- 2025-10-01Anthropic이 경제정책 대응 문서 발표
- 2026-04-06OpenAI가 Industrial Policy for the Intelligence Age 발표
- 2026-04-08The Verge가 워싱턴 반응 보도
주요 입장
전망
- · The Verge는 문서가 공공부 펀드, 더 큰 안전망, 4일 근무제를 제안했다고 정리했다.
- · TechCrunch는 이를 '로봇세와 공공부'를 섞은 형태라고 요약하며 AI 경제질서 설계 논쟁의 시작으로 봤다.
한국 영향
- 한국형 AI 생산성 배당/재교육 정책 논의
- 빅테크 정책 제안의 국내 규제 수용 여부
- 노동계와 스타트업계의 정책 입장차
참고 자료
Video-MME-v2가 공개되며 영상 이해 평가가 단순 QA에서 장시간·종합적 비디오 추론으로 이동하고 있다.
주요 사건
Video-MME-v2 논문이 공유되며, 비디오 이해 벤치마크가 단순한 짧은 클립 질의응답에서 더 긴 맥락과 종합적 추론을 평가하는 방향으로 진화하고 있음을 보여줬다. 이는 멀티모달 모델이 '이미지 잘 보기'를 넘어 '시간축을 따라 이해하기'로 옮겨가는 흐름이다.
배경
- 2023-01-01이미지 중심 멀티모달 벤치마크가 주류
- 2024-01-01Video-MME가 비디오 이해 비교의 대표 지표로 확산
- 2026-04-08Video-MME-v2 논문 공개
주요 입장
전망
- · 비디오 벤치마크는 장면 전환, 시간관계, 음성/텍스트 결합 같은 요소를 제대로 평가해야 한다는 요구가 커져 왔다.
- · 새 벤치마크는 멀티모달 모델의 '긴 컨텍스트' 주장을 검증하는 시험대가 될 가능성이 크다.
한국 영향
- 국내 영상 AI 벤치마크 채택
- 장시간 비디오 처리 비용
- 프라이버시 규제와 영상 AI 상용화 균형
Anthropic의 'Managed Agents' 엔지니어링 글은 장기 실행 에이전트가 이제 연구데모가 아니라 인프라 문제라는 점을 보여준다.
주요 사건
Anthropic은 장시간 실행 에이전트용 hosted service인 Managed Agents를 만들며 '아직 생각되지 않은 프로그램'까지 수용해야 하는 시스템 설계를 다뤘다고 설명했다. 이는 에이전트의 핵심 경쟁이 모델 자체에서 실행환경·복구·관찰성으로 이동 중임을 시사한다.
배경
- 2024-01-01브라우저/코딩 에이전트 데모 급증
- 2025-01-01장기 실행·워크플로 관리가 에이전트 제품화의 병목으로 부상
- 2026-04-08Anthropic Engineering Blog에 Managed Agents 설계 공개
주요 입장
전망
- · Anthropic의 설명처럼 장기 실행 에이전트는 '모델'보다 시스템 설계 문제가 커진다.
- · 에이전트 시장은 점점 클라우드 배치, 모니터링, 실패 복구가 경쟁포인트가 되는 방향이다.
한국 영향
- 국내 에이전트 플랫폼의 observability 지원
- 사내 승인 워크플로와의 연동
- 장기 실행 비용 및 실패율 지표 공개