Anthropic의 보안·컴퓨트 양면 공세와 Nvidia의 소프트웨어/전력 해자 강화가 24시간 기술·AI 뉴스를 지배했다.
- Anthropic은 Mythos로 보안 자동화 수준을 한 단계 끌어올렸고 동시에 3.5GW급 TPU 계약으로 컴퓨트도 선점했다.
- Nvidia 진영은 하드웨어뿐 아니라 NIXL·STX·전력 프로파일 같은 시스템 계층에서 해자를 넓히고 있다.
- 오픈모델 쪽에서는 GLM-5와 Arcee Trinity가 폐쇄형 모델에 대한 대안 압박을 계속 키우고 있다.
Anthropic이 Claude Mythos Preview와 Project Glasswing을 공개하며 AI를 취약점 탐지·익스플로잇 자동화 단계로 끌어올렸다.
주요 사건
Anthropic이 새 프런티어 모델 Claude Mythos Preview를 제한 공개하고, 이를 핵심 오픈소스/인프라 소프트웨어 보안 점검에 투입하는 Project Glasswing을 시작했다. 회사 설명대로면 이 모델은 숙련된 보안 연구자급에 가까운 취약점 탐지·익스플로잇 작성 능력을 보인다.
배경
- 2017-06-01Transformer 논문 발표
- 2024-06-01프런티어 모델들이 코드 에이전트·툴사용 중심으로 진화
- 2026-03-01Anthropic이 Opus 4.6 보안 연구 결과를 공개, 익스플로잇은 제한적이라고 평가
- 2026-04-07Claude Mythos Preview와 Project Glasswing 발표
주요 입장
전망
- · Anthropic 공개 자료 기준 Mythos는 Firefox JS 엔진 실험에서 Opus 4.6의 2회 대비 181회 작동 익스플로잇을 만들었다.
- · OSS-Fuzz 유사 내부 벤치에서 Mythos는 tier 5 완전 제어권 탈취를 10개 패치된 타깃에서 달성했다.
한국 영향
- 국내 중요 오픈소스 프로젝트에 AI 보안 스캐닝 도입 여부
- AI 생성 익스플로잇 관련 법·가이드라인 변화
- 클라우드 보안 기업의 Mythos류 모델 연동
참고 자료
Anthropic이 Google·Broadcom과 3.5GW급 TPU 인프라 계약을 맺으며 컴퓨트 전쟁을 본격화했다.
주요 사건
Anthropic이 2027년부터 가동될 차세대 TPU 용량을 Google Cloud·Broadcom과 장기 확보했다. 보도에 따르면 규모는 3.5GW 수준으로, 매출 급증을 뒷받침할 연산 인프라 선점 성격이 강하다.
배경
- 2023-11-01TPU v5e/v5p 중심의 클라우드 AI 인프라 확대
- 2025-10-01Anthropic이 Google TPU 1GW+ 계약 체결
- 2026-04-06Anthropic이 Google·Broadcom과 다중 기가와트 계약 발표
주요 입장
전망
- · TechCrunch에 따르면 신규 계약은 Broadcom SEC 공시 기준 3.5GW 규모다.
- · Anthropic은 연매출 run-rate가 2025년 말 90억달러에서 300억달러로 급증했고, 연 100만달러 이상 고객이 1,000곳을 넘었다.
한국 영향
- 국내 CSP의 자체 AI칩 전략
- HBM·패키징 수요 변화
- AI 데이터센터 전력정책
참고 자료
OpenAI가 Prism에 논문 리뷰 워크플로를 추가하며 과학 연구 보조를 제품화하기 시작했다.
주요 사건
OpenAI가 과학 협업 도구 Prism에 Paper Review 기능을 넣었다. 기술·과학 논문을 읽고 구조화된 검토를 생성하는 워크플로로, 연구 보조용 에이전트를 제품 수준으로 끌어올리려는 움직임이다.
배경
- 2023-03-01초기 논문 요약형 AI 도구 확산
- 2025-12-16OpenAI가 과학 연구 작업 평가 관련 리서치 공개
- 2026-04-07Prism에 Paper Review 워크플로 추가
주요 입장
전망
- · OpenAI는 Prism을 GPT-5.2 기반의 과학·수학 협업 워크스페이스로 소개했다.
- · 관련 OpenAI 연구는 과학 연구 작업 평가와 실험 자동화 영역을 별도 트랙으로 확장 중이다.
한국 영향
- 국내 학회·저널의 AI 리뷰 사용 정책
- R&D 조직의 보안 환경에서 Prism류 도구 허용 여부
- 과학 논문 검토 자동화의 환각률
참고 자료
Intel이 Musk의 Terafab에 합류하며 미국 내 AI 반도체 수직통합 실험이 한 단계 진전됐다.
주요 사건
Intel이 SpaceX·Tesla·xAI가 추진하는 Texas 기반 Terafab 프로젝트에 참여한다고 밝혔다. 목표는 AI·로봇용 칩 생산 체계를 미국 내에서 대규모 수직통합하는 것이다.
배경
- 2022-08-01미국 CHIPS 법 본격화
- 2025-01-01Intel foundry 전환 전략 가속
- 2026-03-22Musk가 Terafab 구상 공개
- 2026-04-07Intel의 Terafab 합류 발표
주요 입장
전망
- · TechCrunch는 첨단 fab 구축 비용이 통상 200억달러 이상, 수년이 걸린다고 짚었다.
- · Terafab은 연 1TW compute 생산을 목표로 내세우고 있다.
한국 영향
- Terafab의 실제 공정 노드/패키징 범위
- Intel foundry 수율과 고객 확보
- 미국 보조금 정책 변화
참고 자료
SemiAnalysis가 AWS Trainium·Cerebras 조합에도 Nvidia NIXL이 들어간다고 지적하며 소프트웨어 해자를 부각했다.
주요 사건
SemiAnalysis는 AWS가 Trainium 프리필과 Cerebras 디코드를 잇는 KV-cache 전송에 Nvidia의 NIXL을 쓴다고 지적했다. 즉 비(非)Nvidia 칩 조합에서도 Nvidia 소프트웨어가 핵심 연결층이 된다는 의미다.
배경
- 2024-01-01disaggregated inference 아키텍처 확산
- 2026-03-19AWS가 NIXL with EFA 지원 발표
- 2026-04-07SemiAnalysis가 Trainium+Cerebras 사례에서 NIXL 채택 강조
주요 입장
전망
- · AWS는 NIXL with EFA가 KV-cache throughput 향상, inter-token latency 감소, 메모리 활용 최적화를 제공한다고 밝혔다.
- · 지원 조건은 NIXL 1.0.0+, EFA installer 1.47.0+이며 모든 EFA 지원 EC2에서 동작한다.
한국 영향
- 국내 CSP의 KV-cache 전송 최적화 기술
- 국산 AI칩의 vLLM/SGLang 호환성
- Nvidia 소프트웨어 개방성
참고 자료
SemiAnalysis는 Nvidia STX가 장문맥·에이전트 시대의 병목을 푸는 새 AI 스토리지 레이어라고 평가했다.
주요 사건
SemiAnalysis가 GTC 2026 이후 분석에서 Nvidia STX를 단순 스토리지가 아니라 agentic AI와 long-context 추론을 위한 참조 아키텍처로 해석했다. 핵심은 GPU 메모리 밖 데이터 계층을 AI 서빙 경로에 직접 붙이는 것이다.
배경
- 2023-05-01RAG와 벡터DB 확산
- 2025-01-01장문맥·에이전트 워크플로 대중화
- 2026-03-17GTC 2026에서 Nvidia STX 공개
- 2026-04-07SemiAnalysis가 STX의 전략적 의미 분석
주요 입장
전망
- · SemiAnalysis는 STX를 long-context inference와 agentic AI를 위한 핵심 인프라로 해석했다.
- · Forbes는 Nvidia-Certified Storage와 AI Data Platform이 2025~2026년 AI 스토리지 성능 기준이 됐다고 평가했다.
한국 영향
- HBM 외 CXL·SSD 계층 활용도
- 국내 서버 OEM의 Nvidia 스토리지 인증 참여
- 장문맥 추론 원가 변화
참고 자료
SemiAnalysis는 Nvidia Rubin의 2300W Max-P/1800W Max-Q 구성이 성능보다 전력·냉각 설계 경쟁을 앞세운다고 분석했다.
주요 사건
SemiAnalysis가 Rubin GPU의 Max-P(2300W)와 Max-Q(1800W) 두 전력 프로파일을 조명했다. 같은 아키텍처라도 데이터센터가 전력/냉각 제약에 맞춰 성능-효율 곡선을 선택하게 된다는 뜻이다.
배경
- 2024-03-01Blackwell 발표로 랙 전력 경쟁 본격화
- 2026-02-25CNBC가 Vera Rubin 시스템 효율성 선공개
- 2026-04-07SemiAnalysis가 Rubin 전력 프로파일을 재조명
주요 입장
전망
- · Rubin은 2300W(Max-P)와 1800W(Max-Q) 두 전력 엔벌로프를 제공하는 것으로 전해졌다.
- · CNBC는 Vera Rubin이 전작 대비 최대 10배 성능/W 개선을 주장했다고 보도했다.
한국 영향
- 국내 AI DC의 액체냉각 도입 속도
- 고밀도 전력반도체·배전 장비 수요
- Rubin 실제 성능/W 검증
참고 자료
GLM-5가 744B 오픈웨이트 모델로 코딩·에이전트 벤치마크 상위권을 기록하며 중국 오픈모델 압박을 이어갔다.
주요 사건
오픈모델 큐레이터 계정들 사이에서 GLM-5가 다시 부각됐다. Z.ai의 GLM-5는 744B 파라미터(활성 40B) 규모의 MoE 오픈웨이트 모델로, 코딩·에이전트 작업에서 프런티어 클로즈드 모델에 근접한 성능을 내세운다.
배경
- 2024-01-01오픈웨이트 LLM 대중화
- 2026-02-11Z.ai가 GLM-5 공개
- 2026-04-07AI 커뮤니티에서 GLM-5 벤치마크 재부각
주요 입장
전망
- · GLM-5는 744B 파라미터, 활성 40B, 28.5T 토큰 학습으로 소개됐다.
- · 공개 벤치에서 SWE-bench Verified 77.8, CyberGym 43.2, BrowseComp(with context manage) 75.9를 기록했다.
한국 영향
- 국내 기업의 중국계 오픈모델 도입 규정
- Ascend 기반 생태계 확장
- 오픈모델 라이선스·보안 검토 체계
Arcee의 Trinity Large Thinking이 미국산 희귀 오픈 추론모델로 주목받으며 오픈모델 공백을 노렸다.
주요 사건
26명 규모의 미국 스타트업 Arcee가 400B급 오픈 추론모델 Trinity Large Thinking을 내세우며 서구권 기업용 대안 모델 포지션을 강화했다.
배경
- 2024-01-01오픈모델 커스터마이징 시장 성장
- 2026-01-28Arcee가 대형 오픈 모델 Trinity 공개
- 2026-04-07Trinity Large Thinking 주목 기사 확산
주요 입장
전망
- · TechCrunch에 따르면 Arcee는 400B 모델을 2,000만달러 예산으로 구축했다고 주장한다.
- · VentureBeat는 Trinity-Large-Thinking이 399B 파라미터, 출력 토큰당 약 0.90달러/백만으로 일부 최고 폐쇄형 모델 대비 96% 저렴하다고 전했다.
한국 영향
- Arcee 실제 벤치마크 재현성
- 국내 파인튜닝/호스팅 지원 여부
- 오픈모델 상용 라이선스 경쟁