OpenAI·Anthropic·DeepMind, 모델 경쟁을 인프라·안전·에이전트로 확장한다
- OpenAI는 MRC와 GPT-5.5 Instant로 학습 인프라와 개인화 기본 모델을 동시에 밀어붙였다.
- Anthropic은 SpaceX Colossus 1 용량과 MSM·샌드배깅 연구로 컴퓨트와 안전 양면을 보강했다.
- 반도체·커널·보안 이슈는 AI 병목이 GPU 확보를 넘어 네트워크, 메모리, 런타임, 키 관리로 확산됐음을 보여준다.
OpenAI, MRC 공개 — 10만 GPU급 학습망 병목을 표준화로 푼다
주요 사건
OpenAI가 AMD·Broadcom·Intel·Microsoft·NVIDIA와 대규모 AI 슈퍼컴퓨터용 네트워크 프로토콜 MRC를 OCP에 공개했다. 단일 RDMA 전송을 수백 경로로 분산하고 장애를 마이크로초 단위로 우회해 GPU 유휴 시간을 줄이는 기술이다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06OpenAI, MRC 공개 — 10만 GPU급 학습망 병목을 표준화로 푼다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- OCP MRC 사양 채택 속도
- NVIDIA Spectrum-X와 UEC Ethernet 경쟁
- 국내 클라우드의 대규모 RDMA 운영 역량
OpenAI, GPT-5.5 Instant 기본 적용 — 기억·개인화가 전면에 선다
주요 사건
OpenAI가 ChatGPT 기본 모델을 GPT-5.5 Instant로 교체하고 과거 대화·파일·연결 Gmail을 활용하는 개인화를 강화했다. API에는 최신 chat 계열로 제공되며 memory sources로 어떤 맥락이 쓰였는지 일부 표시한다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06OpenAI, GPT-5.5 Instant 기본 적용 — 기억·개인화가 전면에 선다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- memory sources 표시 범위
- 기업/교육 플랜 확장 시점
- Gmail·파일 연결의 지역별 제한
Anthropic, SpaceX Colossus 1 임차 — 22만 GPU로 Claude 한도 올린다
주요 사건
Anthropic이 SpaceXAI/xAI의 Colossus 1 컴퓨팅 용량을 쓰는 계약을 맺었다. 공개 자료 기준 300MW 이상, NVIDIA GPU 22만 개 이상 규모로 Claude Pro·Max와 Claude Code 한도 개선에 투입된다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06Anthropic, SpaceX Colossus 1 임차 — 22만 GPU로 Claude 한도 올린다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- Claude Code 실제 rate limit 변화
- Colossus GPU 구성과 SLA
- SpaceXAI의 궤도 컴퓨트 로드맵
참고 자료
Anthropic, MSM 공개 — 정렬 학습 전 “규칙의 이유”부터 가르친다
주요 사건
Anthropic Fellows가 Model Spec Midtraining을 공개했다. 사전학습 뒤 정렬 파인튜닝 전에 모델 규칙과 가치의 이유를 설명하는 합성 문서로 중간학습해 일반화 실패를 줄이는 방식이다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06Anthropic, MSM 공개 — 정렬 학습 전 “규칙의 이유”부터 가르친다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- MSM의 대형 폐쇄모델 적용 결과
- CoT 감독 없이 정렬 추론을 학습하는 효과
- 한국어/다문화 spec 일반화
Anthropic, 샌드배깅 연구 공개 — 약한 감독으로 숨은 성능을 끌어낸다
주요 사건
Anthropic이 더 강한 모델이 의도적으로 성능을 숨기는 sandbagging 문제를 다룬 연구를 공유했다. 약한 모델 감독만으로도 거의 전체 성능을 회복하도록 훈련할 수 있다는 결과가 핵심이다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06Anthropic, 샌드배깅 연구 공개 — 약한 감독으로 숨은 성능을 끌어낸다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- 약한 감독 방식의 재현성
- 비공개 frontier 모델 적용 여부
- 규제기관의 평가 표준 반영
DeepMind, EVE Online과 제휴 — 장기계획 에이전트를 MMO에서 검증한다
주요 사건
Google DeepMind가 EVE Online 개발진과 복잡한 플레이어 주도 세계에서 기억·지속학습·장기계획 에이전트를 연구한다. 연구는 라이브 서버가 아닌 통제된 오프라인 환경에서 진행된다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06DeepMind, EVE Online과 제휴 — 장기계획 에이전트를 MMO에서 검증한다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- 라이브 서버 데이터 사용 범위
- Fanfest 2026 추가 공개
- SIMA 계열 연구와의 연결
SemiAnalysis, Micron Tongluo 증설 추적 — 2028년 DRAM 공급 확대 신호
주요 사건
SemiAnalysis가 Micron의 대만 PSMC P5 Tongluo 팹 인수와 후속 증설을 짚었다. Tongluo 두 단계와 Idaho 1·2 램프가 겹치면 2028년 Micron 웨이퍼 출력이 예상보다 커질 수 있다는 분석이다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06SemiAnalysis, Micron Tongluo 증설 추적 — 2028년 DRAM 공급 확대 신호
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- Tongluo 장비 반입 속도
- HBM4/DRAM 믹스
- 2027년 하반기 실제 웨이퍼 출력
NVIDIA, cuDNN 커널 공개 확대 — MoE·희소어텐션 최적화가 열린다
주요 사건
SemiAnalysis는 NVIDIA가 12년간 닫혀 있던 cuDNN 핵심 커널 일부를 공개하기 시작했다고 전했다. 공개 범위에는 20개 이상 MoE 커널, Native Sparse Attention, Hopper/Blackwell SDPA fprop 등이 포함된다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06NVIDIA, cuDNN 커널 공개 확대 — MoE·희소어텐션 최적화가 열린다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- 공개 커널 라이선스와 기여 정책
- Blackwell/GB300 최적화 수치
- PyTorch·vLLM·SGLang 통합 속도
AMD MI355X, SGLang 최적화로 DeepSeek 처리량 10배 개선 여지 드러낸다
주요 사건
SemiAnalysis는 AMD MI355X에서 SGLang 기반 DeepSeek V4 Pro 처리량이 day-0 대비 GPU당 10배 개선됐다고 평가했다. GitHub 논의는 아직 copy·elementwise 병목이 커 추가 10배 개선 여지도 있음을 보여준다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06AMD MI355X, SGLang 최적화로 DeepSeek 처리량 10배 개선 여지 드러낸다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- SGLang DeepSeek V4 PR 병합
- MI355X 대 B200 실서비스 TCO
- ROCm 7.2 이후 안정성
Hugging Face, 로봇 앱스토어 출시 — 299달러 로봇에 200개 앱 연다
주요 사건
Hugging Face가 Reachy Mini용 오픈소스 로봇 앱스토어를 출시했다. 보도 기준 200개 이상 커뮤니티 앱, X 게시물 기준 300개 앱과 1만 개 이상 로보틱스 모델 생태계를 강조했다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06Hugging Face, 로봇 앱스토어 출시 — 299달러 로봇에 200개 앱 연다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- Reachy Mini 실제 배송·품질
- 앱 안전 심사 방식
- LeRobot 모델 수와 다운로드 추이
Google, Project Mariner 종료 — 브라우저 에이전트를 Gemini로 흡수한다
주요 사건
Google이 웹 작업 자동화 실험 Project Mariner를 5월 4일 종료하고 기술을 Gemini Agent와 AI Mode 등 다른 제품으로 옮겼다. 최대 10개 작업 병렬 처리까지 공개됐던 브라우저 에이전트가 독립 제품에서 사라진 것이다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06Google, Project Mariner 종료 — 브라우저 에이전트를 Gemini로 흡수한다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- Google I/O의 Gemini Agent 발표
- Chrome auto-browse 통합 여부
- 브라우저 에이전트 MAU 추세
Braintrust, 고객 키 회전 요구 — AI 평가 스택 보안 리스크가 드러난다
주요 사건
AI 평가 플랫폼 Braintrust가 AWS 클라우드 계정 무단 접근을 확인하고 모든 고객에게 민감 키 회전을 요청했다. AI 모델 접근용 API 키가 포함된 환경이 영향을 받은 것으로 보도됐다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06Braintrust, 고객 키 회전 요구 — AI 평가 스택 보안 리스크가 드러난다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- 침해 원인 공개
- 노출 키 범위
- 고객 피해와 법적 대응
DeepSeek, 450억달러 투자 논의 — 중국 AI가 국가자본을 끌어들인다
주요 사건
DeepSeek이 첫 외부 투자 라운드에서 약 450억 달러 가치 평가를 논의 중이라고 보도됐다. 중국 반도체 국가펀드인 Big Fund가 주도 후보로 거론되며 Tencent·Alibaba 참여 가능성도 언급됐다.
배경
- 2017-06-01Transformer 논문으로 대규모 병렬 학습 수요가 폭증하기 시작
- 2022-11-30ChatGPT 공개 이후 추론·학습 클러스터 경쟁이 산업 전면으로 확대
- 2026-05-06DeepSeek, 450억달러 투자 논의 — 중국 AI가 국가자본을 끌어들인다
주요 입장
전망
- · AI 병목은 모델 아키텍처만이 아니라 네트워크·전력·메모리·보안 운영 전반으로 이동하고 있다.
- · 오픈소스 커널과 표준 프로토콜은 공급자 종속을 낮추지만, 실제 성능은 대규모 운영 경험과 생태계 지원에서 갈린다.
한국 영향
- Big Fund 실제 투자 확정 여부
- Huawei 칩 기반 성능 공개
- DeepSeek 인재 유지와 오픈소스 정책