오픈AI·앤트로픽·구글이 각각 사이버보안, 정렬 연구, 로보틱스에서 새 진전을 내놨고, 인프라 쪽에선 Anthropic-Fluidstack 축이 데이터센터 투자 과열을 다시 끌어올렸다.
- OpenAI는 GPT-5.4-Cyber 접근을 확대하며 방어형 보안 AI 시장을 공식화했다.
- Anthropic은 Claude Opus 4.6 기반 Automated Alignment Researchers가 PGR 0.97을 기록했다고 발표했다.
- Google DeepMind는 Gemini Robotics-ER 1.6으로 공간 추론·안전 제약 준수 성능 개선을 제시했다.
- 연구 커뮤니티에선 OmniShow, Matrix-Game 3.0, Attention Sink survey 등 멀티모달/월드모델/Transformer 해석 관련 논문이 집중됐다.
- 인프라 쪽에서는 Fluidstack의 180억달러 밸류 협상 보도가 AI 데이터센터 경쟁의 과열 신호로 읽힌다.
OpenAI가 방어형 보안 전용 모델 GPT-5.4-Cyber 접근 확대를 알리며 고위험 사이버 작업을 신원기반 프로그램으로 계속 제한했다.
주요 사건
OpenAI는 GPT-5.4-Cyber를 'trusted defenders' 대상에 제공한다고 공지했다. 일반 공개 모델이 아니라 보안팀·방어조직을 위한 제한형 배포이며, 고위험 듀얼유스 기능은 Trusted Access for Cyber(TAC) 아래에서만 허용된다는 점을 다시 강조했다.
배경
- 2023-03-14GPT-4 공개로 일반 코딩/보안 보조 활용 급증
- 2025-01-01OpenAI가 GPT-5.3 Codex 세대에서 TAC 운영 고도화
- 2026-04-14OpenAI가 GPT-5.4-Cyber trusted defenders 확대 공지
주요 입장
전망
- · OpenAI system card상 내부 Cyber Range 최고점이 8.33%에 그쳐 아직 전면 자동공격 단계는 아니지만, 보조도구로는 이미 실전 가치가 있다.
- · 제한형 배포는 곧 규제기관이 요구할 최소 거버넌스 기준이 될 가능성이 높다.
한국 영향
- 국내 금융·공공망에서 허용 가능한 보안 AI 운영 기준
- 한국어 로그/악성코드 분석 벤치마크 확보
- 국내 보안벤더의 TAC 유사 파트너십 여부
Anthropic은 Claude Opus 4.6 기반 Automated Alignment Researchers가 약 800시간의 병렬 연구 끝에 weak-to-strong supervision 성능격차의 97%를 회복했다고 발표했다.
주요 사건
Anthropic Fellows 연구는 9개의 Claude Opus 4.6 에이전트에게 실험 설계·코드 작성·결과 해석을 맡겨 alignment research를 자동화했다. 이 시스템은 weak teacher와 stronger base model 사이의 generalization gap을 측정하는 PGR(performance gap recovered)에서 인간 연구자 0.23 대비 0.97까지 끌어올렸다고 주장한다.
배경
- 2024-01-01scalable oversight와 weak-to-strong supervision 논의 본격화
- 2026-02-05Claude Opus 4.6 출시, 장기 에이전트 벤치마크 강화
- 2026-04-14Anthropic이 Automated Alignment Researchers 결과 공개
주요 입장
전망
- · PGR 0.97은 매우 인상적이지만 'crisp and verifiable'한 과제에서 나왔다는 점이 핵심 조건이다.
- · 토큰/학습 비용 1.8만달러 수준은 frontier lab 내부 자동화 실험을 상시화하기에 충분히 낮아졌다.
한국 영향
- 국내 공개모델 대상으로 weak-to-strong supervision 재현 여부
- 정렬 자동화에 필요한 compute·인재 확보
- 외부 감사 가능한 안전평가 체계 구축
Google DeepMind는 Gemini Robotics-ER 1.6을 공개하며 공간 추론, 성공 판정, 물리 안전 제약 준수에서 이전 버전 대비 개선을 내세웠다.
주요 사건
DeepMind는 Gemini Robotics-ER 1.6을 발표했다. 이 모델은 로봇 자체를 직접 움직이는 VLA라기보다 로봇의 상위 브레인 역할을 하며, 물체를 안전하게 집고, 여러 카메라 시점에서 성공 여부를 판단하고, 도구 사용 계획을 세우는 embodied reasoning 쪽 성능을 강화했다.
배경
- 2023-07-28RT-2 등 VLA 계열이 언어-행동 통합 가능성 제시
- 2025-03-12DeepMind가 Gemini Robotics / Robotics-ER 첫 버전 공개
- 2026-04-14Gemini Robotics-ER 1.6 공개
주요 입장
전망
- · DeepMind가 강조한 개선 포인트는 flashy demo보다 공장 배치에 중요한 성공 판정·안전 지시 준수다.
- · 2025년 공개 자료 기준 end-to-end 세팅에서 Gemini Robotics-ER는 Gemini 2.0 대비 2~3배 성공률 개선을 보였다.
한국 영향
- 국내 공장 데이터로 spatial reasoning 모델 튜닝 가능성
- 안전 인증 체계와 로봇 책임 규정
- 국산 로봇 플랫폼과 글로벌 foundation model 결합 여부
Hugging Face는 허브에서 GPU 커널을 바로 불러오는 'Kernels on the Hub'를 밀며 모델 허브를 실행 최적화 레이어까지 확장하고 있다.
주요 사건
AK 계정이 Clement Delangue의 Hugging Face Hub 커널 기능을 리트윗했다. 핵심은 모델·데이터셋 저장소였던 Hugging Face Hub가 CUDA/compute kernels 배포 채널로도 진화하고 있다는 점이다. 개발자는 torch>=2.5 환경에서 Hub에서 최적화 커널을 받아 바로 로드할 수 있다.
배경
- 2023-01-01FlashAttention·vLLM 등 커스텀 추론 최적화 경쟁 본격화
- 2024-11-29huggingface/kernels 공개 저장소 가시화
- 2026-04-14Hugging Face Kernels on the Hub가 다시 주목받음
주요 입장
전망
- · Hugging Face kernels는 torch>=2.5와 CUDA 기반에서 Hub에서 직접 커널을 내려받아 로드하는 모델을 채택했다.
- · 플랫폼 전쟁은 이제 모델 파일보다 실행 아티팩트 표준으로 확장되고 있다.
한국 영향
- 국산 NPU/가속기와의 호환성
- 기업용 사설 허브 배포 수요
- 추론비 절감 효과의 실제 숫자
OmniShow 논문은 사람-사물 상호작용 비디오 생성에서 텍스트·참조이미지·오디오·포즈를 함께 다루는 통합 프레임워크와 전용 벤치마크를 제시했다.
주요 사건
AK가 OmniShow 논문을 소개했다. 이 연구는 사람-사물 상호작용(HOI) 비디오 생성에서 서로 다른 조건들(텍스트, 포즈, 오디오, 참조 이미지)을 한 모델에서 통합하려는 시도다. 동시에 HOIVG-Bench라는 전용 평가셋도 제안했다.
배경
- 2024-02-15비디오 생성 벤치마크 경쟁 본격화
- 2026-03-10DISPLAY 등 HOI 비디오 생성 연구 등장
- 2026-04-13OmniShow 논문 arXiv 제출
주요 입장
전망
- · 논문은 비교 평가를 5초 720p portrait 클립으로 통일해 baseline과 공정하게 비교했다고 밝혔다.
- · 멀티모달 조건 통합과 전용 벤치마크 제안이 핵심 공헌이다.
한국 영향
- 한국어 커머스 데이터셋 적용성
- 초상권·광고 표시 규제
- 로컬 GPU로 구동 가능한 경량화 버전 여부
Attention Sink survey는 Transformer의 비정상적 attention 집중 현상을 180편 이상 연구를 묶어 정리하며 해석·완화 연구를 하나의 축으로 세웠다.
주요 사건
AK가 Attention Sink in Transformers survey를 소개했다. 이 논문은 Transformer가 의미 없는 특정 토큰에 attention mass를 과도하게 쏟는 현상을 체계적으로 정리한 첫 대형 survey다.
배경
- 2023-01-01LLM 장문 추론에서 attention sink 문제 본격 논의
- 2025-01-01KV cache·sigmoid attention 등 완화 기법 확산
- 2026-04-11Attention Sink survey arXiv 제출
주요 입장
전망
- · 이 survey는 180편 이상의 연구를 taxonomy로 묶어 attention sink 연구의 지도 역할을 한다.
- · hallucination, long-context degradation, quantization 안정성과 연동된다는 점이 실용적 포인트다.
한국 영향
- 국문 장문 벤치마크에서의 sink 분석
- NPU 대상 경량 attention 변형 적용성
- hallucination 감소 효과 검증
Matrix-Game 3.0은 5B 모델로 720p에서 최대 40 FPS 실시간 생성과 분 단위 장기 일관성을 동시에 겨냥한 월드모델 연구다.
주요 사건
AK가 Matrix-Game 3.0을 소개했다. 이 논문은 월드모델/인터랙티브 비디오 생성의 병목인 '장기 메모리'와 '실시간성'을 동시에 다루려는 시도다. 저자들은 5B 버전이 720p 최대 40FPS, 더 큰 2x14B 버전은 품질 향상에 초점을 맞췄다고 설명한다.
배경
- 2025-08-12Matrix-Game 2.0 공개
- 2026-03-27프로젝트가 Matrix-Game 3.0 릴리스 공지
- 2026-04-10Matrix-Game 3.0 논문 arXiv 제출
주요 입장
전망
- · 논문은 5B 모델에서 720p 최대 40 FPS를 제시했고, minute-long consistency를 주요 성과로 내세웠다.
- · 이 계열은 Sora류의 영화형 생성과 다른 방향, 즉 실시간 시뮬레이션형 AI로 해석하는 편이 맞다.
한국 영향
- Unreal/게임엔진 연동 수준
- 경량 추론으로 로컬 실시간 실행 가능 여부
- 게임 제작 파이프라인 적용성
Fluidstack가 180억달러 밸류로 10억달러 조달 협상 중이라는 보도는 Anthropic발 AI 데이터센터 수요가 아직 과열 국면임을 보여준다.
주요 사건
TechCrunch는 AI 데이터센터 스타트업 Fluidstack가 180억달러 밸류로 10억달러 규모 신규 라운드를 논의 중이라고 전했다. 불과 몇 달 전 75억달러 수준으로 거론됐던 회사가 두 배 이상 뛴 셈이다. 배경에는 Anthropic의 500억달러 규모 데이터센터 계약이 있다.
배경
- 2024-01-01neocloud 개념이 GPU 공급난 속에서 부상
- 2025-11-12Anthropic이 Fluidstack와 500억달러 데이터센터 계약 체결
- 2026-04-14Fluidstack의 180억달러 밸류 신규 조달 협상 보도
주요 입장
전망
- · TechCrunch 보도에 따르면 신규 라운드가 성사되면 Fluidstack 밸류는 수개월 만에 75억달러에서 180억달러로 뛴다.
- · Anthropic의 500억달러 계약은 독립 AI랩이 hyperscaler 의존을 줄이려는 흐름을 상징한다.
한국 영향
- 국내 GPU 호스팅 사업자의 확장 속도
- 전력망 증설과 요금 체계
- 국내 AI랩의 장기 인프라 계약 가능성
참고 자료
Google은 Chrome에 반복 가능한 Gemini 프롬프트를 저장하는 'Skills'를 넣으며 브라우저를 AI 워크플로 런처로 바꾸고 있다.
주요 사건
Google은 Gemini in Chrome에 Skills 기능을 추가했다. 사용자는 자주 쓰는 프롬프트를 저장해 여러 웹페이지에서 반복 실행할 수 있고, Google은 미리 만들어진 Skills 라이브러리도 함께 제공한다.
배경
- 2025-01-01브라우저형 AI 경쟁 본격화
- 2026-03-17Gemini Personal Intelligence 등 개인화 기능 확대
- 2026-04-14Chrome Skills 공개
주요 입장
전망
- · Google 설명상 Skills는 Gemini 채팅 기록에서 저장하고, / 명령이나 + 버튼으로 재실행할 수 있다.
- · 브라우저 경쟁의 핵심이 검색창이 아니라 workflow memory로 이동하고 있다.
한국 영향
- 한국어 지원 시점
- 국내 웹서비스와의 액션 호환성
- 개인정보 처리·브라우저 권한 이슈
참고 자료
GitHub MCP Server 릴리스 흐름은 MCP Apps 지원을 빠르게 넓히며 텍스트 도구 호출에서 대화형 UI 도구 생태계로 이동하고 있음을 보여준다.
주요 사건
swyx가 GitHub MCP Server와 MCP Apps 흐름을 언급했다. 같은 날 GitHub MCP Server 0.33.0 릴리스에는 MCP Apps 관련 피드백 링크와 UI 개선 내용이 포함돼 있었다. 핵심은 MCP가 단순 툴 스키마를 넘어 rich interactive UI를 채팅 안에 렌더링하는 방향으로 진화한다는 점이다.
배경
- 2024-11-01MCP 생태계가 개발자 도구 표준 후보로 부상
- 2026-02-19GitHub가 MCP Apps support in Insiders Mode 발표
- 2026-04-14GitHub MCP Server 0.33.0 릴리스에 MCP Apps 관련 개선 반영
주요 입장
전망
- · GitHub MCP Server 0.33.0 릴리스 노트에는 'Add feedback link to MCP Apps' 등 MCP Apps 관련 항목이 포함됐다.
- · 채팅이 곧 앱 런타임이 되는 흐름이 점점 선명해지고 있다.
한국 영향
- 국내 IDE/협업툴의 MCP 채택
- 보안·권한 모델 설계
- 한국어 개발 생태계용 MCP 앱 등장 여부
Anthropic 공동창업자가 Mythos를 미국 행정부에 브리핑했다고 확인한 건 보안형 AI가 규제·국가안보 의제와 직접 결합되고 있음을 보여준다.
주요 사건
TechCrunch는 Anthropic 공동창업자 Jack Clark가 Semafor 행사에서 Mythos를 미국 행정부에 브리핑했다고 확인했다고 전했다. Mythos는 Anthropic의 보안/국가안보용 모델 라인으로 알려져 있다.
배경
- 2024-01-01미국 정부의 AI 안전/국가안보 대화 본격화
- 2025-01-01제한형 보안 모델 프로그램이 주요 랩에서 정착
- 2026-04-14Anthropic이 Mythos 브리핑 사실 확인
주요 입장
전망
- · Mythos 사례는 '안전형 보안 AI'가 더 이상 실험이 아니라 정책 채널에 올라간 제품임을 보여준다.
- · 규제와 계약이 동시에 얽히는 분야라 기술력만으로는 승부가 안 난다.
한국 영향
- 공공부문 생성형 AI 보안 등급 체계
- 국가안보용 모델의 국내 법적 근거
- 민관 협력 시 투명성 확보 장치