OpenAI 슈퍼앱 통합 발표·GPT-5.4 mini/nano 출시, Nvidia Nemotron-Cascade 2 오픈소스, AMD MI355X가 Blackwell 추격, Meta MTIA 커스텀칩 4세대 로드맵, Anthropic 8만명 대규모 AI 설문 공개
- OpenAI, ChatGPT·Codex·브라우저를 하나의 데스크톱 '슈퍼앱'으로 통합 계획 발표 — Anthropic 경쟁 대응
- GPT-5.4 mini ($0.75/1M입력) & nano ($0.20/1M입력) 출시 — GPT-5 mini 대비 2배 빠르고 코딩·에이전트 성능 대폭 향상
- Nvidia, Nemotron-Cascade 2 (30B MoE/3B active) 오픈소스 공개 — IMO 2025·IOI 2025 금메달 수준 추론 성능
- AMD MI355X, FP8 기준 Nvidia Blackwell과 동등/우위 추론 성능 달성 — SGLang 최적화 급속 진행
- Meta, MTIA 300~500 커스텀 AI칩 4세대 2년내 배포 로드맵 공개 — Nvidia 의존도 축소
- Anthropic, 81,000명 대상 역대 최대 정성적 AI 설문 결과 공개
- Meta V-JEPA 2.1 — 자기지도학습 비디오 모델로 로봇 파지 성공률 20%p 향상
- 한국 메모리 대중국 수출 급증 — HBM 고부가 메모리 중심 ASP 상승
- Karpathy, 첫 DGX Station GB300 (Dell Pro Max) 수령 — 개인 연구자급 슈퍼컴퓨팅 시대
- GLM-5.1 오픈소스 예고 — 중국 Zhipu AI의 프론티어 모델 개방 가속
- Google AlphaProof 논문 Nature 게재 — AI 수학 증명 정식 학술 인정
- Cursor의 새 모델이 Kimi(Moonshot AI) 기반으로 확인 — 오픈소스 모델의 상용 코딩 도구 침투
OpenAI, ChatGPT·Codex·브라우저를 단일 데스크톱 '슈퍼앱'으로 통합 계획
주요 사건
WSJ 보도에 따르면 OpenAI가 ChatGPT, Codex 코딩 플랫폼, 브라우저를 하나의 데스크톱 '슈퍼앱'으로 통합할 계획이다. 앱 총괄 Fidji Simo는 내부 메모에서 '너무 많은 앱과 스택에 노력이 분산되어 있었다'고 밝혔고, 사장 Greg Brockman이 제품 개편을 임시 총괄한다.
배경
- 2022-11-30ChatGPT 출시
- 2025-05-01Codex 독립 코딩 플랫폼 출시
- 2026-03-19WSJ 슈퍼앱 통합 계획 보도
주요 입장
전망
- · swyx: OpenAI가 Anthropic 위협에 대응해 집중 전략으로 전환
- · WSJ: 엔터프라이즈 경쟁에서 제품 분산이 약점으로 작용
한국 영향
- 슈퍼앱 출시 시기
- 한국어 지원 수준
OpenAI GPT-5.4 mini·nano 출시 — 코딩 성능 유지하며 가격 1/3~1/12로 인하
주요 사건
OpenAI가 GPT-5.4 mini와 nano를 출시했다. Mini는 GPT-5 mini 대비 2배 이상 빠르며, SWE-Bench Pro 54.4%(vs GPT-5 mini 45.7%), OSWorld-Verified 72.1%(vs 42.0%)를 기록. 가격은 mini $0.75/$4.50, nano $0.20/$1.25 per 1M tokens.
배경
- 2026-03-07GPT-5.4 출시
- 2026-03-16GPT-5.4 API 일주일 만에 일 5T 토큰, 연 $1B 신규매출
- 2026-03-17GPT-5.4 mini & nano 출시
주요 입장
전망
- · Sam Altman: GPT-5.4는 가장 좋아하는 대화 모델이며 5.3→5.4 업그레이드에서 인간성이 크게 향상
- · gdb: 출시 일주일 만에 연 $1B 신규매출 런레이트
한국 영향
- 한국 리전 지연시간
- GPT-5.4 mini 한국어 벤치마크
Nvidia, Nemotron-Cascade 2 오픈소스 공개 — 3B 활성 파라미터로 IMO·IOI 금메달급 추론
주요 사건
Nvidia가 Nemotron-Cascade 2를 Hugging Face에 공개했다. 30B MoE 모델에 3B 활성 파라미터만 사용하면서 IMO 2025 금메달(35점), IOI 2025 금메달(439.3점), AIME 2025 92.4%를 달성. Cascade RL과 다중 도메인 온-폴리시 증류가 핵심 기법.
배경
- 2026-03-11Nemotron-3-Super-120B 출시
- 2026-03-16GTC 2026 키노트
- 2026-03-20Nemotron-Cascade 2 HuggingFace 공개
주요 입장
전망
- · AK(HuggingFace): GTC 직후 빠른 오픈소스 공개
- · 벤치마크에서 Qwen3.5-35B-A3B 대비 수학·코딩 모두 우위
한국 영향
- 한국어 성능
- MTIA 등 경쟁 하드웨어와의 호환성
AMD MI355X, FP8 추론에서 Nvidia Blackwell과 동등/우위 — SGLang 최적화로 성능 급상승
주요 사건
SemiAnalysis InferenceX 벤치마크에서 AMD MI355X가 SGLang 기반 FP8 추론에서 Nvidia GB300 NVL72와 동등하거나 우위의 비용 대비 성능을 보이고 있다. 단일 노드 FP4 DeepSeek R1 추론에서도 SGLang 업데이트마다 성능이 급속 개선 중. AMD 공식 블로그도 FP8 기준 MI355X가 GB300 대비 비용 효율에서 우위라고 발표.
배경
- 2025-12-01AMD MI350 시리즈 출시
- 2026-02-16SemiAnalysis InferenceX v2 벤치마크 공개
- 2026-03-18AMD 공식 블로그에서 MI355X vs Blackwell 성능 비교 발표
- 2026-03-20SemiAnalysis, MI355X SGLang 성능 지속 개선 확인
주요 입장
전망
- · SemiAnalysis: 속도가 해자(moat) — 소프트웨어 최적화 속도가 관건
- · AMD: FP4 최적화 3월 말 완료 예정, 하반기 MI450 Helios 랙스케일
한국 영향
- MI450 Helios 랙스케일 성능
- 국내 클라우드의 AMD 도입 현황
Meta, MTIA 커스텀 AI칩 4세대(300~500) 2년내 배포 — Nvidia 의존도 축소 가속
주요 사건
Meta가 자체 AI칩 MTIA 4세대(300·400·450·500)를 2년 내 순차 배포하는 로드맵을 공개했다. MTIA 300은 이미 프로덕션, 400은 랩테스트 완료, 450은 2027년 초, 500은 2027년 중반 양산. MTIA 300→500으로 HBM 대역폭 4.5배, 연산 25배 향상.
배경
- 2023-05-01MTIA 1세대(100) 발표
- 2024-04-01MTIA 2세대(200) 발표
- 2026-03-11MTIA 300~500 로드맵 공개, 300 프로덕션 배포
주요 입장
전망
- · SemiAnalysis: Meta가 Nvidia 청구서를 보고 폭력을 선택했다
- · Meta: 산업 표준(PyTorch, vLLM, Triton) 기반으로 마찰 없는 도입
한국 영향
- TSMC 파운드리 물량 배분
- 국내 메모리 업체의 MTIA 공급 계약
Anthropic, 80,508명 대상 역대 최대 정성적 AI 설문 — '빛과 그림자' 이중성 발견
주요 사건
Anthropic이 159개국 80,508명을 대상으로 Claude Interviewer를 활용해 역대 최대 규모의 정성적 AI 설문을 실시했다. 67%가 AI에 순긍정적이나, 89%가 우려 보유. 가장 큰 희망은 업무 생산성(19%), 가장 큰 우려는 AI 신뢰성(27%). 감정적 의존 우려가 감정 지원 활용 대비 3배 높은 '빛과 그림자' 현상 발견.
배경
- 2025-12-0180,508명 인터뷰 수집 (1주간)
- 2026-03-11Anthropic Institute 설립 발표
- 2026-03-18설문 결과 공개
주요 입장
전망
- · Saffron Huang(Anthropic): 사람들이 AI에서 가장 사랑하는 것이 곧 가장 두려워하는 것
- · Euronews: 선진국-개발도상국 간 AI 인식 격차 뚜렷
한국 영향
- 한국 데이터 세부 분석 공개 여부
- 국내 AI 기업의 유사 설문 실시
Meta V-JEPA 2.1 — 자기지도학습 비디오 모델, 로봇 파지 성공률 20%p 향상
주요 사건
Meta FAIR가 V-JEPA 2.1을 발표했다. 밀집 예측 손실, 심층 자기지도, 다중모달 토크나이저, 스케일업 4가지 혁신을 결합해 영상 이해와 로봇 조작에서 SOTA 달성. Ego4D 7.71 mAP, 실제 로봇 파지 성공률 V-JEPA 2 대비 +20%p.
배경
- 2024-02-01V-JEPA 1.0 발표
- 2025-06-01V-JEPA 2.0 발표
- 2026-03-15V-JEPA 2.1 arXiv 공개
- 2026-03-20Yann LeCun RT로 확산
주요 입장
전망
- · LeCun: V-JEPA 2.1은 밀집 특징과 글로벌 인식 동시 달성
- · bemiagent: 에이전트가 '보는 것'의 근본적 병목을 해결
한국 영향
- 오픈소스 코드 공개 범위
- 한국 제조 환경에서의 적용 실험
한국 메모리 대중국·말레이시아 수출 급증 — HBM 고부가 메모리 중심
주요 사건
SemiAnalysis가 한국의 대중국·말레이시아 메모리 수출이 크게 증가하고 있다고 분석했다. ASP(평균판매가격) 상승이 주도하고 있어, 고부가가치 메모리(HBM 등)가 수출의 중심이 됨을 시사. 수출 목적지별 분석으로 특정 고객사 추정도 가능.
배경
- 2025-01-01HBM3E 양산 본격화
- 2026-03-20SemiAnalysis 한국 메모리 수출 데이터 분석 공개
주요 입장
전망
- · SemiAnalysis: ASP 상승은 고부가 메모리 비중 증가를 시사
- · TrendForce: 한중 HBM 기술격차 5년 이상, 확대 가능성
한국 영향
- 미국 수출통제 규정 변경
- 중국 자체 HBM 개발 진척
Karpathy, 첫 DGX Station GB300 수령 — 개인 연구자급 슈퍼컴퓨팅 시대 도래
주요 사건
Andrej Karpathy가 Nvidia로부터 첫 번째 DGX Station GB300(Dell Pro Max)을 선물받았다. 20암페어 전력이 필요한 이 워크스테이션은 Blackwell GB300 GPU를 탑재, 개인 연구실 수준에서 대형 모델 학습/추론이 가능. Karpathy는 자신의 Dobby 프로젝트 등에 활용할 계획.
배경
- 2026-03-16GTC 2026 키노트, DGX Station GB300 발표
- 2026-03-18Karpathy 첫 DGX Station GB300 수령
주요 입장
전망
- · Karpathy: 20암페어가 필요하다는 힌트에 좋은 것이라 직감
- · Nvidia: 최고의 빌더에게 최고의 도구를
한국 영향
- DGX Station GB300 가격/가용성
- 국내 유통 채널
GLM-5.1 오픈소스 예고 — 중국 Zhipu AI의 프론티어 모델 개방 가속
주요 사건
Zhipu AI(Z.ai)의 GLM-5.1이 오픈소스로 공개될 예정이라고 ZixuanLi가 밝혔다. GLM-5(744B MoE, MIT 라이선스)가 이미 오픈소스 최강으로 평가받는 가운데, 5.1은 추가 개선 버전.
배경
- 2026-01-01Zhipu AI 홍콩 IPO ($558M)
- 2026-02-11GLM-5 MIT 라이선스 공개
- 2026-03-20GLM-5.1 오픈소스 예고
주요 입장
전망
- · AK: 패닉하지 마라, GLM-5.1이 오픈소스 된다
- · Artificial Analysis: GLM-5는 오픈소스 Intelligence Index 1위
한국 영향
- GLM-5.1 성능 벤치마크
- 한국어 지원 수준
Google AlphaProof 논문 Nature 게재 — AI 수학 증명의 학술적 인정
주요 사건
Google DeepMind의 AlphaProof 논문이 Nature에 게재되었다. 2024년 국제수학올림피아드에서 AlphaProof와 AlphaGeometry가 은메달 수준의 성적을 거둔 연구를 정식 학술 검증.
배경
- 2016-03-01AlphaGo vs 이세돌
- 2024-07-01AlphaProof IMO 2024 은메달
- 2026-03-20AlphaProof Nature 게재
주요 입장
전망
- · Pushmeet Kohli(DeepMind VP): AI는 과학을 위한 궁극적 촉매제
- · Nature 게재로 학술적 정당성 획득
한국 영향
- AlphaProof 공개 여부
- 한국 수학 올림피아드 AI 활용
Cursor의 새 모델이 Kimi(Moonshot AI) 기반으로 확인 — 오픈소스의 상용 코딩 도구 침투
주요 사건
HuggingFace CEO Clément Delangue가 Cursor의 새 모델이 Moonshot AI의 Kimi 기반임을 확인했다. 이는 오픈소스 모델이 가장 인기 있는 AI 코딩 도구에 채택된 중요한 사례.
배경
- 2026-01-27Kimi Code 오픈소스 출시
- 2026-03-20Cursor의 Kimi 기반 모델 사용 확인
주요 입장
전망
- · Clément Delangue: 오픈소스가 계속 이긴다는 것을 강화하는 사례
- · 개발자 커뮤니티: 오픈소스 모델의 상용 도구 채택은 생태계 건강성의 증거
한국 영향
- Kimi K2.5 한국어 코딩 성능
- 국내 IDE의 오픈소스 모델 통합
Microsoft, Windows에서 Copilot AI 과잉 통합 일부 롤백
주요 사건
Microsoft가 Windows에서 Copilot AI 진입점을 줄이기 시작했다. Photos, Widgets, Notepad 등 앱에서 Copilot 연동을 제거하며, 사용자 반발에 대응.
배경
- 2023-11-01Copilot Windows 통합 시작
- 2026-03-20일부 앱에서 Copilot 진입점 제거
주요 입장
전망
- · TechCrunch: Microsoft가 AI 블로트 비판에 대응 시작
한국 영향
- 한국어 Copilot 기능 변화
AI 에이전트 보안을 위한 ID 기반 인증(authz) 부상 — Keycard 등 스타트업 주목
주요 사건
swyx가 AI 코딩 에이전트의 보안에서 ID 기반 인가(authorization)가 가장 중요한 솔루션으로 부상하고 있다고 지적. Keycard Labs가 모든 주요 코딩 에이전트를 지원하며, Auth0·WorkOS·Cloudflare도 관련 솔루션 제공. 에이전트가 사용자 자격증명을 상속하면서 사용자와 에이전트를 구분할 수 없는 보안 문제가 핵심.
배경
- 2025-06-01AI 코딩 에이전트 대중화
- 2026-03-19Keycard Labs, 모든 코딩 에이전트 지원 발표
주요 입장
전망
- · swyx: HITL-everything과 dangerously-skip-permissions 사이의 이진 결정을 깨야 한다
한국 영향
- 한국 금융·공공 부문의 에이전트 보안 요구사항