OpenAI GPT-5.4 mini/nano 출시, xAI Grok 4.20 정식 릴리스, AMD MI355 B200 추월 벤치마크, NVIDIA 네트워킹 $11B 분기매출 — GTC 2026 주간 AI 인프라 경쟁 본격화
- OpenAI GPT-5.4 mini/nano 출시 — 코딩·서브에이전트 최적화, GPT-5 mini 대비 2배 빠르고 SWE-Bench Pro 54.4%
- GPT-5.4 API 출시 1주 만에 일 5조 토큰 처리, 연간 $1B 신규매출 달성
- xAI Grok 4.20 베타 종료 정식 출시 — 환각율 22%로 1위, 명령어 준수 83% 1위
- AMD MI355X FP8 추론에서 NVIDIA B200 추월 — SemiAnalysis 벤치마크 확인
- NVIDIA 네트워킹 사업부 분기 $11B 매출(YoY +267%), Cisco 연간매출 상회
- Arista XPO-MSA 발표 — OSFP 대비 4배 밀도(204.8Tbps/1RU), DSP에 존재적 위협
- Karpathy DGX Station GB300(Dell Pro Max) 최초 수령 — 72코어 GB300, 496GB RAM
- Anthropic 81,000명 대규모 AI 사용자 인터뷰 공개 — 159개국 70개 언어
- Linux Foundation $12.5M 오픈소스 보안 기금 — Anthropic·Google·OpenAI·MS 참여
- NVIDIA GTC에서 Hugging Face 소개, DLSS-5 무료 앱 공개
OpenAI GPT-5.4 mini/nano 출시 — 코딩·서브에이전트 최적화 소형 모델
주요 사건
OpenAI가 GPT-5.4 mini와 nano를 ChatGPT, Codex, API에 동시 출시했다. mini는 GPT-5 mini 대비 2배 이상 빠르면서 SWE-Bench Pro 54.4%, OSWorld-Verified 72.1%를 기록해 대형 모델 GPT-5.4(57.7%, 75.0%)에 근접한 성능을 보인다. nano는 분류·데이터 추출·서브에이전트용 초경량 모델이다.
배경
- 2024-07-18GPT-4o mini 출시
- 2025-08-01GPT-5 mini 출시
- 2026-03-07GPT-5.4 출시, Codex Security 프리뷰
- 2026-03-17GPT-5.4 mini/nano 출시
주요 입장
전망
- · Hebbia CTO: mini가 더 큰 GPT-5.4보다 높은 패스율과 소스 귀속을 달성
- · GPT-5.4 API 첫 주 일 5조 토큰 처리(gdb)
한국 영향
- GPT-5.4 mini/nano 한국어 성능 벤치마크
- Codex 국내 개발팀 도입 추이
GPT-5.4 API 출시 1주 만에 일 5조 토큰, 연간 $1B 신규매출 달성
주요 사건
OpenAI CTO Greg Brockman(gdb)이 GPT-5.4가 API 출시 1주 만에 일 5조 토큰을 처리하며, 1년 전 전체 API 볼륨을 초과했다고 발표. 연환산 $1B 신규매출을 기록 중이다. Sam Altman은 GPT-5.4의 '인간적 성격'이 핵심 차별화라고 강조.
배경
- 2026-03-07GPT-5.4 API 출시
- 2026-03-14출시 1주 만에 일 5조 토큰 돌파
- 2026-03-16Sam Altman·Greg Brockman 성과 발표
주요 입장
전망
- · Sam Altman: 5.3→5.4 업그레이드에서 '인간적 성격'이 핵심 차별화
- · 32배 효율 개선(GPT-5.2 대비) — 작업당 37센트 수준
한국 영향
- 한국 리전 지연시간
- 국내 기업 Codex 도입 사례
xAI Grok 4.20 정식 출시 — 환각율 22%로 1위, 명령어 준수 83% 1위
주요 사건
xAI의 Grok 4.20이 베타를 종료하고 정식 출시됐다. 벤치마크에서 환각율 22%로 AI 모델 중 최저, 명령어 준수율 83%로 1위를 기록. Auto, Fast, Expert, Heavy 모드로 제공되며 iOS 앱도 AI Chat & Video로 업데이트.
배경
- 2024-12-01Grok 3 출시
- 2025-09-01Grok 4 발표
- 2026-03-09Grok 4.20 Beta
- 2026-03-18Grok 4.20 정식 출시
주요 입장
전망
- · Ashlee Vance: Grok이 개 암 백신 연구에서 Gemini 오류를 교정한 실사례 보도
- · Reddit 커뮤니티: 투자 규모 대비 성능이 여전히 뒤처진다는 평가
한국 영향
- Grok 4.20 한국어 성능
- xAI의 아시아 시장 전략
AMD MI355X FP8 추론에서 NVIDIA B200 추월 — SemiAnalysis 벤치마크
주요 사건
SemiAnalysis가 AMD MI355X의 FP8 Disaggregated Serving 벤치마크를 공개. MI355X가 NVIDIA B200을 raw tok/s/gpu와 비용 대비 성능 모두에서 추월했으며, 시간이 지날수록 소프트웨어 최적화로 격차가 벌어지는 추세. MTP(Multi-Token Prediction)과 non-MTP 양쪽 모두에서 우위.
배경
- 2024-06-01AMD MI300X 출시
- 2025-06-01MI355X 발표
- 2026-01-01TensorWave 등 클라우드에서 MI355X 가용
- 2026-03-18SemiAnalysis FP8 벤치마크 공개
주요 입장
전망
- · SemiAnalysis: 시간이 지날수록 MI355의 소프트웨어 개선으로 격차 확대
- · TensorWave: MI355X는 기다려온 대안
한국 영향
- AMD MI355X 한국 클라우드(KT, 네이버) 도입 여부
- 삼성 HBM AMD 공급 계약
NVIDIA 네트워킹 사업부 분기 $11B 매출 — Cisco 연간매출 상회, 267% YoY 성장
주요 사건
TechCrunch가 GTC 2026을 계기로 NVIDIA 네트워킹 사업부 심층 분석을 발표. 2020년 $7B에 인수한 Mellanox 기반으로 성장한 이 사업부가 지난 분기 $11B 매출(YoY +267%)을 기록, 연간 $31B 이상을 달성. NVLink, InfiniBand, Spectrum-X, 코패키지드 옵틱스 등 AI 팩토리 전 구간 커버.
배경
- 2020-04-01NVIDIA Mellanox $7B 인수 완료
- 2024-01-01NVLink Switch 출시
- 2026-03-18네트워킹 분기 $11B 매출 공개
주요 입장
전망
- · Zacks Kevin Cook: NVIDIA가 1분기에 Cisco의 연간매출을 상회
- · TechCrunch: Jensen의 2020년 Mellanox 인수는 AI 칩만큼이나 선견지명
한국 영향
- 국내 AI 팩토리 구축 시 NVIDIA 네트워킹 점유율
- InfiniBand vs Spectrum-X 선택
Arista XPO-MSA 발표 — OSFP 대비 4배 밀도, DSP에 존재적 위협
주요 사건
Arista Networks가 수십 개 파트너와 함께 XPO(eXtended Pluggable Optics) MSA를 발표. 8개 OSFP 케이지와 64x200G SerDes를 결합해 모듈당 12.8Tbps, 1RU당 204.8Tbps를 달성 — OSFP 대비 4배 밀도. 액체 냉각 통합, LPO(Linear Pluggable Optics) 네이티브 지원으로 DSP(Digital Signal Processor)가 불필요해져 기존 DSP 업체에 위협.
배경
- 2026-03-12Arista XPO MSA 공식 발표
- 2026-03-18SemiAnalysis 상세 분석 공개
- 2026-03-30OFC 2026에서 라이브 데모 예정
주요 입장
전망
- · Dell'Oro Sameh Boujelbene: XPO는 AI 데이터센터의 돌파구
- · SemiAnalysis: DSP에 존재적 위험
한국 영향
- XPO MSA 한국 업체 참여 여부
- LPO 전환이 국내 DSP 관련 매출에 미치는 영향
Karpathy, DGX Station GB300(Dell Pro Max) 세계 최초 수령 — 개인 AI 랩 시대
주요 사건
Andrej Karpathy가 NVIDIA로부터 DGX Station GB300(Dell Pro Max)를 세계 최초로 수령. 72코어 GB300 프로세서, 496GB LPDDR5X RAM, RTX Pro 2000 Blackwell GPU, 16TB 스토리지, 1600W PSU 탑재. 20암페어 전원이 필요한 데스크톱급 AI 워크스테이션.
배경
- 2025-03-01GB300 프로세서 발표
- 2026-03-16GTC 2026 키노트, Dell Pro Max 출하 시작
- 2026-03-18Karpathy 최초 수령 공개
주요 입장
전망
- · Karpathy: autoresearch로 GPT-2 훈련 시간 11% 단축 달성, 에이전트 스웜이 모든 프론티어 랩에서 활용될 것
한국 영향
- Dell Pro Max GB300 한국 출시 시기·가격
- 국내 AI 연구기관 도입 계획
Anthropic, 81,000명 대규모 AI 사용자 인터뷰 공개 — 159개국 70개 언어
주요 사건
Anthropic이 'Anthropic Interviewer'로 수행한 81,000명 대규모 정성 연구 결과를 발표. Claude 사용자들이 AI 활용 방법, 꿈, 두려움을 공유. 159개국 70개 언어로 진행된 역대 최대 규모 다국어 정성 조사. 의료 진단 도움부터 일자리 대체 우려까지 다양한 목소리 수집.
배경
- 2025-12-01Anthropic Interviewer 프로젝트 시작
- 2026-01-011주 만에 81,000명 참여
- 2026-03-18결과 보고서 공개
주요 입장
전망
- · Anthropic: AI가 가능하게 한 전례 없는 규모의 정성 조사
- · 한국 소프트웨어 엔지니어 응답자: 인류가 자신보다 똑똑한 것을 다뤄본 적 없다
한국 영향
- 한국 응답자 비중 및 주요 우려사항
- 국내 AI 기업의 유사 조사 계획
Linux Foundation $12.5M 오픈소스 보안 기금 — AI 기업 총출동
주요 사건
Linux Foundation이 AlphaOmega 및 OpenSSF를 통해 $12.5M 규모의 오픈소스 보안 기금을 발표. Anthropic, AWS, GitHub, Google, DeepMind, Microsoft, OpenAI가 참여해 지속가능한 오픈소스 보안 솔루션에 투자한다.
배경
- 2022-01-01OpenSSF 설립
- 2024-03-01XZ Utils 백도어 사건
- 2026-03-17Linux Foundation $12.5M 기금 발표
주요 입장
전망
- · Anthropic: AI가 강력해질수록 오픈소스 보안이 더 중요
- · Mozilla: Opus 4.6가 2주 만에 14개 고위험 취약점 발견
한국 영향
- 한국 기업의 OpenSSF 참여 여부
- AI 기반 보안 감사 도구 국내 도입
GTC 2026: Jensen, Hugging Face 소개 + NVIDIA DLSS-5 무료 앱 공개
주요 사건
GTC 2026 키노트에서 Jensen Huang이 Hugging Face를 직접 소개하며 NVIDIA AI의 오픈 모델·데이터셋·블로그를 발표. 별도로 DLSS-5 '업스케일링' 무료 앱이 공개돼 모든 콘텐츠에 NVIDIA 뉴럴 렌더링을 적용 가능해졌다. Hugging Face는 AI 에이전트용 논문 마크다운 서비스도 출시.
배경
- 2026-03-16GTC 2026 키노트
- 2026-03-18DLSS-5 무료 앱 공개, HuggingFace 논문 페이지 출시
주요 입장
전망
- · HuggingFace: AI 에이전트가 논문 페이지 접근 시 자동 마크다운 제공으로 토큰 절약
한국 영향
- DLSS-5 한국 출시 시기
- 국내 GTC 참가 기업 발표 내용
Dylan Patel: 오픈소스 AI 위기 — DeepSeek v4 미출시, Alibaba Qwen 폐쇄 전환
주요 사건
SemiAnalysis의 Dylan Patel이 오픈소스 AI의 위기를 경고. DeepSeek v4가 아직 미출시, Alibaba Qwen이 폐쇄형으로 전환, 서방 오픈웨이트 모델도 부진. '폐쇄형 AI만의 세계는 권력 집중과 독재로 이어진다'고 경고.
배경
- 2025-01-01DeepSeek v3 오픈소스 출시로 AI 업계 충격
- 2026-03-01Alibaba Qwen 폐쇄형 전환 발표
- 2026-03-16Dylan Patel 오픈소스 위기 경고
주요 입장
전망
- · Dylan Patel: 오직 폐쇄형 AI만의 세계는 독재로 이어진다
한국 영향
- DeepSeek v4 출시 여부
- 한국 기업의 오픈소스 LLM 의존도
Nothing CEO: 스마트폰 앱이 사라지고 AI 에이전트가 대체할 것
주요 사건
Nothing CEO Carl Pei가 SXSW에서 스마트폰 앱이 AI 에이전트로 대체될 것이라고 예측. 사용자 의도를 이해하고 대신 행동하는 시스템이 기존 앱 패러다임을 대체할 것이라는 비전 제시.
배경
- 2024-11-01Anthropic Computer Use 출시
- 2025-06-01OpenAI 에이전트 SDK 출시
- 2026-03-18Carl Pei SXSW 발표
주요 입장
전망
- · Carl Pei: 사용자 의도를 이해하고 대신 행동하는 시스템이 미래
한국 영향
- 삼성 One UI 에이전트 기능 로드맵
- 한국 앱 시장 에이전트 전환 속도
Google DeepMind, Kaggle과 AGI 인지 평가 해커톤 출시 — $200K 상금
주요 사건
Google DeepMind이 Kaggle과 함께 AGI 진행 상황을 측정하기 위한 인지 평가(cognitive evaluation) 글로벌 해커톤을 출시. 총 $200K 상금으로 AI의 인지 능력을 테스트하는 새로운 벤치마크를 크라우드소싱으로 개발하는 것이 목표.
배경
- 2026-03-06Anthropic BrowseComp 평가 해킹 사례 발표
- 2026-03-17Google DeepMind AGI 해커톤 출시
주요 입장
전망
- · DeepMind: AGI를 향한 진전을 측정하려면 건전한 경쟁이 필요
한국 영향
- 한국팀 참가 및 상금 수상 여부
- 한국어 AI 평가 표준