OpenAI GPT-5.4 mini/nano 출시로 소형모델 경쟁 본격화, NVIDIA GTC에서 광 인터커넥트 연합(OCI MSA) 결성, 오픈소스 AI 위기론 대두
- OpenAI GPT-5.4 mini·nano 출시 — 코딩·에이전트·멀티모달 최적화, GPT-5 mini 대비 2배 속도
- GPT-5.4 API 첫 주 5T 토큰/일 처리, 연간 $1B 신규 매출 달성 — 5.2→5.4 효율 32배 개선
- NVIDIA·AMD·Broadcom·MS·Meta·OpenAI, 광 인터커넥트 표준화 연합 OCI MSA 결성 — 3.2Tb/s DWDM 기반
- GPU 클러스터 비용 30% 상승 — HBM 메모리 공급 제약이 주요 원인
- 오픈소스 AI 위기: DeepSeek V4 미출시, Alibaba Qwen 폐쇄 전환, 서방 오픈웨이트 정체
- Anthropic 등 7개 빅테크, Linux Foundation에 $12.5M 오픈소스 보안 투자
- Google DeepMind, AGI 인지능력 측정 프레임워크 발표 + Kaggle 해커톤($200K)
- Mistral, 'Forge' 발표 — 기업 자체 AI 모델 처음부터 훈련 가능한 플랫폼
OpenAI, GPT-5.4 mini·nano 출시 — 코딩·에이전트·컴퓨터 사용에 최적화된 경량 모델
주요 사건
OpenAI가 GPT-5.4 mini와 GPT-5.4 nano를 출시했다. mini는 ChatGPT·Codex·API에서 사용 가능하며, 코딩·컴퓨터 사용·멀티모달 이해·서브에이전트에 최적화되어 GPT-5 mini 대비 2배 빠르다. nano는 API 전용으로 분류·데이터 추출·랭킹·간단한 코딩 서브에이전트에 적합하다.
배경
- 2026-03-05GPT-5.4 Thinking, GPT-5.4 Pro 출시
- 2026-03-06Codex Security 연구 프리뷰 공개
- 2026-03-17GPT-5.4 mini, GPT-5.4 nano 출시
주요 입장
전망
- · Sam Altman: 5.3→5.4 업그레이드에서 가장 큰 차별점은 '인간성(humanity)'
- · GPT-5.4 API 첫 주 5T 토큰/일, 연간 $1B 신규 매출 달성
한국 영향
- mini/nano 한국어 성능 벤치마크
- Codex 한국 시장 진출 시기
GPT-5.4 API 첫 주 5T 토큰/일 처리, 연간 $1B 신규 매출 — 역대 최빠른 API 채택
주요 사건
OpenAI의 Greg Brockman이 GPT-5.4가 출시 1주 만에 하루 5조 토큰을 처리하며, 1년 전 전체 API 트래픽을 초과했다고 밝혔다. 연간 환산 $1B 순수 신규 매출을 기록했으며, GPT-5.2 대비 32배 효율 개선으로 작업당 37센트 수준이다.
배경
- 2026-03-05GPT-5.4 API 출시
- 2026-03-12첫 주 5T 토큰/일 달성 확인
주요 입장
전망
- · Sam Altman: 'GPT-5.4의 가장 큰 차별점은 인간성'
- · 32x 효율 개선이 3개월 만에 달성됨
한국 영향
- 한국 리전 지연시간
- 원화 기준 가격 정책
NVIDIA·AMD·Broadcom·MS·Meta·OpenAI, 광 인터커넥트 표준 연합 OCI MSA 결성 — AI 데이터센터 구리 한계 돌파
주요 사건
NVIDIA, AMD, Broadcom, Microsoft, Meta, OpenAI 등 6개 기업이 OCI(Optical Compute Interconnect) MSA를 결성했다. DWDM 기술 기반 200Gbps 양방향 링크(4x50G NRZ)를 표준화하며, 3.2Tb/s급 광 인터커넥트를 AI 데이터센터에 도입한다. 구리 대비 전력 효율·확장성·대역폭에서 우위를 점한다.
배경
- 2026-03-13OCI MSA 공식 발표
- 2026-03-16SemiAnalysis 기술 상세 분석 공개
주요 입장
전망
- · OCI MSA: 동일 광섬유로 양방향 전송, 케이블 수 절반 감소
- · 50G NRZ가 PAM4 대비 비용·전력 우위
한국 영향
- OCI MSA 참여 한국 기업 여부
- 광학 부품 국산화 현황
GPU 클러스터 비용 30% 상승 — NVIDIA 탓 아닌 HBM 메모리 공급 제약
주요 사건
SemiAnalysis가 GPU 클러스터 구축 비용이 30% 상승했다고 보도했다. NVIDIA의 가격 인상이 아닌, HBM(고대역폭 메모리) 등 부품 공급 제약이 주요 원인이다. DGX Spark도 메모리 부족으로 $700 인상($3,999→$4,699)했다.
배경
- 2026-03-10NVIDIA DGX Spark $700 인상 발표
- 2026-03-17SemiAnalysis: GPU 클러스터 비용 30% 상승 보도
주요 입장
전망
- · SemiAnalysis: '다음 GPU 클러스터가 30% 더 비싸졌고 NVIDIA 탓이 아니다'
한국 영향
- HBM3E 가격 동향
- SK하이닉스 2Q 실적 가이던스
오픈소스 AI 위기: DeepSeek V4 미출시, Alibaba Qwen 폐쇄 전환, 서방 오픈웨이트 정체
주요 사건
SemiAnalysis의 Dylan Patel이 오픈소스 AI의 위기를 경고했다. DeepSeek V4가 여전히 미출시이고, Alibaba의 Qwen이 폐쇄형으로 전환하며, 서방의 오픈웨이트 모델들도 정체 상태다. 반면 NVIDIA는 오픈웨이트 모델 사전훈련을 위한 위원회를 구성했다. Patel은 '서방이 중국보다 더 폐쇄적'이라고 비판했다.
배경
- 2025-01DeepSeek V3 오픈소스 공개로 센세이션
- 2026-03Qwen 폐쇄 전환, DeepSeek V4 미출시 지속
- 2026-03-16NVIDIA 오픈웨이트 사전훈련 위원회 결성
주요 입장
전망
- · Dylan Patel: '모든 폐쇄형 AI의 세계는 권력 집중과 독재로 이어진다'
- · SemiAnalysis: '서방이 중국보다 더 공산주의적'
한국 영향
- DeepSeek V4 출시 시기
- 네이버·카카오의 오픈 전략
Anthropic 등 7개 빅테크, Linux Foundation에 $12.5M 오픈소스 보안 그랜트 — AI 시대 소프트웨어 공급망 보호
주요 사건
Linux Foundation이 Alpha-Omega 및 OpenSSF를 통해 $12.5M 그랜트 펀딩을 발표했다. Anthropic, AWS, GitHub, Google, Google DeepMind, Microsoft, OpenAI가 참여하며, AI가 발견하는 보안 취약점과 'AI slop' 보고서 홍수에 대응하기 위한 오픈소스 보안 인프라를 구축한다.
배경
- 2026-03-06Anthropic-Mozilla: Claude가 Firefox 22개 취약점 발견
- 2026-03-17Linux Foundation $12.5M 그랜트 발표
주요 입장
전망
- · Anthropic: 'AI는 취약점을 찾는 데 능하지만 아직 악용에는 미숙. 하지만 오래 지속되지 않을 것'
한국 영향
- Alpha-Omega 프로그램 참여 기회
- 국내 오픈소스 보안 현황
Google DeepMind, AGI 인지능력 측정 프레임워크 발표 — Kaggle 해커톤 $200K 상금
주요 사건
Google DeepMind이 'Measuring Progress Toward AGI: A Cognitive Taxonomy' 논문을 발표하고, Kaggle과 함께 인지능력 평가 해커톤을 시작했다($200K 상금). 프레임워크는 사회 인지, 문제 해결, 실행 기능, 메타인지, 추론 등 10가지 핵심 인지능력을 정의한다.
배경
- 2023-11DeepMind 'Levels of AGI' 논문 (초기 프레임워크)
- 2026-03-17인지 분류 체계 논문 + Kaggle 해커톤 발표
주요 입장
전망
- · DeepMind: '인지과학이 AGI 진전 측정의 한 가지 중요한 퍼즐 조각'
한국 영향
- 해커톤 결과물의 실용성
- 한국어 인지능력 평가 포함 여부
Mistral, 'Forge' 발표 — 기업이 자체 데이터로 AI 모델을 처음부터 훈련하는 플랫폼
주요 사건
프랑스 AI 기업 Mistral이 NVIDIA GTC에서 'Forge'를 발표했다. 기업이 파인튜닝이나 RAG가 아닌, 자체 데이터로 맞춤 AI 모델을 처음부터(from scratch) 훈련할 수 있는 플랫폼이다. OpenAI·Anthropic의 파인튜닝 기반 접근법과 차별화한다.
배경
- 2023-06Mistral AI 창업
- 2026-03-17Forge 플랫폼 GTC에서 발표
주요 입장
전망
- · TechCrunch: 'Forge는 파인튜닝과 RAG에 의존하는 경쟁사 접근법에 도전'
한국 영향
- Forge 가격 모델
- 한국어 지원 여부
GPU 사일런트 에러 모니터링 중요성 대두 — SemiAnalysis, Prometheus 기반 진단 사례 공개
주요 사건
SemiAnalysis가 GPU 사일런트 에러(하드 에러 없이 성능 저하)의 위험성을 경고했다. Prometheus 수집기를 통해 온도·전력 상관관계를 분석, 250W에서 90°C를 기록하는 비정상 GPU를 발견한 사례를 공개했다(정상: 600W+ 시 65°C 이상).
배경
- 2026-03-17SemiAnalysis 사일런트 에러 모니터링 사례 공개
주요 입장
전망
- · SemiAnalysis: '온도-전력 상관관계 분석이 사일런트 에러 탐지의 핵심'
한국 영향
- Prometheus 기반 GPU 모니터링 도입 현황
미국 PC 수입 1-2월 전년 대비 17% 감소 — 메모리 가격 상승으로 ASP 상승에도 수량 부진
주요 사건
SemiAnalysis(ChipBook)에 따르면 2026년 1월까지 미국 PC 수입이 전년 대비 17% 감소했다. 메모리 가격 상승으로 평균 판매가(ASP)는 올랐지만, 주류 수요 회복이 지연되고 있다.
배경
- 2026-03-17ChipBook: 1월 미국 PC 수입 -17% YoY 발표
주요 입장
전망
- · SemiAnalysis: '주류 수요 회복 고전, 메모리 가격이 ASP 끌어올려'
한국 영향
- 2Q PC 시장 회복 여부
- AI PC 보급률
Laminar AI, $3M 시드 투자 유치 — 장기 실행 AI 에이전트용 오픈소스 관측성 플랫폼
주요 사건
Laminar AI가 장기 실행 AI 에이전트를 위한 오픈소스 관측성(observability) 플랫폼 개발을 위해 $3M 시드 투자를 유치했다. AI 에이전트가 복잡해지면서 모니터링·디버깅·성능 추적 도구의 필요성이 커지고 있다.
배경
- 2026-03-17Laminar AI $3M 시드 투자 발표
주요 입장
전망
- · 에이전트 관측성은 DevOps에서 AI Ops로의 전환의 핵심
한국 영향
- 오픈소스 커뮤니티 성장 속도
- 한국어 문서 지원
Mixture-of-Depths Attention 논문 발표 — 효율적 트랜스포머 아키텍처 개선
주요 사건
Mixture-of-Depths Attention 논문이 발표되었다. 트랜스포머 모델에서 모든 토큰에 동일한 연산을 적용하는 대신, 토큰별로 다른 깊이의 어텐션을 적용해 효율성을 높이는 기법이다.
배경
- 2024-01Google: Mixture-of-Depths 초기 연구
- 2026-03-17MoD Attention 논문 발표
주요 입장
전망
- · 효율적 어텐션은 에이전트 시대 추론 비용 절감의 핵심 연구 방향
한국 영향
- 프로덕션 모델 적용 사례
- 벤치마크 결과