OpenAI GPT-5.4 출시로 컴퓨터 유즈·100만 토큰 컨텍스트 시대 개막, NVIDIA GB300 NVL72 Hopper 대비 50배 추론 성능 입증, Broadcom AI칩 매출 2027년 $100B 전망
- OpenAI GPT-5.4 출시: 네이티브 컴퓨터 유즈, 1M 토큰 컨텍스트, 47% 토큰 효율 개선, OSWorld 75% 달성
- NVIDIA GB300 NVL72: Hopper 대비 최대 50배 처리량, 35배 비용 절감 — SemiAnalysis InferenceX 벤치마크 확인
- Broadcom Q1 실적 호조: AI칩 매출 $100B 가시권 선언, 매출 $19.3B (+29% YoY), Q2 가이던스 $22B
- OpenAI Codex 200만 사용자 돌파, Windows 앱 출시 — 2주간 +40만 증가
- TensorRT-LLM 소프트웨어 최적화로 GB200 MoE 추론 45일 만에 2배 성능 향상
- AWS Amazon Connect Health: 의료 전문 AI 에이전트 플랫폼 출시
- Karpathy, AI 에이전트 장기 메모리와 weight-based 업데이트 연구 방향 제시
- Tencent HY-WU: 뉴럴 메모리 프레임워크 기반 이미지 편집 모델 공개
- Meta AI 연구팀: 'Beyond Language Modeling' — 비전 중심 멀티모달 사전학습 연구 발표
- SemiAnalysis, Brookfield의 Ori 인수 기술실사 주도 — 소버린 AI 컴퓨트 테마 부상
OpenAI GPT-5.4 출시 — 네이티브 컴퓨터 유즈와 100만 토큰 컨텍스트로 에이전트 AI 시대 본격화
주요 사건
OpenAI가 GPT-5.4를 출시했다. API와 Codex에서 100만 토큰 컨텍스트를 지원하며, 네이티브 컴퓨터 유즈 기능을 탑재한 첫 범용 모델이다. GPT-5.4 Thinking(추론 모드)과 GPT-5.4 Pro(고성능)도 함께 공개됐다. 토큰 효율이 47% 개선되었고, 응답 중간에 사용자가 방향을 수정할 수 있는 'steering' 기능도 도입됐다.
배경
- 2025-12-01GPT-5.0 출시
- 2026-02-04Codex 100만 WAU 돌파
- 2026-03-03GPT-5.3 Instant 출시
- 2026-03-05GPT-5.4 출시 — 컴퓨터 유즈, 1M 컨텍스트, Tool Search
주요 입장
전망
- · Mercor CEO: 'GPT-5.4는 슬라이드덱, 재무모델, 법률분석 등 장기 결과물 생성에서 최고 성능을 보이며 비용도 낮다'
- · Karpathy: '12월 이후 코딩 에이전트가 근본적으로 달라졌다. 30분이면 주말 프로젝트가 완성된다'
한국 영향
- GPT-5.4 한국어 성능 벤치마크
- 국내 코딩 에이전트 도입 현황
참고 자료
NVIDIA GB300 NVL72, Hopper 대비 최대 50배 추론 성능·35배 비용 절감 — SemiAnalysis InferenceX 벤치마크 입증
주요 사건
SemiAnalysis InferenceX 벤치마크에서 NVIDIA GB300 NVL72(Blackwell Ultra)가 Hopper 대비 최대 50배 처리량/MW, 35배 낮은 비용/토큰을 달성했다. 특히 저지연 에이전트 워크로드에서 압도적이며, FP4 모드에서 MoE 모델 추론 시 H100을 완전히 압도한다.
배경
- 2024-03-01NVIDIA Blackwell 아키텍처 발표
- 2025-09-01GB200 NVL72 출하 시작
- 2026-01-15TensorRT-LLM 0.5.1 → 0.8.1 업그레이드 (45일간 2x 성능)
- 2026-03-05GB300 NVL72 InferenceX 벤치마크 결과 공개
주요 입장
전망
- · SemiAnalysis: 'GB300 FP4에서 프런티어 MoE 추론 시 H100을 완전히 압도한다'
- · LMSYS: 'SGLang on GB300 NVL72로 25배 성능 달성'
한국 영향
- SK하이닉스 12-Hi HBM3e 양산 일정
- 삼성전자 HBM 품질 인증 현황
참고 자료
Broadcom CEO, AI칩 매출 2027년 $100B 가시권 선언 — Q1 실적 호조, Q2 가이던스 $22B
주요 사건
Broadcom이 FY2026 Q1 실적을 발표했다. 매출 $19.31B(+29% YoY), EPS $2.05로 시장 예상 상회. CEO Hock Tan은 '2027년 AI칩 매출만 $100B 이상 달성 가시권'이라고 선언했다. Q2 가이던스 $22B으로 컨센서스 $20.56B를 크게 상회.
배경
- 2024-11-01VMware 인수 완료
- 2025-12-01FY2025 AI 매출 급성장
- 2026-03-05FY2026 Q1 실적 발표 — AI칩 $100B 가시권 선언
주요 입장
전망
- · Hock Tan CEO: 'AI칩 매출 $100B 달성에 필요한 공급망을 이미 확보했다'
한국 영향
- 삼성 파운드리 3nm 수율 및 Broadcom 수주 현황
- 국내 AI칩 스타트업 동향
TensorRT-LLM 최적화로 GB200 NVL72 MoE 추론 성능 45일 만에 2배 향상 — 소프트웨어가 핵심
주요 사건
SemiAnalysis에 따르면 TensorRT-LLM 0.5.1에서 0.8.1로 업그레이드하는 45일 동안, 동일한 GB200 NVL72 하드웨어에서 대규모 MoE 모델의 FP4 추론 성능이 최대 2배 향상됐다. 핵심은 통신과 연산의 오버랩을 개선한 커널 최적화.
배경
- 2026-01-20TensorRT-LLM 0.5.1 배포
- 2026-03-05TensorRT-LLM 0.8.1 — 동일 하드웨어 2x 성능
주요 입장
전망
- · SemiAnalysis: '중국 엔지니어들이 통신 오버랩 커널을 작성해 wall clock 시간을 크게 단축했다'
한국 영향
- 국내 GPU 클러스터 운영사의 추론 스택 업데이트 현황
OpenAI Codex 200만+ 활성 사용자 돌파 — Windows 앱 출시, 주간 25% 성장
주요 사건
OpenAI Codex가 200만 활성 사용자를 돌파했다. 주간 25% 성장률을 기록 중이며, Windows 네이티브 앱도 출시됐다. GPT-5.4 통합으로 /fast 모드도 추가. 1월 1일 대비 3배 이상 성장.
배경
- 2026-02-02Codex 데스크톱 앱 출시
- 2026-02-04100만 WAU 돌파
- 2026-02-27160만 WAU
- 2026-03-05200만+ WAU, Windows 앱 출시, GPT-5.4 통합
주요 입장
전망
- · Swyx: 'GPT 래퍼이자 GPU 래퍼 시대. 제품 인력에게 세대적 기회'
- · Dylan Patel: 'Cursor와 Thinking Machines가 합쳐야 하는 이유는 문화적 적합성'
한국 영향
- 국내 기업의 Codex/Cursor 도입률
- AI 코딩 에이전트 보안 이슈
Karpathy, AI 에이전트 장기 메모리 연구 방향 제시 — Weight-based 업데이트와 RL 도구 통합
주요 사건
Andrej Karpathy가 AI 에이전트의 장기 메모리 문제에 대해 견해를 밝혔다. 현재의 프롬프트 컴팩션+재귀 서브에이전트 접근이 '놀라울 정도로 효과적'이지만, RL에서 메모리 연산을 도구로 도입하거나, weight-based 업데이트(아마도 수면 중)를 통한 더 근본적인 접근이 필요하다고 제시.
배경
- 2026-02-25Karpathy: AI로 프로그래밍이 완전히 달라졌다
- 2026-02-27Karpathy: 멀티 에이전트 연구 조직 실험 공유
- 2026-03-05Karpathy: 장기 메모리 연구 방향 제시
주요 입장
전망
- · Karpathy: '현재 컴팩션은 조잡한 초기 구현이지만, RL에서 도구로 통합하면 상당히 멀리 갈 수 있다'
- · Awni Hannun: '프롬프트 컴팩션 + 재귀 서브에이전트가 놀라울 정도로 효과적'
한국 영향
- 국내 AI 연구팀의 에이전트 메모리 관련 논문
- OpenClaw/NanoClaw 등 클로 에코시스템 발전
AWS Amazon Connect Health 출시 — 의료 전문 AI 에이전트 플랫폼으로 헬스케어 AI 시장 공략
주요 사건
AWS가 Amazon Connect Health를 출시했다. 의료기관을 위한 에이전틱 AI 솔루션으로, 환자 예약 관리, 문서화, 본인 확인 등을 자동화한다. Amazon Connect(일 1,600만 상호작용 처리)를 기반으로 의료 특화 기능을 추가.
배경
- 2026-03-05AWS Amazon Connect Health 출시
주요 입장
전망
한국 영향
- 국내 클라우드(NHN, KT)의 헬스케어 AI 솔루션 출시 동향
SemiAnalysis, Brookfield의 Ori 인수 기술실사 주도 — 소버린 AI 컴퓨트 투자 테마 부상
주요 사건
SemiAnalysis가 Brookfield의 Ori(AI 인프라 기업) 인수에 대한 기술 실사를 주도했다고 발표. Ori는 Radiant로 합병되어 Brookfield의 수직통합 AI 인프라 플랫폼이 됐다. Brookfield는 $100B AI 인프라 투자 프로그램을 운영 중.
배경
- 2026-03-04Brookfield, Ori 인수 → Radiant 합병 발표
주요 입장
전망
- · SemiAnalysis: '소버린 AI 컴퓨트가 글로벌 인프라 투자의 핵심 테마가 되고 있다'
한국 영향
- 정부 AI 인프라 투자 예산
- 국내 데이터센터 기업 AI 전환 현황
OpenAI, Chain-of-Thought 통제 가능성 연구 발표 — GPT-5.4 Thinking의 추론 투명성 검증
주요 사건
OpenAI가 Chain-of-Thought(CoT) 통제 가능성에 대한 새 평가 스위트와 논문을 발표했다. GPT-5.4 Thinking이 추론 과정을 의도적으로 숨기는 능력이 낮다는 결과를 보여, CoT 모니터링이 유효한 안전 도구로 남아있음을 시사했다.
배경
- 2026-03-05OpenAI CoT 통제 가능성 평가 스위트 공개
주요 입장
전망
한국 영향
- 국내 AI 안전 규제 동향
- 한국 AI 기업들의 추론 모델 안전성 평가
Meta AI, 'Beyond Language Modeling' — 비전을 1급 시민으로 대우하는 멀티모달 사전학습 연구 발표
주요 사건
Meta AI 연구팀이 'Beyond Language Modeling' 논문을 발표, 비전을 언어와 동등한 1급 시민으로 취급하는 멀티모달 사전학습 접근법을 제안했다. Yann LeCun을 포함한 연구진이 참여. 기존 언어 중심 멀티모달 모델의 한계를 지적하며 시각 세계 이해를 강조.
배경
- 2026-03-04Meta AI 'Beyond Language Modeling' 논문 공개
- 2026-03-05LeCun 등 홍보, AK 공유
주요 입장
전망
- · LeCun/Meta 연구팀: '인간은 언어와 비전으로 소통하지만, 대부분 멀티모달 모델은 언어 중심으로 편향'
한국 영향
- 국내 멀티모달 AI 연구 동향
- Meta AR 기기 한국 출시 일정
Tencent HY-WU 공개 — 확장 가능한 뉴럴 메모리 프레임워크 기반 텍스트 기반 이미지 편집 모델
주요 사건
Tencent가 HY-WU(Hugging Face 공개)를 발표했다. '확장 가능한 기능적 뉴럴 메모리 프레임워크'를 제안하며, 텍스트 기반 이미지 편집에 적용한 모델이다. Tencent Hunyuan 시리즈의 최신 연구.
배경
- 2026-03-05Tencent HY-WU Hugging Face 공개
주요 입장
전망
한국 영향
- HY-WU 한국어 지원 여부
- 국내 콘텐츠 기업의 AI 도구 도입
HBM 제조 복잡성 급증 — 16-Hi 스택으로 갈수록 웨이퍼 소모량과 수율 손실 심화
주요 사건
SemiAnalysis가 HBM 제조의 웨이퍼 소모 분석을 공개했다. HBM은 일반 DDR DRAM 대비 비트당 수배의 웨이퍼를 소비하며, 8-Hi → 12-Hi → 16-Hi 스택으로 갈수록 격차가 확대된다. TSV 킵아웃 존, 대역폭 최적화된 대형 다이, 적층 과정의 복합 수율 손실이 원인.
배경
- 2024-01-01HBM3 8-Hi 주류
- 2025-06-01HBM3e 12-Hi 양산 시작
- 2026-03-04SemiAnalysis: HBM 웨이퍼 소모 분석 공개
- 2027-01-01HBM4 16-Hi 예상 양산
주요 입장
전망
- · SemiAnalysis: 'HBM 다이는 대역폭 최적화로 밀도가 아닌 크기가 커, 웨이퍼당 수확량이 크게 줄어든다'
한국 영향
- 삼성전자 HBM3e 수율 개선 현황
- SK하이닉스 16-Hi HBM4 개발 일정