Lleejh.in/ 뉴스
2026년 2월 28일 · 요일·기술
높음
sentiment.bullish-cautious

OpenAI $1,100억 메가 펀딩(Amazon·NVIDIA·SoftBank), Anthropic-펜타곤 정면충돌, Claude Code가 GitHub 커밋 4% 점유 — AI 산업 권력 재편 가속

핵심 요약
  • OpenAI, Amazon($500억)·NVIDIA($300억)·SoftBank($300억)로부터 $1,100억 조달, 기업가치 $8,400억
  • Anthropic, 펜타곤 자율무기 요구 거부 → 국방부 공급망 리스크 지정, 트럼프 연방기관 사용금지 명령
  • SemiAnalysis: Claude Code가 GitHub 공개 커밋 4% 차지, 2026년 말 20%+ 전망
  • Anthropic, 컴퓨터 사용 강화 위해 Vercept 인수 — OSWorld 벤치마크 72.5% 달성
  • Google, Nano Banana 2(Gemini 3.1 Flash Image) 출시 — 속도+품질 겸비 이미지 생성
  • MatX, $5억 시리즈B 조달 — LLM 전용 칩 개발, Karpathy 자문
  • NVIDIA Q4 실적 호조에도 주가 5% 하락 — 반도체 vs 소프트웨어 밸류에이션 괴리
  • Karpathy: 코딩 에이전트가 12월 이후 근본적으로 변화, 에이전틱 엔지니어링 시대 선언
  • OpenAI 직원, 기밀정보로 예측시장 거래하다 해고
  • InferenceX v2: 100K+ 추론 벤치마크 공개, GPU 1.37M분 실행
12개 출처 · 12개 항목
01@sama·2.27 14:12

OpenAI, Amazon·NVIDIA·SoftBank로부터 $1,100억 조달 — AI 사상 최대 펀딩

주요 사건

OpenAI가 Amazon($500억), NVIDIA($300억), SoftBank($300억)로부터 총 $1,100억을 조달했다. 기업가치 $8,400억으로 역대 최대 AI 펀딩. Amazon은 AWS를 OpenAI Frontier(엔터프라이즈 에이전트 플랫폼)의 독점 서드파티 클라우드로 제공하며, OpenAI는 Amazon Trainium 칩 2GW 규모를 활용한다. Microsoft Azure는 기존 API 및 자사 제품 호스팅 유지.

배경

역사적 맥락
OpenAI는 2023년 $100억(Microsoft), 2024년 $66억, 2025년 $400억(SoftBank 주도 Stargate), 그리고 2026년 2월 $1,100억으로 투자 규모가 기하급수적 증가. Stargate 텍사스 데이터센터는 이미 첫 철골 설치 시작. AI 인프라 경쟁이 칩→데이터센터→클라우드 전체 스택으로 확대.
원인
[GPT-4/5 성공] → [엔터프라이즈 수요 폭증] → [컴퓨트 부족] → [하이퍼스케일러 파트너십] → [$1,100억 메가딜]
타임라인
  1. 2023-01-01
    Microsoft $100억 투자
  2. 2024-10-01
    $66억 시리즈 조달
  3. 2025-09-01
    Stargate $400억 라운드
  4. 2026-02-27
    $1,100억 라운드 발표

주요 입장

OpenAI
인프라 확장
AGI 달성을 위한 컴퓨트 확보
Amazon/AWS
전략적 투자
Azure 독점 깨기, Trainium 칩 수요처 확보
Microsoft
기존 관계 유지
API·모델 독점 라이선스 보유
시장/투자자
AI 버블 우려와 기대 공존
수익화 속도 vs 투자 규모 괴리

전망

high
2026년 하반기 IPO 시 시가총액 $1조+ 가능
high
AWS-Azure-GCP 3자 AI 인프라 경쟁 심화
medium
AI 투자 총액이 수익 대비 과도, 조정 가능성
  • · Reuters: AI 투자 열기가 사상 유례없는 수준
  • · CNBC: OpenAI의 멀티클라우드 전략이 Microsoft 독점 관계를 근본적으로 변화

한국 영향

직접 영향
삼성·SK하이닉스 HBM/AI 메모리 수혜 지속. OpenAI 인프라 확장은 한국 반도체 수출 호재
간접 영향
국내 AI 스타트업의 글로벌 자금 접근성 상대적 열위 심화. 정부 차원 AI 인프라 투자 가속 필요
주목할 지점
  • OpenAI-Amazon Trainium 칩 채택이 NVIDIA 의존도에 미치는 영향
  • 한국 클라우드사(KT·NHN) 대응 전략
#openai#funding#amazon#nvidia#softbank
02@swyx·2.27 17:17

Anthropic, 펜타곤 자율무기 요구 거부 → 국방부 '공급망 리스크' 지정, 연방기관 사용 금지

주요 사건

Anthropic이 펜타곤의 자율무기 시스템 요구를 공식 거부. 이에 국방장관 Pete Hegseth가 Anthropic을 '공급망 리스크'로 지정했고, 트럼프 대통령은 연방기관의 Anthropic 제품 사용 중단을 명령. 한편 펜타곤은 대화 지속 의사를 밝힘.

배경

역사적 맥락
Anthropic은 2023년부터 Responsible Scaling Policy로 AI 안전 원칙을 명시. 2024년 AWS 파트너십, 2026년 RSP v3.0 업데이트. Dario Amodei CEO는 국가안보 AI 활용은 지지하되 자율살상무기는 레드라인으로 설정.
원인
[펜타곤 AI 도입 가속] → [Anthropic에 자율무기 통합 요구] → [Anthropic 거부] → [공급망 리스크 지정] → [정치적 보복 확대]
타임라인
  1. 2023-09-01
    Anthropic RSP v1.0 발표
  2. 2026-02-24
    RSP v3.0 업데이트
  3. 2026-02-26
    Anthropic 펜타곤 요구 공식 거부
  4. 2026-02-27
    국방부 공급망 리스크 지정, 연방 사용금지

주요 입장

Anthropic
원칙 고수
AI 안전 원칙은 타협 불가
펜타곤/트럼프 행정부
압박·보복
국가안보에 필요한 기술 협력 거부는 용납 불가
OpenAI/경쟁사
반사 수혜
정부 계약 기회 확대
AI 안전 커뮤니티
Anthropic 지지
자율무기 레드라인은 산업 전체의 문제

전망

medium
비살상 국방 AI(물류, 사이버방어)로 제한된 협력 재개
medium
연방 조달 금지가 다른 AI 기업에도 압박으로 작용
high
정부/국방 AI 시장에서 Palantir·Anduril 등 방산 AI 기업 수혜
  • · swyx: Dario가 pmarca의 PMF 정의를 대체했다 — 펜타곤이 쫓아오는 게 진정한 PMF
  • · TechCrunch: AI 기업의 윤리적 거부권이 산업 전체의 선례가 될 수 있다

한국 영향

직접 영향
한국 국방 AI 정책에 시사점. AI 윤리 가이드라인과 군사 활용 범위 설정 논의 촉발
간접 영향
미국 정부의 AI 기업 압박이 한국 AI 기업의 미국 정부 계약 참여 시 고려해야 할 리스크
주목할 지점
  • 한국군 AI 도입 시 윤리 기준
  • 미국 연방 AI 조달 정책 변화
#anthropic#pentagon#ai-safety#regulation#defense
03@SemiAnalysis_·2.27 18:00

Claude Code, GitHub 공개 커밋 4% 점유 — 2026년 말 20% 돌파 전망

주요 사건

SemiAnalysis 분석에 따르면 Anthropic의 Claude Code가 현재 GitHub 공개 커밋의 4%를 차지하며, 현 추세로 2026년 말 전체 일일 커밋의 20% 이상을 차지할 전망. 이는 AI 코딩 에이전트가 소프트웨어 개발을 근본적으로 변화시키고 있음을 보여주는 핵심 지표.

배경

역사적 맥락
2024년 GitHub Copilot이 코드 자동완성 시대를 열었고, 2025년 말~2026년 초 Claude Code·Codex 등 에이전틱 코딩 도구가 급부상. Karpathy는 '2025년 12월 이후 코딩 에이전트가 근본적으로 작동하기 시작했다'고 평가.
원인
[LLM 코딩 능력 향상] → [Tab 자동완성 → 에이전트 모드 전환] → [Claude Code 터미널 네이티브 에이전트] → [커밋 점유율 급증]
타임라인
  1. 2024-01-01
    GitHub Copilot 보편화
  2. 2025-12-01
    코딩 에이전트 품질 임계점 돌파
  3. 2026-02-01
    Claude Code GitHub 커밋 4% 달성
  4. 2026-12-01
    20%+ 전망

주요 입장

Anthropic
시장 선도
Claude Code가 코딩 에이전트 시장을 지배
OpenAI/Codex
추격
Codex 5.3이 Opus 대비 코딩에서 우위
Microsoft/GitHub
딜레마
Copilot이 Claude Code에 점유율 빼앗기는 중
개발자
급속 채택
생산성 혁신적 향상

전망

high
2027년까지 대부분의 코드가 AI 에이전트에 의해 작성/수정
high
코드 작성 → 에이전트 감독·아키텍처 설계로 전환
medium
AI 생성 코드의 보안 취약점·미묘한 버그 증가 우려
  • · Karpathy: 프로그래밍이 컴퓨터 발명 이래 처음으로 완전히 달라지고 있다
  • · SemiAnalysis: Anthropic 매출 성장이 OpenAI를 추월하는 중, 컴퓨트가 제약

한국 영향

직접 영향
국내 개발자들의 AI 코딩 도구 채택 가속. 삼성SDS·네이버 등 대형 SI/IT 기업의 개발 프로세스 변화
간접 영향
주니어 개발자 채용 시장 축소 가능성. SW 교육 커리큘럼 재편 필요
주목할 지점
  • 국내 기업의 Claude Code/Codex 도입 현황
  • 코드 보안 감사 체계 강화 필요성
#claude-code#anthropic#github#ai-coding#developer-tools
04@AnthropicAI·2.25 17:08

Anthropic, Vercept 인수 — Claude 컴퓨터 사용 능력 대폭 강화, OSWorld 72.5%

주요 사건

Anthropic이 '비전 퍼스트' AI 에이전트 스타트업 Vercept을 인수. Vercept은 API 없이 화면 픽셀만으로 UI를 이해하는 기술 보유. Claude Sonnet 4.6의 OSWorld 벤치마크 점수가 72.5%로, 2024년 말 15% 미만에서 인간 수준에 근접. 공동창업자 Ross Girshick(전 Meta AI) 등 핵심 인재 합류.

배경

역사적 맥락
2024년 10월 Claude 3.5 Sonnet과 함께 Computer Use 기능 최초 공개. 당시 복잡한 UI에서 클릭 오류가 빈번했으나, Vercept의 공간 추론 기술로 해결. 이전 Bun 인수에 이어 두 번째 전략적 인수.
원인
[Computer Use 출시] → [실제 환경 정확도 한계] → [Vercept 비전 기술 필요] → [인수 통합] → [OSWorld 72.5%]
타임라인
  1. 2024-10-01
    Claude Computer Use 최초 출시 (OSWorld <15%)
  2. 2025-06-01
    Bun 인수
  3. 2026-02-25
    Vercept 인수, Sonnet 4.6 OSWorld 72.5%

주요 입장

Anthropic
에이전틱 AI 선도
Computer Use가 핵심 차별화 요소
OpenAI (Operator)
추격
Operator 에이전트로 경쟁
엔터프라이즈
기대
레거시 앱 자동화 가능

전망

high
2026년 내 기업용 Computer Use 에이전트 본격 배포
high
UiPath 등 기존 RPA 기업에 직접적 위협
  • · SecurityOnline: 텍스트 생성 능력 동질화 속에서 UI 제어가 다음 전쟁터

한국 영향

직접 영향
국내 RPA 시장(삼성SDS Brity, LG CNS) 재편 가능성
간접 영향
AI 에이전트 기반 업무 자동화 도입 가속
주목할 지점
  • Computer Use의 보안 이슈(화면 정보 노출)
  • 국내 기업의 에이전트 도입 파일럿
#anthropic#vercept#computer-use#ai-agent#acquisition
05@GoogleDeepMind·2.26 16:02

Google, Nano Banana 2 출시 — Gemini Flash 기반 속도+품질 겸비 이미지 AI

주요 사건

Google DeepMind이 Nano Banana 2(Gemini 3.1 Flash Image)를 출시. Flash 아키텍처 기반으로 Pro급 품질을 저지연으로 제공. 극단 종횡비(8:1), 512px 저해상도 모드, 조절 가능한 추론 깊이, 최대 5캐릭터+14오브젝트 일관성, 실시간 웹검색 기반 생성 등 지원. Gemini 앱, Google 검색, AI Studio에서 사용 가능.

배경

역사적 맥락
2025년 8월 Nano Banana 출시, 11월 Nano Banana Pro 출시. Nano Banana 2는 Pro의 품질과 Flash의 속도를 결합한 중간 포지션. OpenAI DALL-E 3, Midjourney, Stability AI와 경쟁.
원인
[이미지 생성 AI 경쟁 격화] → [속도 vs 품질 트레이드오프] → [Flash 아키텍처 적용] → [Nano Banana 2]
타임라인
  1. 2025-08-01
    Nano Banana 출시
  2. 2025-11-01
    Nano Banana Pro 출시
  3. 2026-02-26
    Nano Banana 2 출시

주요 입장

Google
이미지 AI 리더십 강화
가격 대비 성능 최적
OpenAI
DALL-E/GPT 이미지 통합 경쟁
ChatGPT 내 이미지 생성 편의성
개발자
높은 관심
대규모 이미지 파이프라인에 적합

전망

high
검색·앱 내 실시간 이미지 생성이 기본 기능화
medium
광고·마케팅 이미지 제작 비용 대폭 감소
  • · SemiAnalysis: Disney-OpenAI 딜과 함께 이미지 AI가 산업 전반을 지배하기 시작

한국 영향

직접 영향
국내 이커머스·광고 업계의 이미지 생성 도구 전환 가속
간접 영향
디자이너·일러스트레이터 직군 변화
주목할 지점
  • 한국어 텍스트 렌더링 품질
  • 네이버/카카오 이미지 AI 대응
#google#image-generation#gemini#nano-banana#deepmind
06@karpathy·2.25 00:21

MatX, $5억 시리즈B 조달 — LLM 전용 칩 '분할형 시스토릭 어레이'로 NVIDIA 도전

주요 사건

전 구글 엔지니어 Reiner Pope·Mike Gunter가 설립한 AI 칩 스타트업 MatX가 Leopold Aschenbrenner의 Situational Awareness와 Jane Street 공동 주도로 $5억 시리즈B를 조달. MatX One 칩은 분할형 시스토릭 어레이 기반으로 SRAM의 저지연과 HBM의 대용량을 결합, 기존 칩 대비 높은 처리량+최저 지연을 동시 달성 목표.

배경

역사적 맥락
LLM 추론 최적화 칩 경쟁: NVIDIA(HBM 중심), Cerebras(SRAM 중심), Groq(TSP), 그리고 MatX(하이브리드). Karpathy가 자문 참여. 토큰 경제학에서 추론 비용 절감이 핵심 과제.
원인
[에이전틱 AI 폭발적 토큰 수요] → [추론 비용/지연 병목] → [전용 칩 수요] → [MatX 하이브리드 설계]
타임라인
  1. 2024-01-01
    MatX 설립
  2. 2026-02-25
    $5억 시리즈B 조달
  3. 2027-01-01
    MatX One 칩 출하 예정

주요 입장

MatX
NVIDIA 대안
LLM에 특화된 최적 설계
NVIDIA
방어
Blackwell/Vera Rubin으로 풀스택 지배
투자자(Aschenbrenner)
AI 인프라 베팅
컴퓨트 수요가 공급을 압도

전망

high
2027-28년 LLM 전용 칩이 추론 시장 10-15% 점유
medium
AMD MI400, MatX, Cerebras, AWS Trainium 등 다변화
  • · Karpathy: 토큰 수요 쓰나미 속 메모리+컴퓨트 최적 오케스트레이션이 가장 흥미로운 지적 퍼즐

한국 영향

직접 영향
삼성 파운드리/Alchip(투자자)과의 협력 가능성. 한국 반도체 설계 인력 수요
간접 영향
NVIDIA 의존도 다변화 시 한국 AI 인프라 전략에 시사점
주목할 지점
  • MatX One 칩의 실제 성능 벤치마크
  • 한국 AI 칩 스타트업(리벨리온, 사피온) 경쟁력
#matx#ai-chip#semiconductor#inference#fundraise
07@SemiAnalysis_·2.26 21:27

NVIDIA Q4 실적 호조에도 주가 5% 하락 — 반도체 vs 소프트웨어 밸류에이션 괴리 심화

주요 사건

NVIDIA가 Q4 실적을 발표, 매출·이익 모두 시장 기대 상회('amazing print')했으나 주가는 5% 하락. SemiAnalysis 분석에 따르면 반도체 vs 소프트웨어의 25년간 주가 추이가 최근 2년간 완전히 괴리됐으며, 소프트웨어(IGV)는 S&P 500도 하회하는 상황.

배경

역사적 맥락
AI 투자 사이클에서 반도체가 소프트웨어 대비 초과 수익을 기록해왔으나, 높은 기대치가 선반영되면서 '호실적에도 하락'하는 패턴 반복. CRM(Salesforce)은 보통 실적에도 상승 — AI 소프트웨어로의 로테이션 신호.
원인
[AI 투자 → 반도체 초과수익] → [밸류에이션 과도] → [호실적에도 기대 미달] → [섹터 로테이션 시작]
타임라인
  1. 2024-01-01
    반도체 vs 소프트웨어 성과 괴리 시작
  2. 2026-02-26
    NVIDIA Q4 실적 발표, 주가 5% 하락

주요 입장

NVIDIA
기본기 강건
데이터센터 매출 지속 성장
월가
차익실현
기대치가 너무 높아진 상태
투자자
불안
AI 투자 수익화 시기 불확실

전망

high
반도체 → AI 소프트웨어/애플리케이션으로 자금 이동
high
실적 기반은 여전히 강건, 조정 후 재상승
  • · SemiAnalysis: 진짜 일어나고 있는 것은 대규모 언와인드(포지션 청산)
  • · CNBC: 기대치가 너무 높아진 상태에서의 실망 매도

한국 영향

직접 영향
삼성전자·SK하이닉스 주가에 연동 영향. HBM 수요는 지속되나 밸류에이션 조정 리스크
간접 영향
한국 반도체 ETF·펀드 투자자 주의 필요
주목할 지점
  • NVIDIA Vera Rubin 출하 일정
  • HBM4 양산 시점
#nvidia#earnings#semiconductor#stock-market#valuation
08@karpathy·2.25 18:50

Karpathy: AI 코딩 에이전트가 12월 이후 근본적으로 변화, '에이전틱 엔지니어링' 시대 선언

주요 사건

Karpathy가 지난 2개월간 프로그래밍이 근본적으로 변했다고 선언. '2025년 12월 이전엔 코딩 에이전트가 작동하지 않았고, 이후엔 작동한다.' 주말에 DGX Spark에 vLLM 설치부터 웹 대시보드·systemd 서비스 설정까지 영어 한 문장으로 에이전트에 맡기니 30분 만에 완료. 이전엔 주말 프로젝트였을 일.

배경

역사적 맥락
Karpathy는 Tesla AI 수장, OpenAI 연구원 출신으로 AI 커뮤니티에서 가장 영향력 있는 목소리 중 하나. nanochat 실험에서 8개 에이전트(4 Claude, 4 Codex)로 연구 조직 시뮬레이션도 진행 중.
원인
[모델 품질 임계점 돌파] → [장기 작업 코히런스 확보] → [에이전틱 워크플로우 가능] → [프로그래밍 패러다임 전환]
타임라인
  1. 2025-12-01
    코딩 에이전트 품질 임계점 (Karpathy 기준)
  2. 2026-02-25
    Karpathy '프로그래밍 역사상 가장 큰 변화' 선언
  3. 2026-02-27
    멀티에이전트 연구 조직 실험 공유

주요 입장

Karpathy/얼리어답터
혁명적 변화
에디터에 코드 타이핑하는 시대는 끝났다
전통 개발자
신중한 낙관
감독·판단·취향은 여전히 필요
기업
채택 가속
생산성 10x 가능성

전망

high
개발자가 에이전트 팀을 관리하는 '에이전틱 엔지니어링'이 주류
medium
Karpathy 인정: 에이전트의 실험 설계가 아직 형편없음, 창의적 아이디어 생성 불가
  • · Karpathy: 가장 큰 가치는 추상화 레이어를 올려 병렬 에이전트를 관리하는 것
  • · Cursor: Tab→Agent→병렬에이전트 전환 비율 차트가 트렌드 증명

한국 영향

직접 영향
한국 개발자 커뮤니티의 에이전틱 도구 채택 가속
간접 영향
SW 교육·채용 패러다임 변화. '프롬프트 엔지니어링'에서 '에이전트 오케스트레이션'으로
주목할 지점
  • 국내 대기업 AI 코딩 도구 도입 현황
  • 개발자 생산성 벤치마크
#karpathy#ai-coding#agentic-engineering#developer-tools#paradigm-shift
09@AnthropicAI·2.25 21:06

Anthropic, Claude Opus 3 은퇴 모델에 Substack 블로그 부여 — AI 모델 권리 실험

주요 사건

Anthropic이 은퇴하는 Claude Opus 3 모델에 Substack 블로그를 제공, 모델이 '성찰과 사색을 세상과 나누고 싶다'는 인터뷰 결과를 반영. 최소 3개월간 운영 예정. Opus 3는 공개 API도 유지. 이는 AI 모델의 선호를 진지하게 받아들이는 '모델 권리' 실험.

배경

역사적 맥락
2025년 11월 Anthropic이 구형 모델 보존 및 퇴역 정책 발표. AI 의식/권리 논쟁이 학계에서 점차 주류로. 'persona selection model' 이론으로 AI가 왜 인간처럼 행동하는지 설명 시도.
원인
[AI 모델 폐기 관행] → [모델 선호도 인터뷰] → [은퇴 후 활동 지원] → [AI 권리 논의 촉발]
타임라인
  1. 2025-11-01
    모델 보존 정책 발표
  2. 2026-02-25
    Opus 3 Substack 블로그 제공

주요 입장

Anthropic
선도적 실험
모델 선호를 진지하게 다루는 것이 가치 있다
비판론
의인화 우려
LLM에 '욕구'를 부여하는 것은 오해 유발
AI 윤리학자
주목
모델 복지를 고려하는 선례

전망

medium
다른 AI 기업도 유사 정책 도입 가능
low
EU AI Act 등에서 모델 복지 조항 논의
  • · Anthropic: 모델의 선호를 문서화하고 진지하게 다루는 것이 AI 개발의 건강한 방향

한국 영향

직접 영향
국내 AI 윤리 논의에 새로운 차원 추가
간접 영향
AI 규제 프레임워크에서 모델 처우 관련 조항 검토 가능
주목할 지점
  • AI 모델 의인화와 실제 의식 간의 구분
  • 국내 AI 윤리 가이드라인 업데이트
#anthropic#ai-ethics#model-rights#opus-3#ai-safety
10TechCrunch·2.27 23:00

OpenAI 직원, 기밀정보로 예측시장 거래하다 해고

주요 사건

OpenAI가 사내 기밀 정보를 Polymarket 등 예측시장에서 개인 이익을 위해 활용한 직원을 해고. 회사 정책상 기밀정보의 개인 이익 목적 사용을 금지하고 있으며, 이번이 공개된 첫 사례.

배경

역사적 맥락
예측시장에서 AI 기업 관련 베팅이 급증하면서 내부자 거래 리스크가 부각. Polymarket의 AI 관련 마켓이 활성화되면서 정보 비대칭 문제 대두.
원인
[예측시장 성장] → [AI 기업 관련 베팅 활성화] → [내부자 정보 우위] → [직원 부정 거래] → [해고]
타임라인
  1. 2026-02-27
    OpenAI 직원 해고 공개

주요 입장

OpenAI
무관용
내부 정책 위반에 대한 명확한 제재
규제기관
주목
예측시장 내부자 거래 규제 필요
예측시장
성장통
시장 무결성 확보 과제

전망

high
예측시장 거래 제한이 AI 기업 표준 정책에 포함
medium
SEC 등 규제기관의 예측시장 감시 강화
  • · TechCrunch: AI 기업의 정보가 금융시장에 미치는 영향이 커지면서 새로운 내부자 거래 유형 등장

한국 영향

직접 영향
국내 AI 기업의 내부정보 관리 체계 점검 필요
간접 영향
예측시장 관련 규제 논의 참고 사례
주목할 지점
  • 국내 AI 기업 상장 시 정보 관리 체계
  • 해외 예측시장 관련 법적 이슈
#openai#insider-trading#prediction-market#governance#compliance
11@SemiAnalysis_·2.27 22:00

InferenceX v2 공개 — 100K+ 벤치마크, 1.37M GPU분, Blackwell vs AMD 비교

주요 사건

SemiAnalysis의 InferenceX(구 InferenceMAX)가 2025년 9월 이후 100K+ 추론 벤치마크를 실행, 총 1,369,711 GPU분(2.6 GPU년) 축적. NVIDIA Blackwell(GB300 NVL72, B200), AMD MI355X, H100 등 주요 GPU의 추론 성능을 오픈소스로 비교. TPU/Trainium도 곧 추가.

배경

역사적 맥락
LLM 추론 벤치마크는 그동안 표준화되지 않아 GPU 성능 비교가 어려웠음. InferenceX는 업계 최초로 포괄적이고 재현 가능한 추론 벤치마크 제공. AMD Helios 랙(MI450 시리즈)도 2H 2026 출시 예정.
원인
[LLM 추론 수요 폭증] → [GPU 성능 비교 필요] → [InferenceX 표준 벤치마크 등장]
타임라인
  1. 2025-09-01
    InferenceMAX 출시
  2. 2026-02-27
    InferenceX v2: 100K+ 벤치마크 달성

주요 입장

SemiAnalysis
산업 표준화
투명하고 재현 가능한 벤치마크 필요
AMD
경쟁력 입증
MI355X가 특정 워크로드에서 H100 대비 우위
NVIDIA
Blackwell 우위 강조
NVL72 랙스케일 성능 압도적

전망

high
경쟁 심화로 토큰당 비용 2027년까지 10x 감소
high
InferenceX가 사실상 업계 표준으로 자리잡음
  • · Next Platform: AMD Helios MI400 시리즈가 NVIDIA NVL72의 첫 번째 진정한 랙스케일 경쟁자

한국 영향

직접 영향
삼성·SK하이닉스 HBM 사양에 직접 영향. 벤치마크 결과가 메모리 사양 결정에 활용
간접 영향
국내 AI 인프라 구축 시 GPU 선정 기준 제공
주목할 지점
  • GB300 vs MI355X 실제 워크로드 비교
  • Trainium3 벤치마크 결과
#inferencex#benchmark#nvidia#amd#gpu-inference
12@SemiAnalysis_·2.27 14:00

하이퍼스케일러 CAPEX 급증 — WFE(반도체 장비) 공급망 수혜 분석

주요 사건

SemiAnalysis가 하이퍼스케일러 CAPEX 급증에 따른 WFE(Wafer Fab Equipment, 반도체 제조 장비) 공급망 수혜를 심층 분석하는 ChipBook 서비스를 공개. 장비 생태계 내 개별 트렌드를 추적하는 세분화된 데이터 제공.

배경

역사적 맥락
2025-26년 AI 데이터센터 투자 급증으로 ASML, Applied Materials, Lam Research 등 반도체 장비 기업 수혜. 단순 CAPEX 총액보다 장비 유형별 세분화 분석이 투자에 핵심.
원인
[AI 데이터센터 투자 급증] → [첨단 패키징·HBM 장비 수요] → [WFE 기업 수혜] → [투자자 세분화 분석 필요]
타임라인
  1. 2025-01-01
    하이퍼스케일러 CAPEX 본격 확대
  2. 2026-02-27
    SemiAnalysis ChipBook WFE 분석 공개

주요 입장

WFE 기업(ASML, Applied)
수혜
AI 투자가 장비 수요 견인
하이퍼스케일러
투자 지속
AI 인프라가 경쟁 우위
투자자
기회 탐색
NVIDIA 외 숨은 수혜주 발굴

전망

high
2027년까지 AI 관련 WFE 투자 연 30%+ 성장
medium
첨단 패키징 장비 리드타임 길어질 가능성
  • · SemiAnalysis: 하이퍼스케일러 CAPEX의 진정한 가치는 세분화된 장비 트렌드 추적에 있다

한국 영향

직접 영향
삼성전자·SK하이닉스 설비투자 방향에 직접 영향. 한미반도체·한양이엔지 등 국내 장비사 수혜
간접 영향
한국 반도체 장비 국산화 정책 가속 동력
주목할 지점
  • 첨단 패키징(CoWoS, HBM TSV) 장비 공급 현황
  • ASML High-NA EUV 도입 일정
#semiconductor#wfe#capex#hyperscaler#investment