NVIDIA Blackwell 4개월 만에 추론 성능 3.25배 향상, GPU 렌탈 가격 급등 속 AI 인프라 경쟁 가속 — Meta AI 모델 지연, AMI Labs 10억 달러 유치로 세계 모델 도전
- NVIDIA Blackwell B200 DeepSeek FP4 추론 성능 4개월 만에 400→1300 tok/s/gpu로 3.25배 향상
- 에이전틱 코딩 수요·DRAM 가격 상승으로 GPU 렌탈 가격 급등, 네오클라우드 고객 협상력 약화
- Meta 차세대 AI 모델 'Avocado' 출시 연기 — Google·OpenAI·Anthropic 대비 성능 부족
- Yann LeCun의 AMI Labs, 세계 모델 기반 AI 접근법으로 10.3억 달러 시리즈A 유치
- Anthropic, Jack Clark 주도 'Anthropic Institute' 설립 — AI의 사회적 영향 연구
- Claude Opus 4.6, Mozilla Firefox에서 2주 만에 22개 보안 취약점 발견 (14개 고위험)
- TSMC N2 SRAM 비트셀 면적 2개 노드 연속 정체 — Intel 18A가 오히려 0.77x 축소 달성
- OpenAI, Promptfoo 인수로 에이전틱 보안 테스팅 강화
NVIDIA Blackwell B200, 4개월 만에 DeepSeek 추론 성능 3.25배 향상 — 소프트웨어 최적화의 위력
주요 사건
SemiAnalysis에 따르면 NVIDIA Blackwell B200의 DeepSeek FP4 추론 성능이 불과 4개월 사이에 GPU당 400 tok/s에서 1,300 tok/s로 3.25배 향상됐다. 동일 하드웨어에서 소프트웨어 스택(TensorRT-LLM, 커널 최적화, FP4 양자화 개선) 만으로 이뤄진 성과로, 95 tok/s/user 인터랙티비티 기준 측정.
배경
- 2024-03-18NVIDIA GTC 2024에서 Blackwell 아키텍처 발표
- 2025-01-01B200 GPU 양산 출하 시작
- 2025-11-01B200 DeepSeek FP4 추론 성능 ~400 tok/s/gpu 측정
- 2026-03-13동일 하드웨어에서 1,300 tok/s/gpu 달성 (3.25x)
주요 입장
전망
- · SemiAnalysis: NVIDIA의 소프트웨어 모트가 하드웨어 경쟁보다 더 강력한 진입장벽
한국 영향
- Blackwell Ultra 출하 일정
- 국내 네오클라우드의 B200 도입 현황
참고 자료
GPU 렌탈 가격 급등 — 에이전틱 코딩 수요 폭증과 DRAM 가격 상승이 원인
주요 사건
SemiAnalysis에 따르면 NVIDIA GPU 렌탈 가격이 다시 급등하고 있으며 네오클라우드 용량이 매진되고 있다. 2024년 중반~2025년 3분기까지는 고객 우위 시장이었으나, 에이전틱 코딩(Codex, Cursor 등) 수요 급증과 DRAM 가격 상승으로 고객 협상력이 약화.
배경
- 2024-06-01GPU 렌탈 시장 고객 우위 시작
- 2025-10-01가격 바닥 형성
- 2026-01-01에이전틱 코딩 수요 급증 시작
- 2026-03-13GPU 렌탈 가격 급등, 용량 매진 보고
주요 입장
전망
- · SemiAnalysis: 에이전틱 코딩이 GPU 수요의 새로운 주력 카테고리
한국 영향
- DRAM 가격 추이
- 국내 클라우드 GPU 가격 동향
Meta, 차세대 AI 모델 'Avocado' 출시 연기 — Google·OpenAI·Anthropic 대비 추론·코딩 성능 부족
주요 사건
Meta가 차세대 AI 모델 'Avocado'의 출시를 연기했다. 내부 테스트에서 Google, OpenAI, Anthropic의 경쟁 모델 대비 추론, 코딩, 글쓰기 성능에서 뒤처진 것이 원인. FirstSquawk이 보도하고 swyx 등 업계 인사들이 공유.
배경
- 2025-06-01Meta Superintelligence Labs 출범
- 2026-03-05OpenAI GPT-5.4 출시
- 2026-03-13Meta Avocado 모델 출시 연기 보도
주요 입장
전망
- · swyx: Meta의 지연은 프론티어 경쟁의 기술 난이도를 보여주는 신호
한국 영향
- Avocado 재출시 일정
- Llama 4 시리즈 업데이트
TSMC N2 노드 SRAM 비트셀 면적 2세대 연속 정체 — Intel 18A가 오히려 0.77x 축소
주요 사건
SemiAnalysis가 ISSCC 데이터를 인용해 TSMC의 N2 노드 SRAM 비트셀 면적이 거의 개선되지 않았다고 보고. MediaTek의 발표에 따르면 N3E High Current 비트셀은 N5 대비 오히려 퇴보했으며, N2도 미미한 개선에 그침. 반면 Intel 18A는 0.77x 축소를 달성.
배경
- 2022-12-01TSMC N3 양산 시작
- 2025-12-01SemiWiki: TSMC N2 SRAM 스케일링 정체 논의
- 2026-03-13ISSCC 데이터 기반 N2 SRAM 정체 확인, Intel 18A 비교
주요 입장
전망
- · SemiAnalysis: 로직 밀도만으로 노드 우위를 판단하는 시대 종료
한국 영향
- 삼성 2nm SRAM 벤치마크
- TSMC A14 SRAM 로드맵
Yann LeCun의 AMI Labs, 세계 모델 기반 AI로 10.3억 달러 시리즈A 유치 — LLM 패러다임에 도전
주요 사건
Yann LeCun이 창업한 AMI(Advanced Machine Intelligence) Labs가 35억 달러 프리머니 밸류에이션에 10.3억 달러 시리즈A를 유치. Cathay Innovation, Greycroft, Bezos Expeditions 등이 공동 리드. LLM 기반 접근법의 한계를 지적하며 추론·계획·세계 모델 기반의 대안적 AI 아키텍처를 추구.
배경
- 2013-12-01LeCun이 Facebook AI Research(FAIR) 설립
- 2025-12-01LeCun Meta 퇴사
- 2026-01-01AMI Labs 설립
- 2026-03-1010.3억 달러 시리즈A 유치 발표
주요 입장
전망
- · Reuters: AMI의 초기 타겟은 제조·항공우주·바이오 분야의 복잡 시스템 운영
- · LeCun: Meta Ray-Ban 스마트 글라스에도 적용 가능성 논의 중
한국 영향
- AMI Labs 첫 제품 출시 일정
- 국내 세계 모델 연구 현황
Anthropic, 'Anthropic Institute' 설립 — Jack Clark 주도로 AI의 사회적 영향 연구 본격화
주요 사건
Anthropic이 'Anthropic Institute'를 설립, AI의 일자리·안보·사회적 영향을 연구하는 조직을 출범. Anthropic 공동창업자 Jack Clark이 'Head of Public Benefit'이라는 새 직함으로 이끌며, ML 엔지니어·경제학자·사회과학자로 구성된 학제간 팀 운영.
배경
- 2021-01-01Anthropic 설립
- 2026-03-11Anthropic Institute 설립 발표
주요 입장
전망
- · eWeek: 프론티어 랩의 내부 정보를 활용한 정책 연구는 전례 없는 시도
한국 영향
- 첫 연구 보고서 발표
- 국내 AI 기업의 유사 기구 설립 동향
Claude Opus 4.6, Mozilla Firefox에서 2주간 22개 보안 취약점 발견 — 14개 고위험
주요 사건
Anthropic이 Mozilla와 협력해 Claude Opus 4.6으로 Firefox 코드베이스의 보안 취약점을 탐색한 결과, 2주 만에 22개 취약점을 발견. 이 중 14개가 고위험(high-severity)으로, Mozilla가 2025년 전체에 해결한 고위험 버그의 1/5에 해당. Anthropic은 '프론티어 모델이 이제 세계적 수준의 취약점 연구자'라고 평가하면서도, 아직 발견보다 익스플로잇 능력은 낮다고 분석.
배경
- 2026-02-20Anthropic-Mozilla 보안 연구 파트너십 시작 (추정)
- 2026-03-062주간 22개 취약점 발견 결과 발표
주요 입장
전망
- · Anthropic: 발견 능력이 익스플로잇 능력을 앞서지만 이 격차는 오래 지속되지 않을 것
한국 영향
- AI 보안 감사 서비스 상용화
- 국내 오픈소스 프로젝트 적용 사례
OpenAI, Promptfoo 인수 — 에이전틱 AI 보안 테스팅·레드팀 역량 Frontier에 통합
주요 사건
OpenAI가 AI 보안 플랫폼 Promptfoo 인수를 발표. Promptfoo는 LLM 애플리케이션의 레드팀·평가·컴플라이언스 도구로 Fortune 500 기업의 25% 이상이 사용, 오픈소스 CLI는 35만+ 개발자가 활용. 인수 후 OpenAI Frontier 플랫폼에 통합 예정이며, 오픈소스 프로젝트는 유지.
배경
- 2024-01-01Promptfoo 설립
- 2026-03-09OpenAI 인수 발표
주요 입장
전망
- · TechInformed: Promptfoo의 기술이 OWASP LLM Top 10 위험 카테고리와 정확히 맞물림
한국 영향
- Promptfoo 오픈소스 라이선스 유지 여부
- 국내 AI 보안 규제 동향
Karpathy 'autoresearch' — AI 에이전트가 48시간 만에 700개 실험, 11% 성능 향상 달성
주요 사건
Andrej Karpathy가 'autoresearch' 프로젝트를 공개. AI 에이전트에게 nanochat LLM 훈련 코드를 자율적으로 최적화시킨 결과, 48시간 동안 약 700개 변경을 시도해 20개 실질적 개선을 발견, GPT-2 훈련 시간을 2.02시간→1.80시간으로 11% 단축. 이 개선들은 더 큰 모델에도 전이됨.
배경
- 2026-03-05nanochat이 GPT-2를 2시간 만에 훈련 (ClimbMix 데이터셋)
- 2026-03-07autoresearch 오픈소스 레포 공개
- 2026-03-0948시간 자율 실험 결과 발표 — 11% 성능 향상
주요 입장
전망
- · Karpathy: '모든 프론티어 랩이 이것을 할 것이다. 이것이 최종 보스전이다.'
- · eli5defi: '20년 경력 연구자도 놓친 개선을 에이전트가 찾았다는 사실이 핵심'
한국 영향
- autoresearch의 대규모 모델 적용 결과
- 국내 연구 그룹 도입 사례
xAI Grok 4.20 베타 출시 — Opus 4.5급 성능에 빠른 추론, 낮은 가격
주요 사건
xAI가 Grok 4.20 베타를 출시. 사용자 리뷰에 따르면 Anthropic Claude Opus 4.5급 성능을 보이면서도 추론 속도가 상당히 빠르고 가격이 저렴. Elon Musk가 관련 트윗을 리트윗하며 'xAI about to fly'라는 반응을 공유.
배경
- 2023-07-01xAI 설립
- 2026-03-12Grok 4.20 베타 출시
주요 입장
전망
- · slow_developer: Grok 4.20이 가성비 기준으로 매우 강력
한국 영향
- Grok 4.20 정식 출시 일정
- 한국어 성능 벤치마크
SemiAnalysis, Anthropic Opus 4·5·6 아키텍처와 연간 지출 규모 분석 공개
주요 사건
SemiAnalysis의 Dylan Patel이 Anthropic Claude Opus 4, 5, 6의 아키텍처와 연간 컴퓨트 지출 규모(runrate)에 대한 심층 분석 영상을 공개. 프론티어 AI 모델의 아키텍처 선택과 훈련 비용 구조에 대한 업계 내부 분석.
배경
- 2024-03-01Claude Opus 3 출시
- 2025-06-01Claude Opus 4 출시 (추정)
- 2026-03-13SemiAnalysis Opus 4/5/6 아키텍처 분석 공개
주요 입장
전망
- · SemiAnalysis: Anthropic의 컴퓨트 runrate는 업계에서 가장 빠르게 증가 중
한국 영향
- Anthropic Opus 5 출시 시점
- 국내 AI 컴퓨트 예산 규모
Evan You, Void 플랫폼 출시 — Vite 네이티브 배포 + 자동 인프라 프로비저닝
주요 사건
Vue.js·Vite 창시자 Evan You가 Void 플랫폼을 발표. Vite 네이티브 배포 플랫폼으로, DB·KV·스토리지·AI·크론·큐 등 인프라를 코드 기반으로 자동 프로비저닝. Vite+ SDK와 통합되어 개발·테스트·배포를 하나의 도구 체인으로 통합.
배경
- 2021-09-01swyx 'Your Code is Your Infra' 에세이 발표
- 2026-03-13Evan You Void 플랫폼 발표
주요 입장
전망
- · swyx: 5년 전 예측이 현실이 됐다
한국 영향
- Void 정식 출시 및 가격 정책
- 국내 도입 사례
Karpathy, '에이전트 커맨드 센터' IDE 비전 제시 — 프로그래밍의 기본 단위가 파일에서 에이전트로
주요 사건
Karpathy가 IDE의 미래에 대한 비전을 제시. 'IDE 시대가 끝나는 것이 아니라, 더 큰 IDE가 필요하다'는 주장. 프로그래밍의 기본 단위가 파일에서 에이전트로 바뀌고, 인간은 더 높은 추상화 수준에서 에이전트 팀을 관리하는 '에이전트 커맨드 센터' 개념. 또한 '에이전틱 조직을 포크할 수 있다'는 아이디어도 제시.
배경
- 2021-06-01GitHub Copilot 출시
- 2024-01-01Cursor 등 AI IDE 대중화
- 2026-03-11Karpathy '에이전트 커맨드 센터' IDE 비전 제시
주요 입장
전망
- · Karpathy: '인간 조직은 포크할 수 없지만, 에이전틱 조직은 포크할 수 있다'
한국 영향
- 에이전트 IDE 스타트업 동향
- Cursor/Windsurf 에이전트 기능 업데이트
AI 서버 ODM 매출 급증 — 하이퍼스케일러 서버 출하량의 바로미터
주요 사건
SemiAnalysis가 AI 서버 ODM(주문자개발생산) 업체들의 매출 성장률을 분석. 하이퍼스케일러와 데이터센터 운영자들의 서버 출하 수준을 파악하는 핵심 지표로, 지속적인 성장과 가속을 확인.
배경
- 2024-01-01AI 서버 수요 급증 시작
- 2026-03-13SemiAnalysis ODM 매출 분석 공개
주요 입장
전망
- · SemiAnalysis: ODM 매출 추이가 AI 인프라 실수요를 가장 정확히 반영
한국 영향
- 대만 ODM 월간 매출 추이
- 국내 서버 부품 수출 동향