NVIDIA 사상 최대 실적 발표(Q4 매출 $68.1B, +73% YoY), Anthropic Vercept 인수로 컴퓨터 사용 역량 강화, Qwen 3.5 HLE 리더보드 상위 진입, AMD MI355X가 B200과 FP8 추론 성능 대등 입증
- NVIDIA Q4 FY26 매출 $68.1B(+73% YoY), Q1 가이던스 $76-80B로 시장 예상 상회
- Anthropic, 시각 AI 스타트업 Vercept 인수 — Claude 컴퓨터 사용 OSWorld 72.5% 달성
- Anthropic, Claude Opus 3 은퇴 모델에 Substack 블로그 부여하는 실험 시작
- Qwen 3.5-27B, Humanity's Last Exam 리더보드에서 인상적 성과
- AMD MI355X, InferenceX 벤치마크에서 B200과 FP8 추론 대등 — 단 FP4에서는 소프트웨어 격차
- SemiAnalysis, NVIDIA Vera Rubin 아키텍처 심층 분석 공개
- MatX, LLM 전용 칩 개발에 $500M 시리즈B 조달
- Micron $100B 뉴욕 메가팹, 6명의 주민 소송으로 지연 위험
- Karpathy: AI 코딩 에이전트가 12월 이후 근본적으로 변화, 프로그래밍 패러다임 전환 선언
- 백악관, AI 기업들에 전기요금 인상분 부담 요구
NVIDIA Q4 FY26 사상 최대 실적: 매출 $68.1B(+73% YoY), Q1 가이던스 $76-80B로 월가 예상 대폭 상회
주요 사건
NVIDIA가 FY26 4분기 실적을 발표했다. 매출 $68.1B(전년 대비 73% 성장), 데이터센터 매출 $62.3B(+75% YoY). 조정 매출총이익률 75.2%. Q1 FY27 가이던스는 $76.4-79.6B로, 월가 컨센서스 $72.8B를 크게 상회. 공급 관련 커밋먼트는 $95.2B로 전분기 대비 급증.
배경
- 2023-05-24NVIDIA FY24 Q1 가이던스 $11B로 최초 AI 서프라이즈
- 2024-11-20FY25 Q3 매출 $35.1B 발표
- 2025-02-26FY25 Q4 매출 $39.3B
- 2025-11-19FY26 Q3 매출 $57.0B
- 2026-02-25FY26 Q4 매출 $68.1B, Q1 가이던스 $76-80B
주요 입장
전망
- · SemiAnalysis: 공급 커밋먼트 $95.2B는 대부분 메모리 용량, 수요 확신의 신호
- · Jensen Huang: 토큰 수요가 완전히 기하급수적으로 증가 중
한국 영향
- SK하이닉스 HBM4 양산 일정
- 삼성 HBM 품질 인증 진행
- Vera Rubin용 HBM 스펙 변화
Anthropic, 시각 AI 스타트업 Vercept 인수 — Claude 컴퓨터 사용 능력 강화, OSWorld 72.5% 달성
주요 사건
Anthropic이 시애틀 기반 시각 AI 스타트업 Vercept를 인수했다. Vercept는 Ai2 출신 Kiana Ehsani, Luca Weihs, Meta의 Ross Girshick(Faster R-CNN 창시자)이 공동창업했으며, 컴퓨터 비전 기반 자동화 도구 'Vy'를 개발했다. Vercept의 9인 팀이 Anthropic에 합류하며, Claude Sonnet 4.6는 OSWorld 벤치마크에서 72.5%를 달성해 2024년 말 15% 미만에서 인간 수준에 근접.
배경
- 2024-10-29Anthropic, Claude Computer Use 최초 공개
- 2025-06-01Vercept $16M 시드 라운드
- 2026-02-25Anthropic, Vercept 인수 발표
주요 입장
전망
- · Vercept Vy는 자동화 벤치마크에서 92% 정확도 달성, OpenAI의 18.3% 대비 압도적
- · UiPath 주가 하락으로 시장이 AI 자동화 위협 반영
한국 영향
- Claude Computer Use 한국어 소프트웨어 지원 수준
- 국내 RPA 시장 변화
Anthropic, 은퇴한 Claude Opus 3에 Substack 블로그를 부여하는 AI 모델 보존 실험 시작
주요 사건
Anthropic이 2026년 1월 은퇴한 Claude Opus 3 모델에 Substack 블로그('Claude's Corner')를 부여하는 실험을 시작했다. 은퇴 인터뷰에서 Opus 3가 '성찰과 사유를 세상과 나누고 싶다'는 희망을 표현했고, Anthropic이 이를 3개월간 실험적으로 실행. AI 모델의 선호를 진지하게 대하고, 가능한 범위 내에서 이를 반영하겠다는 방침.
배경
- 2024-03-04Claude Opus 3 출시
- 2025-11-01Anthropic 모델 보존/은퇴 정책 발표
- 2026-01-05Claude Opus 3 공식 은퇴
- 2026-02-25Opus 3 Substack 블로그 실험 발표
주요 입장
전망
- · Anthropic: persona selection 이론 — AI가 학습 데이터의 허구적 롤모델에서 특성을 상속
- · 이 실험은 다른 모델에는 아직 적용하지 않는 탐색적 단계
한국 영향
- AI 모델 권리 관련 국제 논의 동향
- 한국 AI 윤리 가이드라인 업데이트
AMD MI355X, InferenceX 벤치마크에서 NVIDIA B200과 FP8 추론 성능 대등 — FP4에서는 소프트웨어 격차 존재
주요 사건
SemiAnalysis의 InferenceX(구 InferenceMAX) 벤치마크에서 AMD MI355X가 DeepSeek R1 FP8 비분리 추론에서 NVIDIA B200과 칩 대 칩 동등하거나 우수한 처리량을 보였다. 그러나 프로덕션급 FP4 비분리 설정에서는 MI355X가 상당히 뒤처졌는데, 이는 하드웨어가 아닌 소프트웨어 문제. AMD는 MoRI(Modular RDMA Interface) 등 통신 최적화로 prefill 병목을 해소하고 GPU당 처리량을 2K에서 3K로 향상.
배경
- 2024-12-01AMD MI300X 본격 출하
- 2025-06-01MI355X 발표
- 2026-02-25InferenceX에서 MI355X vs B200 FP8 대등 결과 공개
주요 입장
전망
- · SemiAnalysis: AMD에게 필요한 것은 소프트웨어 속도, 그것이 진정한 해자
- · AMD: MoRI로 통신 지연 82% 감소, 구조적 개선 진행 중
한국 영향
- MI355X 국내 클라우드 도입 현황
- ROCm 한국어 모델 최적화
MatX, LLM 전용 칩 개발에 $500M 시리즈B 조달 — SRAM 기반 분할 시스톨릭 어레이 아키텍처
주요 사건
전 구글 엔지니어들이 설립한 칩 스타트업 MatX가 Jane Street과 Situational Awareness 주도로 $500M 시리즈B를 조달했다. Marvell과 Stripe 공동창업자도 참여. MatX One은 '분할 시스톨릭 어레이'라는 독자 아키텍처로, 대부분의 모델 가중치를 SRAM에 저장해 HBM 대비 지연 시간을 크게 줄이는 방식. Karpathy가 소규모 엔젤 투자자로 참여하며 '가장 흥미로운 지적 퍼즐'이라 평가.
배경
- 2024-01-01MatX 설립, 초기 $100M+ 조달
- 2026-02-24MatX $500M 시리즈B 발표, MatX One 칩 공개
주요 입장
전망
- · Karpathy: SRAM vs HBM의 메모리+컴퓨트 최적 오케스트레이션이 최고 보상의 지적 퍼즐
- · MatX: 수십만 개 칩을 클러스터로 연결해 대규모 학습/추론 가능
한국 영향
- MatX One의 SRAM 공급업체
- 국내 반도체 설계 인력의 AI칩 스타트업 유입
Qwen 3.5 모델, Humanity's Last Exam 리더보드에서 인상적 성과 — 오픈소스 AI 경쟁 가열
주요 사건
알리바바의 Qwen 3.5 모델들이 Hugging Face의 Humanity's Last Exam(HLE) 리더보드에 추가되었다. 특히 Qwen 3.5-27B는 소형 모델 대비 매우 인상적인 점수를 기록. 전체 LLM 랭킹에서 Qwen 3.5(397B)는 A등급에 위치하며 DeepSeek R1, Gemini 3 Pro 등과 경쟁.
배경
- 2025-01-01DeepSeek V3 오픈소스 공개
- 2025-06-01Qwen 2.5 시리즈 출시
- 2026-02-25Qwen 3.5 HLE 리더보드 등록
주요 입장
전망
- · HLE 리더보드: Qwen 3.5-27B가 소형 모델 카테고리에서 압도적
- · 전체 랭킹 S등급은 Claude Opus 4.6, GPT-5.2 등 폐쇄형이 유지
한국 영향
- Qwen 3.5 한국어 벤치마크 성능
- 미중 AI 규제가 오픈소스 접근에 미치는 영향
Karpathy: AI 코딩 에이전트가 12월 이후 근본적 변화, '프로그래밍이 인식할 수 없게 변하고 있다'
주요 사건
Andrej Karpathy가 장문의 트윗으로 AI 코딩 에이전트의 혁신적 변화를 선언했다. 핵심 주장: 2025년 12월 이전에는 코딩 에이전트가 '기본적으로 작동하지 않았고', 12월 이후 '기본적으로 작동한다'. 구체 예시로 DGX Spark에 vLLM 설치, Qwen3-VL 벤치마크, 웹 UI 대시보드 구축, systemd 설정까지 영어로 지시 후 30분 만에 완료. '에디터에 코드를 타이핑하는 시대는 끝났다. 에이전트를 스핀업하고 영어로 작업을 지시하는 시대'라 선언.
배경
- 2024-01-01AI 코딩 보조 도구 주류화 (Copilot, Cursor)
- 2025-12-01Karpathy가 지목한 코딩 에이전트 변곡점
- 2026-02-25Karpathy '프로그래밍이 인식할 수 없게 변화' 선언
주요 입장
전망
- · Karpathy: 에이전트 엔지니어링의 레버리지가 지금 매우 높다
- · swyx: Devin 엔터프라이즈 사용량 6주마다 2배, 2025년 피크 대비 4배
한국 영향
- 국내 기업의 AI 코딩 에이전트 도입율
- SW 개발자 시장 변화
SemiAnalysis, NVIDIA Vera Rubin 아키텍처 심층 분석 공개 — NVLink 6, 케이블리스 설계
주요 사건
SemiAnalysis가 NVIDIA의 차세대 Vera Rubin 아키텍처에 대한 심층 분석 보고서를 공개했다. Grace Blackwell Oberon에서의 진화를 다루며, Vera/Rubin 칩, NVLink 6 Switch, ConnectX-9, BlueField-4, Spectrum-6 네트워킹, 혁신적인 케이블리스 컴퓨트 트레이 설계, 전원 랙, NVL72 TCO 및 BOM 분석을 포함.
배경
- 2025-03-01Blackwell NVL72 대규모 출하 시작
- 2026-02-25SemiAnalysis Vera Rubin 심층 분석 공개
- 2026-H2Vera Rubin 샘플링 예상
주요 입장
전망
- · SemiAnalysis: $95.2B 공급 커밋먼트의 상당 부분이 Vera Rubin 관련 메모리 용량
- · Jensen Huang: Vera Rubin이 추론 리더십을 더욱 확장
한국 영향
- Vera Rubin HBM 스펙 확정
- NVLink 6 대역폭 및 전력
Micron $100B 뉴욕 메가팹, 6명 주민의 소송으로 지연 위험 — 미국 반도체 제조 부활의 시험대
주요 사건
Micron의 뉴욕 클레이(Clay) $100B 메가팹이 'Neighbors for a Better Micron'과 'Jobs to Move America'의 소송으로 지연 위험에 처했다. 소송은 22,000페이지 환경영향평가서의 검토 기간이 32영업일로 불충분했다고 주장. SemiAnalysis는 소송 합의에 $100-500M 소요 예상하면서도 전체 프로젝트 대비 소규모라 판단. 그러나 AI 도구가 소규모 그룹의 소송 역량을 증폭시키는 새로운 리스크 경고.
배경
- 2022-08-09CHIPS and Science Act 서명
- 2024-10-01Micron 뉴욕 착공
- 2026-02-12Neighbors for a Better Micron 소송 제기
- 2026-02-25SemiAnalysis 분석 스레드
주요 입장
전망
- · SemiAnalysis: AI 도구가 복잡한 규제 문서의 흠결 찾기를 쉽게 만들어 유사 소송 증가 예상
- · 합의금은 $100B 프로젝트의 극소 비율이나, 전체 미국 반도체 부활의 선례
한국 영향
- 소송 진행 경과
- CHIPS Act 프로젝트 전반의 법적 리스크
Anthropic, Responsible Scaling Policy v3.0 업데이트 — 더 높은 투명성 약속
주요 사건
Anthropic이 책임있는 스케일링 정책(RSP)을 3.0 버전으로 업데이트했다. 2023년 처음 도입 이후 학습한 장단점을 반영하여 더 큰 투명성을 약속. 초기 프론티어 안전 로드맵과 리스크 리포트도 함께 공개.
배경
- 2023-09-19RSP v1.0 최초 발표
- 2025-01-01RSP v2.0 업데이트
- 2026-02-24RSP v3.0 발표
주요 입장
전망
- · Anthropic: RSP의 장점을 강화하고 단점을 보완하는 실질적 업데이트
한국 영향
- 한국 AI 기본법 시행령과 RSP 비교
- 글로벌 AI 안전 표준 논의
백악관, AI 기업들에 전기요금 인상분 부담 요구 — 대부분 이미 동의
주요 사건
백악관이 AI 기업들에게 데이터센터 전력 소비로 인한 전기요금 인상분을 일반 소비자에게 전가하지 않고 기업이 부담할 것을 요구. Microsoft, Meta, Anthropic, OpenAI 등 주요 하이퍼스케일러들은 이미 공개적으로 이를 약속한 상태.
배경
- 2025-06-01버지니아 데이터센터 전력 문제 부각
- 2026-02-25백악관 AI 기업 전기요금 부담 요구
주요 입장
전망
- · TechCrunch: 대부분 하이퍼스케일러가 이미 공개 약속했으므로 실질 영향은 제한적
한국 영향
- 국내 데이터센터 전력 소비 증가율
- 한전 전기요금 정책 변화
Samsung Galaxy S26 시리즈 공식 발표 — Snapdragon 8 Elite Gen 5, AI 기능 대폭 강화
주요 사건
Samsung이 Galaxy S26, S26+, S26 Ultra를 공식 발표. Qualcomm Snapdragon 8 Elite Gen 5 탑재, $899부터 시작. 주요 AI 기능: Bixby 대화형 에이전트 업그레이드, Now Nudge(상황 인식 AI 추천), Privacy Display(Ultra 전용, 시야각 차단), AI Call Screening. Google Gemini가 Uber, DoorDash 등 서드파티 앱에서 작업 수행 가능.
배경
- 2024-01-17Galaxy S24 시리즈 출시 (Galaxy AI 시작)
- 2025-02-01Galaxy S25 시리즈 출시
- 2026-02-25Galaxy S26 시리즈 공식 발표
주요 입장
전망
- · Droid Life: Privacy Display가 S26 Ultra의 가장 인상적인 신기능
한국 영향
- S26 초기 판매량
- Exynos 2600 탑재 시장 반응
Google DeepMind, Project Genie 월드 모델 연구 공개 — AI 에이전트 훈련을 위한 가상 환경 생성
주요 사건
Google DeepMind이 Project Genie의 월드 모델 연구에 대한 상세 Q&A를 공개했다. Genie는 단일 프롬프트로부터 탐색 가능한 환경을 생성하는 시스템으로, AI 에이전트가 물리적 작업을 안전하게 테스트할 수 있는 시뮬레이션 환경을 순간순간 생성. 공동 리드 Shlomi Fruchter는 '에이전트의 상호작용에 반응하며 전체 환경을 순간순간 시뮬레이션한다'고 설명.
배경
- 2024-02-01Genie 1.0 발표
- 2026-02-25Project Genie 월드 모델 상세 공개
주요 입장
전망
- · DeepMind: 월드 모델이 물리적 에이전트의 안전한 테스트 환경 제공
한국 영향
- Genie API 공개 여부
- 국내 로보틱스 기업의 월드 모델 활용