Meta 'Avocado' 모델 출시 연기·TSMC N3 AI 실리콘 대란·Grok 4.20 벤치마크 1위·Anthropic 월 $6B ARR 돌파·GTC 2026 개막 임박
- Meta, 내부 테스트에서 Google·OpenAI·Anthropic 모델에 뒤처진 'Avocado' AI 모델 출시를 5월 이후로 연기—Gemini 라이선스 검토 중
- SemiAnalysis, TSMC N3 웨이퍼 부족이 AI 인프라 최대 병목이라고 분석—하이퍼스케일러 Capex 급증에도 실리콘 공급 부족
- xAI Grok 4.20 Multi-Agent, BridgeBench에서 96.1점으로 GPT-5.4·Claude 4.6 제치고 1위—역대 최저 환각률 22%
- Anthropic, 에이전틱 코딩 플랫폼 Claude Code 주도로 2월 단월 ARR $6B 추가
- Anthropic Institute 출범—Jack Clark이 Head of Public Benefit으로 AI 공익 싱크탱크 이끌어
- GPT-6 아키텍처, MoE 희소성 증가 추세 지속—더 넓은 expert parallelism 필요
- NVIDIA GTC 2026 기조연설 임박—Jensen Huang의 AI 컴퓨팅 비전 발표 예정
Meta, AI 모델 'Avocado' 출시를 5월 이후로 연기—Google·OpenAI·Anthropic에 성능 뒤처져
주요 사건
Meta의 차세대 AI 모델 코드명 'Avocado'가 내부 테스트에서 Google Gemini 3.0, OpenAI GPT-5.4, Anthropic Claude에 비해 추론·코딩·작문 성능이 뒤처져 출시가 최소 5월 이후로 연기됐다. Meta는 단기적으로 Gemini를 라이선스해 AI 제품에 활용하는 방안도 검토 중이다.
배경
- 2023-02-24Meta LLaMA 공개
- 2024-07-23LLaMA 3.1 405B 출시
- 2026-01-01Meta, 2026년 AI 투자 $135B 예고
- 2026-03-12Avocado 출시 연기 보도
주요 입장
전망
- · Meta의 AI 투자 규모 대비 모델 성능 갭이 시장의 핵심 리스크
- · Gemini 라이선스는 Google에 대한 의존도를 높이는 양날의 검
한국 영향
- Avocado 오픈소스 공개 여부
- Meta-Google Gemini 라이선스 조건
참고 자료
TSMC N3 웨이퍼 부족이 AI 인프라 최대 병목—하이퍼스케일러 Capex 급증에도 실리콘 공급난 심화
주요 사건
SemiAnalysis가 'The Great AI Silicon Shortage' 보고서를 발표. AI 토큰 수요 폭증으로 GPU 수요가 공급을 크게 초과하고 있으며, TSMC N3 공정 웨이퍼가 핵심 병목이다. Anthropic은 2월 한 달에만 ARR $6B를 추가했으나 컴퓨트가 더 있었으면 더 성장했을 것이라고 분석. Google 2026년 capex 예상치가 기존 대비 약 2배로 상향됐다.
배경
- 2023-01-01TSMC N3 양산 시작
- 2025-01-01CoWoS 패키징 병목 이슈
- 2026-03-12SemiAnalysis AI 실리콘 부족 보고서 발표
주요 입장
전망
- · SemiAnalysis: 네오클라우드에 연락해봐도 소규모 클러스터조차 확보 불가
- · Google 2026 capex가 기존 대비 약 2배로 상향
한국 영향
- 삼성 GAA 3nm 경쟁력
- SK하이닉스 HBM4 공급 일정
- 국내 AI 컴퓨트 인프라 정책
xAI Grok 4.20 Multi-Agent, BridgeBench 96.1점으로 GPT-5.4·Claude 4.6 제치고 1위—역대 최저 환각률
주요 사건
xAI의 Grok 4.20 Multi-Agent가 BridgeBench에서 96.1점(100% 완료율, 87.8초 지연)으로 GPT-5.4와 Claude 4.6을 제치고 1위를 기록했다. Artificial Analysis 평가에서도 역대 최저 환각률 22%를 달성했으며, Grok 4.20 Heavy Beta 2는 심층 분석에서 극도로 빠른 속도를 보여준다.
배경
- 2023-11-01xAI Grok 1.0 출시
- 2025-02-01Grok 3 출시
- 2026-03-09Grok 4.20 Beta 출시
- 2026-03-13BridgeBench 1위 달성
주요 입장
전망
- · Grok 4.20 Heavy Beta 2는 심층 분석에서 극도로 빠르다 - Elon Musk
- · 환각률 22%는 역대 어떤 모델보다 낮은 수치 - Artificial Analysis
한국 영향
- Grok 4.20 API 가격 정책
- 한국어 성능 벤치마크
SemiAnalysis, GPT-6 아키텍처는 MoE 희소성 증가 추세 지속—더 넓은 expert parallelism 필요
주요 사건
SemiAnalysis의 Dylan Patel이 GPT-6의 아키텍처가 MoE(Mixture of Experts) 희소성을 더욱 증가시키는 방향으로 진행될 것이라고 분석했다. 디코드 단계에서 MoE dispatch·combine 콜렉티브를 위한 더 넓은 expert parallelism이 필요해질 전망.
배경
- 2017-01-01Switch Transformer 등 MoE 연구 활성화
- 2023-03-01GPT-4 MoE 아키텍처 채택 (비공식)
- 2025-10-01OpenAI gpt-oss 오픈소스 공개 (128 experts, top-4)
- 2026-03-12SemiAnalysis GPT-6 MoE 희소성 증가 분석
주요 입장
전망
- · Dylan Patel: GPT-6는 디코드 단계에서 더 넓은 expert parallelism 필요
한국 영향
- CXL 메모리 확장 기술 상용화
- 국내 AI 인프라의 네트워크 대역폭
SemiAnalysis, Anthropic Opus 4·5·6 아키텍처와 런레이트 분석 공개
주요 사건
SemiAnalysis가 Anthropic의 Claude Opus 4, 5, 6 아키텍처와 런레이트에 대한 분석 영상을 공개했다. 같은 보고서에서 Anthropic이 에이전틱 코딩 플랫폼 Claude Code의 폭발적 성장으로 2월 한 달에만 $6B ARR를 추가했다고 밝혔다.
배경
- 2024-03-04Claude 3 Opus 출시
- 2025-06-01Claude 4 출시
- 2026-02-01Anthropic 2월 ARR $6B 추가
- 2026-03-13SemiAnalysis Opus 4/5/6 아키텍처 분석
주요 입장
전망
- · SemiAnalysis: Anthropic이 더 많은 컴퓨트가 있었으면 $6B 이상을 추가했을 것
한국 영향
- Claude Code 한국어 코드 지원 품질
- 국내 에이전틱 코딩 스타트업 동향
Anthropic Institute 출범—Jack Clark이 Head of Public Benefit으로 AI 공익 싱크탱크 주도
주요 사건
Anthropic이 AI의 대규모 사회적 영향을 연구하는 내부 싱크탱크 'Anthropic Institute'를 출범시켰다. 공동창업자 Jack Clark이 Head of Public Benefit이라는 새 직책으로 이끌며, ML 엔지니어·경제학자·사회과학자로 구성된다. Pentagon 블랙리스트 분쟁 중에 발표.
배경
- 2021-01-01Anthropic 설립
- 2026-02-26Pentagon 관련 성명 발표
- 2026-03-11Anthropic Institute 출범
주요 입장
전망
- · Jack Clark: 프론티어 AI 연구소의 내부 정보를 최대한 활용할 것
한국 영향
- Anthropic Institute의 아시아 지역 연구 계획
- 한국 AI 안전 정책 반영
NVIDIA GTC 2026 기조연설 임박—Jensen Huang, AI 컴퓨팅의 미래 발표 예정
주요 사건
NVIDIA의 연례 GPU Technology Conference(GTC) 2026이 개막을 앞두고 있다. Jensen Huang CEO의 기조연설에서 새로운 제품 발표, 파트너십, AI 컴퓨팅 비전이 공개될 예정이다.
배경
- 2024-03-01GTC 2024 - Blackwell 발표
- 2025-03-01GTC 2025 - Rubin 발표
- 2026-03-15GTC 2026 기조연설 예정
주요 입장
전망
- · SemiAnalysis x FluidStack 해커톤이 GTC 앞서 개최—AI 인프라 커뮤니티 관심 집중
한국 영향
- 차세대 GPU의 HBM 사양
- 한국 데이터센터 관련 파트너십
Karpathy, 에이전트 IDE 시대 선언—'IDE의 시대는 끝나지 않았다, 더 큰 IDE가 필요하다'
주요 사건
Andrej Karpathy가 AI 에이전트 시대에도 IDE가 사라지지 않고 오히려 '에이전트 커맨드 센터'로 진화한다고 주장했다. 프로그래밍의 기본 단위가 파일에서 에이전트로 바뀌었을 뿐 여전히 프로그래밍이라는 관점. 또한 autoresearch 실험에서 에이전트가 자율적으로 700개 변경을 시도해 GPT-2 훈련 시간을 11% 단축시킨 성과를 공유.
배경
- 2026-03-07autoresearch 레포 공개
- 2026-03-09autoresearch가 nanochat에서 GPT-2 훈련 시간 11% 단축
- 2026-03-11에이전트 IDE 비전 공유
주요 입장
전망
- · Karpathy: 모든 프론티어 AI 연구소가 이렇게 할 것이다. 이것이 최종 보스전
- · 에이전트가 700개 변경을 자율적으로 시도해 실제 개선을 달성
한국 영향
- autoresearch 방식의 국내 적용 사례
- 에이전트 IDE 스타트업 동향
swyx, '전용 에이전틱 브라우저는 실수—크롬 확장이 정답' 선언
주요 사건
AI 인플루언서 swyx가 전용 에이전틱 브라우저(별도 브라우저 앱)가 실수였고, 크롬 확장 프로그램 방식이 승리했다고 선언. Claude Cowork 등이 사용자가 이미 있는 곳(기존 브라우저)에서 작동하는 방식으로 성공.
배경
- 2025-06-01다양한 에이전틱 브라우저 출시
- 2026-01-01Claude Cowork 크롬 확장 출시
- 2026-03-12swyx '에이전틱 브라우저는 실수' 선언
주요 입장
전망
- · swyx: 충분한 증거를 봤다—전용 에이전틱 브라우저는 실수였다
한국 영향
- Chrome Web Store AI 확장 프로그램 트렌드
- 국내 브라우저 시장 특성(네이버 웨일 등)
Google DeepMind, 런던 신사옥 'Platform 37' 공개—AlphaGo Move 37에서 이름 유래
주요 사건
Google DeepMind이 런던 신사옥 이름을 'Platform 37'로 발표. AlphaGo가 이세돌과의 대국에서 보여준 혁신적 수 'Move 37'에서 유래. 저탄소 건축자재 사용, 런던 야생동물 신탁과 협력한 옥상 정원 포함. 연말 'The AI Exchange'라는 무료 공개 전시 공간도 개장 예정.
배경
- 2016-03-09AlphaGo vs 이세돌 - Move 37
- 2026-03-12Platform 37 발표
주요 입장
전망
- · Pushmeet: AlphaEvolve가 극값 조합론에서 새로운 수학적 결과 달성
한국 영향
- DeepMind 서울 오피스 역할 확대 여부
Standard Kernel, AI 기반 GPU 커널 자동 생성 스타트업 시드 라운드 완료—H100에서 최대 4배 성능 향상
주요 사건
Standard Kernel이 시드 라운드를 완료했다. AI를 사용해 GPU 커널을 자동 생성하는 스타트업으로, NVIDIA H100에서 cuDNN 대비 80%~4배 성능 향상을 파트너 테스트에서 입증. 칩 레벨 명령어 최적화로 새로운 하드웨어 출시 첫날부터 최적 성능을 달성하는 것이 목표.
배경
- 2025-01-01LLM 기반 커널 생성 연구 활성화
- 2026-03-11Standard Kernel 시드 라운드 발표
주요 입장
전망
- · Jump Capital: AI 인프라에서 가장 투자가 부족한 영역 중 하나
- · Dylan Patel: 커널 생성은 AI 하드웨어 성능과 효율성의 핵심
한국 영향
- 국내 AI 칩의 커널 최적화 도구 현황
- Standard Kernel의 NVIDIA 외 칩 지원 계획
Grok Imagine 1.0 대규모 업데이트—레퍼런스 이미지 기반 비디오·이미지 생성 기능 추가
주요 사건
xAI의 Grok Imagine이 1.0 메이저 업데이트를 받았다. 레퍼런스 이미지를 입력으로 비디오·이미지를 생성하는 기능이 추가됐으며, 색상·조명 통합 품질이 크게 향상. X Premium 구독자에게 제공.
배경
- 2025-06-01Grok Imagine 초기 버전
- 2026-03-12Grok Imagine 1.0 레퍼런스 기반 생성 업데이트
주요 입장
전망
- · Elon Musk: 직접 시도해보라(Try it out)
한국 영향
- Grok Imagine의 한국어 프롬프트 지원
- X Premium 한국 사용자 비율
FLUX.2 klein 9B-KV, KV-Cache 최적화로 이미지 편집 속도 2배 향상
주요 사건
Black Forest Labs의 FLUX.2 klein 9B 이미지 편집 모델이 KV-Cache 최적화 버전(9B-KV)을 출시해 속도가 2배 향상됐다. 이미지 편집 분야에서 가장 인기 있는 모델 중 하나.
배경
- 2025-01-01FLUX.2 시리즈 출시
- 2026-03-12FLUX.2 klein 9B-KV 출시 (2x faster)
주요 입장
전망
- · linoy_tsaban: 가장 좋아하는 편집 모델이 2배 빨라졌다
한국 영향
- FLUX 모델의 국내 도입 현황
Rox AI, AI 네이티브 CRM/영업 자동화 스타트업 $1.2B 밸류에이션 달성
주요 사건
AI 네이티브 영업 자동화 스타트업 Rox가 $1.2B 밸류에이션을 달성했다. New Relic 전 CGO가 2024년에 설립, Sequoia와 General Catalyst가 투자. 기존 CRM 도구를 대체하는 AI 네이티브 접근.
배경
- 2024-01-01Rox AI 설립
- 2026-03-12$1.2B 밸류에이션 달성
주요 입장
전망
- · 2024년 설립부터 2년 만에 유니콘 달성—AI SaaS의 속도
한국 영향
- Rox AI의 아시아 진출 계획
- 국내 AI 네이티브 SaaS 스타트업 동향