AI 인프라 병목과 플랫폼 재편이 동시에 심해졌다: Blackwell·메모리·대체칩 경쟁이 커지고, 애플리케이션 레이어에선 Cursor·World·Tesla가 확장 국면에 들어갔다.
- X 기준으론 SemiAnalysis의 인프라발 뉴스가 가장 강했고, GB200/Positron/AI 메모리 병목이 핵심 축이었다.
- RSS 보충으로 Tesla robotaxi, Cerebras IPO, Anthropic-정부 관계, Cursor 대형 투자 같은 산업 재편 이슈를 채웠다.
- 24시간 컷오프를 적용해 OpenAI GPT-Rosalind 같은 24시간 초과 항목은 제외했다.
SemiAnalysis가 Positron AI의 차세대 추론 서버가 단일 서버에서 16조 파라미터급 모델을 겨냥한다고 전했다.
주요 사건
반도체 스타트업 Positron AI가 한 대의 서버에서 초거대 추론 모델을 돌릴 수 있다는 메시지를 내놨다. 핵심은 GPU 클러스터를 크게 늘리는 대신, 메모리 용량과 전력 효율을 극단적으로 끌어올린 전용 추론 하드웨어로 대형 모델 서빙 비용을 낮추겠다는 주장이다.
배경
- 2023-01-01생성형 AI 서비스 확산으로 추론 인프라 비용이 핵심 이슈로 부상
- 2025-01-01추론 특화 반도체 스타트업들에 대규모 자금 유입
- 2026-04-18SemiAnalysis가 Positron의 16조 파라미터 단일 서버 비전을 언급
주요 입장
전망
- · Positron은 현재 Atlas 서버에서 H200 대비 4.54배 perf/W, 3.08배 perf/$를 주장한다.
- · 차세대 로드맵은 4개 Asimov 칩과 8TB+ 메모리로 'superintelligence-in-a-box'를 표방한다.
한국 영향
- HBM/DDR 혼합 메모리 아키텍처 수요
- 국내 추론 서비스 사업자의 전력비 민감도
- NVIDIA 대체 칩 소프트웨어 호환성
SemiAnalysis는 NVIDIA GB200 NVL72가 최적화된 Hopper 기준선 대비 50배 이상 추론 성능을 냈다고 주장했다.
주요 사건
SemiAnalysis가 자사 벤치마크 결과를 인용하며 랙스케일 Blackwell 시스템 GB200 NVL72가 Hopper 세대보다 훨씬 큰 추론 성능 향상을 보였다고 밝혔다. 단순 GPU 교체가 아니라 FP4/FP8, wide expert parallelism, disaggregated prefill 같은 최신 서빙 기법을 함께 쓴 결과라는 점이 핵심이다.
배경
- 2024-03-18NVIDIA가 GTC에서 Blackwell 발표
- 2026-02-03vLLM이 GB200에서 26.2K prefill TPGS, 10.1K decode TPGS를 공개
- 2026-04-18SemiAnalysis가 GB200 NVL72의 50배+ 성능 주장
주요 입장
전망
- · vLLM은 GB200가 H200 대비 3~5배 수준 개선을, SemiAnalysis InferenceX는 특정 인터랙티브 설정에서 H100 대비 최대 55배 실성능 차이를 제시했다.
- · GB200는 CPU-GPU NVLink-C2C와 8TB/s 메모리 대역폭이 강점으로 반복적으로 언급된다.
한국 영향
- HBM4 전환 속도
- 국내 데이터센터 전력 인허가
- Blackwell 공급 병목
NVIDIA의 Lyra 2.0이 한 장의 이미지에서 장시간 탐색 가능한 3D 월드를 만드는 연구로 주목받았다.
주요 사건
Hugging Face 커뮤니티 계정 AK가 NVIDIA의 Lyra 2.0 공개를 알렸다. 이 모델은 일반 영상 생성과 달리 카메라를 오래 움직여도 물체 위치와 공간 구조가 무너지지 않도록 3D 일관성을 유지하는 것이 핵심이다.
배경
- 2024-01-01비디오 생성 모델 경쟁 본격화
- 2025-09-23Lyra 1.0 공개
- 2026-04-14Lyra 2.0 논문 공개
주요 입장
전망
- · 논문은 64개 GB200 GPU, 배치 크기 64, 학습률 3e-5로 Lyra 2.0을 학습했다고 설명한다.
- · 핵심 기여는 geometry-based routing과 self-augmented histories로 장기 드리프트를 줄인 점이다.
한국 영향
- 오픈소스 생태계 확산
- 실시간 렌더링 성능
- 시뮬레이터 연동성
Yann LeCun이 Dario Amodei의 대규모 화이트칼라 일자리 소멸 경고에 공개 반박했다.
주요 사건
Meta AI의 Yann LeCun이 Anthropic CEO Dario Amodei의 '1~5년 내 화이트칼라 일자리 절반 소멸' 발언을 정면 비판했다. 논점은 AI 능력 자체보다 노동시장의 적응 속도와 실제 도입률이다.
배경
- 2025-01-27Dario Amodei가 AI 고용 충격을 경고
- 2026-04-09관련 인터뷰와 기사 재확산
- 2026-04-18LeCun이 공개 반박
주요 입장
전망
- · Anthropic 연구 인용 기사들은 프로그래머의 'observed exposure'가 74.5%까지 높다고 설명했다.
- · CNBC는 2025년 AI를 이유로 한 미국 해고가 약 5만5천 건 수준이었다고 전했다.
한국 영향
- 국내 신입 개발자 채용 감소 여부
- 기업의 AI 도입률
- 노동정책 대응
Tesla가 로보택시 서비스를 댈러스와 휴스턴으로 확대했다.
주요 사건
Tesla가 기존 오스틴 중심의 무인 로보택시 실험을 댈러스와 휴스턴까지 넓혔다. 제한된 지오펜스 내에서 운행하지만, 도시 확장 자체가 상용화 속도를 보여준다.
배경
- 2025-06-01Tesla 로보택시 초기 운영 본격화
- 2026-01-287개 도시 H1 확장 계획 제시
- 2026-04-18댈러스·휴스턴 론칭 발표
주요 입장
전망
- · 시장 추적 자료들은 Austin에서 유료 주행거리가 약 70만 마일 수준까지 누적됐다고 본다.
- · 초기 댈러스·휴스턴 지오펜스는 도시당 대략 25제곱마일 안팎으로 추정된다.
한국 영향
- 카메라 기반 접근의 안전성
- 도시별 규제 승인
- Tesla Cybercab 양산 일정
AI 칩 스타트업 Cerebras가 대형 계약을 등에 업고 IPO를 추진한다.
주요 사건
Cerebras가 IPO 서류를 제출했다. OpenAI·AWS와의 계약을 바탕으로 NVIDIA 대안 서사를 자본시장에 본격적으로 올리는 이벤트다.
배경
- 2019-08-01Cerebras가 웨이퍼 스케일 칩으로 주목받기 시작
- 2025-10-01IPO 계획 한차례 철회
- 2026-04-18Cerebras가 다시 IPO 서류 제출
주요 입장
전망
- · Reuters는 OpenAI가 3년간 200억달러 이상을 Cerebras 칩 기반 서버에 지출할 수 있다고 전했다.
- · 시장 보도에 따르면 Cerebras는 850M달러 크레딧 라인과 과거 80억달러 안팎 평가를 발판으로 상장에 재도전한다.
한국 영향
- 상장 밸류에이션
- 실제 매출 전환율
- 제조 파트너십
Anthropic가 Pentagon 갈등 와중에도 Mythos를 두고 트럼프 행정부와 접촉을 이어가고 있다.
주요 사건
Anthropic는 국방부와 계약 분쟁으로 '공급망 리스크' 낙인이 찍혔지만, 고위 행정부와는 Mythos 모델 관련 대화를 계속하고 있다. 안전 우려가 큰 모델을 정부는 원하고, 회사는 공개는 막는 이상한 구조다.
배경
- 2026-04-07Anthropic가 Mythos 공개
- 2026-04-14Jack Clark가 정부 브리핑 사실 확인
- 2026-04-18관계 해빙 조짐 보도 확산
주요 입장
전망
- · TechCrunch 보도에 따르면 Mythos는 공공 공개 대신 소수 조직에 제한 배포되고 있다.
- · 기사들은 JPMorgan·Amazon·Apple 등이 프로젝트 Glasswing 맥락에서 거론된다고 전했다.
한국 영향
- 미 정부-민간 AI 계약 구조
- 사이버 모델 접근 제한 방식
- 안전성 평가 체계
Sam Altman의 World가 Tinder를 시작으로 '인간 인증' 인프라를 대중 서비스에 확장하려 한다.
주요 사건
World가 Tinder, 티켓팅, 기업 인증 등으로 인간 인증 서비스를 넓히겠다고 밝혔다. 생성형 에이전트와 봇이 늘면서 '네가 진짜 사람인지'를 증명하는 계층을 인터넷 기본 인프라로 만들려는 시도다.
배경
- 2025-04-30World ID와 Match Group 협업 발표
- 2026-03-31World 개발자 기능 확대
- 2026-04-17Tinder 포함 글로벌 확장 계획 공개
주요 입장
전망
- · TechCrunch에 따르면 Tinder의 일본 파일럿 성공 이후 미국 포함 글로벌 시장 확대가 예고됐다.
- · World는 Orb 외에도 NFC 정부 ID와 셀피 기반의 다층 검증 체계를 추진 중이다.
한국 영향
- 개인정보 규제
- 생체정보 저장 방식
- 플랫폼 도입 사례
OpenAI가 Sora와 과학 프로젝트를 줄이면서 핵심 리더들이 잇따라 회사를 떠났다.
주요 사건
OpenAI for Science를 이끌던 Kevin Weil과 Sora를 이끌던 Bill Peebles가 퇴사했다. OpenAI가 소비자용 실험 프로젝트를 줄이고 엔터프라이즈 AI와 슈퍼앱 전략으로 재정렬 중이라는 신호로 읽힌다.
배경
- 2025-10-01OpenAI for Science 공식화
- 2026-03-01Sora 비용 부담과 축소설 확산
- 2026-04-17Weil·Peebles 퇴사 공개
주요 입장
전망
- · TechCrunch는 Sora 운영비가 하루 약 100만달러 수준이었다고 전했다.
- · 이번 이탈은 OpenAI가 'side quests'를 접고 있다는 내러티브를 강화한다.
한국 영향
- OpenAI 조직 개편
- Sora 후속 전략
- 기업용 제품 집중도
Cursor가 최소 20억달러 신규 투자와 500억달러 밸류에이션을 논의 중이라는 보도가 나왔다.
주요 사건
AI 코딩 스타트업 Cursor가 500억달러 가치에 20억달러 이상 자금 조달을 추진 중이라는 보도가 나왔다. 핵심은 AI 코딩 시장이 아직 '기능'이 아니라 독립 대형 소프트웨어 카테고리로 평가받고 있다는 점이다.
배경
- 2024-08-01Cursor 초기 대형 라운드와 급성장 시작
- 2026-02-01연환산 매출 20억달러 도달 보도
- 2026-04-17500억달러 밸류에이션 협상 보도
주요 입장
전망
- · TechCrunch는 Cursor가 2026년 말 연환산 매출 60억달러 이상을 전망한다고 전했다.
- · 보도상 2026년 2월 기준 연환산 매출 20억달러, 대기업 매출 비중 확대가 핵심 근거다.
한국 영향
- 국내 엔터프라이즈 도입률
- 모델 비용 구조
- 개발자 생산성 측정 방식
글로벌 메모리 부족이 AI 수요 때문에 수년 더 이어질 수 있다는 경고가 나왔다.
주요 사건
The Verge가 Nikkei Asia 등을 인용해 DRAM 공급 부족이 2027년 이후까지 이어질 수 있다고 보도했다. AI 데이터센터가 HBM과 DRAM 수요를 빨아들이면서 PC·스마트폰·자동차까지 메모리 'AI 세금'이 번지고 있다.
배경
- 2025-12-15HBM 수요 150%+ 성장 전망 확산
- 2026-01-23메모리 부족이 2027년까지 지속될 것이란 분석 확산
- 2026-04-18The Verge가 장기 부족 전망 재보도
주요 입장
전망
- · Nikkei 인용 보도는 2027년 말에도 수요의 60%만 충족될 수 있다고 전했다.
- · 다른 분석들은 HBM이 2026년 전체 TSV 용량의 70% 이상을 소모하고, 고급 16단 HBM4 수율이 약 10% 수준이라고 본다.
한국 영향
- HBM4 수율
- Yongin cluster 증설
- 국내 완제품 업체 마진 압박