AI 경쟁축이 모델 성능에서 전력·추론비용·출처검증·데이터 공급망으로 이동한다
- SemiAnalysis는 LLM 지연시간의 48%가 프리필, 52%가 디코드라고 지목하며 추론 인프라 병목을 전면화했다.
- Google은 SynthID 1000억건 워터마크와 Gemini for Science로 출처검증·과학자동화 경쟁을 동시에 확장했다.
- OpenRouter는 월 100조 토큰 처리와 13억달러 평가액으로 멀티모델 라우팅 시장의 핵심 인프라로 부상했다.
- DuckDuckGo와 Human Archive 사례는 AI 확산의 반작용이 프라이버시·동의·노동 데이터 문제로 나타남을 보여준다.
SemiAnalysis, LLM 지연시간 절반이 프리필이라고 지목한다
주요 사건
SemiAnalysis가 엔드투엔드 LLM 지연시간을 프리필 48%, 디코드 52%로 분해하며 KV 캐시 읽기와 쓰기가 추론 병목의 핵심이라고 설명했다.
배경
- 2024-01-01vLLM·PagedAttention 계열 서빙 최적화 확산
- 2026-03-01PPD 논문, 다중턴 TTFT 48~73% 감소 보고
- 2026-05-26SemiAnalysis가 프리필 48%·디코드 52% 병목 제시
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- TTFT/TPOT 공개 여부
- H200·B200 도입 이후 캐시 네트워크 설계
- 국내 LLM 서비스의 장문 과금 정책
SemiAnalysis, AI 데이터센터 800VDC 전환을 전력 병목 해법으로 제시한다
주요 사건
SemiAnalysis가 800V DC 전환, 전력 랙 경제성, 고체변압기와 MW당 장비 구성을 다룬 분석을 공개했다.
배경
- 2024-03-01GB200 NVL72 등 고전력 랙 설계 확산
- 2026-03-06NVIDIA 800V HVDC 분석, 효율 92%+·구리 45% 절감 제시
- 2026-05-26SemiAnalysis가 800VDC 전환 분석 공개
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 800V DC 표준 채택 속도
- SiC/GaN 전력반도체 국산화
- 국내 AI 데이터센터 전력 PUE 공개
Anthropic, 에이전트 권한을 샌드박스로 제한하는 운영 원칙을 내놓는다
주요 사건
Anthropic이 에이전트의 접근권한과 실행권한은 능력 향상에 맞춰 진화해야 하며, 파괴적 작업 범위를 샌드박싱으로 제한한다고 설명했다.
배경
- 2025-10-20Claude Code 샌드박싱, 권한 프롬프트 84% 감소 공개
- 2026-05-26Anthropic이 에이전트 권한 운영 원칙 재강조
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 에이전트 권한정책 표준
- 국내 개인정보보호위 가이드라인
- 사내망 연동형 AI 보안 사고
Google, SynthID 1000억건 워터마크를 검색·크롬·픽셀로 확장한다
주요 사건
Google DeepMind는 SynthID가 1000억 개 이상의 콘텐츠에 워터마크를 적용했고 OpenAI·ElevenLabs·Kakao가 파트너로 합류한다고 밝혔다. Gemini의 검증 기능은 5000만 회 이상 사용됐고 Search·Chrome·Pixel 영상 provenance로 확장된다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26Google, SynthID 1000억건 워터마크를 검색·크롬·픽셀로 확장한다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
Google DeepMind, Gemini for Science로 연구 자동화 경쟁을 끌어올린다
주요 사건
Google DeepMind가 Gemini for Science 도구를 홍보했다. 관련 검색 결과는 Co-Scientist와 ERA가 Nature 동시 검증을 받았고 ERA가 CDC 코로나 입원 예측 앙상블을 능가했으며 간섬유화 후보 물질 Vorinostat 실험에서 91% 감소 효과를 냈다고 전한다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26Google DeepMind, Gemini for Science로 연구 자동화 경쟁을 끌어올린다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
swyx, Gemma 4 공개모델 성능을 중국 추격 구도 반전 신호로 본다
주요 사건
swyx가 Gemma 4를 언급하며 미국의 중국 공개모델 추격도 주목해야 한다고 평가했다. Google 모델카드는 Gemma 4가 MMLU Pro 85.2%, AIME 2026 89.2%, LiveCodeBench v6 80.0%, GPQA Diamond 84.3%를 기록한다고 제시한다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26swyx, Gemma 4 공개모델 성능을 중국 추격 구도 반전 신호로 본다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
SpaceX, American Airlines 500대에 Starlink를 넣으며 항공 인터넷을 확대한다
주요 사건
Elon Musk가 Starlink 항공사 파트너십 확대를 리트윗했고 TechCrunch는 American Airlines가 500대 이상 Airbus 기체에 Starlink를 설치한다고 보도했다. Starlink 항공 파트너는 38개, 적용 기체는 6300대 이상으로 집계된다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26SpaceX, American Airlines 500대에 Starlink를 넣으며 항공 인터넷을 확대한다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
OpenRouter, 1년 만에 13억달러 가치로 뛰며 멀티모델 관문을 장악한다
주요 사건
OpenRouter가 CapitalG 주도 1억1300만달러 Series B를 유치했고 평가액은 약 13억달러로 알려졌다. 400개 이상 모델, 800만 사용자, 월 100조 토큰·주 25조 토큰 처리로 6개월 전 주 5조 토큰 대비 5배 증가했다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26OpenRouter, 1년 만에 13억달러 가치로 뛰며 멀티모델 관문을 장악한다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
DuckDuckGo, 구글 AI 검색 반발 속 미국 설치가 최고 30.5% 늘어난다
주요 사건
Google I/O 이후 DuckDuckGo 미국 앱 설치가 5월20~25일 평균 18.1%, 5월25일 최고 30.5% 증가했다. iOS는 평균 33%, 최고 69.9%였고 AI-free 검색 페이지 방문도 평균 22.7% 늘었다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26DuckDuckGo, 구글 AI 검색 반발 속 미국 설치가 최고 30.5% 늘어난다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
Human Archive, 인도 긱워커 데이터로 로봇 학습 병목을 겨냥한다
주요 사건
UC Berkeley·Stanford 연구자 창업팀 Human Archive가 인도 서비스 노동자에게 카메라·센서를 착용시켜 물리 AI 학습 데이터를 모으는 모델로 820만달러를 유치했다. 검색 결과는 1000개 이상 헤드셋, 50개 이상 커스텀 장비, RGB-D·촉각·모션 데이터를 언급한다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26Human Archive, 인도 긱워커 데이터로 로봇 학습 병목을 겨냥한다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
Import AI, 2028년 전 자동화 AI R&D 가능성을 공개 의제로 끌어올린다
주요 사건
Jack Clark의 Import AI 458은 AI 성공을 ‘정상 기술’이 아닌 사회적 전환으로 다뤄야 한다고 주장했다. 이전 분석에서는 자동화 AI R&D가 2028년 말까지 나타날 확률을 약 60%, 2027년은 30%로 제시했다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26Import AI, 2028년 전 자동화 AI R&D 가능성을 공개 의제로 끌어올린다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응
TechCrunch, 원자로 스타트업에 무기급 플루토늄 활용 압박이 커진다고 전한다
주요 사건
미 정부가 보유한 수십 톤의 무기급 플루토늄을 원자로 스타트업 연료로 활용하는 방안을 밀고 있다고 TechCrunch가 보도했다. AI 데이터센터 전력난 속 원자력 스타트업과 비확산 리스크가 맞물린 이슈다.
배경
- 2017-06-01Transformer 이후 대규모 모델 경쟁 시작
- 2023-11-01생성AI가 소비자·기업 서비스로 본격 확산
- 2026-05-26TechCrunch, 원자로 스타트업에 무기급 플루토늄 활용 압박이 커진다고 전한다
주요 입장
전망
- · SemiAnalysis·TechCrunch·Google·Anthropic 등 24시간 내 원문과 Exa 검색 결과를 교차 확인했다.
- · 핵심 신호는 모델 성능 자체보다 추론비용, 전력, 출처검증, 데이터 공급망으로 경쟁축이 이동한다는 점이다.
한국 영향
- 국내 파트너십 참여 여부
- 표준 채택 속도
- 서비스 이용자 반응