Google I/O와 OpenAI 용량전략이 AI 경쟁축을 인프라·에이전트로 옮긴다
- OpenAI는 1~3년 컴퓨트 보장 판매와 이미지 출처 검증으로 기업·신뢰 인프라를 동시에 강화한다.
- Google은 Gemini 3.5 Flash, Gemini for Science, AI Mode 검색으로 저비용 에이전트 플랫폼 전략을 전면화한다.
- Karpathy의 Anthropic 합류와 AMD·Nvidia 최적화 소식은 프런티어 경쟁이 인재·추론비용·학습효율 싸움으로 이동했음을 보여준다.
OpenAI, 1~3년 컴퓨트 보장 판매로 기업 토큰 수요를 선점한다
주요 사건
OpenAI가 기업 고객에게 장기 API·모델 사용량을 보장하는 Guaranteed Capacity를 내놨다. Sam Altman은 모델 성능 개선으로 세계가 한동안 컴퓨트 부족 상태에 놓일 것이라며 1~3년 약정 고객에게 할인 토큰을 제공한다고 설명했다.
배경
- 2020-06-01GPT-3 공개로 대규모 언어모델 API 시장 개화
- 2023-03-14GPT-4 출시 후 기업용 생성AI 수요 급증
- 2026-05-19OpenAI Guaranteed Capacity 발표
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- OpenAI 약정 가격과 실제 토큰 할인폭
- 국내 클라우드의 예약형 AI 추론 상품 출시 여부
참고 자료
OpenAI, C2PA·SynthID 병행으로 AI 이미지 출처 검증을 강화한다
주요 사건
OpenAI가 생성 이미지에 C2PA Content Credentials와 Google SynthID 워터마크를 함께 넣고, 공개 검증 도구로 OpenAI 제품 생성 여부를 확인하게 하겠다고 밝혔다.
배경
- 2021-02-01C2PA 표준화 프로젝트 출범
- 2023-08-29Google SynthID 워터마크 공개
- 2026-05-19OpenAI가 C2PA와 SynthID 동시 적용 발표
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- OpenAI 검증 도구의 API 공개 여부
- 국내 플랫폼의 C2PA 메타데이터 보존 정책
참고 자료
ChatGPT 이미지 생성, 주간 15억 장 돌파로 창작 워크플로를 장악한다
주요 사건
OpenAI는 ChatGPT에서 매주 15억 장이 넘는 이미지가 생성되고 있다고 밝혔다. Images 2.0 이후 텍스트 렌더링, 포토리얼리즘, 다국어, 캐릭터 일관성 개선이 사용량을 끌어올린 것으로 설명된다.
배경
- 2021-01-05OpenAI DALL·E 공개
- 2023-09-20DALL·E 3가 ChatGPT와 결합
- 2026-05-19ChatGPT 이미지 주간 15억 장 생성 공개
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- 이미지 생성 단가와 지연시간
- 국내 저작권 가이드라인 개정 여부
Google, Gemini 3.5 Flash로 고속·저가 에이전트 모델 경쟁을 연다
주요 사건
Google DeepMind가 Gemini 3.5 Flash를 Antigravity와 결합해 다중 서브에이전트가 도시를 설계·구현하는 데모를 공개했다. 검색 결과 기준 공개 벤치마크는 1M 컨텍스트, 76.2% Terminal-Bench 2.1, $1.50/$9 per 1M 토큰 가격을 제시한다.
배경
- 2023-12-06Google Gemini 1.0 공개
- 2024-05-14Gemini Flash 계열 발표
- 2026-05-19Gemini 3.5 Flash 공개 및 Antigravity 연동
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- Gemini 3.5 Flash 실제 API 지연시간
- 한국어 코딩·문서 작업 성능
참고 자료
Google, Gemini for Science로 AI 연구 자동화를 제품군으로 묶는다
주요 사건
Google DeepMind가 과학자를 위한 Gemini for Science를 발표했다. Co-Scientist 기반 가설 생성, AlphaEvolve·Empirical Research Assistance 기반 계산 발견, NotebookLM·전문 데이터베이스 연계가 포함된다.
배경
- 2020-11-30AlphaFold 2가 단백질 구조 예측 돌파구 제시
- 2025-05-14AlphaEvolve가 알고리즘 설계 에이전트로 공개
- 2026-05-19Gemini for Science 발표
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- Gemini for Science의 데이터베이스 커버리지
- 실제 논문·특허 생산성 개선 사례
참고 자료
Karpathy, Anthropic 합류로 Claude 사전학습 자동화 팀을 만든다
주요 사건
Andrej Karpathy가 Anthropic에 합류해 R&D로 복귀한다고 밝혔다. 보도와 Anthropic 설명에 따르면 그는 Claude를 활용해 사전학습 연구 자체를 가속하는 팀을 만들 예정이다.
배경
- 2015-12-11OpenAI 설립
- 2017-06-01Transformer 논문이 현대 LLM 사전학습 기반 형성
- 2026-05-19Karpathy가 Anthropic 합류 발표
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- Anthropic의 pretraining 관련 논문·오픈소스 공개
- Karpathy의 교육 프로젝트 지속 여부
참고 자료
SemiAnalysis, AMD MI355가 B200 대비 GLM5 추론비용 40% 낮췄다고 평가한다
주요 사건
SemiAnalysis는 AMD MI355가 GLM5 단일노드 FP8 서빙에서 Nvidia B200보다 40% 저렴해졌다고 평가했다. 다만 분산 추론과 FP4 최적화에서는 CUDA 생태계를 더 따라잡아야 한다고 지적했다.
배경
- 2023-12-06AMD Instinct MI300X 본격 공개
- 2025-03-01B200·Blackwell 추론 인프라 확산
- 2026-05-19SemiAnalysis가 MI355 GLM5 FP8 비용 우위 언급
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- MI355X 분산 추론 성능
- ROCm의 FP4·MTP 지원 안정성
참고 자료
Nvidia LongLive-2.0, NVFP4로 장편 영상 생성 학습 2.15배 가속한다
주요 사건
AK가 Nvidia의 LongLive-2.0 논문을 소개했다. 이 시스템은 NVFP4 기반 장편 영상 생성 인프라로, sequence-parallel autoregressive training과 Blackwell W4A4 NVFP4 추론을 결합해 학습 2.15배, 추론 1.84배 속도 향상을 보고했다.
배경
- 2022-04-01확산모델 기반 이미지 생성 대중화
- 2024-03-18Nvidia Blackwell 아키텍처 공개
- 2026-05-19LongLive-2.0 논문·모델 공개
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- LongLive-2.0 품질 저하 없는 FP4 적용 범위
- 상용 영상 모델의 장편 일관성 벤치마크
NanoGPT-Bench, 코딩 에이전트의 AI R&D 기여도를 공개 과제로 측정한다
주요 사건
AK가 코딩 에이전트가 AI R&D 문제를 풀 수 있는지 묻는 NanoGPT-Bench 공개를 공유했다. NanoGPT 속도전처럼 작은 LLM 사전학습 과제를 통해 에이전트의 연구 기여를 누적 측정하려는 흐름이다.
배경
- 2022-12-01Karpathy nanoGPT 공개
- 2025-01-01코딩 에이전트 벤치마크가 SWE-bench 이후 확장
- 2026-05-19NanoGPT-Bench 관련 공개 확산
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- NanoGPT-Bench 리더보드의 인간 대비 에이전트 성능
- 에이전트 기여의 검증·저자성 논쟁
참고 자료
Nvidia, 10조 토큰 학습 소형 Nemotron으로 대형 모델 스케일링을 예측한다
주요 사건
AK가 Nvidia Nemotron CLIMB Proxy Models 공개를 공유했다. 62M·350M 파라미터 소형 디코더 모델을 10조 토큰으로 학습해 대형 모델의 데이터 조합과 성능을 예측하는 스케일링 법칙 연구용 프록시로 쓴다.
배경
- 2020-01-23Scaling Laws for Neural Language Models 발표
- 2024-06-01Nemotron 계열 모델 공개 확대
- 2026-05-18Nemotron CLIMB Proxy Models 공개 확산
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- 62M·350M 결과의 7B 이상 모델 전이 정확도
- 한국어 데이터 믹스 프록시 실험 가능성
참고 자료
Google 검색, AI Mode 월 10억 명 기반으로 에이전트 쇼핑을 붙인다
주요 사건
Google I/O 2026 이후 The Verge와 Mashable은 Google 검색이 AI Mode, 쇼핑 에이전트, Universal Cart, Gmail·문서와 연결된 실행형 검색으로 확장되고 있다고 보도했다. Mashable은 AI Mode 월간 이용자가 10억 명을 넘었다고 전했다.
배경
- 1998-09-04Google 설립
- 2024-05-14Google AI Overviews 미국 출시
- 2026-05-19I/O 2026에서 AI Mode·에이전트 쇼핑 업데이트 공개
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- AI Mode 한국어·한국 출시 일정
- Universal Cart의 판매자 수수료·데이터 정책
참고 자료
Musk-Altman 소송 패소, OpenAI 지배구조 논쟁을 법정 밖으로 돌린다
주요 사건
MIT Technology Review는 Elon Musk가 OpenAI의 비영리 지위와 회사 방향을 문제 삼은 소송에서 패소한 뒤 재판 의미를 다루는 라운드테이블을 발행했다. 이 이슈는 AI 기업의 사명·영리화·안전 거버넌스 논쟁을 다시 부각한다.
배경
- 2015-12-11OpenAI 비영리 연구소로 출범
- 2019-03-11OpenAI LP/capped-profit 구조 도입
- 2026-05-19MIT Technology Review가 Musk v. Altman 재판 라운드테이블 발행
주요 입장
전망
- · 컴퓨트·데이터 병목이 모델 성능보다 제품 배포 속도를 더 크게 좌우한다는 견해가 강화되고 있다.
- · 벤치마크 수치가 실제 운영비와 지연시간으로 번역되는지 검증하는 고객 사례가 다음 경쟁축이다.
한국 영향
- OpenAI 지배구조 개편 여부
- xAI와 OpenAI의 추가 법적·상업적 충돌