OpenAI, AWS 진입으로 AI 유통 경쟁을 멀티클라우드로 재편한다
- OpenAI가 AWS Bedrock에 들어가며 Microsoft 중심 유통 구조가 완화된다.
- SemiAnalysis는 CPU·ABF·추론 벤치마크가 AI 인프라의 새 병목이라고 지적한다.
- NVIDIA·Meta·Apple은 멀티모달과 KV 캐시 효율을 공개 모델·논문으로 밀어붙인다.
- Google의 국방 AI·EU Android DMA 압박은 AI 플랫폼 권한을 규제 의제로 끌어올린다.
OpenAI, AWS Bedrock 진입 — AI 유통 독점 구도 흔든다
주요 사건
Dylan Patel이 OpenAI 뉴스룸의 'enterprise offerings on every cloud' 발언을 공유했다. 같은 날 Amazon은 OpenAI 최신 모델과 코딩 에이전트를 Amazon Bedrock에서 제공한다고 발표했다. Bedrock은 기존 보안·거버넌스·오케스트레이션 API로 Anthropic, Meta, Mistral, Cohere 모델과 OpenAI 모델을 함께 평가하게 만든다.
배경
- 2019-07-22Microsoft가 OpenAI에 대규모 투자하며 Azure 중심 동맹을 형성
- 2026-04-28Amazon이 OpenAI 모델과 코딩 에이전트의 Bedrock 제공을 발표
- 2026-04-28AWS OpenAI 페이지가 GPT-5.5·GPT-5.4 preview와 Bedrock Managed Agents를 명시
주요 입장
전망
- · Reuters 계열 보도는 OpenAI-Microsoft 독점 완화가 AWS·Google Cloud 고객의 OpenAI 도입 장벽을 낮춘다고 평가했다.
- · AWS 발표는 Bedrock Managed Agents가 OpenAI 모델에 맞춰 최적화된 생산용 에이전트 인프라를 제공한다고 강조했다.
한국 영향
- 한국 리전 Bedrock 지원 범위
- GPT-5.5·GPT-5.4 preview의 데이터 보관 조건
- AWS·Azure 간 에이전트 비용 비교
참고 자료
OpenAI, GPT-5.4 Pro 수학 성과로 연구 자동화 가능성 키운다
주요 사건
OpenAI는 60년 동안 열려 있던 Erdős 문제 하나가 GPT-5.4 Pro의 도움으로 해결됐다고 소개했다. 연구자 Sebastien Bubeck과 Ernest Ryu가 AI가 수학에 강해질 때 연구 방식이 어떻게 바뀌는지 설명하는 팟캐스트도 공개했다.
배경
- 1930-01-01Paul Erdős가 조합론·정수론 문제 생태계를 확장
- 2024-01-17AI 정리증명·기하 문제 해결 성과가 대중화
- 2026-04-28OpenAI가 GPT-5.4 Pro의 Erdős 문제 해결 보조 사례를 공개
주요 입장
전망
- · OpenAI 연구진은 AI가 수학에서 '문제 풀이기'를 넘어 연구 워크플로의 일부가 된다고 설명했다.
- · 수학계는 모델이 제안한 증명의 오류 가능성 때문에 독립 검증과 재현성을 요구한다.
한국 영향
- GPT-5.4 Pro의 원문 문제와 검증 논문
- Lean 등 형식검증 도구 연동
- 국내 연구기관의 AI 연구보조 도입 지침
SemiAnalysis, AI 서버 CPU 수요 반등을 새 인프라 변수로 지목한다
주요 사건
SemiAnalysis는 AI 붐에서 GPU와 네트워킹에 가려졌던 CPU 수요가 다시 중요해졌다고 분석했다. AI 워크로드는 코어당 성능과 지연시간, 클라우드는 소켓당 와트 성능, 엔터프라이즈는 소프트웨어 라이선스 비용이 CPU 경제성을 좌우한다고 설명했다.
배경
- 2023-03-01생성 AI 확산으로 GPU 서버 수요 급증
- 2025-01-01AI 추론 비중 증가로 서버 전체 TCO 논의 확대
- 2026-04-28SemiAnalysis가 CPU 수요 반전 분석을 공개
주요 입장
전망
- · SemiAnalysis는 AI·클라우드·소프트웨어 라이선스별 CPU 경제성이 서로 다르다고 분리해 봐야 한다고 지적했다.
- · 서버 업계는 GPU 공급만큼 전력·냉각·CPU 메모리 경로가 실제 서비스 성능을 좌우한다고 본다.
한국 영향
- AMD EPYC·Intel Xeon 신제품의 AI 서버 채택률
- ARM 서버의 국내 클라우드 도입
- Oracle·VMware 등 라이선스 정책 변화
SemiAnalysis, Ajinomoto ABF 98% 점유율을 AI 칩 병목으로 지목한다
주요 사건
SemiAnalysis는 모든 AI 칩에 필요한 박막 절연 소재 ABF의 98%가 일본 Ajinomoto에 집중돼 있고 생산 준비가 끝난 대체재가 없다고 지적했다. 한 생산자는 2027년까지 예약이 찼고 리드타임은 6개월을 넘으며, NVIDIA가 공급사 증설 자본지출의 절반을 부담할 정도로 병목이 커졌다고 설명했다.
배경
- 1990-01-01Ajinomoto가 반도체 패키징용 ABF를 상용화
- 2025-01-01HBM·첨단 패키징 수요가 AI 칩 공급망 병목으로 부상
- 2026-04-28SemiAnalysis가 ABF 집중도를 AI 칩 핵심 리스크로 제기
주요 입장
전망
- · SemiAnalysis는 ABF를 '모든 AI 칩에 필요한 단일 박막 소재'라고 표현하며 공급 집중을 경고했다.
- · BigGo Finance 보도는 Ajinomoto가 2030년까지 ABF 생산능력을 50% 확대하고 250억 엔을 투자한다고 전했다.
한국 영향
- Ajinomoto ABF 가격 인상
- NVIDIA·TSMC·기판사 CAPEX 계약
- 국내 FC-BGA 증설 수율
InferenceX, DeepSeek V4 Pro에서 B300이 H200보다 최대 8배 빠르다
주요 사건
SemiAnalysis는 InferenceX에 DeepSeek V4 Pro의 vLLM 성능을 추가했고 B200, B300, H200, GB200 분산 구성을 비교했다고 밝혔다. 공개 트윗 기준 B300은 H200보다 최대 8배 빠르며, vLLM 0.20의 DeepGEMM MegaMoE가 EP dispatch, combine, GEMM, SwiGLU를 하나의 mega-kernel로 합치면 성능이 더 개선될 수 있다고 설명했다.
배경
- 2024-03-18NVIDIA가 Blackwell 아키텍처를 공개
- 2025-07-12SemiAnalysisAI가 InferenceX 공개 벤치마크 프로젝트를 운영
- 2026-04-28InferenceX가 DeepSeek V4 Pro의 B300·H200 비교를 추가
주요 입장
전망
- · SemiAnalysis는 B300이 DeepSeek V4 Pro vLLM 환경에서 H200보다 최대 8배 빠르다고 밝혔다.
- · InferenceX는 B200, H200, H100, AMD MI355X, MI325X, MI300X를 비교하는 공개 추론 벤치마크를 제공한다고 설명한다.
한국 영향
- vLLM 0.20 DeepGEMM MegaMoE 성능
- B300 국내 공급 시점
- 토큰당 원가와 p95 latency 공개 여부
참고 자료
NVIDIA, 30B 옴니모달 Nemotron 3 Nano를 공개한다
주요 사건
NVIDIA가 문서, 이미지, 음성, 장시간 오디오·비디오 이해, 컴퓨터 사용, 일반 추론을 겨냥한 Nemotron 3 Nano Omni를 공개했다. Hugging Face에는 30B-A3B Reasoning 모델의 BF16, FP8, NVFP4 체크포인트가 올라왔고 기술 보고서와 학습 데이터셋도 함께 공개됐다.
배경
- 2024-01-01오픈 멀티모달 모델 경쟁이 LLaVA·Qwen-VL 계열로 확산
- 2025-01-01FP8·저정밀 추론이 대형 모델 배포의 핵심 기술로 부상
- 2026-04-28NVIDIA가 Nemotron 3 Nano Omni 체크포인트를 Hugging Face에 공개
주요 입장
전망
- · Hugging Face 발표는 Nemotron 3 Nano Omni가 문서·음성·비디오·컴퓨터 사용을 아우르는 옴니모달 이해 모델이라고 설명했다.
- · NVIDIA 모델 카드에는 BF16, FP8, NVFP4 세 정밀도 체크포인트가 2026년 4월 28일 공개됐다고 명시돼 있다.
한국 영향
- Nemotron 3 Nano Omni 라이선스
- 한국어 문서·영상 벤치마크
- NIM 기반 온프레미스 배포 비용
Meta Tuna-2, 비전 인코더 없이 픽셀 임베딩으로 멀티모달을 학습한다
주요 사건
AK가 Meta의 Tuna-2 논문을 공유했다. Tuna-2는 사전학습된 비전 인코더나 VAE에 의존하지 않고 단순 패치 임베딩으로 원시 픽셀을 처리해 시각 이해와 이미지 생성을 하나의 멀티모달 모델 안에서 수행한다.
배경
- 2021-01-05CLIP이 대규모 이미지-텍스트 표현학습의 표준이 됨
- 2023-01-01멀티모달 LLM이 비전 인코더와 LLM 연결 방식으로 확산
- 2026-04-28Meta Tuna-2 논문이 공개되고 AK가 공유
주요 입장
전망
- · Tuna-2 논문은 encoder-free 설계가 규모가 커질수록 더 강한 멀티모달 이해를 보인다고 주장한다.
- · 논문은 인코더 기반 변형이 초기 pretraining에서는 더 빠르게 수렴하지만 장기적으로 픽셀 기반 설계가 경쟁 가능하다고 설명한다.
한국 영향
- Tuna-2 코드·가중치 공개 여부
- GenEval·MMMU 등 벤치마크 수치
- 픽셀 기반 모델의 학습 비용
Apple, KV 캐시를 층별 공유해 LLM 추론 메모리 부담을 낮춘다
주요 사건
AK가 Apple의 'Stochastic KV Routing' 논문을 공유했다. 이 방법은 학습 중 각 층이 자기 KV 상태나 앞선 층의 KV 상태를 무작위로 참조하게 해, 배포 시 일부 층의 KV 캐시를 공유하거나 생략해도 성능 손실을 줄이는 접근이다.
배경
- 2017-06-12Transformer가 self-attention 구조를 제시
- 2023-01-01긴 컨텍스트 LLM이 KV 캐시 비용 문제를 본격화
- 2026-04-28Apple Stochastic KV Routing 논문이 X에서 공유
주요 입장
전망
- · 논문은 깊이축 캐시 공유가 시간축 compression·eviction과 직교하는 최적화 축이라고 설명한다.
- · 평가에서는 pretraining 또는 fine-tuning에 stochastic routing을 넣으면 여러 모델군에서 캐시 메모리 절감이 가능하다고 주장한다.
한국 영향
- Apple 논문의 공개 코드
- 한국어 장문 QA 성능 저하 여부
- 모바일 NPU 적용 가능성
참고 자료
Google DeepMind, AI 교육 프로그램을 180개국 290만명으로 넓힌다
주요 사건
Google DeepMind는 Raspberry Pi Foundation과 만든 Experience AI 프로그램이 2023년 이후 교사 3만명 이상을 훈련했고, 180개국 19개 언어로 학생 290만명에게 도달했다고 밝혔다. 교사 93%는 AI 개념 지식이 늘었고 87%는 복잡한 개념을 가르칠 자신감이 커졌다고 답했다. 라틴아메리카에서는 Google.org의 460만 달러 지원으로 2028년까지 교사 2만4000명, 학생 125만명을 목표로 한다.
배경
- 2023-04-01Experience AI 프로그램 출범
- 2025-01-01UNESCO ICT 교육상 수상
- 2026-04-28Google DeepMind가 290만명 도달 성과와 라틴아메리카 확장을 재공유
주요 입장
전망
- · Raspberry Pi Foundation은 Experience AI가 180개국 19개 언어로 290만명에게 도달했다고 밝혔다.
- · 프로그램 평가에서 교사 93%는 AI 개념 지식 증가, 87%는 교수 자신감 증가를 보고했다.
한국 영향
- Experience AI 한국어 자료 확대
- 교사 연수 효과 측정 방식
- 공교육 내 빅테크 콘텐츠 의존도
참고 자료
Google, Pentagon에 AI 접근권 확대 — Anthropic 안전장치 논쟁 뒤따른다
주요 사건
TechCrunch는 Google이 미 국방부의 기밀 네트워크에서 자사 AI를 '합법적 사용' 범위로 활용할 수 있게 접근권을 넓혔다고 보도했다. 계약에는 Google이 국내 대량감시나 완전자율무기 사용을 의도하지 않는다는 문구가 포함됐지만, lawful government purpose의 폭을 둘러싼 논쟁이 남는다. 이는 Anthropic이 국방부의 안전장치 제거 요구를 거부한 뒤 나온 움직임이다.
배경
- 2018-06-01Google 직원 반발 뒤 Project Maven 계약 갱신 중단
- 2026-02-26Anthropic이 Pentagon 안전장치 제거 요구를 거부
- 2026-04-28Google의 Pentagon AI 접근 확대 보도
주요 입장
전망
- · TechCrunch는 Google 계약이 Anthropic의 거부 이후 Pentagon AI 접근을 넓힌 사례라고 평가했다.
- · Reuters는 Anthropic이 국내 대량감시와 완전자율무기 관련 안전장치 제거를 거부했다고 보도했다.
한국 영향
- Google 계약의 실제 사용 제한
- Anthropic의 DoD 계약 상태
- 한국 국방부 AI 윤리 가이드라인
참고 자료
EU, Google에 Android AI 접근 개방 요구 — Gemini 특권을 겨냥한다
주요 사건
Reuters는 EU 집행위원회가 Google에 Gemini가 누리는 Android 핵심 기능을 경쟁 AI 서비스도 쓸 수 있도록 조치하라고 요구했다고 보도했다. 제안은 사용자가 선호하는 AI로 이메일 전송, 음식 주문, 사진 공유 같은 앱 작업을 실행하게 하는 방향이다. 이해관계자 의견 제출 기한은 5월 13일이며 최종 결정은 7월 말로 예정돼 있다.
배경
- 2022-11-01EU Digital Markets Act 발효
- 2026-01-01EU가 Google DMA 준수를 돕는 specification proceeding 개시
- 2026-04-27Reuters가 Android AI 경쟁 접근 요구를 보도
- 2026-07-31EU 최종 결정 예정
주요 입장
전망
- · EU 경쟁당국은 제안이 Android 사용자의 AI 서비스 선택권을 넓힌다고 밝혔다.
- · Reuters는 DMA 위반 시 글로벌 연매출의 최대 10% 벌금이 가능하다고 설명했다.
한국 영향
- 5월 13일 이해관계자 의견
- 7월 EU 최종 결정
- 삼성 One UI의 AI assistant 선택권