Lleejh.in/ 뉴스
2026년 4월 29일 · 요일·기술
높음
혼합

OpenAI, AWS 진입으로 AI 유통 경쟁을 멀티클라우드로 재편한다

핵심 요약
  • OpenAI가 AWS Bedrock에 들어가며 Microsoft 중심 유통 구조가 완화된다.
  • SemiAnalysis는 CPU·ABF·추론 벤치마크가 AI 인프라의 새 병목이라고 지적한다.
  • NVIDIA·Meta·Apple은 멀티모달과 KV 캐시 효율을 공개 모델·논문으로 밀어붙인다.
  • Google의 국방 AI·EU Android DMA 압박은 AI 플랫폼 권한을 규제 의제로 끌어올린다.
11개 출처 · 11개 항목
01@dylan522p·4.28 22:57

OpenAI, AWS Bedrock 진입 — AI 유통 독점 구도 흔든다

주요 사건

Dylan Patel이 OpenAI 뉴스룸의 'enterprise offerings on every cloud' 발언을 공유했다. 같은 날 Amazon은 OpenAI 최신 모델과 코딩 에이전트를 Amazon Bedrock에서 제공한다고 발표했다. Bedrock은 기존 보안·거버넌스·오케스트레이션 API로 Anthropic, Meta, Mistral, Cohere 모델과 OpenAI 모델을 함께 평가하게 만든다.

배경

역사적 맥락
OpenAI는 2019년 이후 Microsoft Azure와 깊게 묶였지만, 기업 고객은 보안·데이터 위치·기존 조달 때문에 멀티클라우드를 요구해 왔다. Anthropic은 AWS와 Google을 동시에 활용하며 멀티클라우드 배포를 사실상 표준 전략으로 만들었다.
원인
기업 AI 도입 확대 → 단일 클라우드 조달 병목 → AWS·Google의 모델 마켓 경쟁 → OpenAI의 Bedrock 진입 → 클라우드가 모델 유통권을 두고 재경쟁
타임라인
  1. 2019-07-22
    Microsoft가 OpenAI에 대규모 투자하며 Azure 중심 동맹을 형성
  2. 2026-04-28
    Amazon이 OpenAI 모델과 코딩 에이전트의 Bedrock 제공을 발표
  3. 2026-04-28
    AWS OpenAI 페이지가 GPT-5.5·GPT-5.4 preview와 Bedrock Managed Agents를 명시

주요 입장

OpenAI
유통 확대
Azure 밖 고객에게도 frontier 모델과 코딩 에이전트를 팔아 기업 침투율을 높인다.
AWS
모델 포트폴리오 강화
Bedrock을 단일 모델 API·거버넌스 계층으로 만들 수 있다.
Microsoft
독점 약화 관리
핵심 라이선스와 Azure 우선권을 지키면서 OpenAI 성장을 허용한다.
기업 고객
선택권 확대
기존 AWS 보안·조달 체계 안에서 OpenAI를 시험할 수 있다.

전망

high
대기업은 OpenAI·Anthropic·오픈모델을 같은 관리 계층에서 벤치마크하고 워크로드별로 나눠 쓴다.
medium
모델 자체보다 프롬프트 캐시, 에이전트 오케스트레이션, 데이터 레지던시가 할인 경쟁의 중심이 된다.
medium
Azure는 Copilot, GitHub, Windows 통합으로 OpenAI 접근성 이상의 가치를 증명해야 한다.
  • · Reuters 계열 보도는 OpenAI-Microsoft 독점 완화가 AWS·Google Cloud 고객의 OpenAI 도입 장벽을 낮춘다고 평가했다.
  • · AWS 발표는 Bedrock Managed Agents가 OpenAI 모델에 맞춰 최적화된 생산용 에이전트 인프라를 제공한다고 강조했다.

한국 영향

직접 영향
국내 AWS 중심 기업은 Azure 전환 없이 OpenAI 모델을 도입할 수 있어 PoC 속도가 빨라진다.
간접 영향
공공·금융권은 멀티클라우드 AI 조달 기준과 모델 감사 체계를 더 촘촘히 만들어야 한다.
주목할 지점
  • 한국 리전 Bedrock 지원 범위
  • GPT-5.5·GPT-5.4 preview의 데이터 보관 조건
  • AWS·Azure 간 에이전트 비용 비교
#openai#aws#cloud#agents
02@OpenAI·4.28 17:41

OpenAI, GPT-5.4 Pro 수학 성과로 연구 자동화 가능성 키운다

주요 사건

OpenAI는 60년 동안 열려 있던 Erdős 문제 하나가 GPT-5.4 Pro의 도움으로 해결됐다고 소개했다. 연구자 Sebastien Bubeck과 Ernest Ryu가 AI가 수학에 강해질 때 연구 방식이 어떻게 바뀌는지 설명하는 팟캐스트도 공개했다.

배경

역사적 맥락
수학 AI는 정리증명기, AlphaGeometry, 대형언어모델 기반 추론을 거치며 발전했다. GPT 계열은 자연어 추론과 코드 실행을 결합하면서 인간 연구자의 탐색 공간을 줄이는 보조 도구로 자리 잡고 있다.
원인
추론 모델 고도화 → 장문 증명·계산 탐색 가능 → 미해결 문제 보조 성공 사례 등장 → 연구 생산성 논쟁 확대
타임라인
  1. 1930-01-01
    Paul Erdős가 조합론·정수론 문제 생태계를 확장
  2. 2024-01-17
    AI 정리증명·기하 문제 해결 성과가 대중화
  3. 2026-04-28
    OpenAI가 GPT-5.4 Pro의 Erdős 문제 해결 보조 사례를 공개

주요 입장

OpenAI
연구 보조 도구화
모델은 인간 수학자의 가설 생성·검증 속도를 높인다.
학계
검증 우선
증명은 모델 산출보다 인간 검토와 형식 검증이 중요하다.
경쟁 모델 개발사
벤치마크 경쟁
AIME·MATH·정리증명 성능을 frontier 모델 차별화 지표로 삼는다.

전망

medium
수학·물리·컴퓨터과학에서 모델이 반례 탐색과 보조정리 제안에 더 많이 쓰인다.
high
Lean·Coq 같은 증명 검증기와 LLM의 결합이 연구 신뢰성의 핵심이 된다.
medium
단순 문제풀이 벤치마크보다 실제 미해결 문제 기여도가 모델 평가 기준으로 올라온다.
  • · OpenAI 연구진은 AI가 수학에서 '문제 풀이기'를 넘어 연구 워크플로의 일부가 된다고 설명했다.
  • · 수학계는 모델이 제안한 증명의 오류 가능성 때문에 독립 검증과 재현성을 요구한다.

한국 영향

직접 영향
국내 대학·연구소는 수학·반도체 설계·신약탐색에서 AI 보조 연구 체계를 실험할 명분을 얻는다.
간접 영향
연구윤리, AI 공동저자 표기, 계산자원 지원 기준이 필요하다.
주목할 지점
  • GPT-5.4 Pro의 원문 문제와 검증 논문
  • Lean 등 형식검증 도구 연동
  • 국내 연구기관의 AI 연구보조 도입 지침
#openai#math#research#ai-model
03@SemiAnalysis_·4.28 21:01

SemiAnalysis, AI 서버 CPU 수요 반등을 새 인프라 변수로 지목한다

주요 사건

SemiAnalysis는 AI 붐에서 GPU와 네트워킹에 가려졌던 CPU 수요가 다시 중요해졌다고 분석했다. AI 워크로드는 코어당 성능과 지연시간, 클라우드는 소켓당 와트 성능, 엔터프라이즈는 소프트웨어 라이선스 비용이 CPU 경제성을 좌우한다고 설명했다.

배경

역사적 맥락
2023~2025년 AI 인프라 투자는 H100·H200·B200 GPU와 InfiniBand·Ethernet에 집중됐다. 그러나 추론 서비스, 데이터 전처리, 에이전트 오케스트레이션은 여전히 CPU 병렬성·메모리 대역폭·라이선스 구조에 민감하다.
원인
GPU 클러스터 확장 → 주변 시스템 병목 노출 → 추론·클라우드 운영비 증가 → CPU 성능·전력·라이선스 경제성 재평가
타임라인
  1. 2023-03-01
    생성 AI 확산으로 GPU 서버 수요 급증
  2. 2025-01-01
    AI 추론 비중 증가로 서버 전체 TCO 논의 확대
  3. 2026-04-28
    SemiAnalysis가 CPU 수요 반전 분석을 공개

주요 입장

CPU 업체
재평가 기대
AI 서버도 CPU 성능·전력효율 없이는 TCO를 낮출 수 없다.
GPU 업체
플랫폼 통합
GPU·CPU·네트워킹을 묶은 레퍼런스 아키텍처가 더 중요해진다.
클라우드 사업자
TCO 최적화
워크로드별 CPU 배치와 라이선스 최적화가 마진을 좌우한다.

전망

medium
AI 클러스터 증설이 GPU뿐 아니라 고성능 서버 CPU 교체 수요를 만든다.
high
코어 수와 소켓 수 기반 소프트웨어 과금이 하드웨어 선택의 핵심 변수로 남는다.
medium
전력효율과 자체 칩 전략을 가진 클라우드가 x86 의존도를 더 낮춘다.
  • · SemiAnalysis는 AI·클라우드·소프트웨어 라이선스별 CPU 경제성이 서로 다르다고 분리해 봐야 한다고 지적했다.
  • · 서버 업계는 GPU 공급만큼 전력·냉각·CPU 메모리 경로가 실제 서비스 성능을 좌우한다고 본다.

한국 영향

직접 영향
국내 데이터센터와 SI 기업은 GPU 견적뿐 아니라 CPU·라이선스·전력 TCO를 함께 계산해야 한다.
간접 영향
국산 AI 클라우드 정책도 GPU 구매 보조에서 랙 단위 효율 지표로 옮겨가야 한다.
주목할 지점
  • AMD EPYC·Intel Xeon 신제품의 AI 서버 채택률
  • ARM 서버의 국내 클라우드 도입
  • Oracle·VMware 등 라이선스 정책 변화
#semiconductor#cpu#ai-infrastructure#datacenter
04@SemiAnalysis_·4.28 17:00

SemiAnalysis, Ajinomoto ABF 98% 점유율을 AI 칩 병목으로 지목한다

주요 사건

SemiAnalysis는 모든 AI 칩에 필요한 박막 절연 소재 ABF의 98%가 일본 Ajinomoto에 집중돼 있고 생산 준비가 끝난 대체재가 없다고 지적했다. 한 생산자는 2027년까지 예약이 찼고 리드타임은 6개월을 넘으며, NVIDIA가 공급사 증설 자본지출의 절반을 부담할 정도로 병목이 커졌다고 설명했다.

배경

역사적 맥락
ABF는 고성능 CPU·GPU 패키지 기판의 미세 배선을 가능하게 하는 절연 필름이다. AI 가속기는 HBM, 대형 패키지, 고속 인터커넥트 요구가 커지면서 기판 소재 품질과 공급 안정성이 성능만큼 중요해졌다.
원인
AI 가속기 패키지 대형화 → ABF 수요 급증 → 단일 소재 업체 의존 노출 → 리드타임·가격 상승 → NVIDIA 등 고객의 공급망 직접 투자
타임라인
  1. 1990-01-01
    Ajinomoto가 반도체 패키징용 ABF를 상용화
  2. 2025-01-01
    HBM·첨단 패키징 수요가 AI 칩 공급망 병목으로 부상
  3. 2026-04-28
    SemiAnalysis가 ABF 집중도를 AI 칩 핵심 리스크로 제기

주요 입장

Ajinomoto
희소 소재 공급자
품질과 공정 노하우가 진입장벽을 만든다.
NVIDIA·AI 칩 고객
공급망 선점
GPU 생산은 파운드리만큼 패키징 소재 확보에 달려 있다.
대체 소재 업체
기회 탐색
단일 공급 리스크를 줄일 대체 필름·기판 기술이 필요하다.
정부
경제안보 관심
AI 칩 핵심 소재 집중은 지정학적 취약점이다.

전망

high
GPU 업체와 클라우드가 ABF·기판 업체에 선급금과 CAPEX를 제공한다.
medium
품질 인증과 수율 문제로 2027년 전까지 의미 있는 대체 공급은 제한된다.
medium
AI 수혜가 GPU에서 기판·필름·화학 소재로 확산된다.
  • · SemiAnalysis는 ABF를 '모든 AI 칩에 필요한 단일 박막 소재'라고 표현하며 공급 집중을 경고했다.
  • · BigGo Finance 보도는 Ajinomoto가 2030년까지 ABF 생산능력을 50% 확대하고 250억 엔을 투자한다고 전했다.

한국 영향

직접 영향
삼성전기·LG이노텍 등 패키지 기판 기업은 ABF 확보와 고객 장기계약이 경쟁력의 핵심이 된다.
간접 영향
소재 국산화 정책은 포토레지스트를 넘어 AI 패키징 필름·기판으로 넓혀야 한다.
주목할 지점
  • Ajinomoto ABF 가격 인상
  • NVIDIA·TSMC·기판사 CAPEX 계약
  • 국내 FC-BGA 증설 수율
#semiconductor#packaging#supply-chain#nvidia
05@SemiAnalysis_·4.28 02:49

InferenceX, DeepSeek V4 Pro에서 B300이 H200보다 최대 8배 빠르다

주요 사건

SemiAnalysis는 InferenceX에 DeepSeek V4 Pro의 vLLM 성능을 추가했고 B200, B300, H200, GB200 분산 구성을 비교했다고 밝혔다. 공개 트윗 기준 B300은 H200보다 최대 8배 빠르며, vLLM 0.20의 DeepGEMM MegaMoE가 EP dispatch, combine, GEMM, SwiGLU를 하나의 mega-kernel로 합치면 성능이 더 개선될 수 있다고 설명했다.

배경

역사적 맥락
AI 추론 비용은 모델 품질뿐 아니라 커널, 스케줄러, KV 캐시, GPU 세대에 좌우된다. Blackwell 계열은 FP4·FP8, 더 큰 메모리 대역폭, 랙 단위 NVLink로 Hopper 대비 추론 효율을 끌어올린다.
원인
DeepSeek V4 Pro 같은 MoE 모델 확산 → 추론 커널 병목 확대 → vLLM·SGLang·TensorRT-LLM 최적화 경쟁 → B300/H200 성능 격차 부각
타임라인
  1. 2024-03-18
    NVIDIA가 Blackwell 아키텍처를 공개
  2. 2025-07-12
    SemiAnalysisAI가 InferenceX 공개 벤치마크 프로젝트를 운영
  3. 2026-04-28
    InferenceX가 DeepSeek V4 Pro의 B300·H200 비교를 추가

주요 입장

NVIDIA
CUDA 생태계 우위
하드웨어와 커널 최적화가 결합될 때 세대 간 성능 격차가 커진다.
vLLM 커뮤니티
오픈소스 최적화
MegaMoE 같은 커널 통합으로 공개 추론 스택도 상용 수준 효율을 낼 수 있다.
클라우드 고객
비용 검증
토큰당 비용은 모델 가격보다 실제 처리량과 지연시간으로 결정된다.
AMD·대체 가속기
벤치마크 대응
공개 벤치마크에서 소프트웨어 성능을 증명해야 한다.

전망

high
대형 MoE 추론은 H100/H200에서 B200/B300·GB200 계열로 빠르게 이동한다.
high
vLLM, SGLang, TensorRT-LLM의 커널 업데이트가 모델 출시만큼 중요한 뉴스가 된다.
medium
기업 고객은 raw throughput, TTFT, p95 latency, 비용을 함께 요구한다.
  • · SemiAnalysis는 B300이 DeepSeek V4 Pro vLLM 환경에서 H200보다 최대 8배 빠르다고 밝혔다.
  • · InferenceX는 B200, H200, H100, AMD MI355X, MI325X, MI300X를 비교하는 공개 추론 벤치마크를 제공한다고 설명한다.

한국 영향

직접 영향
국내 AI 클라우드는 H100/H200 임대만으로 가격 경쟁력을 유지하기 어려워지고 Blackwell 조달 전략이 중요해진다.
간접 영향
소프트웨어 커널 엔지니어와 분산 추론 운영 역량이 GPU 구매만큼 중요해진다.
주목할 지점
  • vLLM 0.20 DeepGEMM MegaMoE 성능
  • B300 국내 공급 시점
  • 토큰당 원가와 p95 latency 공개 여부
#inference#deepseek#nvidia#benchmark
06Hugging Face·4.28 15:58

NVIDIA, 30B 옴니모달 Nemotron 3 Nano를 공개한다

주요 사건

NVIDIA가 문서, 이미지, 음성, 장시간 오디오·비디오 이해, 컴퓨터 사용, 일반 추론을 겨냥한 Nemotron 3 Nano Omni를 공개했다. Hugging Face에는 30B-A3B Reasoning 모델의 BF16, FP8, NVFP4 체크포인트가 올라왔고 기술 보고서와 학습 데이터셋도 함께 공개됐다.

배경

역사적 맥락
멀티모달 모델은 텍스트·이미지 이해에서 음성·비디오·문서·에이전트 작업으로 확장됐다. NVIDIA는 모델 공개와 NIM 배포를 결합해 GPU 판매뿐 아니라 엔터프라이즈 AI 소프트웨어 스택까지 장악하려 한다.
원인
기업 문서·영상 데이터 증가 → 멀티모달 에이전트 수요 확대 → 오픈 체크포인트 공개 경쟁 → NVIDIA가 FP8·NVFP4 최적화 모델로 하드웨어 활용 경로 제시
타임라인
  1. 2024-01-01
    오픈 멀티모달 모델 경쟁이 LLaVA·Qwen-VL 계열로 확산
  2. 2025-01-01
    FP8·저정밀 추론이 대형 모델 배포의 핵심 기술로 부상
  3. 2026-04-28
    NVIDIA가 Nemotron 3 Nano Omni 체크포인트를 Hugging Face에 공개

주요 입장

NVIDIA
오픈 모델 배포
GPU 최적화 모델과 NIM 배포로 기업 멀티모달 에이전트를 빠르게 구축하게 한다.
오픈소스 커뮤니티
검증 기대
체크포인트·데이터·보고서 공개는 재현성과 파생 연구를 가능하게 한다.
경쟁사
멀티모달 방어
Google, OpenAI, Meta도 장문 비디오·문서 이해 성능을 높여야 한다.

전망

high
PDF·영상·회의 녹취를 함께 처리하는 사내 에이전트 PoC가 늘어난다.
medium
FP8·NVFP4 체크포인트가 비용 절감을 위한 기본 배포 옵션이 된다.
medium
Long video QA, document VQA, computer-use 성능이 공개 리더보드에서 검증된다.
  • · Hugging Face 발표는 Nemotron 3 Nano Omni가 문서·음성·비디오·컴퓨터 사용을 아우르는 옴니모달 이해 모델이라고 설명했다.
  • · NVIDIA 모델 카드에는 BF16, FP8, NVFP4 세 정밀도 체크포인트가 2026년 4월 28일 공개됐다고 명시돼 있다.

한국 영향

직접 영향
국내 제조·금융사는 문서와 영상 데이터를 결합한 사내 지식 에이전트를 자체 GPU 환경에서 시험할 수 있다.
간접 영향
AI 반도체 정책은 모델 경량화·저정밀 추론 소프트웨어까지 포함해야 한다.
주목할 지점
  • Nemotron 3 Nano Omni 라이선스
  • 한국어 문서·영상 벤치마크
  • NIM 기반 온프레미스 배포 비용
#nvidia#multimodal#open-model#enterprise-ai
07@_akhaliq·4.28 17:12

Meta Tuna-2, 비전 인코더 없이 픽셀 임베딩으로 멀티모달을 학습한다

주요 사건

AK가 Meta의 Tuna-2 논문을 공유했다. Tuna-2는 사전학습된 비전 인코더나 VAE에 의존하지 않고 단순 패치 임베딩으로 원시 픽셀을 처리해 시각 이해와 이미지 생성을 하나의 멀티모달 모델 안에서 수행한다.

배경

역사적 맥락
기존 통합 멀티모달 모델은 CLIP류 비전 인코더와 이미지 생성용 VAE·확산 모델을 따로 쓰는 경우가 많았다. 이 구조는 이해와 생성 표현이 달라 end-to-end 최적화가 어렵다는 문제가 있었다.
원인
멀티모달 이해·생성 통합 수요 → 인코더·VAE 분리 구조의 불일치 노출 → 원시 픽셀 기반 학습 시도 → Tuna-2의 encoder-free 구조 제안
타임라인
  1. 2021-01-05
    CLIP이 대규모 이미지-텍스트 표현학습의 표준이 됨
  2. 2023-01-01
    멀티모달 LLM이 비전 인코더와 LLM 연결 방식으로 확산
  3. 2026-04-28
    Meta Tuna-2 논문이 공개되고 AK가 공유

주요 입장

Meta 연구진
구조 단순화
비전 인코더 없이도 픽셀 공간에서 이해와 생성을 함께 학습할 수 있다.
기존 멀티모달 모델 개발사
검증 필요
인코더 기반 구조는 학습 안정성과 초기 수렴 속도에서 여전히 장점이 있다.
사용자·개발자
품질 기대
이해와 생성 표현이 같아지면 이미지 편집·분석 일관성이 좋아질 수 있다.

전망

medium
대규모 학습 자원을 가진 연구소가 VAE-free 멀티모달 구조를 더 실험한다.
high
상용 모델은 당분간 인코더 기반과 픽셀 기반을 작업별로 혼합한다.
medium
논문 주장처럼 scale이 커질수록 fine-grained perception에서 강점이 나타날 수 있다.
  • · Tuna-2 논문은 encoder-free 설계가 규모가 커질수록 더 강한 멀티모달 이해를 보인다고 주장한다.
  • · 논문은 인코더 기반 변형이 초기 pretraining에서는 더 빠르게 수렴하지만 장기적으로 픽셀 기반 설계가 경쟁 가능하다고 설명한다.

한국 영향

직접 영향
국내 비전 AI 연구팀은 VAE·CLIP 의존을 줄인 멀티모달 학습 실험을 참고할 수 있다.
간접 영향
영상·이미지 생성 스타트업은 모델 구조 단순화가 학습비와 파이프라인 복잡도를 낮출지 주시해야 한다.
주목할 지점
  • Tuna-2 코드·가중치 공개 여부
  • GenEval·MMMU 등 벤치마크 수치
  • 픽셀 기반 모델의 학습 비용
#meta#multimodal#research#vision
08@_akhaliq·4.28 16:12

Apple, KV 캐시를 층별 공유해 LLM 추론 메모리 부담을 낮춘다

주요 사건

AK가 Apple의 'Stochastic KV Routing' 논문을 공유했다. 이 방법은 학습 중 각 층이 자기 KV 상태나 앞선 층의 KV 상태를 무작위로 참조하게 해, 배포 시 일부 층의 KV 캐시를 공유하거나 생략해도 성능 손실을 줄이는 접근이다.

배경

역사적 맥락
LLM 추론은 다음 토큰을 만들 때 이전 토큰의 key-value 상태를 저장하는 KV 캐시에 크게 의존한다. 긴 컨텍스트와 동시 사용자 수가 늘면서 KV 캐시 메모리는 GPU 비용과 처리량의 핵심 병목이 됐다.
원인
긴 컨텍스트 모델 확산 → KV 캐시 메모리 폭증 → 시간축 압축·eviction 연구 증가 → Apple이 깊이축 cache sharing을 학습 방식으로 제안
타임라인
  1. 2017-06-12
    Transformer가 self-attention 구조를 제시
  2. 2023-01-01
    긴 컨텍스트 LLM이 KV 캐시 비용 문제를 본격화
  3. 2026-04-28
    Apple Stochastic KV Routing 논문이 X에서 공유

주요 입장

Apple 연구진
메모리 최적화
층별 KV 공유를 학습에 포함하면 배포 하드웨어 제약에 유연하게 대응할 수 있다.
클라우드 추론 사업자
비용 절감 관심
KV 캐시를 줄이면 같은 GPU에서 더 많은 세션을 처리할 수 있다.
모델 품질팀
정확도 검증
캐시 공유는 환각·장문 기억 성능 저하를 면밀히 봐야 한다.

전망

medium
메모리가 작은 모바일·PC NPU 환경에서 KV 공유 학습이 특히 유용해질 수 있다.
medium
vLLM·SGLang류 런타임이 모델별 층별 캐시 정책을 지원할 가능성이 있다.
high
기업은 정확도와 비용을 워크로드별로 선택하는 배포 프로파일을 요구한다.
  • · 논문은 깊이축 캐시 공유가 시간축 compression·eviction과 직교하는 최적화 축이라고 설명한다.
  • · 평가에서는 pretraining 또는 fine-tuning에 stochastic routing을 넣으면 여러 모델군에서 캐시 메모리 절감이 가능하다고 주장한다.

한국 영향

직접 영향
국내 온디바이스 AI·스마트폰 업체는 긴 컨텍스트 기능을 메모리 제한 안에서 제공할 연구 방향을 얻는다.
간접 영향
AI 반도체 설계도 KV 캐시 압축·공유 지원을 하드웨어 기능으로 고려해야 한다.
주목할 지점
  • Apple 논문의 공개 코드
  • 한국어 장문 QA 성능 저하 여부
  • 모바일 NPU 적용 가능성
#apple#llm-inference#kv-cache#research
09@GoogleDeepMind·4.28 17:10

Google DeepMind, AI 교육 프로그램을 180개국 290만명으로 넓힌다

주요 사건

Google DeepMind는 Raspberry Pi Foundation과 만든 Experience AI 프로그램이 2023년 이후 교사 3만명 이상을 훈련했고, 180개국 19개 언어로 학생 290만명에게 도달했다고 밝혔다. 교사 93%는 AI 개념 지식이 늘었고 87%는 복잡한 개념을 가르칠 자신감이 커졌다고 답했다. 라틴아메리카에서는 Google.org의 460만 달러 지원으로 2028년까지 교사 2만4000명, 학생 125만명을 목표로 한다.

배경

역사적 맥락
AI 리터러시는 코딩 교육을 넘어 모델의 한계, 편향, 책임 있는 사용을 이해하는 시민 교육으로 확장됐다. 생성 AI가 학교 과제와 직업훈련에 들어오면서 교사 재교육이 핵심 병목이 됐다.
원인
생성 AI 대중화 → 학교 현장의 교육 격차 확대 → 무료 커리큘럼과 교사 훈련 수요 증가 → DeepMind·Raspberry Pi의 글로벌 프로그램 확장
타임라인
  1. 2023-04-01
    Experience AI 프로그램 출범
  2. 2025-01-01
    UNESCO ICT 교육상 수상
  3. 2026-04-28
    Google DeepMind가 290만명 도달 성과와 라틴아메리카 확장을 재공유

주요 입장

Google DeepMind
AI 리터러시 확대
AI가 사회 전반에 퍼질수록 학생과 교사가 기술 원리를 이해해야 한다.
Raspberry Pi Foundation
교사 중심 확산
무료 자료와 train-the-trainer 모델이 지속 가능한 보급을 만든다.
교육 당국
커리큘럼 검토
AI 윤리와 실습을 공교육 안에 넣어야 한다.

전망

high
국가별 교육과정에 생성 AI 이해·검증·윤리 단원이 편입된다.
medium
무료 자료의 공익성과 기업 생태계 선점 의도가 함께 논의된다.
high
온라인 연수, 교재, 평가도구 시장이 커진다.
  • · Raspberry Pi Foundation은 Experience AI가 180개국 19개 언어로 290만명에게 도달했다고 밝혔다.
  • · 프로그램 평가에서 교사 93%는 AI 개념 지식 증가, 87%는 교수 자신감 증가를 보고했다.

한국 영향

직접 영향
한국 교육부와 시도교육청은 AI 디지털교과서 논의와 별개로 교사 리터러시 훈련 지표를 강화해야 한다.
간접 영향
국내 에듀테크 기업은 AI 사용법보다 원리·검증·윤리 교육 콘텐츠 수요를 노릴 수 있다.
주목할 지점
  • Experience AI 한국어 자료 확대
  • 교사 연수 효과 측정 방식
  • 공교육 내 빅테크 콘텐츠 의존도
#google#education#ai-literacy#deepmind
10TechCrunch·4.28 18:15

Google, Pentagon에 AI 접근권 확대 — Anthropic 안전장치 논쟁 뒤따른다

주요 사건

TechCrunch는 Google이 미 국방부의 기밀 네트워크에서 자사 AI를 '합법적 사용' 범위로 활용할 수 있게 접근권을 넓혔다고 보도했다. 계약에는 Google이 국내 대량감시나 완전자율무기 사용을 의도하지 않는다는 문구가 포함됐지만, lawful government purpose의 폭을 둘러싼 논쟁이 남는다. 이는 Anthropic이 국방부의 안전장치 제거 요구를 거부한 뒤 나온 움직임이다.

배경

역사적 맥락
미 국방부의 AI 도입은 Project Maven 이후 직원 반발과 윤리 논쟁을 반복했다. 최근 OpenAI, xAI, Google 등은 정부·국방 고객을 확대하는 반면 Anthropic은 감시·자율무기 안전장치에서 더 강한 제한을 유지해 왔다.
원인
국방 AI 수요 증가 → 모델 안전장치와 작전 권한 충돌 → Anthropic 거부 → Google이 더 넓은 접근권 제공 → 빅테크의 국방 AI 윤리 논쟁 재점화
타임라인
  1. 2018-06-01
    Google 직원 반발 뒤 Project Maven 계약 갱신 중단
  2. 2026-02-26
    Anthropic이 Pentagon 안전장치 제거 요구를 거부
  3. 2026-04-28
    Google의 Pentagon AI 접근 확대 보도

주요 입장

Google
정부 고객 확대
합법적 목적 안에서 AI를 제공하되 대량감시·자율무기는 의도하지 않는다.
Pentagon
작전 유연성 요구
기밀망에서도 최신 AI를 활용해야 한다.
Anthropic
안전장치 고수
AI가 국내 감시나 자율무기 타깃팅에 쓰이는 것은 허용할 수 없다.
직원·시민단체
감시 우려
'합법'이라는 표현만으로 권리 침해 위험을 막을 수 없다.

전망

high
미 정부는 주요 모델 기업과 classified AI 배포 계약을 늘린다.
medium
Project Maven 때처럼 내부 윤리 논쟁과 공개 항의가 커질 수 있다.
medium
감시, 정보분석, 무기체계, 행정업무별 허용·금지 기준이 더 구체화된다.
  • · TechCrunch는 Google 계약이 Anthropic의 거부 이후 Pentagon AI 접근을 넓힌 사례라고 평가했다.
  • · Reuters는 Anthropic이 국내 대량감시와 완전자율무기 관련 안전장치 제거를 거부했다고 보도했다.

한국 영향

직접 영향
한국 국방 AI 도입도 모델 안전장치, 망분리, 작전권한의 경계를 미리 정해야 한다.
간접 영향
국내 AI 기업이 방산 시장에 진입할 때 사용 제한 정책과 감사 로그가 필수 요건이 된다.
주목할 지점
  • Google 계약의 실제 사용 제한
  • Anthropic의 DoD 계약 상태
  • 한국 국방부 AI 윤리 가이드라인
#google#defense-ai#anthropic#ai-safety
11Techbooky·4.28 20:28

EU, Google에 Android AI 접근 개방 요구 — Gemini 특권을 겨냥한다

주요 사건

Reuters는 EU 집행위원회가 Google에 Gemini가 누리는 Android 핵심 기능을 경쟁 AI 서비스도 쓸 수 있도록 조치하라고 요구했다고 보도했다. 제안은 사용자가 선호하는 AI로 이메일 전송, 음식 주문, 사진 공유 같은 앱 작업을 실행하게 하는 방향이다. 이해관계자 의견 제출 기한은 5월 13일이며 최종 결정은 7월 말로 예정돼 있다.

배경

역사적 맥락
EU의 Digital Markets Act는 대형 플랫폼의 자기우대와 데이터 접근 제한을 겨냥한다. 검색·브라우저·앱스토어에서 시작한 규제 초점이 이제 스마트폰 운영체제의 AI assistant 권한으로 이동하고 있다.
원인
Gemini의 Android 시스템 통합 강화 → 경쟁 AI의 기능 접근 격차 확대 → DMA specification proceeding → EU의 AI assistant 동등 접근 요구
타임라인
  1. 2022-11-01
    EU Digital Markets Act 발효
  2. 2026-01-01
    EU가 Google DMA 준수를 돕는 specification proceeding 개시
  3. 2026-04-27
    Reuters가 Android AI 경쟁 접근 요구를 보도
  4. 2026-07-31
    EU 최종 결정 예정

주요 입장

EU 집행위원회
개방 요구
Android 사용자는 Gemini뿐 아니라 ChatGPT·Claude·Grok 같은 AI도 시스템 수준에서 선택할 수 있어야 한다.
Google
과잉규제 반박
Android는 이미 개방적이며 제조사가 AI 서비스를 자유롭게 커스터마이즈할 수 있다.
경쟁 AI 개발사
동등 접근 요구
음성호출, 앱 실행, 로컬 데이터 접근 없이는 모바일 AI 경쟁이 불가능하다.
사용자
선택권 기대
선호 AI를 기본 assistant로 쓰고 앱 작업까지 맡기길 원한다.

전망

medium
EU에서 제3자 AI assistant가 시스템 invocation과 앱 실행 권한을 얻는다.
medium
Google은 보안·프라이버시·제품 무결성을 이유로 범위 축소를 요구한다.
low
EU 모델이 한국·일본·영국의 모바일 AI 경쟁정책 참고 사례가 된다.
  • · EU 경쟁당국은 제안이 Android 사용자의 AI 서비스 선택권을 넓힌다고 밝혔다.
  • · Reuters는 DMA 위반 시 글로벌 연매출의 최대 10% 벌금이 가능하다고 설명했다.

한국 영향

직접 영향
삼성 갤럭시의 Gemini·Bixby·제3자 AI 통합 전략에도 EU 결정이 영향을 줄 수 있다.
간접 영향
한국 플랫폼 규제도 검색·앱마켓을 넘어 AI assistant 기본권한으로 확대될 가능성이 있다.
주목할 지점
  • 5월 13일 이해관계자 의견
  • 7월 EU 최종 결정
  • 삼성 One UI의 AI assistant 선택권
#google#android#dma#regulation