AI 경쟁축이 모델 발표에서 에이전트 인프라·로컬 추론·규제 검증으로 이동한다
- OpenAI Codex Appshots와 Google Science Skills가 에이전트의 작업 맥락·전문 도구 결합을 본격화한다.
- Cohere W4A4, AMD Ryzen AI Halo, Mix-Quant가 고성능 AI의 비용·하드웨어 장벽을 낮춘다.
- Waymo 운행 중단과 트럼프 AI 보안명령 연기는 AI 상용화가 안전·규제 병목에 진입했음을 보여준다.
- Spotify·UMG 합의는 생성형 콘텐츠를 금지보다 허가·보상 모델로 흡수하는 첫 대형 사례다.
OpenAI, Codex에 Appshots 추가 — 앱 화면·텍스트를 작업 맥락으로 자동 주입
주요 사건
OpenAI가 Codex 업데이트에서 Appshots를 공개했다. 맥에서 Command-Command로 앱 창을 붙이면 Codex가 스크린샷뿐 아니라 보이는 영역 밖 텍스트까지 가져와 코딩·문서·디자인 작업의 맥락으로 사용한다.
배경
- 2025-04-01OpenAI Codex 계열 에이전트 사용 확대
- 2026-02-02OpenAI, Codex 데스크톱 앱 공개
- 2026-05-21Codex Appshots·/goal 개선 발표
주요 입장
전망
- · OpenAI는 Codex 앱을 다중 에이전트 지휘 센터로 설명했다.
- · 9to5Mac은 Appshots가 스크린샷과 창 텍스트를 동시에 전달한다고 보도했다.
한국 영향
- Appshots의 기업용 권한·감사 로그
- Codex와 Claude Code/Cursor의 장시간 작업 성공률
Google DeepMind, Antigravity 과학 스킬 공개 — 30개 생명과학 DB를 에이전트에 연결
주요 사건
Google DeepMind가 Google Antigravity용 Science Skills를 공개했다. UniProt, AlphaFold Database, AlphaGenome API, InterPro 등 30개 이상 생명과학 데이터베이스와 도구를 에이전트 워크플로에 연결한다.
배경
- 2021-07-01AlphaFold DB 공개 후 구조생물학 활용 확대
- 2026-05-19Google, Gemini for Science와 Science Skills 발표
- 2026-05-21DeepMind, AK2 희귀질환 구조 분석 사례 소개
주요 입장
전망
- · Google은 Science Skills가 복잡한 구조생물학 분석을 수시간에서 수분으로 줄였다고 밝혔다.
- · GitHub 저장소는 AlphaGenome·AFDB·UniProt 등 30개 이상 도구 연동을 명시했다.
한국 영향
- Science Skills 오픈소스 확장 속도
- 국내 유전체·임상 데이터와의 연동 가능성
SemiAnalysis, EDA 시장 분석 공개 — AI ASIC이 Cadence·Synopsys 과점의 새 성장축으로 부상
주요 사건
SemiAnalysis가 EDA Market Primer를 공개하며 Cadence, Synopsys, Siemens, 중국 EDA 부상, 고객 소유 툴링(COT), hyperscaler ASIC 설계 수요를 다뤘다.
배경
- 1987-01-01Synopsys Design Compiler 상용화
- 2017-01-01Siemens, Mentor Graphics 인수로 EDA 3강 체제 강화
- 2026-05-21SemiAnalysis, EDA Market Primer 공개
주요 입장
전망
- · SEMI 자료는 2025년 Q3 EDA/IP 매출이 전년 대비 8.8% 늘었다고 집계했다.
- · SemiEngineering은 중국 EDA 매출이 다시 두 자릿수 성장으로 돌아섰다고 전했다.
한국 영향
- Synopsys-Ansys 통합 효과
- 중국 EDA의 첨단 노드 검증 성공 사례
Google, TPU용 llm-d 야간 CI 추가 — 쿠버네티스 추론 스택이 Nvidia 의존을 낮춘다
주요 사건
SemiAnalysis는 Google이 오픈소스 분산 추론 프로젝트 llm-d에 GKE/TPU 계열 야간 CI를 추가했다고 평가했다. Kubernetes 기반 프로덕션 추론에서 TPU 지원 품질을 높이는 움직임이다.
배경
- 2025-01-01vLLM·Kubernetes 기반 LLM 서빙 확산
- 2026-05-08llm-d, GKE 야간 E2E 워크플로 PR 병합
- 2026-05-21SemiAnalysis, TPU CI 품질 개선 언급
주요 입장
전망
- · llm-d PR들은 GKE 야간 E2E, tiered-prefix-cache, LMCache, H100 8장 기준 테스트를 추가했다.
- · SemiAnalysis는 TPU가 llm-d CI와 코드 품질 면에서 Nvidia를 따라잡고 있다고 평가했다.
한국 영향
- TPU에서 vLLM/llm-d 실제 처리량
- AMD GPU의 llm-d CI 참여 여부
Cohere Command A+, W4A4 양자화로 218B 모델을 B200 1장·H100 2장에 올린다
주요 사건
Cohere의 Command A+가 Hugging Face에 W4A4 양자화 버전으로 공개됐다. 모델카드는 BF16은 B200 4장/H100 8장이 필요하지만 W4A4는 B200 1장 또는 H100 2장으로 구동 가능하다고 제시한다.
배경
- 2017-06-01Transformer 논문 이후 대형 언어모델 경쟁 시작
- 2026-05-20Cohere, Command A+ Apache 2.0 공개 보도
- 2026-05-21W4A4 Hugging Face 배포 확산
주요 입장
전망
- · Hugging Face 모델카드는 W4A4가 품질 차이가 거의 없고 지연시간·속도 특성이 좋다고 설명한다.
- · VentureBeat는 W4A4가 375 tokens/s, TTFT 113ms, 이전 Command A Reasoning 대비 출력 속도 최대 63% 증가라고 보도했다.
한국 영향
- 한국어 성능과 라이선스 조건
- H100 2장 구성의 실제 동시접속 처리량
AMD, Ryzen AI Halo 공개 — 128GB 로컬 AI 박스로 200B 모델 구동을 겨냥한다
주요 사건
AMD가 Ryzen AI Halo 개발 플랫폼을 공개했다. Ryzen AI Max+ 395, 128GB LPDDR5x, 2TB SSD, 50 TOPS NPU를 담은 소형 로컬 AI 장비로, 적절한 양자화 시 200B급 모델 구동을 목표로 한다.
배경
- 2024-01-01로컬 LLM·Ollama·LM Studio 사용 확산
- 2026-05-20AMD Ryzen AI Halo 영상 공개
- 2026-06-01사전예약 시작 예정
주요 입장
전망
- · TechPowerUp은 AMD가 GPT OSS 120B에서 DGX Spark 대비 최대 7%, Qwen 3.5 122B에서 최대 12% 우위를 주장했다고 전했다.
- · Notebookcheck는 128GB 메모리, Radeon 8060S 40CU, 120W TDP, 4,000달러 시작가를 보도했다.
한국 영향
- ROCm의 Windows 안정성
- Qwen·GPT-OSS 계열 실제 tok/s 벤치마크
Mix-Quant, 에이전트 LLM 병목인 프리필을 NVFP4로 3배 가속한다
주요 사건
Mix-Quant 논문은 에이전트형 LLM 추론에서 긴 입력을 처리하는 prefilling 단계만 NVFP4로 양자화하고, 토큰을 생성하는 decoding은 BF16으로 유지하는 방식으로 품질 손실을 줄이면서 속도를 높인다.
배경
- 2023-01-01ReAct·도구사용 에이전트 연구 확산
- 2025-01-01Blackwell NVFP4 기반 저정밀 추론 관심 확대
- 2026-05-21Mix-Quant 논문 공유
주요 입장
전망
- · 논문은 agentic benchmark에서 prefill 최대 3배 가속을 보고했다.
- · 관련 QuantSpec 연구는 계층적 4비트 KV cache로 장문 추론 최대 약 2.5배 가속을 보고했다.
한국 영향
- 한국어 장문 작업의 품질 저하 여부
- vLLM/TensorRT-LLM 통합 가능성
참고 자료
MINTEval, 장기 에이전트 메모리 정확도 27.9% 확인 — 검색보다 기억 구성이 병목이다
주요 사건
MINTEval/LongMINT는 장기간 상호작용에서 사실이 갱신·간섭되는 상황을 평가하는 벤치마크다. 평균 13.88만 토큰, 최대 180만 토큰 맥락의 1.56만 QA에서 기존 7개 시스템 평균 정확도는 27.9%에 그쳤다.
배경
- 2023-01-01RAG 기반 장문 QA 확산
- 2025-01-01에이전트 메모리 프레임워크 등장
- 2026-05-21MINTEval 논문 공유
주요 입장
전망
- · MINTEval 논문은 평균 정확도 27.9%, multi-target aggregation 26.5% 수준을 보고했다.
- · STITCH 연구는 의도 기반 색인이 장기 메모리 검색 성능을 35.6% 개선했다고 주장했다.
한국 영향
- 메모리 벤치마크의 한국어 확장
- 개인정보보호법상 장기 기억 관리 기준
MIGA, 학습 없이 무한 프레임 비디오 생성 — VBench 주체 일관성 4.7% 개선
주요 사건
MIGA는 별도 학습 없이 기존 비디오 생성 모델을 긴 영상 생성에 활용하는 방법이다. 두 단계 정렬과 이중 일관성 강화로 긴 영상에서 주체·배경이 흔들리는 문제를 줄였다.
배경
- 2024-01-01VBench 등 비디오 생성 평가 확산
- 2025-01-01FIFO-diffusion·MemRoPE류 긴 영상 기법 등장
- 2026-05-21MIGA 논문 공유
주요 입장
전망
- · 논문은 VBench에서 FIFO-Diffusion 대비 주체 일관성 4.7%, 배경 일관성 2.0% 개선을 보고했다.
- · MemRoPE 연구는 고정 크기 캐시로 분·시간 단위 영상 일관성을 유지하는 접근을 제안했다.
한국 영향
- 한국어 프롬프트 기반 장면 제어력
- 상업 모델과 오픈 모델 적용 가능성
참고 자료
Daytona, 60ms 에이전트 샌드박스로 급성장 — AI 인프라의 새 단위가 VM에서 샌드박스로 이동한다
주요 사건
swyx가 공유한 Latent Space/Daytona 내용은 에이전트용 컴퓨트 인프라가 60ms 콜드스타트, 85만 일일 실행, 대규모 병렬 샌드박스 같은 지표로 경쟁하고 있음을 보여준다.
배경
- 2024-01-01컴퓨터 사용·코딩 에이전트 실행환경 수요 증가
- 2026-05-01Daytona, Agent-native compute와 Series A 메시지 확산
- 2026-05-21swyx, Daytona 지표와 에이전트 인프라 논의 공유
주요 입장
전망
- · Daytona는 에이전트 샌드박스가 밀리초 단위 시작, fork, snapshot, 장기 실행을 지원해야 한다고 설명한다.
- · 공개 자료는 60ms 이하 콜드스타트, 6~20시간 업무 절감 사례를 강조한다.
한국 영향
- 샌드박스 탈출·데이터 유출 사고
- 국내 클라우드의 에이전트 런타임 상품화
Waymo, 침수·공사구간 대응 실패로 고속도로 운행 중단 — 로보택시의 ODD 한계가 드러난다
주요 사건
Waymo가 공사구간 대응 문제로 고속도로 운행을 중단했고, 별도로 애틀랜타와 샌안토니오에서는 폭우·침수 도로에 로보택시가 들어가 서비스가 일시 중단됐다.
배경
- 2020-10-01Waymo One, 피닉스에서 무인 로보택시 상용화 확대
- 2026-05-14Waymo, 침수 도로 회피 관련 소프트웨어 리콜
- 2026-05-21애틀랜타·샌안토니오 서비스 중단과 고속도로 운행 제한 보도
주요 입장
전망
- · TechCrunch는 Waymo가 애틀랜타와 샌안토니오에서 침수 도로 문제로 서비스를 멈췄다고 보도했다.
- · Engadget은 약 4,000대 규모의 자발적 리콜과 OTA 패치가 있었다고 전했다.
한국 영향
- Waymo의 최종 침수 회피 패치
- 국내 장마철 자율주행 실증 데이터
참고 자료
트럼프, AI 보안 행정명령 연기 — 출시 전 14~90일 정부 검증안이 산업 속도와 충돌한다
주요 사건
트럼프 대통령이 frontier AI 모델을 출시 전 정부가 평가할 수 있게 하는 AI 보안 행정명령 서명을 연기했다. 초안에는 14~90일 사전 공유·검증, ONCD·NSA·CISA·NIST 등의 평가 체계가 포함된 것으로 보도됐다.
배경
- 2023-10-30미국 AI 행정명령, 안전성 평가와 보고 요구 강화
- 2026-05-21AI 보안 행정명령 서명 연기 보도
주요 입장
전망
- · TechCrunch는 초안이 모델 출시 전 14~90일 정부 공유 요구를 담았다고 보도했다.
- · CyberScoop은 NSA, ONCD, CISA, NIST, 재무부가 평가 체계에 관여할 수 있다고 전했다.
한국 영향
- 최종 행정명령의 의무/자발 범위
- 한국 AI 기본법·사이버 보안 지침과의 정합성
참고 자료
Spotify·UMG, AI 커버·리믹스 유료 애드온 합의 — 저작권 음악 생성의 허가형 모델을 연다
주요 사건
Spotify와 Universal Music Group이 Premium 이용자가 참여 아티스트 곡의 AI 커버·리믹스를 만들 수 있는 라이선스 계약을 발표했다. 기능은 유료 애드온으로 출시되고 아티스트·송라이터가 수익을 배분받는다.
배경
- 2023-04-01AI 음성 커버·가짜 듀엣 논란 확산
- 2025-01-01Spotify-UMG 다년 라이선스 관계 강화
- 2026-05-21AI 커버·리믹스 유료 애드온 계약 발표
주요 입장
전망
- · PRNewswire는 이 도구가 Premium 유료 애드온이며 아티스트·송라이터 추가 수익원을 만든다고 밝혔다.
- · Variety는 consent, credit, compensation이 계약의 핵심이라고 전했다.
한국 영향
- 참여 아티스트 범위와 수익배분율
- 한국 저작권법상 AI 커버 권리 처리