AI 에이전트 경쟁이 모바일·CLI·칩·안전성 전선으로 동시에 확산한다
- OpenAI와 xAI가 Codex 모바일·Grok Build CLI로 개발자 에이전트 시장의 접점을 넓힌다
- Google TPU Broadfly와 Cerebras IPO가 추론 인프라 병목을 투자·네트워크 경쟁으로 끌어올린다
- Anthropic은 미중 AI 경쟁·공익 배치·Gates 2억 달러 파트너십으로 정책 전선을 넓힌다
- 안전성 연구는 단일 뉴런·공급망 공격·형식검증으로 모델 신뢰의 취약 지점을 드러낸다
OpenAI, Codex를 ChatGPT 모바일에 탑재해 원격 개발 승인까지 확장한다
주요 사건
OpenAI가 iOS·Android용 ChatGPT 앱에서 Codex 작업을 시작·검토·조정·승인할 수 있는 프리뷰를 공개했다. Sam Altman은 Codex 자동화용 hooks와 기업 전환 프로모션도 함께 강조했다.
배경
- 2021-08-01OpenAI Codex 공개
- 2026-02-01Codex Mac 앱 출시
- 2026-05-14Codex가 ChatGPT 모바일 앱 프리뷰로 확장
주요 입장
전망
- · OpenAI는 모바일에서도 active threads, approvals, plugins, project context를 다룰 수 있다고 설명했다
- · Karpathy는 최근 에이전트형 코딩 모델의 성능 향상이 기술 직군의 AI 체감 격차를 키운다고 지적해왔다
한국 영향
- Codex Windows 지원 일정
- 기업용 감사 로그와 데이터 보존 정책
- 국내 IDE·DevOps 업체의 에이전트 통합
xAI, Grok Build CLI 베타로 AI 코딩 에이전트 경쟁에 직접 진입한다
주요 사건
Elon Musk가 Grok Build를 리포스트하며 xAI의 에이전트형 CLI 코딩 도구 초기 베타를 알렸다. The Verge는 SuperGrok Heavy 가입자 대상 초기 베타라고 보도했다.
배경
- 2025-01-01SWE-Bench 기반 코딩 모델 경쟁 본격화
- 2026-03-15Grok Build 관련 기능 설명 공개
- 2026-05-14xAI Grok Build 초기 베타 공개
주요 입장
전망
- · The Verge는 xAI가 Anthropic·OpenAI의 AI 코딩 집중에 대응해 새 도구를 내놨다고 평가했다
- · 독립 분석 자료는 Grok Build의 70.8% SWE-Bench Verified와 256K 컨텍스트를 경쟁 포인트로 제시했다
한국 영향
- SuperGrok Heavy 가격과 한국 지원
- SWE-Bench 외 실제 기업 코드 성능
- GitHub·JetBrains·VS Code 연동
Anthropic, 미중 AI 경쟁 보고서로 개방진영의 프런티어 우위 유지를 촉구한다
주요 사건
Anthropic이 미국과 민주주의 동맹이 현재 프런티어 AI에서 앞서 있지만 그 우위를 유지하려면 정책·보안·공급망 투자가 필요하다는 보고서를 냈다.
배경
- 2025-01-01DeepSeek R1이 미국 AI 시장에 충격을 줌
- 2026-04-15Stanford AI Index가 미중 성능 격차 축소를 지적
- 2026-05-14Anthropic이 미중 AI 경쟁 보고서 공개
주요 입장
전망
- · Foreign Policy는 중국이 저렴하고 충분히 좋은 오픈 모델로 글로벌 사우스에서 표준을 만들 수 있다고 분석했다
- · Stanford AI Index 관련 보도는 프런티어 경쟁이 벤치마크보다 배포와 통합으로 이동한다고 평가했다
한국 영향
- 미국 AI 수출통제 변화
- 중국 오픈모델의 한국어 성능
- 국내 AISI·모델평가 인프라 구축
Anthropic·Gates 재단, 2억 달러로 보건·교육용 Claude 배치를 확대한다
주요 사건
Anthropic과 Gates Foundation이 4년간 2억 달러 규모의 보조금, Claude 크레딧, 기술 지원을 글로벌 보건·생명과학·교육·농업·경제 이동성 프로그램에 투입한다고 발표했다.
배경
- 2025-05-01Gates Foundation이 2045년 종료 전 추가 2,000억 달러 지출 방침 공개
- 2026-01-14Gates Foundation이 2026년 90억 달러 연간 지출 승인
- 2026-05-14Anthropic과 Gates Foundation 2억 달러 파트너십 발표
주요 입장
전망
- · Anthropic은 Institute for Disease Modeling과 말라리아·결핵 예측 개선을 추진한다고 밝혔다
- · Gates Foundation은 2026년 지출 중 상당 부분을 글로벌 보건과 교육·농업에 배정했다
한국 영향
- 보건 데이터 프라이버시 기준
- Claude 의료 평가 벤치마크 공개 여부
- 한국 국제개발 사업과의 접점
Google TPU Broadfly, 1,152칩 추론 팟으로 MoE 지연시간을 줄인다
주요 사건
SemiAnalysis가 Google의 추론 중심 TPU 네트워크 Broadfly를 분석하며 단일 팟이 최대 1,152개 TPU까지 확장되고 Ironwood 대비 4.5배 큰 팟 규모와 최대 7홉 통신을 제공한다고 설명했다.
배경
- 2015-01-01Google 1세대 TPU 내부 배치
- 2025-01-01Ironwood TPU가 대규모 팟 구조를 확장
- 2026-05-14SemiAnalysis가 Broadfly 네트워크 모델 분석 공개
주요 입장
전망
- · Google Cloud는 Boardfly가 3D torus 대비 네트워크 지름을 16홉에서 7홉으로 줄인다고 설명했다
- · NAND Research는 TPU 8i가 추론 가격성능 80% 개선과 2배 전력효율 개선을 목표로 한다고 분석했다
한국 영향
- TPU 8i 외부 고객 GA 시점
- OCS·AEC·DR4 광모듈 공급망
- 국내 HBM·패키징 수주
Cerebras, 55억 달러 IPO와 90%대 급등으로 AI 칩 대안을 증명한다
주요 사건
Cerebras가 주당 185달러에 3,000만 주를 공모해 약 55억 달러를 조달하고, 상장 첫날 주가가 90~108% 급등했다는 보도가 이어졌다. TechCrunch와 SemiAnalysis는 OpenAI·AWS 파트너십과 빠른 토큰 추론 경제성을 핵심 배경으로 봤다.
배경
- 2015-01-01Cerebras 설립
- 2024-01-01고객 집중 우려로 IPO 추진 지연
- 2026-05-14Cerebras 나스닥 상장 후 주가 급등
주요 입장
전망
- · Cerebras는 WSE-3가 leading GPU 칩보다 58배 크고 일부 추론에서 최대 15배 빠르다고 밝혔다
- · Benzinga는 OpenAI 워런트와 AWS 계약이 과거 고객 집중 우려를 완화했다고 분석했다
한국 영향
- OpenAI·AWS 실제 사용량
- WSE-3 전력당 성능 검증
- 국내 HBM 수요와의 연결성
단일 뉴런 조작 논문, LLM 안전 정렬이 생각보다 희소하다고 경고한다
주요 사건
AK가 'A Single Neuron Is Sufficient to Bypass Safety Alignment in Large Language Models' 논문을 공유했다. 논문은 1.7B~70B 규모 7개 모델에서 특정 refusal neuron을 억제하면 유해 요청 거부가 우회될 수 있다고 주장한다.
배경
- 2022-11-01ChatGPT 이후 RLHF 안전 정렬 대중화
- 2025-09-01NeuroStrike 등 안전 뉴런 공격 연구 등장
- 2026-05-14단일 뉴런 안전 우회 논문이 X에서 확산
주요 입장
전망
- · 논문은 1.7B~70B 7개 모델에서 refusal neuron 억제가 다양한 유해 요청에 대한 거부를 우회한다고 주장한다
- · NeuroStrike 연구는 0.6% 미만 뉴런 제거로 평균 76.9% 공격 성공률을 보고해 유사한 위험을 뒷받침한다
한국 영향
- 논문 재현성
- 오픈웨이트 모델 안전 패치
- 국내 AI 안전연구 투자
Nvidia AnyFlow, 1.3B~14B 비디오 확산 모델의 임의 스텝 추론을 안정화한다
주요 사건
AK가 AnyFlow: Any-Step Video Diffusion Model with On-Policy Flow Map Distillation 논문을 공유했다. 논문은 고정 스텝에 묶이지 않고 샘플링 예산을 늘릴수록 품질이 개선되는 비디오 확산 distillation 프레임워크를 제안한다.
배경
- 2024-02-01Sora 공개로 고품질 비디오 생성 경쟁 본격화
- 2025-03-25Wan2.1 기반 장문 비디오 모델 연구 공개
- 2026-05-13AnyFlow 논문 제출 및 Hugging Face 가중치 공개
주요 입장
전망
- · arXiv 초록은 AnyFlow가 few-step regime에서 consistency 기반 모델과 동등하거나 우수하고 스텝 예산 증가에 따라 성능이 개선된다고 밝혔다
- · Hugging Face 모델카드는 T2V·I2V·V2V를 480P에서 지원하고 1.3B·14B 가중치를 공개했다고 설명했다
한국 영향
- 한국어 프롬프트 성능
- 상업 라이선스
- 워터마킹·검출 도구 통합
Hugging Face, 데이터셋 100만 개 돌파로 오픈 AI 인프라의 무게를 키운다
주요 사건
Hugging Face가 이번 주 데이터셋 100만 개를 넘어섰다는 소식이 공유됐다. AI World와 Hugging Face 페이지는 데이터셋 수가 약 99만~100만 수준에 도달했고 로보틱스·강화학습 데이터가 빠르게 커지고 있다고 설명했다.
배경
- 2016-01-01Hugging Face 설립
- 2020-01-01Datasets 라이브러리와 Hub 생태계 확장
- 2026-05-14Hugging Face 데이터셋 100만 개 돌파 소식 확산
주요 입장
전망
- · AI World는 fastest-growing category가 Robotics & Reinforcement Learning이라고 전했다
- · Hugging Face 문서는 Hub를 오픈소스 모델·데이터셋·데모 협업의 중심 인프라로 설명한다
한국 영향
- 한국어 데이터셋 공개량
- 데이터셋 카드 표준
- 저작권·개인정보 감사 도구
Aleph, PutnamBench 99.4% 해결로 형식검증 에이전트의 실용성을 높인다
주요 사건
Yann LeCun이 Logical Intelligence의 Aleph 형식검증 에이전트가 주요 theorem proving 벤치마크를 통과했다는 소식을 리포스트했다. 회사 블로그는 Aleph가 PutnamBench 672문제 중 668개, 99.4%를 Lean으로 자동 증명했다고 밝혔다.
배경
- 2024-01-01Lean 4 기반 자동정리증명 연구 확산
- 2026-01-21Aleph가 PutnamBench 99.4% 성과 발표
- 2026-05-14AI 연구자들이 Aleph 성과를 재확산
주요 입장
전망
- · Logical Intelligence는 Aleph가 672개 중 668개 PutnamBench 문제를 자동 증명했다고 밝혔다
- · 회사 제품 설명은 Aleph가 안전민감 팀의 수개월 검증 작업을 반복 가능한 워크플로로 바꾼다고 주장한다
한국 영향
- 자연어 요구사항→Lean 번역 정확도
- 국내 안전인증기관 수용 여부
- RTL·스마트컨트랙트 적용 사례
Recursive, 6억5천만 달러로 ‘AI가 AI를 개선하는’ 실험을 상업화한다
주요 사건
TechCrunch가 Richard Socher의 새 스타트업 Recursive를 조명했다. 외부 보도와 GV 발표에 따르면 Recursive는 6억5천만 달러를 조달하고 AI가 자기 코드베이스·벤치마크·실험을 개선하는 recursive self-improvement를 목표로 한다.
배경
- 2020-01-01AutoML·NAS가 모델 설계 자동화 가능성을 보임
- 2025-01-01에이전트형 코딩 모델이 연구 도구로 확산
- 2026-05-14Recursive의 대규모 자금 조달과 자기개선 AI 비전 보도
주요 입장
전망
- · GV는 Recursive가 AI가 자기 코드베이스를 개선하는 open-ended architecture를 만든다고 밝혔다
- · The Decoder는 Recursive가 아직 구체적 기술 성과를 공개하지 않았다고 지적했다
한국 영향
- Recursive의 공개 벤치마크
- 자기개선 안전장치
- Nvidia·AMD 참여가 컴퓨트 공급으로 이어지는지
OpenAI 공급망 사고, Codex·ChatGPT 앱 서명 인증서 교체를 촉발한다
주요 사건
OpenAI가 오픈소스 개발 도구 공급망 공격 이후 일부 직원 기기와 제한된 저장소 접근 영향을 확인하고, 사용자 데이터·운영 시스템·IP 침해 증거는 없다고 밝혔다. macOS 앱 서명·notarization 관련 자료는 예방적으로 교체한다.
배경
- 2026-03-31OpenAI 워크플로가 악성 패키지 영향을 받은 시점으로 설명
- 2026-05-13OpenAI가 공급망 사고 대응 공개
- 2026-05-14TechCrunch 등 주요 매체가 보도
주요 입장
전망
- · OpenAI는 production systems, IP, user data 침해 증거가 없다고 밝혔다
- · AppleInsider는 Mac 사용자가 6월 12일 전 업데이트해야 할 수 있다고 보도했다
한국 영향
- OpenAI 앱 업데이트 강제 일정
- 공급망 공격 관련 IOC 공개
- 국내 기업 CI/CD 비밀정보 권한분리