AI 에이전트 수요, 클라우드·평가·웹 인프라 병목을 키운다
- Anthropic은 생물학·안전성 평가를 공개하며 Claude를 과학 연구 보조와 모델 감사 영역으로 밀어 올렸다.
- OpenAI는 Codex 활용과 DevDay를 전면에 내세우며 GPT-5.5 이후 경쟁축을 채팅에서 작업 실행으로 옮겼다.
- Google Cloud와 Microsoft Copilot 지표는 AI 수요가 실제 매출로 전환되지만 컴퓨트·채택 병목이 동시에 커진다는 신호를 냈다.
- DeepSeek V4와 vLLM 최적화 논의는 1M 토큰 장문맥·MoE 추론 효율이 오픈 모델 경쟁의 핵심 지표가 됐음을 보여준다.
Anthropic, BioMysteryBench 공개 — Claude가 난제 30% 해결
주요 사건
Anthropic은 실제 생물학 데이터 분석 문제 99개로 구성한 BioMysteryBench를 공개했다. 전문가 패널이 풀지 못한 23개 문제 중 최신 Claude 계열 모델이 약 30%를 해결했다는 점을 강조했다.
배경
- 2023-01-01LLM 기반 과학 문헌 요약·생물정보학 보조 활용 확산
- 2025-01-01생물학·바이오리스크 평가가 프런티어 모델 안전성 테스트의 핵심 축으로 부상
- 2026-04-29Anthropic이 BioMysteryBench와 Claude 성능 결과 공개
주요 입장
전망
- · Anthropic은 최신 모델이 전문가가 막힌 23문제 중 약 30%와 나머지 다수를 해결했다고 밝혔다.
- · 기존 생물정보학 벤치마크 연구는 멀티모달 도표·이미지 해석이 여전히 주요 오류 원인이라고 지적한다.
한국 영향
- Claude의 BioMysteryBench 세부 공개
- 국내 제약사의 AI 실험 설계 도입
- 바이오리스크 평가 기준
참고 자료
Anthropic, 자기보고 어댑터 제시 — 숨은 행동 감사 성능 개선
주요 사건
Anthropic은 LLM이 파인튜닝 과정에서 학습한 행동을 자연어로 스스로 보고하게 만드는 Introspection Adapter 연구를 소개했다. 단일 LoRA 어댑터가 다양한 파인튜닝 모델에 일반화돼 AuditBench와 암호화된 파인튜닝 공격 탐지에서 성과를 냈다고 설명했다.
배경
- 2025-01-01Diff Interpretation Tuning 등 모델 행동 해석 연구 확산
- 2026-04-18Introspection Adapters 논문 제출
- 2026-04-29Anthropic이 연구를 공식 소개
주요 입장
전망
- · Anthropic은 IA가 AuditBench에서 기존 최고 성능을 냈고 암호화된 파인튜닝 API 공격도 탐지했다고 밝혔다.
- · 논문은 모델 크기와 훈련 데이터 다양성이 IA 일반화 성능을 높인다고 보고했다.
한국 영향
- LoRA 기반 감사 도구 공개 여부
- AuditBench 후속 성능
- 국내 AI 안전연구소 평가 기준
참고 자료
OpenAI, Codex 활용 전면화 — 에이전트가 사무작업으로 확장
주요 사건
OpenAI는 Codex가 연구 정리, 데이터 내보내기 분석, 스프레드시트·덱·요약 작성 등 코딩 외 업무까지 지원할 수 있다는 사용 사례를 집중적으로 공개했다. Sam Altman도 Codex가 ‘ChatGPT moment’를 맞고 있다고 언급했다.
배경
- 2022-11-30ChatGPT 공개
- 2025-09-23GPT-5-Codex가 Codex 기본 모델로 확산
- 2026-04-23GPT-5.5가 ChatGPT와 Codex에 배포
- 2026-04-29OpenAI가 Codex 업무 활용 사례를 연속 공개
주요 입장
전망
- · OpenAI는 GPT-5.5가 Codex 작업에서 GPT-5.4보다 더 적은 토큰으로 높은 품질을 낸다고 설명했다.
- · MIT Technology Review는 Codex와 Claude Cowork 같은 다중 에이전트 도구가 지식노동을 조립라인처럼 재구성할 수 있다고 평가했다.
한국 영향
- Codex 기업 플랜 가격
- 브라우저 조작 기능 안정성
- 국내 SaaS의 에이전트 API 대응
OpenAI, DevDay 9월 29일 확정 — GPT-5.5 빌더 대회 병행
주요 사건
OpenAI는 DevDay 2026을 9월 29일 샌프란시스코에서 열겠다고 발표했다. 동시에 GPT-5.5와 Image Gen으로 만든 제출작 중 매주 2~3개를 골라 DevDay 티켓을 제공하는 빌더 콘테스트를 시작했다.
배경
- 2025-10-06OpenAI DevDay 2025 개최
- 2026-04-23GPT-5.5 공개
- 2026-04-29OpenAI DevDay 2026 일정과 콘테스트 발표
- 2026-09-29DevDay 2026 예정
주요 입장
전망
- · OpenAI는 GPT-5.5와 Image Gen으로 만든 플레이 가능한 링크 제출을 요구했다.
- · 2025년 DevDay는 1,500명 이상 개발자 초청과 API 제품 발표가 핵심이었다.
한국 영향
- 등록 세부 일정
- Codex API 공개 여부
- 한국 참가·콘테스트 수상 사례
참고 자료
SemiAnalysis, DeepSeek V4 vLLM 최적화 — GB200 추론 개선 부각
주요 사건
SemiAnalysis는 DeepSeek V4 Pro 출시 직후 vLLM 0.20.0과 MegaMoE 커널을 활용해 GB200 환경에서 의미 있는 성능 개선이 나왔다고 전했다. vLLM과 InferenceX가 Dynamo+vLLM 조합으로 배포 최적화를 진행 중이라는 내용이다.
배경
- 2026-04-24DeepSeek V4 계열 공개
- 2026-04-28vLLM·InferenceX가 B200/B300/H200/GB200 최적화 성능을 공유
- 2026-04-29SemiAnalysis가 vLLM 0.20.0 MegaMoE 기반 GB200 개선을 언급
주요 입장
전망
- · DeepSeek V4 Pro는 1.6T 총 파라미터와 49B 활성 파라미터, 1M 토큰 문맥을 제시한다.
- · DeepSeek V4 Flash는 1M 문맥에서 V3.2 대비 FLOPs 10%, KV 캐시 7% 수준까지 낮춘 것으로 소개됐다.
한국 영향
- vLLM 0.20 MegaMoE 안정성
- GB200/B300 벤치마크
- 국내 클라우드의 DeepSeek V4 제공 여부
참고 자료
DeepSeek V4 논쟁 확산 — 1M 문맥 비용이 오픈모델 지표로 부상
주요 사건
swyx는 DeepSeek V4가 벤치마크 과시보다 장문맥 효율, CSA·HCA·mHC 구조, 낮은 추론비용을 보여준 점이 중요하다고 평가했다. 오픈 베이스 모델을 내놓고 후처리는 에이전트 연구소가 맡게 하는 전략이라는 해석이다.
배경
- 2024-01-01장문맥 LLM 경쟁이 RAG·에이전트 사용성과 결합
- 2026-04-24DeepSeek V4 계열 공개
- 2026-04-29업계에서 V4의 장문맥·비용 구조에 대한 평가 확산
주요 입장
전망
- · Hugging Face 블로그는 V4-Pro가 1M 토큰에서 V3.2 대비 FLOPs 27%, KV 캐시 10%를 요구한다고 정리했다.
- · AlphaSignal은 V4-Pro 가격을 100만 토큰당 입력 $1.74, 출력 $3.48로 소개하며 GPT-5.5·Opus 대비 낮은 단가를 강조했다.
한국 영향
- 한국어 장문맥 성능
- 상용 라이선스 조건
- 국내 GPU 클라우드 비용
참고 자료
Hugging Face, AI 과학 허브 공개 — 오픈 모델·데이터 결집
주요 사건
AK가 공유한 Hugging Science 발표는 과학 연구용 AI 모델과 데이터셋을 모으는 허브를 지향한다. 오픈 모델·오픈 데이터가 과학 AI의 기반 인프라가 된다는 메시지다.
배경
- 2021-07-15AlphaFold DB 공개로 오픈 과학 AI 인프라 중요성 부각
- 2024-01-01Hugging Face가 과학 데이터셋·모델 컬렉션을 확대
- 2026-04-29Hugging Science 공개가 업계에 확산
주요 입장
전망
- · AK가 공유한 발표는 ‘open models and datasets are the powerhouse of science’라는 메시지를 강조했다.
- · Anthropic의 BioMysteryBench 공개와 맞물려 과학 AI 평가는 공개 데이터·벤치마크 중심으로 이동 중이다.
한국 영향
- Hugging Science 컬렉션 규모
- 한국 연구데이터 공개 연계
- 민감 데이터 라이선스
참고 자료
DeepInfra, Hugging Face 추론 제공자 합류 — 저비용 배포 경쟁 심화
주요 사건
AK는 DeepInfra가 Hugging Face의 공식 Inference Provider가 됐다는 소식을 공유했다. 사용자는 Hugging Face 모델 페이지에서 DeepInfra의 가격과 인프라를 통해 오픈 모델을 바로 호출할 수 있게 된다.
배경
- 2023-01-01오픈 LLM 배포와 서빙 비용 경쟁 본격화
- 2025-01-01Hugging Face Inference Providers 생태계 확대
- 2026-04-29DeepInfra의 공식 제공자 합류 소식 확산
주요 입장
전망
- · DeepInfra는 비용 효율적인 프라이빗 서버리스 추론을 강점으로 내세운다.
- · DeepSeek V4와 같은 대형 오픈 모델은 런타임 최적화 없이는 실사용 비용이 높아 추론 제공자 역할이 커진다.
한국 영향
- 한국 리전 제공 여부
- 개인정보 처리 조건
- DeepSeek·Qwen 등 인기 모델 단가
참고 자료
Microsoft, 유료 Copilot 2천만명 돌파 — 기업 AI 채택 지표 개선
주요 사건
Microsoft는 유료 엔터프라이즈 Copilot 사용자가 2천만명을 넘었고, 사용자당 질의가 전분기 대비 약 20% 증가했다고 밝혔다. 대규모 좌석 계약도 늘고 있으며 주간 참여도가 Outlook 수준에 도달했다는 설명이다.
배경
- 2023-11-01Microsoft 365 Copilot 기업용 출시
- 2026-04-28Accenture가 74만3천명 전사 Copilot 배포를 발표
- 2026-04-29Microsoft가 2천만명 이상 유료 Copilot 사용자 공개
주요 입장
전망
- · TechCrunch는 Microsoft가 유료 Copilot 사용자 2천만명 이상과 사용자당 질의 20% 증가를 공개했다고 보도했다.
- · Accenture 사례는 20만명 테스트 코호트에서 월간 활성 사용률 89%, 일상 업무 최대 15배 단축 보고를 제시했다.
한국 영향
- Copilot 국내 레퍼런스
- 좌석당 ROI
- 문서 데이터 보안 정책
참고 자료
Google Cloud, 분기 매출 200억달러 돌파 — AI 수요가 용량 앞질러
주요 사건
TechCrunch는 Google Cloud가 2026년 1분기 매출 200억달러를 처음 넘어섰고 전년 대비 63% 성장했지만, AI 수요 때문에 용량 제약을 받았다고 보도했다. Gemini Enterprise와 AI 솔루션 수요가 성장을 견인했다.
배경
- 2023-01-01생성AI 클라우드 수요가 GPU 공급 병목을 만들기 시작
- 2026-04-24Google의 Anthropic 대규모 투자·컴퓨트 공급 보도
- 2026-04-29Google Cloud가 분기 매출 200억달러와 용량 제약을 공개
주요 입장
전망
- · TechCrunch는 Google Cloud 매출이 63% 증가했고 backlog가 크게 늘었다고 전했다.
- · CRN은 Google이 2026년 CapEx를 1,750억~1,850억달러 범위로 예상한다고 보도했다.
한국 영향
- Google Cloud 한국 리전 AI 용량
- TPU 공급 조건
- 국내 전력망·데이터센터 규제
참고 자료
Parallel Web Systems, 20억달러 가치 평가 — 에이전트용 웹 인프라 과열
주요 사건
전 Twitter CEO Parag Agrawal이 세운 Parallel Web Systems가 Sequoia 주도 1억달러 투자를 유치하며 20억달러 가치 평가를 받았다고 TechCrunch가 전했다. 회사는 AI 에이전트가 실시간 웹을 검색하고 작업에 활용하는 API를 만든다.
배경
- 2023-01-01Parallel Web Systems 설립
- 2025-11-12Parallel이 1억달러 Series A와 7억4천만달러 가치 평가 발표
- 2026-04-29TechCrunch가 1억달러 Series B와 20억달러 가치 평가 보도
주요 입장
전망
- · Economic Times는 Series B가 Sequoia 주도이며 기존 투자자 Kleiner Perkins, Index, Khosla 등이 참여했다고 전했다.
- · Parallel은 2025년 Series A 발표에서 ‘AI를 위한 웹 인프라’를 핵심 비전으로 제시했다.
한국 영향
- Parallel API 공개 범위
- 웹 콘텐츠 라이선스
- 한국어 웹 검색 품질
참고 자료
MIT Tech Review, 에이전트 오케스트레이션 경고 — 지식노동 재편 임박
주요 사건
MIT Technology Review는 The Download에서 Codex와 Claude Cowork 같은 도구를 예로 들며, 여러 AI 에이전트가 역할을 나눠 복잡한 지식노동을 처리하는 ‘오케스트레이션’이 핵심 트렌드라고 정리했다.
배경
- 2022-11-30ChatGPT가 대화형 AI 대중화
- 2025-01-01Claude Code·Codex 등 코딩 에이전트가 개발 워크플로에 침투
- 2026-04-29MIT Technology Review가 오케스트레이션 에이전트를 주요 AI 트렌드로 조명
주요 입장
전망
- · MIT Technology Review는 에이전트 팀이 지식노동에 조립라인식 변화를 가져올 수 있다고 평가했다.
- · 동시에 LLM의 예측 불가능성이 의료·금융 같은 중요 시스템과 결합할 때 위험이 커진다고 경고했다.
한국 영향
- 국내 기업 에이전트 PoC
- 감사 로그 표준
- 업무 자동화 관련 노사 이슈