오픈AI·앤트로픽·구글이 모델/에이전트/로보틱스 업데이트를 동시에 쏟아내며, 인프라 쪽에선 Blackwell NVL72와 데이터센터 EPC 수익성 이슈가 부상했다.
- OpenAI는 GPT-Rosalind로 생명과학 특화 모델 시장에 진입했고, Codex를 범용 에이전트형 데스크톱 앱으로 확장했다.
- Anthropic은 Claude Opus 4.7을 공개하며 코딩·장시간 에이전트 작업 우위를 강화했다.
- Google DeepMind는 Spot 로봇용 Gemini Robotics-ER 1.6과 Gemini 3.1 Flash TTS로 embodied AI와 음성 스택을 같이 밀고 있다.
- SemiAnalysis 계열 소스에선 GB200 NVL72의 추론 우위와 데이터센터 EPC 마진 급등이 핵심 반도체/인프라 신호로 보인다.
- 오픈소스 연구 쪽에선 HY-World 2.0, DR3-Eval, UniDoc-RL이 각각 3D 월드모델, 딥리서치 평가, 문서형 비주얼 RAG를 밀어 올렸다.
OpenAI가 생명과학 특화 추론 모델 GPT-Rosalind를 공개했다.
주요 사건
OpenAI가 생물학·신약개발·중개연구용 특화 모델 시리즈 GPT-Rosalind를 발표했다. 일반 챗봇이 아니라 단백질, 화학, 유전체, 생화학, 문헌 탐색 같은 연구 워크플로를 돕는 연구용 모델이다.
배경
- 2021-07-15AlphaFold2 공개로 생명과학 AI 기대 급등
- 2024-01-01AI 신약개발·omics 해석용 에이전트 수요 본격 확대
- 2026-04-16OpenAI가 GPT-Rosalind와 Life Sciences plugin 발표
주요 입장
전망
- · OpenAI 공개 자료와 외부 보도는 GPT-Rosalind가 연구자 보조 도구로는 실용 단계에 들어갔다고 본다.
- · 다만 완전 자율 실험실로 가기엔 검증·안전·도메인지식 통합이 아직 병목이라는 시각이 많다.
한국 영향
- 국내 바이오 데이터셋과의 연결성
- 생물안보 심사 기준
- API/엔터프라이즈 가격 정책
OpenAI가 Codex를 Mac 앱 제어·브라우저·메모리·플러그인까지 갖춘 범용 에이전트 앱으로 확장했다.
주요 사건
Codex가 단순 코딩 보조를 넘어 Mac 앱 조작, 브라우저 내 상호작용, 이미지 생성, 90개 이상 플러그인, 사용 습관 기억, 반복 작업 자동화를 지원하는 데스크톱 에이전트로 업데이트됐다.
배경
- 2023-03-14툴 사용형 LLM 흐름 본격화
- 2025-01-01코딩 에이전트가 터미널/파일 단위 작업으로 확장
- 2026-04-16OpenAI가 Codex 대규모 데스크톱 에이전트 업데이트 발표
주요 입장
전망
- · 외부 보도는 이번 업데이트를 Claude Code와 Cursor에 대한 정면 대응으로 본다.
- · 메모리와 ongoing tasks가 붙으면서 개인형 비서/에이전트 OS 가능성이 더 커졌다는 평가가 나온다.
한국 영향
- 엔터프라이즈 권한관리
- 가격정책
- 국내 SaaS와의 플러그인 생태계
Anthropic이 Claude Opus 4.7을 공개하며 코딩·장시간 에이전트 작업 우위를 재강조했다.
주요 사건
Anthropic이 Claude Opus 4.7을 발표했다. 핵심 메시지는 장시간 작업의 일관성, 지시 준수, 코딩/에이전트 성능 강화다.
배경
- 2024-06-20Claude 3.5 Sonnet 계열로 코딩 강자 이미지 형성
- 2025-01-01에이전트/코딩 벤치마크 경쟁 본격화
- 2026-04-16Claude Opus 4.7 발표
주요 입장
전망
- · 외부 분석은 Opus 4.7을 비-preview 범용 모델 중 최상위권으로 평가한다.
- · 다만 Mythos Preview 같은 상위 비공개 계층이 별도로 존재해 공개형 최고 성능의 한계도 보인다.
한국 영향
- 국내 보안 규제 적합성
- API 비용
- 기업 내 장시간 에이전트 운영 안정성
Google DeepMind가 Spot 로봇에 Gemini Robotics-ER를 붙이며 embodied AI 상용화 단계를 끌어올렸다.
주요 사건
Google DeepMind가 Boston Dynamics Spot에 Gemini Robotics-ER 1.6 계열을 연결해, 영어 명령 기반으로 주변 이해·사진 촬영·집기·점검 같은 작업을 더 잘 수행하게 했다고 밝혔다.
배경
- 2023-01-01로봇에 멀티모달 파운데이션 모델 적용 실험 확산
- 2025-01-01Gemini Robotics-ER 1.x 계열 고도화
- 2026-04-16Spot 연동 발표
주요 입장
전망
- · DeepMind 발표는 로봇의 공간 추론 개선을 핵심으로 내세운다.
- · 외부 매체들은 Spot 같은 검증된 하드웨어와 결합했다는 점을 상용화 신호로 본다.
한국 영향
- 산업안전 인증
- 한국어 명령 처리
- 현장 데이터 확보 경쟁
Google DeepMind가 Gemini 3.1 Flash TTS를 공개하며 저지연·다국어 음성 생성 경쟁에 불을 붙였다.
주요 사건
Gemini 3.1 Flash TTS가 공개됐다. 텍스트로 말투·속도·전달 방식까지 제어하는 Audio Tags, 70개 이상 언어 지원, SynthID 워터마킹이 핵심이다.
배경
- 2023-11-01생성형 음성 경쟁 본격화
- 2025-01-01멀티모달 앱에서 음성 인터페이스 수요 확대
- 2026-04-15Gemini 3.1 Flash TTS 공개
주요 입장
전망
- · 공개 문서 기준 70+ 언어와 Audio Tags, SynthID가 이번 릴리스의 핵심 차별점이다.
- · 실시간 에이전트 UX 경쟁에서 저지연 TTS는 기본 기능이 되고 있다.
한국 영향
- 한국어 음질
- 워터마킹 실효성
- API 비용 및 지연시간
SemiAnalysis는 GB200 NVL72가 Kimi K2.5 추론에서 B200 대비 최대 3배 성능을 낸다고 전했다.
주요 사건
SemiAnalysis가 NVIDIA GB200 NVL72가 Moonshot의 Kimi K2.5 같은 MoE 추론에서 B200 대비 최대 3배 성능을 낸다고 소개했다. 핵심은 scale-up 네트워크와 wide expert parallelism 최적화다.
배경
- 2023-01-01MoE 계열 모델 재부상
- 2024-03-18Blackwell 플랫폼 공개
- 2026-04-16SemiAnalysis가 NVL72 vs B200 추론 우위 언급
주요 입장
전망
- · MoE 시대에는 네트워크와 expert parallelism이 실제 체감 성능을 크게 좌우한다는 해석이 우세하다.
- · 다만 벤치마크는 특정 모델/서빙 스택 최적화 편향을 볼 필요가 있다.
한국 영향
- HBM 수요
- 랙 단위 전력/냉각
- MoE 최적화 소프트웨어 생태계
데이터센터 EPC 마진이 2023년 1분기 대비 741bp 급등하며 AI 인프라 병목이 건설 쪽으로 번지고 있다.
주요 사건
SemiAnalysis는 데이터센터 EPC(설계·조달·시공) 기업들의 마진이 2023년 1분기 대비 741bp 상승했고, 데이터센터 장비 제조사와의 격차가 거의 사라졌다고 짚었다.
배경
- 2023-01-01생성형 AI CAPEX 사이클 본격화
- 2025-01-01전력·부지·냉각 병목이 산업 핵심 이슈로 부상
- 2026-04-17SemiAnalysis가 EPC 마진 상승 수치 공개
주요 입장
전망
- · FT와 SemiAnalysis 흐름을 종합하면 AI 병목은 점점 물리 인프라 쪽으로 이동 중이다.
- · GPU 확보보다 전력 인입과 시공 일정이 더 큰 제약이 되는 사례가 늘고 있다.
한국 영향
- 국내 전력망 용량
- 냉각 설비 공급망
- AI 데이터센터 인허가 속도
Dylan Patel은 메모리 가격 급등과 Apple MacBook Neo 충격 속에서도 Intel 장기 반등 가능성을 언급했다.
주요 사건
Dylan Patel이 Intel은 장기적으로 다시 올라올 수 있지만, 단기 숫자는 메모리 가격과 Apple의 저가 MacBook Neo 때문에 좋지 않을 수 있다고 평가했다.
배경
- 2021-02-15Intel 재건 전략과 파운드리 전환 본격화
- 2026-03-12Apple MacBook Neo 공개로 보급형 PC 시장 충격
- 2026-04-16Dylan Patel이 Intel 단기/장기 전망 언급
주요 입장
전망
- · Fortune·Engadget 보도도 MacBook Neo가 PC 업계에 충격을 줬다고 해석한다.
- · 다만 Intel 회복은 단일 제품보다 제조·제품로드맵 신뢰 회복 여부가 핵심이다.
한국 영향
- DRAM/NAND 가격
- 보급형 노트북 경쟁
- Intel 로드맵 실행
Tencent의 HY-World 2.0이 텍스트·이미지·영상에서 편집 가능한 3D 월드를 만드는 오픈소스 월드모델로 주목받았다.
주요 사건
AK가 공유한 HY-World 2.0은 텍스트, 이미지, 비디오를 입력받아 생성·복원·시뮬레이션 가능한 3D 월드를 만드는 멀티모달 월드모델이다. 편집 가능한 3D 자산까지 바로 뽑는 점이 포인트다.
배경
- 2023-01-01텍스트-투-3D 실험이 활발해짐
- 2025-01-01월드모델과 인터랙티브 시뮬레이션 연구 가속
- 2026-04-17HY-World 2.0이 커뮤니티에서 확산
주요 입장
전망
- · 외부 요약들은 HY-World 2.0의 강점을 '편집 가능한 3D 자산'으로 본다.
- · 다만 대규모 상용 제작에 쓰려면 일관성·물리성·저작권 관리가 더 필요하다.
한국 영향
- 상용 라이선스
- 언리얼/유니티 연동
- 국산 3D 파이프라인 대체 여부
DR3-Eval은 딥리서치 에이전트를 더 현실적이고 재현 가능하게 평가하자는 흐름을 보여줬다.
주요 사건
AK가 공유한 DR3-Eval은 딥리서치 에이전트 평가를 현실적·재현 가능하게 만들자는 문제의식을 담은 연구다. 단순 QA가 아니라 긴 조사 과업을 어떻게 공정하게 평가할지에 초점이 있다.
배경
- 2025-01-01Deep research agent 제품군 본격 등장
- 2026-01-26DRBench 같은 현실형 평가 벤치마크 공개
- 2026-04-17DR3-Eval 커뮤니티 확산
주요 입장
전망
- · ICLR 2026의 DRBench 같은 연구와 같은 맥락에서 평가 현실화 요구가 강해지고 있다.
- · 향후 에이전트 시장에서 benchmark auditing이 중요해질 수 있다.
한국 영향
- 한국어 평가셋
- 재현성 있는 사내 검증
- 보고서 품질 자동평가
UniDoc-RL은 문서형 비주얼 RAG에서 coarse-to-fine 검색과 dense reward를 결합한 새 접근을 제시했다.
주요 사건
UniDoc-RL은 문서 중심 멀티모달 RAG에서 이미지 검색→정밀 선택→영역 크롭으로 이어지는 계층형 행동 공간과 dense reward를 결합해 성능을 높이려는 연구다.
배경
- 2023-01-01문서 VQA와 문서 RAG 수요 확대
- 2025-01-01멀티모달 RAG가 본격 상용화
- 2026-04-17UniDoc-RL 논문 확산
주요 입장
전망
- · 논문 초록 기준 핵심은 hierarchical actions와 dense rewards로 credit assignment 문제를 푸는 것이다.
- · 문서형 멀티모달 RAG는 국내 금융·법률에서도 바로 쓸 수 있는 분야다.
한국 영향
- 국내 문서셋 적용성
- 추론 비용
- 온프레미스 배포 가능성