오픈AI·앤트로픽·구글이 모델/에이전트 업데이트를 쏟아낸 가운데, 반도체 인퍼런스 경쟁과 AI 보안 리스크도 동시에 부상했다.
- OpenAI는 생명과학 특화 GPT-Rosalind와 범용 에이전트화된 Codex 업데이트를 동시에 밀었다.
- Anthropic은 Claude Opus 4.7 출시와 함께 LLM의 'subliminal learning' 연구를 Nature에 공개했다.
- Google DeepMind는 로보틱스·음성 합성에서 실사용형 개선 수치를 제시했다.
- SemiAnalysis발 반도체 벤치마크/신생 칩 스타트업 이슈가 AI 인프라 경쟁 심화를 보여줬다.
- Vercel 침해 사례는 서드파티 AI 툴이 새로운 공급망·OAuth 공격면이 되고 있음을 드러냈다.
OpenAI가 생명과학 특화 추론 모델 GPT-Rosalind를 공개했다.
주요 사건
OpenAI가 생물학·신약개발·중개의학 연구용으로 튜닝한 GPT-Rosalind를 연구 프리뷰로 공개했다. OpenAI 설명에 따르면 단순 논문 요약이 아니라 데이터베이스 조회, 최신 논문 탐색, 외부 과학 도구 사용, 후속 실험 제안까지 포함하는 툴-헤비 과학 워크플로를 겨냥한다.
배경
- 2017-06-01Transformer 계열 모델 확산 시작
- 2020-12-01AlphaFold2가 구조예측 상업성 기대를 키움
- 2024-01-01제약사들이 생성형 AI 협업을 대거 확대
- 2026-04-16OpenAI가 GPT-Rosalind 연구 프리뷰 공개
주요 입장
전망
- · OpenAI는 RNA sequence-to-function 평가에서 역사적 인간 전문가 57개 점수와 비교했다고 밝혔다.
- · 업계에서는 실제 가치가 wet-lab 검증 연결성에 달렸다는 시각이 강하다.
한국 영향
- 국내 바이오 데이터셋의 API화 여부
- 제약사-모델사 공동검증 사례
- 의료 AI 책임 규정
참고 자료
OpenAI가 Codex를 맥 앱·브라우저·플러그인·지속 작업까지 확장해 '터미널 밖' 에이전트로 밀어붙였다.
주요 사건
OpenAI가 Codex 데스크톱 앱에 맥 앱 제어, 인앱 브라우저, 90개 이상 플러그인, 이미지 생성, 과거 행동 학습, 반복·지속 작업 기능을 추가했다. 코드 생성 보조를 넘어 장기 실행형 개인 에이전트 제품으로 포지셔닝을 바꾼 셈이다.
배경
- 2023-01-01코파일럿형 보조 도구가 개발자 기본 툴로 자리잡기 시작
- 2025-01-01agentic coding 도구 경쟁이 본격화
- 2026-04-16OpenAI가 Codex 대규모 데스크톱 업데이트 공개
주요 입장
전망
- · OpenAI는 90+ plugins 지원을 공개하며 도구 생태계 경쟁에 들어갔다.
- · Sam Altman은 'computer use'가 예상보다 더 유용하다고 직접 언급했다.
한국 영향
- 기업 맥 단말 보안정책과의 충돌
- 국내 개발툴의 plugin/MCP 대응
- 고가 AI 구독 수요
참고 자료
Anthropic이 Claude Opus 4.7을 공개하며 장기 실행 작업과 지시 준수 강화를 전면에 내세웠다.
주요 사건
Anthropic이 Claude Opus 4.7을 발표했다. 공개 메시지의 핵심은 긴 작업을 더 엄밀하게 처리하고, 지시 준수와 도구 사용 안정성을 높였다는 점이다. 동시에 API에서 xhigh effort 레벨을 추가해 추론-지연시간 trade-off를 더 세밀하게 조절하게 했다.
배경
- 2023-03-01Claude 계열이 장문 처리와 안전성 포지션 확보
- 2025-01-01코딩/에이전트 워크플로에서 Claude 계열 점유 확대
- 2026-04-16Claude Opus 4.7 공개
주요 입장
전망
- · Anthropic은 xhigh effort를 추가해 reasoning/latency 조정 폭을 넓혔다.
- · 시장에서는 코딩 에이전트 품질을 체감 성능으로 평가하는 흐름이 강해지고 있다.
한국 영향
- 한국어 장기 작업 품질
- 기업용 거버넌스 기능
- 국내 IDE/CI 통합 사례
Anthropic 공동연구의 'Subliminal Learning' 논문이 Nature에 실리며 모델 증류의 숨은 위험이 다시 부각됐다.
주요 사건
Anthropic이 공동 저자로 참여한 subliminal learning 연구가 Nature에 게재됐다. 핵심 주장은 교사 모델이 생성한 겉보기에 무관한 데이터(숫자열, 코드 등)로 학생 모델을 학습시키면, 선호나 심지어 misalignment 같은 행동 특성이 은밀히 전달될 수 있다는 것이다.
배경
- 2020-01-01LLM distillation과 synthetic data 활용이 일반화
- 2025-07-01Subliminal learning 프리프린트 공개
- 2026-04-15Nature 정식 게재 및 Anthropic 재조명
주요 입장
전망
- · Nature 논문은 숫자열·코드·CoT 등 여러 데이터 형식에서 특성 전이를 보고했다.
- · 특히 misalignment 전이가 가능하다는 점이 정책·안전 커뮤니티에 크게 읽힌다.
한국 영향
- 합성데이터 provenance 표준
- 파인튜닝 데이터 감사도구
- 공공 AI 조달 기준
Google DeepMind와 Boston Dynamics가 Spot에 Gemini Robotics를 붙이며 산업용 로봇의 실사용 성능을 끌어올렸다.
주요 사건
Google DeepMind가 Boston Dynamics Spot에 Gemini Robotics embodied reasoning 모델을 연결했다고 발표했다. 자연어 지시 기반으로 주변 이해, 물체 식별, 정리 작업, 계기판·온도계 판독 같은 산업 점검 업무를 더 잘 수행하게 했다는 내용이다.
배경
- 2020-01-01Spot이 산업 점검용 상용 플랫폼으로 확산
- 2025-01-01Gemini Robotics 계열이 공개되며 로봇 foundation model 경쟁 시작
- 2026-04-14Gemini Robotics-ER 1.6 발표
- 2026-04-16Boston Dynamics Spot 통합 공개
주요 입장
전망
- · Google 자료 기준 instrument reading 성능은 이전 ER 1.5의 23%에서 ER 1.6의 86%, agentic vision 사용 시 93%로 개선됐다.
- · 인간 부상 위험 탐지는 10% 개선됐다고 발표됐다.
한국 영향
- 산업 현장 계기판 판독 정확도
- 국내 안전 규제와 인증
- 한국어 자연어 제어 품질
참고 자료
Google DeepMind가 70개 이상 언어와 Audio Tags를 지원하는 Gemini 3.1 Flash TTS를 공개했다.
주요 사건
Google DeepMind가 Gemini 3.1 Flash TTS를 발표했다. 핵심은 텍스트 안에 Audio Tags를 넣어 톤·속도·연기 스타일을 제어할 수 있고, 70개 이상 언어를 지원하며, 모든 출력에 SynthID 워터마크를 넣는다는 점이다.
배경
- 2022-01-01생성형 TTS 시장이 급성장
- 2024-01-01멀티모달 LLM과 음성 API 결합 가속
- 2026-04-15Gemini 3.1 Flash TTS 발표
주요 입장
전망
- · Google은 70+ languages와 SynthID watermarking을 공식 강조했다.
- · 서드파티 분석에선 Artificial Analysis TTS leaderboard Elo 1211 수준이라는 평가가 나왔다.
한국 영향
- 한국어 prosody 품질
- 국내 딥페이크 대응 규제
- 음성 API 가격 인하 경쟁
xAI가 Grok STT/TTS API를 내놓으며 음성 API 가격 경쟁에 불을 붙였다.
주요 사건
Elon Musk가 xAI의 신규 음성 API 출시를 홍보했고, xAI는 별도 뉴스 페이지에서 Grok Speech-to-Text와 Text-to-Speech API를 공개했다. 배치 STT는 시간당 0.10달러, 스트리밍은 시간당 0.20달러, TTS는 100만자당 4.20달러로 책정했다.
배경
- 2023-01-01생성형 음성 스타트업 붐 본격화
- 2025-01-01차량·보이스에이전트에 LLM 음성 결합 확산
- 2026-04-19xAI Grok STT/TTS API 부각
주요 입장
전망
- · xAI는 STT 배치 $0.10/hr, 스트리밍 $0.20/hr, TTS $4.20/1M chars를 제시했다.
- · 공격적 가격 전략은 음성 API 시장의 마진을 더 압박할 가능성이 크다.
한국 영향
- 한국어 STT 정확도
- 국내 통신사/금융권 채택 여부
- 합성음성 식별 규정
참고 자료
SemiAnalysis는 NVIDIA GB200 NVL72가 Hopper 대비 50배 이상 빠를 수 있다고 주장하며 인퍼런스 경쟁 구도를 뒤흔들었다.
주요 사건
SemiAnalysis가 InferenceX 결과를 바탕으로 NVIDIA GB200 NVL72가 강한 Hopper baseline 대비 50배 이상 빠를 수 있다고 주장했다. Jensen Huang이 예전에 말한 35배를 넘는다는 식의 메시지로, FP4·MTP·disaggregated prefill·wide expert parallelism 등 최신 추론 최적화를 모두 포함한 결과다.
배경
- 2023-03-01Hopper H100이 AI 인프라 표준으로 부상
- 2024-03-01NVIDIA가 GB200 NVL72의 대폭 성능 향상을 제시
- 2026-04-18SemiAnalysis가 InferenceX 기반 50x+ 결과를 공개
주요 입장
전망
- · SemiAnalysis는 'over 50x faster'를 언급했다.
- · AMD 측 반론은 FP4와 MTP 등 특정 설정이 NVIDIA에 유리하다는 점에 집중한다.
한국 영향
- HBM 탑재량 변화
- 국내 GPU 클라우드의 Blackwell 도입 시점
- 전력·냉각 CAPEX
참고 자료
SemiAnalysis는 Positron AI가 단일 서버에서 16조 파라미터 모델을 돌리겠다는 비전을 띄우며 메모리 중심 AI 칩 설계를 부각시켰다.
주요 사건
SemiAnalysis가 Positron AI를 소개하며 '단일 서버에서 16 trillion parameter 모델 구동'이라는 메시지를 전했다. Positron 공식 페이지에 따르면 Titan 시스템은 8TB 이상 메모리, 10M+ 토큰 컨텍스트, 서버당 최대 16T 파라미터 지원을 목표로 한다.
배경
- 2023-01-01추론 최적화가 메모리 대역폭 문제로 이동
- 2025-02-01Positron이 대규모 투자 유치로 주목
- 2026-04-18Titan/16T 모델 비전이 다시 확산
주요 입장
전망
- · Positron Titan 페이지는 8TB+ memory와 10M+ context, 16T parameters/server를 명시한다.
- · 핵심 쟁점은 실제 성능보다 공급 시점과 소프트웨어 호환성이다.
한국 영향
- LPDDR/HBM 채택 전략
- 실제 양산 일정
- 국내 파운드리/패키징 연계 가능성
참고 자료
Vercel 침해 사건은 서드파티 AI 툴의 OAuth가 실제 공격 진입점이 될 수 있음을 보여줬다.
주요 사건
The Verge 등 복수 보도에 따르면 Vercel은 내부 시스템에 대한 무단 접근이 발생했고, 원인이 서드파티 AI 툴의 손상된 Google Workspace OAuth 앱이라고 설명했다. 해커 그룹 ShinyHunters가 관련 침해를 주장하면서 개발자 도구·내부 운영도구 전반의 접근권한 관리 문제가 부각됐다.
배경
- 2024-01-01기업들이 AI 업무도구를 대거 도입하기 시작
- 2025-01-01OAuth 기반 AI 워크스페이스 통합이 일반화
- 2026-04-19Vercel breach 보도 확산
주요 입장
전망
- · 보도에 따르면 침해 벡터는 compromised third-party AI tool의 Google Workspace OAuth 앱이었다.
- · 이는 AI 도구가 새로운 'identity supply chain'이 되고 있음을 보여준다.
한국 영향
- OAuth 최소권한 정책
- AI SaaS 벤더 보안 심사
- 사내 문서/이슈트래커 연동 관리
참고 자료
Google DeepMind의 Gemini Robotics-ER 1.6 자체도 물리세계 이해와 안전 판단 성능을 끌어올리며 로봇 AI 경쟁을 가속했다.
주요 사건
Google DeepMind는 Gemini Robotics-ER 1.6이 시각·공간 이해를 크게 개선했고, 액체 회피나 20kg 초과 물체 비운반 같은 물리 제약을 더 잘 이해하며, 인간 부상 위험 감지에서 10% 개선됐다고 밝혔다. 이 소식은 Spot 통합과 맞물리며 '연구 모델'이 아니라 '안전 강화된 로봇 운영 레이어'라는 점을 강조했다.
배경
- 2023-01-01멀티모달 foundation model의 로봇 적용 연구 확산
- 2025-01-01Gemini Robotics 계열 공개
- 2026-04-14Gemini Robotics-ER 1.6 발표
주요 입장
전망
- · Google은 인간 injury risk detection이 10% 향상됐다고 밝혔다.
- · 액체·중량 제한 이해 같은 constraint reasoning이 상용화 핵심이라는 평가가 많다.
한국 영향
- 국내 산업안전 인증체계
- 로봇 AI 로그·리플레이 감사
- 작업장 보험 상품 변화
참고 자료
베이징 휴머노이드 하프마라톤에서 로봇 기록이 인간 세계기록을 앞서며 중국 로봇 경쟁이 한 단계 올라갔다.
주요 사건
베이징 휴머노이드 하프마라톤에서 중국 업체 Honor의 로봇이 50분 26초를 기록했다. 이는 최근 인간 하프마라톤 세계기록보다 빠른 수치다. 단순 홍보 이벤트처럼 보이지만 장거리 보행과 주행, 열관리, 배터리, 자율 제어가 같이 개선됐다는 뜻이다.
배경
- 2024-01-01중국 휴머노이드 투자가 본격 확대
- 2025-04-01작년 로봇 하프마라톤 최고 기록은 2시간 40분 수준
- 2026-04-19올해 우승 로봇이 50분 26초를 기록
주요 입장
전망
- · TechCrunch는 우승 기록이 50분 26초이며 작년 2시간 40분 대비 큰 폭 개선이라고 전했다.
- · CNBC는 냉각 설계와 인간형 다리 비율 최적화가 핵심이라고 설명했다.
한국 영향
- 국내 휴머노이드 투자
- 열관리 기술
- 중국산 로봇 가격 경쟁