오픈AI의 Codex 요금제 세분화, 구글·메타의 모델 공세, 엔비디아의 추론 최적화, 앤트로픽의 보안형 모델 통제가 24시간 기술/AI 뉴스의 핵심 흐름이었다.
- OpenAI가 ChatGPT에 월 100달러 Codex 중심 Pro 티어를 추가하며 코딩 에이전트 경쟁을 가격/사용량 경쟁으로 전환했다.
- Google DeepMind와 Meta는 각각 Gemma 4, Muse Spark로 오픈/프로프라이어터리 양쪽에서 모델 존재감을 끌어올렸다.
- Nvidia DWDP와 Google-Intel 협업은 모델 성능보다 인프라 효율이 경쟁력의 핵심으로 이동하고 있음을 보여준다.
- Anthropic Mythos와 Florida의 OpenAI 조사 이슈는 안전·규제 리스크가 상용화 속도를 따라붙고 있음을 시사한다.
OpenAI가 Codex 수요를 겨냥해 월 100달러 ChatGPT Pro 티어를 도입했다.
주요 사건
OpenAI가 기존 20달러 Plus와 200달러 Pro 사이에 100달러 요금제를 신설했다. 핵심은 일반 챗봇이 아니라 Codex 같은 코딩 에이전트 사용량 확대이며, OpenAI는 Plus 대비 5배, 프로모션 기간에는 최대 10배 Codex 사용량을 내세웠다.
배경
- 2022-11-30ChatGPT 공개
- 2025-05-01코딩 에이전트 시장에서 Claude Code 등 경쟁 격화
- 2026-04-09OpenAI가 Codex 중심 100달러 Pro 티어 발표
주요 입장
전망
- · CNBC는 OpenAI가 Anthropic Claude Code와 직접 경쟁하기 위한 가격 전술로 해석했다.
- · OpenAI 공지 기준 새 100달러 티어는 Plus 대비 Codex 5배, 한시적으로 최대 10배 사용량을 제공한다.
한국 영향
- 기업용 에이전트 예산 전환 속도
- 국내 IDE/보안 툴과의 번들 경쟁
참고 자료
Google DeepMind는 Gemma 4가 첫 주 1천만 다운로드를 넘겼고 동급 대비 높은 성능을 냈다고 강조했다.
주요 사건
Google DeepMind가 Gemma 4 채택 속도를 공개하며 오픈 연구 커뮤니티에서의 초기 흥행을 부각했다. 트윗에서는 '자기보다 10배 큰 모델을 능가'한다는 메시지와 함께 Gemma 계열 누적 다운로드 5억+를 제시했다.
배경
- 2024-02-21Google이 Gemma 1 공개
- 2025-00-00오픈 모델 경쟁이 Llama·Qwen·DeepSeek 중심으로 가속
- 2026-04-09Google DeepMind가 Gemma 4 초기 확산 수치 공개
주요 입장
전망
- · Google DeepMind는 Gemma 4 첫 주 다운로드 1천만+, Gemma 계열 누적 5억+를 제시했다.
- · NVIDIA 포럼의 DGX Spark 초기 벤치마크는 Gemma 4 26B-A4B MoE가 23.7 tokens/s decode를 기록했다고 소개했다.
한국 영향
- 한국어 튜닝 생태계 형성
- 국내 GPU 서버에서의 실제 속도
참고 자료
Nvidia의 DWDP는 GB200 NVL72에서 추론 처리량을 평균 8.8% 높이는 새 병렬화 기법으로 주목받았다.
주요 사건
SemiAnalysis가 Nvidia의 DWDP(Distributed Weight-Data Parallelism)를 소개했다. 이는 대형 MoE 추론의 prefill 병목을 줄이기 위해 GPU 간 대역폭을 더 쓰는 대신 집단 동기화 대기 시간을 줄이는 방식이다.
배경
- 2023-00-00대형 MoE 서비스화와 추론 병렬화 복잡성 증가
- 2025-00-00GB200 NVL72 등 랙 스케일 GPU 패브릭 상용화
- 2026-04-09DWDP 관련 평가가 공개되며 추론 최적화 이슈 부상
주요 입장
전망
- · arXiv 초록과 SemiAnalysis 요약 모두 DeepSeek-R1 on GB200 NVL72에서 output TPS/GPU 평균 8.8% 개선을 언급했다.
- · 다만 TTFT는 악화될 수 있어 대화형 제품보다 배치/고밀도 서비스에 더 적합하다는 해석이 나온다.
한국 영향
- NVLink 대체 패브릭 경쟁
- 추론 서비스의 TTFT/TPS 가격 모델
MedGemma 1.5가 의료 영상·문서 이해 성능을 크게 끌어올리며 의료용 오픈 모델 경쟁을 자극했다.
주요 사건
Hugging Face 계정 _akhaliq가 MedGemma 1.5 기술 보고서를 공유했다. 핵심은 4B 모델이 의료 영상·병리 슬라이드·전자기록 이해에서 이전 버전보다 확장된 멀티모달 능력을 보였다는 점이다.
배경
- 2023-00-00의료 QA 중심의 초기 의료 LLM 확산
- 2025-00-00의료 영상과 문서를 함께 다루는 멀티모달 흐름 강화
- 2026-04-09MedGemma 1.5 기술 보고서 확산
주요 입장
전망
- · 기술 보고서 요약 기준으로 MedGemma 1.5는 3D MRI 조건 분류 정확도를 절대 11%p, 3D CT를 3%p 개선했다.
- · 병리 WSI에서는 macro F1이 47% 향상됐다고 보고됐다.
한국 영향
- 의료기기 인허가 연계
- 병원 내 프라이빗 멀티모달 배포
MARS는 별도 draft 모델 없이 다중 토큰 생성 속도를 올리는 경량 파인튜닝 기법으로 부상했다.
주요 사건
MARS(Mask AutoRegreSsion) 논문이 공개됐다. 자기회귀 모델이 한 번에 여러 토큰을 예측하도록 추가 학습시키는 방식으로, speculative decoding처럼 별도 draft 모델을 두지 않고도 속도 향상을 노린다.
배경
- 2023-00-00speculative decoding 대중화
- 2024-00-00Medusa류 multi-head 속도 최적화 연구 확산
- 2026-04-09MARS 논문 공개
주요 입장
전망
- · 논문 요약 기준으로 MARS는 6개 벤치마크에서 기본 AR 성능을 유지하거나 개선하면서 multi-token generation을 지원한다고 주장한다.
- · 핵심 포인트는 speculative decoding과 달리 별도 draft model이 필요 없다는 점이다.
한국 영향
- 오픈서빙 엔진 지원 여부
- 장문 추론 품질 저하 여부
RAGEN-2는 에이전트 RL에서 '그럴듯하지만 입력을 무시하는' reasoning collapse를 진단하고 완화책을 제시했다.
주요 사건
RAGEN-2 논문은 멀티턴 에이전트 RL에서 엔트로피는 높아 보여도 실제로는 입력과 무관한 템플릿형 추론으로 붕괴하는 'template collapse'를 지적했다. 그리고 보상 분산이 높은 샘플만 남기는 SNR-aware filtering으로 이를 완화했다고 주장한다.
배경
- 2024-00-00LLM RLHF에서 GRPO/PPO 확산
- 2025-00-00에이전트 RL에서 reasoning collapse 보고 증가
- 2026-04-09RAGEN-2 논문 공개
주요 입장
전망
- · RAGEN-2 페이지는 MI가 성능을 엔트로피보다 약 2배 더 잘 예측한다고 주장한다.
- · 실험 요약 기준으로 PPO·Qwen2.5-3B 설정에서 평균 +6.9포인트 개선 사례가 제시됐다.
한국 영향
- 국내 평가셋 구축
- 에이전트 RL 학습 안정성
Meta의 Muse Spark는 1년 만의 신형 모델로서 메타의 프론티어 경쟁 복귀 신호로 받아들여졌다.
주요 사건
MIT Technology Review의 일일 브리핑이 Meta Superintelligence Labs의 첫 모델인 Muse Spark 출시를 주요 AI 뉴스로 다뤘다. 독립 벤치 자료와 외신을 종합하면 Meta는 이 모델을 Meta AI 앱의 새 엔진으로 밀고 있다.
배경
- 2025-04-01Llama 4 계열 공개 후 기대 이하 평가
- 2025-00-00Meta Superintelligence Labs 체제 정비
- 2026-04-08Muse Spark 공개 및 Meta AI 앱 반영 시작
주요 입장
전망
- · Artificial Analysis에 따르면 Muse Spark의 Intelligence Index는 52로 상위 5위권, HLE는 39.9%였다.
- · SiliconANGLE은 Meta 주장 기준으로 HealthBench Hard에서 GPT-5.4보다 2%p 이상 높았다고 전했다.
한국 영향
- 한국 출시 속도
- API 공개 여부와 비용
참고 자료
Anthropic는 Mythos를 공개 제한하며 '취약점 탐지형 초강력 모델'의 안전통제를 전면에 내세웠다.
주요 사건
TechCrunch는 Anthropic이 Mythos 모델의 공개를 제한한 배경을 다뤘다. Anthropic은 이 모델이 주요 운영체제와 브라우저에서 제로데이 탐지·익스플로잇 작성 능력을 보여 Project Glasswing라는 제한된 파트너 프로그램으로만 다룬다고 설명했다.
배경
- 2024-00-00프론티어 모델의 코드·보안 평가 강화
- 2026-04-07Anthropic가 Mythos Preview와 Project Glasswing 공개
- 2026-04-09TechCrunch가 공개 제한의 동기와 논란을 조명
주요 입장
전망
- · The Register는 Anthropic 설명 기준으로 Mythos의 exploit 개발 성공률이 72.4%였다고 전했다.
- · Anthropic은 Firefox 관련 비교에서 Opus 4.6의 수백 회 시도 중 2회 수준 대비 Mythos는 181회 exploit 성공 사례를 제시했다.
한국 영향
- 고위험 모델 접근 정책
- 보안 AI의 국내 규제 프레임
참고 자료
Florida 법무장관의 OpenAI 조사 착수는 생성형 AI의 책임소재를 둘러싼 규제 전선을 넓히고 있다.
주요 사건
Florida 법무장관이 ChatGPT가 과거 FSU 총격 사건과 연결됐을 가능성을 조사하겠다고 밝혔다. 사건의 사실관계는 아직 다퉈질 여지가 있지만, 생성형 AI 서비스가 오프라인 범죄와 연결될 때 어떤 법적 책임을 지는지가 쟁점이 됐다.
배경
- 1996-02-08미국 통신품위법 Section 230 제정
- 2025-04-00FSU 총격 관련 ChatGPT 연계 의혹 제기
- 2026-04-09Florida AG가 OpenAI 조사 방침 발표
주요 입장
전망
- · TechCrunch는 Florida AG가 미성년자 위해, 국가안보 위협, 총격 사건 연계 가능성을 조사 포인트로 제시했다고 보도했다.
- · OECD AI Incident Monitor는 이 사안을 AI가 사람 피해에 직간접적으로 기여한 사례로 분류했다.
한국 영향
- 국내 AI 기본법 하위규정
- 고위험 사용 시 로그 감사 의무