Anthropic-Amazon 초대형 컴퓨트 계약, OpenAI의 Codex 메모리 확장, Kimi·PersonaVLM 같은 오픈 연구 진전이 하루 사이 기술/AI 흐름을 주도했다.
- Anthropic가 Amazon으로부터 즉시 50억달러, 최대 250억달러 추가 투자 옵션과 함께 향후 10년 AWS 1000억달러 사용 및 최대 5GW 컴퓨트 확보를 발표했다.
- OpenAI는 Codex의 Chronicle 연구 프리뷰를 공개하며 화면 맥락 기반 메모리와 컴퓨터 사용을 결합한 에이전트형 개발 도구 경쟁을 가속했다.
- 오픈 생태계에서는 Kimi K2.6, PersonaVLM, Positron 등 모델·인프라·개인화 연구가 동시에 전진하며 폐쇄형 빅테크를 압박했다.
Anthropic가 Amazon과 최대 5GW·AWS 1000억달러 규모 인프라 계약을 맺고 즉시 50억달러 투자를 추가 유치했다.
주요 사건
Anthropic는 Amazon과의 협력을 확대해 Claude 훈련·배포용 컴퓨트를 최대 5기가와트까지 확보한다고 밝혔다. 올해 말까지 약 1GW가 먼저 들어오고, Amazon은 즉시 50억달러를 투자하며 향후 최대 200억달러를 추가 투자할 수 있다.
배경
- 2021-01-01Anthropic 설립
- 2023-09-25Amazon이 Anthropic에 대규모 전략 투자 발표
- 2025-06-24AWS Project Rainier 가동, Anthropic 워크로드 탑재
- 2026-04-20Anthropic-Amazon 5GW·1000억달러 계약 발표
주요 입장
전망
- · CNBC 보도 기준 Anthropic는 10년간 AWS 기술에 1000억달러 이상을 쓰기로 약정했다.
- · AWS는 Project Rainier가 약 50만 Trainium2 칩 규모이며 이전 Claude 학습 대비 5배 이상 컴퓨트를 제공한다고 설명한다.
한국 영향
- Trainium 계열 확산이 엔비디아 독점에 실제 균열을 내는지
- HBM 수요가 GPU 중심에서 커스텀 ASIC까지 넓어지는지
OpenAI Codex가 Chronicle을 도입해 화면 맥락을 메모리로 축적하는 연구 프리뷰를 시작했다.
주요 사건
Sam Altman은 Codex용 Chronicle 연구 프리뷰를 공개했다. 기존 대화 기반 메모리에서 더 나아가 최근 화면 캡처를 바탕으로 Codex가 맥락을 쌓고, 사용자가 말하는 '이거/저거'를 더 잘 이해하도록 하는 기능이다.
배경
- 2024-01-01코딩 AI가 IDE 보조에서 에이전트 실행 단계로 이동
- 2026-04-16OpenAI가 Codex 컴퓨터 사용·플러그인 확장 공개
- 2026-04-20Chronicle 연구 프리뷰 공개
주요 입장
전망
- · OpenAI 문서상 Chronicle은 macOS 연구 프리뷰이며 화면 캡처는 임시 저장 후 로컬 메모리 확장 파일로 요약된다.
- · 외부 분석은 Codex 플러그인이 90개 이상 추가되어 총 100개 이상 통합으로 확장됐다고 요약한다.
한국 영향
- 온디바이스 메모리 정책과 기업 관리자 제어 기능
- 국내 보안 규정이 화면기반 메모리를 어떻게 해석하는지
Kimi K2.6가 Hugging Face에 공개되며 오픈소스 에이전트형 멀티모달 모델 경쟁을 끌어올렸다.
주요 사건
AK는 Moonshot AI의 Kimi K2.6 공개를 알렸다. K2.6는 장기 코딩, 에이전트 실행, 멀티모달 입력, swarm 기반 태스크 오케스트레이션을 전면에 내세운 공개 모델이다.
배경
- 2025-01-01오픈 에이전트형 모델 경쟁 본격화
- 2026-01-30Kimi K2.5 공개
- 2026-04-20Kimi K2.6 확산
주요 입장
전망
- · 모델 카드 기준 Kimi K2.6는 AIME 2026 96.4, GPQA Diamond 90.5, SWE-Bench Pro 58.6을 기록했다.
- · INT4 양자화 버전은 FP16 대비 약 2배 빠른 추론과 50% 메모리 절감을 내세운다.
한국 영향
- 실전 한국어·코딩 성능 검증
- 상업 사용 라이선스와 배포 비용
PersonaVLM 논문이 장기 개인화 멀티모달 메모리 성능 개선을 제시했다.
주요 사건
AK가 PersonaVLM 논문을 소개했다. 이 연구는 장기 개인화 멀티모달 모델을 위한 에이전트 프레임워크와 Persona-MME라는 새 평가셋을 제시한다.
배경
- 2023-01-01상용 챗봇에 개인화 메모리 기능 실험 시작
- 2026-03-20PersonaVLM arXiv 공개
- 2026-04-20연구가 소셜에서 재확산
주요 입장
전망
- · 논문은 Persona-MME 2000+ 케이스 벤치마크를 제안했다.
- · 128k 컨텍스트에서 기준선 대비 Persona-MME 22.4%, PERSONAMEM 9.8% 개선, GPT-4o 대비 각각 5.2%, 2.0% 우위를 보고했다.
한국 영향
- 한국어 멀티모달 개인화 데이터셋 부재
- 온디바이스 개인화와 클라우드 개인화의 균형
SemiAnalysis가 GPU 클러스터의 진짜 비용은 하드웨어 가격보다 goodput과 다운타임에 달려 있다고 강조했다.
주요 사건
SemiAnalysis는 GPU 클러스터 총소유비용(TCO), 다운타임, goodput이 실제 AI 인프라 경제성을 좌우한다고 정리한 글을 배포했다. 단순 FLOPS나 GPU 장당 가격 비교가 아니라, 장애와 엔지니어링 손실까지 포함한 클러스터 수준 비용을 보라는 메시지다.
배경
- 2023-01-01GPU 부족기엔 조달 자체가 핵심 이슈
- 2025-01-01goodput·cluster utilization 지표가 대두
- 2026-04-20SemiAnalysis가 클러스터 TCO 프레임 재강조
주요 입장
전망
- · SemiAnalysis 분석 인용 기준 H100 서버는 약 19만달러 수준, GB200 NVL72의 TCO는 H100 대비 약 1.6배 수준으로 계산됐다.
- · 보고서는 GB200가 이 1.6배 TCO를 상쇄하려면 최소 그 이상 성능 우위와 충분한 신뢰성이 필요하다고 본다.
한국 영향
- 국내 리전의 전력·냉각 비용 포함 TCO 공개 여부
- 고객이 token당 실효비용을 비교할 수 있는지
Positron이 첫 AI 칩 출하와 Oracle 고객 확보를 알리며 메모리 중심 추론 인프라 스타트업의 존재감을 키웠다.
주요 사건
SemiAnalysis는 Positron이 18개월 만에 첫 AI 칩을 출하하고 3년이 안 돼 Oracle을 고객으로 확보했다고 전했다. Positron은 메모리 대역폭·용량을 앞세운 추론 특화 구조를 강조한다.
배경
- 2023-01-01Positron 설립 단계
- 2026-02-05Positron 대규모 자금조달 및 Asimov 로드맵 공개
- 2026-04-20첫 칩 출하 및 Oracle 확보 소식 확산
주요 입장
전망
- · Positron Titan은 시스템당 8TB+ 메모리와 최대 16조 파라미터 단일 서버 지원을 내세운다.
- · 차세대 Asimov 칩은 칩당 최대 2.3TB 메모리, 2.76TB/s 메모리 대역폭, 약 400W TDP, 엔비디아 Rubin 대비 5배 token/$·token/W를 주장한다.
한국 영향
- Oracle 실제 배포 규모
- 소프트웨어 호환성 및 고객 전환 비용
Google의 Gemini in Chrome이 한국 포함 7개국으로 확대되며 브라우저 내 AI 비서 경쟁이 본격화됐다.
주요 사건
Google은 Gemini in Chrome을 호주·인도네시아·일본·필리핀·싱가포르·한국·베트남으로 확대했다. 브라우저 탭을 벗어나지 않고 요약, 설명, 정보 찾기 등을 수행하는 기능이다.
배경
- 2026-01-28Google이 Gemini 3 기반 Chrome AI 기능 소개
- 2026-03-13Gemini in Chrome 국가·언어 확장 발표
- 2026-04-20한국 포함 7개국 롤아웃 기사화
주요 입장
전망
- · Google 공지 기준 Gemini in Chrome은 50개 이상 추가 언어를 지원한다.
- · 기반 모델은 Gemini 3.1이며 향후 auto browse 2 같은 agentic browsing 기능으로 확장되고 있다.
한국 영향
- 한국어 정확도와 웹문서 인용 품질
- 학교·기업 환경에서의 관리자 제어 기능
NSA가 Pentagon 블랙리스트 와중에도 Anthropic의 Mythos를 사용 중이라는 보도가 나왔다.
주요 사건
Axios와 TechCrunch 보도에 따르면 NSA는 Pentagon이 Anthropic를 공급망 리스크로 몰아가는 상황에서도 제한 공개 모델 Mythos Preview를 사용 중이다. 용도는 공격보다 방어용 취약점 탐지가 중심으로 전해졌다.
배경
- 2025-07-01Anthropic가 DoD 관련 계약 체결
- 2026-02-01Pentagon과 Anthropic 갈등 심화
- 2026-04-19Axios가 NSA의 Mythos 사용 보도
주요 입장
전망
- · Axios 보도 기준 Mythos 접근 조직은 약 40곳 수준으로 제한됐다.
- · 일부 사용 사례는 17년 된 FreeBSD 취약점 같은 exploit 가능성 탐지에 강점을 보인다고 전해진다.
한국 영향
- 제한 공개 보안모델의 국내 도입 가능성
- 공공조달에서 모델 안전조건을 어떻게 명문화할지
Deezer는 신규 업로드 곡의 44%가 AI 생성물이며 그 스트림 대부분이 사기성이라고 밝혔다.
주요 사건
음악 스트리밍사 Deezer는 하루 약 7만5000개의 AI 생성 트랙이 올라오며, 이는 신규 업로드의 44%에 해당한다고 밝혔다. 전체 스트림 비중은 1~3%지만, 이 중 85%는 사기성으로 탐지돼 비수익 처리된다고 한다.
배경
- 2025-01-01Deezer가 AI 음악 탐지 도구 출시
- 2025-11-01AI 업로드 비중 가파르게 상승
- 2026-04-20신규 업로드 44%가 AI 생성물이라고 발표
주요 입장
전망
- · Deezer 발표 기준 AI 생성 트랙은 하루 약 7만5000곡, 월 200만곡 이상이다.
- · 탐지 시스템의 허위양성률은 0.01% 미만이라고 Ars Technica가 전했다.
한국 영향
- 국내 플랫폼의 AI 음악 표기 정책
- 저작권 단체와 플랫폼 간 로열티 규정 개정
중국 기술 노동자들이 자신의 AI 분신을 훈련하라는 압박에 맞서기 시작했다.
주요 사건
MIT Technology Review는 중국 기술기업에서 직원들에게 업무 흐름과 습관을 문서화해 AI 에이전트에 이식하도록 요구하는 사례가 늘고 있다고 보도했다. 일부 노동자는 이를 방해하는 'anti-distillation' 도구까지 만들고 있다.
배경
- 2025-01-01기업 내 AI 자동화 문서화 요구 증가
- 2026-04-01Colleague Skill 프로젝트 바이럴
- 2026-04-20MIT Technology Review 심층 보도
주요 입장
전망
- · MIT TR 보도에 따르면 일부 반자동화 스크립트는 500만 개 이상의 반응을 끌어냈다.
- · 현장 인터뷰들은 현재 에이전트가 여전히 상당한 인간 감독을 필요로 한다고 말한다.
한국 영향
- 직무 데이터의 소유권 규정
- AI 자동화 교육이 실질적 역량 강화인지 대체 준비인지