Anthropic Claude Sonnet 4.6 출시로 코딩·에이전트 성능 Opus급 도달, xAI Grok 4.20·Qwen 3.5·Tiny Aya 등 모델 릴리스 러시 + SemiAnalysis InferenceX v2로 Blackwell·AMD 최초 종합 벤치마크 공개
- Anthropic Claude Sonnet 4.6: 코딩·컴퓨터 사용·장문맥 추론에서 Opus급 성능, $3/$15 per M tokens, 1M 컨텍스트 베타
- xAI Grok 4.20 Beta 출시: 에이전트·멀티스텝 추론·금융 시뮬레이션에서 큰 도약
- Qwen 3.5 출시: 네이티브 멀티모달 에이전트 모델 + ASR 1.7B 음성인식
- Cohere Tiny Aya: 3.35B 파라미터로 70개+ 언어 지원 다국어 소형 모델
- SemiAnalysis InferenceX v2: GB300 NVL72·MI355X 최초 제3자 벤치마크, 1000개 GPU 활용
- Mistral AI가 Koyeb 인수: 유럽 AI 인프라 수직통합 전략
- Dreamer: Hugo Barra(전 Oculus VP)의 AI 에이전트 OS 플랫폼 스텔스 탈출
- Anthropic 르완다 MOU 체결, 벵갈루루 오피스 오픈 — 글로벌 확장 가속
Anthropic Claude Sonnet 4.6 출시 — 코딩·컴퓨터 사용에서 Opus급 성능을 Sonnet 가격으로 제공
주요 사건
Anthropic이 Claude Sonnet 4.6을 출시했다. 코딩, 컴퓨터 사용(GUI 자동화), 장문맥 추론, 에이전트 계획, 디자인 전반에서 이전 Sonnet 대비 대폭 개선되었으며, 일부 벤치마크에서 Opus 4.5에 근접하거나 능가한다. 가격은 Sonnet 4.5와 동일($3/$15 per M tokens)이며 1M 토큰 컨텍스트 윈도우가 베타로 제공된다. OSWorld 벤치마크에서 16개월간 꾸준한 상승세를 보이며 '인간 수준' 컴퓨터 사용에 근접하고 있다.
배경
- 2024-10-01Anthropic 최초 컴퓨터 사용 모델 출시
- 2025-11-01Claude Opus 4.5 출시
- 2026-02-12Anthropic $30B 펀딩, $380B 밸류에이션
- 2026-02-17Claude Sonnet 4.6 출시
주요 입장
전망
- · SemiAnalysis: Claude Code 사용량 폭증, 일일 $6K 지출 수준 도달
- · Dylan Patel: 'Codex가 코딩에서 Opus를 능가' — 경쟁 치열
한국 영향
- 1M 컨텍스트 한국어 성능 검증
- 국내 SaaS 기업의 Claude 통합 속도
xAI Grok 4.20 Beta 출시 — 에이전트 성능·멀티스텝 추론에서 대폭 도약
주요 사건
xAI가 Grok 4.20 Beta를 출시했다. 실세계 에이전트 성능, 멀티스텝 추론, 금융 시뮬레이션에서 가장 큰 폭의 개선을 보였으며, 순수 학술 벤치마크(MMLU-Pro 등)에서는 Grok 4.1이 이미 천장에 가까워 소폭 개선에 그쳤다.
배경
- 2025-08-01Grok 3 출시
- 2025-12-01Grok 4.1 출시
- 2026-02-17Grok 4.20 Beta 출시
주요 입장
전망
- · 독립 평가: 에이전트 모드에서 가장 큰 개선, 복잡한 도구 사용 쿼리에서 실질적 차이
한국 영향
- 한국어 성능 수준
- xAI API 한국 서비스 확대 여부
SemiAnalysis InferenceX v2 — GB300 NVL72·MI355X 최초 제3자 벤치마크, 약 1000개 GPU 동원
주요 사건
SemiAnalysis가 InferenceX v2(구 InferenceMAX)를 공개했다. NVIDIA Blackwell Ultra GB300 NVL72와 AMD MI355X를 포함해 지난 3-4년간 출시된 모든 주요 GPU에 대한 종합 추론 벤치마크를 처음으로 제공한다. 약 1000개의 프론티어 GPU를 사용하며, 분산 서빙(disagg PD)과 wide expert parallelism 최적화를 적용한 대규모 MoE 모델 테스트를 포함한다.
배경
- 2025-06-01InferenceMAX v1 출시
- 2026-01-01HBO MAX 상표 분쟁, InferenceX로 개명
- 2026-02-16InferenceX v2 출시, GB300·MI355X 최초 벤치마크
주요 입장
전망
- · Dylan Patel: '하드웨어+소프트웨어 성능은 새 모델과 ML 시스템 기법으로 계속 진화'
- · 곧 TPUv7 Ironwood·Trainium3도 추가 예정
한국 영향
- HBM 병목 여부
- 한국 데이터센터의 Blackwell 도입 일정
Qwen 3.5 출시 — 네이티브 멀티모달 에이전트 모델, ASR 1.7B 음성인식 동시 공개
주요 사건
알리바바 Qwen 팀이 Qwen 3.5를 출시했다. '네이티브 멀티모달 에이전트'를 표방하며 HuggingChat에서 즉시 사용 가능. 동시에 Qwen3-ASR-1.7B 음성인식 모델도 공개되어 Open ASR Leaderboard에서 영어 평균 WER 5.76을 기록했다.
배경
- 2024-09-01Qwen 2.5 출시
- 2025-04-01Qwen 3 출시
- 2026-02-17Qwen 3.5 + ASR 1.7B 출시
주요 입장
전망
- · HuggingChat 사용자: 'epic - working extremely well'
한국 영향
- Qwen 3.5 한국어 벤치마크
- 정부의 중국 AI 모델 사용 가이드라인
Cohere Tiny Aya — 3.35B 파라미터로 70개+ 언어 지원 다국어 소형 모델 출시
주요 사건
Cohere Labs가 Tiny Aya를 출시했다. 3.35B 파라미터의 소형 모델이면서 70개 이상의 언어에서 강력한 다국어 성능을 보인다. 오픈 웨이트로 Hugging Face에서 공개되었으며, 로컬 디바이스에서도 구동 가능하다.
배경
- 2024-02-01Aya 101 출시
- 2026-02-17Tiny Aya 3.35B 출시
주요 입장
전망
- · 테크니컬 리포트에 설계 결정과 평가 방식에 대한 유용한 인사이트 다수 포함
한국 영향
- 한국어 성능 품질
- 온디바이스 배포 실용성
Mistral AI, 클라우드 스타트업 Koyeb 인수 — 유럽 AI 인프라 수직통합 가속
주요 사건
프랑스 AI 기업 Mistral AI가 서버리스 클라우드 스타트업 Koyeb을 인수했다. Mistral의 첫 인수로, 13명의 직원과 3명의 공동창업자가 합류한다. 지난주 스웨덴 데이터센터에 12억 유로 투자를 발표한 데 이어 인프라 내재화를 강화하는 행보.
배경
- 2025-09-01Mistral AI €11.7B 밸류에이션 달성
- 2026-02-10스웨덴 데이터센터 12억 유로 투자 발표
- 2026-02-17Koyeb 인수 발표
주요 입장
전망
- · Koyeb CEO: 'Mistral과 함께 AI 인프라의 미래를 구축'
한국 영향
- 한국의 AI 클라우드 자주권 정책
- 국내 AI 기업의 인프라 수직통합 동향
Dreamer 스텔스 탈출 — Hugo Barra(전 Oculus VP)가 AI 에이전트 OS 플랫폼 공개
주요 사건
Hugo Barra(전 Meta/Oculus VP), David Singleton(전 Android VP), Nicholas Jitkoff(전 Google 디자인 리더)가 공동창업한 Dreamer가 스텔스에서 나왔다. AI 에이전트와 에이전틱 앱을 위한 새로운 OS 플랫폼을 표방한다. 'Sidekick'이라는 에이전트가 다른 에이전트를 빌드하고 자체 앱스토어에 퍼블리시하는 구조.
배경
- 2025-01-01Dreamer 개발 시작
- 2026-02-17Dreamer 베타 공개
주요 입장
전망
- · swyx: '가장 야심찬 풀스택 소비자+코딩 에이전트 스타트업'
- · David Singleton: 'Jobs가 말한 마음의 자전거, 드디어 실현'
한국 영향
- Dreamer의 한국어/아시아 시장 진출 계획
- 국내 에이전트 플랫폼 스타트업 동향
Sam Altman: Codex 주간 사용자 연초 대비 3배 이상 증가, Peter Steinberger OpenAI 합류로 개인 에이전트 개발 추진
주요 사건
Sam Altman이 Codex 주간 사용자가 연초 대비 3배 이상 증가했다고 밝혔다. 또한 OpenClaw 창시자 Peter Steinberger가 OpenAI에 합류해 차세대 개인 에이전트를 개발한다고 발표. OpenClaw은 오픈소스 재단으로 이관되며 OpenAI가 계속 지원할 예정.
배경
- 2026-02-12GPT-5.3-Codex-Spark 리서치 프리뷰 출시
- 2026-02-15Peter Steinberger OpenAI 합류 발표
- 2026-02-16Codex 사용자 3배 증가 공개
주요 입장
전망
- · Dylan Patel(SemiAnalysis): 'Claude Code 일일 지출 $6K 도달, 2주 전 $1K에서 급증'
한국 영향
- Codex/Claude Code 한국어 코딩 성능
- 국내 기업의 코딩 에이전트 도입률
Anthropic, 르완다 정부와 MOU 체결 + 벵갈루루 오피스 오픈 — 글로벌 확장 본격화
주요 사건
Anthropic이 아프리카 최초의 AI 파트너십으로 르완다 정부와 MOU를 체결해 보건·교육 등 공공 부문에 AI를 도입한다. 또한 인도 벵갈루루에 아시아-태평양 두 번째 오피스를 열었다. 인도는 claude.ai의 두 번째로 큰 시장이다.
배경
- 2026-02-12$30B 펀딩, $380B 밸류에이션
- 2026-02-16벵갈루루 오피스 오픈
- 2026-02-17르완다 MOU 체결
주요 입장
전망
한국 영향
- Anthropic 한국 시장 전략
- 정부 AI 도입 파트너십
Thrive Capital, $10B 신규 펀드 클로징 — AI 투자 자금 역대 최대 규모
주요 사건
Thrive Capital이 $10B 규모의 Thrive X 펀드를 클로징했다. $1B은 초기 투자, $9B은 성장 투자에 배정. 이전 펀드 대비 거의 2배 규모. OpenAI의 핵심 투자자인 Josh Kushner가 이끈다.
배경
- 2024-01-01이전 Thrive 펀드 약 $5B 규모
- 2026-02-17Thrive X $10B 클로징
주요 입장
전망
- · Sam Altman: 'Josh보다 헌신적이고 사려 깊은 투자자는 없다'
한국 영향
- 한국 AI 기업의 글로벌 펀딩 유치 사례
- 국내 AI 투자 펀드 규모 동향
ASE, AI 가속기 테스트 수요 증가에 대응해 테스터 장비 대규모 확충
주요 사건
세계 최대 반도체 OSAT(외주 조립·테스트) 기업 ASE가 테스터 장비를 대폭 확충하고 있다. AI 가속기와 첨단 패키징의 복잡성 증가로 테스트 수요가 공급망 전반에서 급증하고 있다.
배경
- 2025-01-01AI 가속기 테스트 TAM 성장세 확인
- 2026-02-17ASE 테스터 확충 계획 공개
주요 입장
전망
- · SemiAnalysis ChipBook: 테스트 산업 내 주요 기업 종합 분석 제공
한국 영향
- 한국 OSAT 기업의 AI 가속기 테스트 대응 현황
- 삼성 파운드리의 테스트 인프라
Apple, AI 웨어러블 3종 개발 중 — AI 하드웨어 경쟁 가열
주요 사건
TechCrunch에 따르면 Apple이 3종의 AI 웨어러블 디바이스를 개발 중이다. AI 하드웨어 시장이 뜨거워지는 가운데 iPhone 제조사가 다수의 스마트 제품을 준비하고 있다.
배경
- 2024-06-01Apple Intelligence 발표
- 2026-02-17AI 웨어러블 3종 개발 중 보도
주요 입장
전망
한국 영향
- Apple AI 웨어러블의 삼성 부품 채택 여부
- 삼성의 대응 전략
Karpathy: 'LLM이 프로그래밍 언어의 제약 조건을 완전히 바꾼다 — 소프트웨어 대부분을 여러 번 다시 쓰게 될 것'
주요 사건
Andrej Karpathy가 LLM이 프로그래밍 언어와 형식적 방법론의 제약 조건을 근본적으로 바꾸고 있다고 주장했다. C→Rust 변환, COBOL 레거시 코드 업그레이드 등에서 이미 변화가 보이며, LLM에 최적화된 새로운 프로그래밍 언어의 필요성을 제기했다. 또한 DeepWiki MCP + GitHub CLI 조합으로 라이브러리에서 필요한 기능만 '추출'하는 워크플로우를 시연했다.
배경
- 2025-02-01'Vibe coding' 개념 제시
- 2026-02-11순수 Python 243줄 GPT 구현 공개
- 2026-02-16LLM 시대 프로그래밍 언어 비전 발표
주요 입장
전망
- · Thomas Wolf(HuggingFace): '소프트웨어 공급망 축소, 모노리스의 귀환'
한국 영향
- 국내 기업의 LLM 기반 코드 마이그레이션 도입 사례
- 개발자 재교육 정책