Alibaba Qwen3.5 397B 출시로 중국 AI 경쟁 격화, SemiAnalysis InferenceX v2에서 GB300 NVL72가 H100 대비 100배 추론 성능 입증, OpenClaw 창시자 Peter Steinberger OpenAI 합류
- Alibaba Qwen3.5 (397B) 출시 — 네이티브 멀티모달, 비주얼 에이전틱 기능 탑재, 추론 비용 60% 절감
- SemiAnalysis InferenceX v2: GB300 NVL72가 H100 대비 최대 100배 추론 성능, MTP로 토큰당 비용 21배 절감
- OpenClaw 창시자 Steinberger OpenAI 합류, OpenClaw는 독립 재단으로 전환
- Anthropic 벵갈루루 사무소 공식 오픈, 인도 2위 시장, 매출 런레이트 $14B
- MiniMax M2.5 오픈소스 모델 SWE-Bench 80.2%, BrowseComp 76.3% 달성
- Tesla 한국에서 AI 칩 설계 엔지니어 채용 확대
- Ricursive Intelligence, AI 칩 스타트업이 4개월 만에 $4B 밸류에이션으로 $335M 조달
Alibaba Qwen3.5 출시: 397B 파라미터 멀티모달 모델로 에이전틱 AI 시대 선언
주요 사건
Alibaba가 Qwen3.5를 공개했다. 397B 파라미터의 네이티브 비전-언어 모델로, 262K 컨텍스트 윈도우를 지원하며 모바일/데스크톱 앱에서 독립적으로 작업을 수행하는 '비주얼 에이전틱' 기능을 갖추고 있다. 전작 대비 추론 비용 60% 절감, 대용량 처리 성능 8배 향상을 주장하며, GPT-5.2, Claude Opus 4.5, Gemini 3 Pro를 여러 벤치마크에서 앞선다고 발표했다.
배경
- 2023-08-01Alibaba Qwen 시리즈 최초 공개
- 2025-01-20DeepSeek R1 글로벌 바이럴
- 2025-01-29Qwen 2.5-Max 대응 출시
- 2026-02-14ByteDance Doubao 2.0 출시
- 2026-02-16Alibaba Qwen3.5 (397B) 출시
주요 입장
전망
- · Reuters: DeepSeek 차기 모델이 수일 내 출시 예정, 작년 같은 글로벌 충격 재현 가능성
- · Alibaba: 에이전틱 AI 시대에 맞춘 추론 비용당 성능 새 기준 제시
한국 영향
- DeepSeek 차기 모델 출시 시점과 성능
- 한국어 지원 품질 및 에이전틱 기능 현지화
참고 자료
SemiAnalysis InferenceX v2: GB300 NVL72가 H100 대비 최대 100배 추론 성능, MTP로 21배 비용 절감
주요 사건
SemiAnalysis가 InferenceX v2 벤치마크를 공개했다. 약 1,000개 GPU를 동원해 NVIDIA GB300 NVL72, B300, B200, H100과 AMD MI355X를 포함한 모든 주요 서방 GPU를 대상으로 DeepSeek MoE 모델의 분산 추론(Disaggregated Prefill + Wide Expert Parallelism)을 테스트했다. GB300 NVL72 FP4가 H100 대비 최대 100배 성능, 비용 조정 시 65배 효율을 달성. MTP(Multi-Token Prediction)는 GB300 FP4에서 토큰 비용을 $2.35→$0.11/백만토큰으로 21배 절감했다.
배경
- 2024-03-01NVIDIA GTC 2024에서 Blackwell 아키텍처 발표
- 2025-10-01InferenceMAX v1 오픈소스 벤치마크 공개
- 2026-02-13HBO MAX의 C&D로 InferenceMAX→InferenceX 리브랜딩
- 2026-02-16InferenceX v2 공개, GB300 NVL72 최초 서드파티 벤치마크
주요 입장
전망
- · Dylan Patel: GB300 NVL72 성능을 로그 스케일로 표시해야 할 정도의 격차
- · Emilio Andere: Jensen이 과소약속(underpromise)한 셈, 실측 100x는 업계 충격
한국 영향
- TPUv7 Ironwood·Trainium3 벤치마크 추가 예정
- 한국 데이터센터의 Blackwell 도입 일정
참고 자료
OpenClaw 창시자 Peter Steinberger OpenAI 합류, OpenClaw는 독립 재단으로 전환
주요 사건
Sam Altman이 OpenClaw 창시자 Peter Steinberger의 OpenAI 합류를 발표했다. Steinberger는 '차세대 개인 에이전트'를 주도하게 되며, OpenClaw는 OpenAI가 계속 지원하는 독립 오픈소스 재단으로 전환된다. OpenClaw는 GitHub 10만+ 스타, 1주일에 200만 방문자를 기록한 바이럴 AI 에이전트 프로젝트다.
배경
- 2025-11-01OpenClaw(Clawdbot) 최초 공개
- 2025-12-01GitHub 10만 스타 돌파
- 2026-02-15Steinberger OpenAI 합류, OpenClaw 재단 전환 발표
주요 입장
전망
- · swyx: 비엔나 집에서 세 명이 세상을 바꾼 것, 오픈소스 재단은 극도로 경쟁력 있을 것
- · TechCrunch: 일부 AI 전문가들은 OpenClaw가 AI 연구 관점에서는 새로운 것이 없다고 평가
한국 영향
- OpenClaw 재단 거버넌스 구조
- 한국어 지원 확대 여부
Anthropic 벵갈루루 사무소 공식 오픈, 인도 시장 매출 런레이트 배증
주요 사건
Anthropic이 벵갈루루(인도) 사무소를 공식 오픈하고, 기업·교육·농업 분야 파트너십을 발표했다. 인도는 Claude.ai 2위 시장으로, 사용량의 거의 절반이 코딩/수학 작업이다. Air India는 Claude Code로 소프트웨어 개발 가속, CRED는 2배 빠른 기능 배포를 달성. 10개 인도 언어 지원 강화 중이며, 인도 매출 런레이트는 4개월 만에 배증했다.
배경
- 2025-10-01Anthropic 인도 확장 발표
- 2026-02-12Anthropic $30B 펀딩, $380B 밸류에이션
- 2026-02-16벵갈루루 사무소 공식 오픈
주요 입장
전망
- · Irina Ghose(Anthropic 인도 MD): 인도는 세계에서 가장 유망한 책임감 있는 AI 기회
- · Reuters: Anthropic CEO Amodei, 인도 매출 4개월 만에 배증 확인
한국 영향
- Anthropic 한국 사무소 설립 가능성
- 한국어 지원 품질 개선
MiniMax M2.5 오픈소스 모델: SWE-Bench 80.2%, H200에서 GPU당 2,500 tok/s 달성
주요 사건
MiniMax가 M2.5를 오픈소스로 공개했다. SWE-Bench Verified 80.2%, Multi-SWE-Bench 51.3%, BrowseComp 76.3%를 기록한 프론티어급 모델로, 코딩뿐 아니라 Word/Excel/PPT 작업, 에이전트 도구 호출에도 강하다. SemiAnalysis 벤치마크에서 8xH200 TEP8 기준 GPU당 2,500 tok/s 처리량을 달성, 효율적인 추론이 확인됐다.
배경
- 2025-09-01MiniMax M2.1 코딩 모델 출시
- 2026-02-12MiniMax M2.5 오픈소스 출시
- 2026-02-16SemiAnalysis H200 추론 효율 벤치마크 공개
주요 입장
전망
- · SemiAnalysis: M2.5는 10K+ 컨텍스트에서도 사용자당 20tok/s 유지하며 실용적 인터랙티비티 확보
한국 영향
- M2.5 한국어 코딩 성능
- 자체 GPU 인프라 투자 대비 API 비용 분석
Tesla, 한국에서 AI 칩 설계 엔지니어 채용 확대 — Elon Musk 직접 홍보
주요 사건
Tesla가 한국에서 AI 칩 설계 엔지니어를 채용 중이며, Elon Musk가 직접 X에서 홍보했다. Tesla AI 팀은 '세계에서 가장 높은 생산량을 기록할 AI 칩 아키텍처' 개발을 목표로 하고 있으며, 칩 설계·제조·AI 소프트웨어 전 분야에서 인재를 모집 중이다.
배경
- 2021-08-01Tesla Dojo D1 칩 발표
- 2025-01-01Tesla 커스텀 AI 칩 차기 세대 개발 가속
- 2026-02-16Tesla Korea AI 칩 설계 엔지니어 채용 공고
주요 입장
전망
- · Benzinga: Tesla가 한국을 AI 칩 설계 전략적 채용 거점으로 선택
한국 영향
- Tesla Korea 채용 규모 및 포지션 상세
- 국내 반도체 인력 시장 임금 영향
참고 자료
Karpathy: LLM 시대에 맞는 새로운 프로그래밍 언어가 필요하다 — 소프트웨어 대규모 재작성 시대
주요 사건
Andrej Karpathy가 LLM이 프로그래밍 언어와 소프트웨어 엔지니어링의 제약 조건을 근본적으로 변화시키고 있다고 논했다. LLM은 번역에 특히 강하며(원본 코드가 상세 프롬프트 역할, 테스트 작성 가능), C→Rust, COBOL 레거시 전환 모멘텀이 증가 중이다. 그러나 Rust조차 LLM 타겟 언어로 최적이 아니며, 소프트웨어의 대부분이 여러 번 재작성될 가능성을 제시했다.
배경
- 2025-02-01Karpathy 'vibe coding' 용어 제안
- 2026-02-11Karpathy, DeepWiki+에이전트로 torchao fp8 기능 독립 추출 시연
- 2026-02-11GPT를 243줄(→200줄) 순수 Python으로 구현하는 'art project' 공개
- 2026-02-16LLM 최적 PL과 소프트웨어 대규모 재작성 논의
주요 입장
전망
- · Thom Wolf(HuggingFace): 소프트웨어 공급망 축소, 모놀리스 회귀, 코드베이스 재작성 비용 급감
- · Karpathy: '라이브러리는 끝났다, LLM이 새 컴파일러다'
한국 영향
- 에이전틱 코딩 도구의 기업 도입 속도
- 한국어 코드 주석/문서에 대한 LLM 번역 성능
Ricursive Intelligence, AI 칩 스타트업이 4개월 만에 $4B 밸류에이션으로 $335M 조달
주요 사건
AI 칩 스타트업 Ricursive Intelligence가 설립 4개월 만에 $4B 밸류에이션으로 $335M을 조달했다. AI 업계에서 유명한 창업자들이 설립했으며, VCs가 줄을 서서 투자한 것으로 알려졌다.
배경
- 2025-10-01Ricursive Intelligence 설립 추정
- 2026-02-16$335M 시리즈 A, $4B 밸류에이션
주요 입장
전망
- · TechCrunch: 창업자들이 AI 업계에서 워낙 유명해 모든 기업이 채용하려 했다
한국 영향
- Ricursive Intelligence의 칩 아키텍처 상세
- 한국 파운드리와의 협력 가능성
Sam Altman: OpenAI Codex 주간 사용자 올해 들어 3배 이상 증가
주요 사건
Sam Altman이 OpenAI Codex의 주간 활성 사용자가 2026년 초 이후 3배 이상 증가했다고 밝혔다. GPT-5.3-Codex-Spark가 2월 12일 Pro 사용자 대상으로 출시되며 1,000+ tok/s 속도를 제공하고 있다.
배경
- 2026-02-12GPT-5.3-Codex-Spark 연구 프리뷰 출시
- 2026-02-16Sam Altman, Codex 주간 사용자 3배+ 증가 확인
주요 입장
전망
- · Dylan Patel: Claude Code Fast 모드가 비싸다는 건 cope, SemiAnalysis 일 지출 $6K
- · Sam Altman: 1,000+ tok/s로 '그냥 만들 수 있는' 경험 제공
한국 영향
- 한국어 코드 생성 품질
- 기업용 라이선스 가격 정책
Hyperscaler CAPEX 급증으로 반도체 장비 수입 가속 — 대만·한국이 중국 앞서
주요 사건
SemiAnalysis의 ChipBook 데이터에 따르면, 하이퍼스케일러 CAPEX 증가로 웨이퍼 제조 장비(WFE) 수입이 급증하고 있다. 2025년까지 대만과 한국으로의 리소그래피 장비 수입이 중국보다 빠르게 성장했다. Meta의 새 데이터센터 설계는 발전기를 아예 생략해 건설 리드타임을 단축하고 있다.
배경
- 2024-01-01AI 투자 사이클 본격화
- 2025-12-31대만·한국 리소그래피 수입, 중국 초과 성장 확인
- 2026-02-16SemiAnalysis ChipBook 데이터 공개
주요 입장
전망
- · SemiAnalysis: 위성사진에서 발전기 유무로 데이터센터 세대를 구분할 수 있다
한국 영향
- 2026년 삼성전자 설비투자 계획
- ASML EUV 장비 한국 납품 일정
Apple, iPhone에서 RCS 종단간 암호화 메시지 테스트 시작
주요 사건
Apple이 iOS 26.4 개발자 베타에서 종단간 암호화(E2EE) RCS 메시지 테스트를 시작했다. 현재는 Apple 기기 간에서만 테스트 가능하며, 향후 iPhone-Android 간 암호화 RCS 메시지가 가능해질 예정이다.
배경
- 2024-09-01iOS 18에서 RCS 최초 지원
- 2025-01-01Apple, E2EE RCS 지원 계획 발표
- 2026-02-16iOS 26.4 베타에서 E2EE RCS 테스트 시작
주요 입장
전망
- · The Verge: 아직 Apple 기기 간에서만 테스트 가능하지만 크로스플랫폼 출시가 핵심
한국 영향
- 한국 통신사 RCS E2EE 지원 일정
- 카카오톡 시장 영향