GLM-5 오픈소스 744B MoE 공개, Anthropic ASL-4 안전 보고서 선제 발표, Google DeepMind 연구급 수학문제 에이전트 공개
- Zhipu AI, GLM-5 744B MoE 오픈소스 공개 — SWE-bench Verified 77.8%, 오픈소스 1위
- Anthropic, Opus 4.6 사보타주 리스크 리포트 발표 — ASL-4 기준 선제 적용
- Anthropic, 데이터센터 전력 비용 100% 자체 부담 공약
- Google DeepMind, Gemini Deep Think로 연구급 수학·물리 문제 해결 에이전트 공개
- TSMC 1월 매출 $12.7B 사상 최고치 (YoY +42.6%)
- OpenAI, ChatGPT 무료·Go 티어에 광고 테스트 시작
- Sam Altman: GPT-5.2 업데이트 + Codex 앱 첫 주 100만 다운로드
- Windsurf Arena 리더보드 공개 — Opus 4.6 1위, '속도' 선호 확인
- Karpathy, 243줄 순수 Python GPT + DeepWiki MCP 워크플로우 제안
- SemiAnalysis: Amphenol VR200 NVL144 커넥터 분석, 한국 메모리 말레이시아 수출 증가
Zhipu AI, GLM-5 744B MoE 오픈소스 공개 — 오픈소스 최강 코딩·에이전트 모델
주요 사건
중국 Zhipu AI(Z.ai)가 744B 파라미터(40B 활성) MoE 모델 GLM-5를 MIT 라이선스로 오픈소스 공개. 28.5T 토큰 사전학습, DeepSeek Sparse Attention 적용. SWE-bench Verified 77.8%, HLE w/ Tools 50.4%로 오픈소스 1위. 비동기 RL 인프라 'slime'으로 훈련 효율 극대화.
배경
- 2024-06-01GLM-4 공개
- 2025-01-01DeepSeek-V3 오픈소스 충격
- 2025-08-01GLM-4.5 355B 공개
- 2026-02-11GLM-5 744B 오픈소스 공개, LMSYS 오픈소스 1위
주요 입장
전망
- · SemiAnalysis: SGLang Day-0 지원으로 즉시 배포 가능
- · LMSYS: 6K+ 투표 기반 오픈소스 최고 평가
한국 영향
- GLM-5 한국어 성능 평가
- 국내 클라우드 배포 지원 현황
Anthropic, Claude Opus 4.6 사보타주 리스크 리포트 발표 — ASL-4 안전 기준 선제 적용
주요 사건
Anthropic이 Claude Opus 4.6에 대한 사보타주 리스크 리포트를 공개. Opus 4.6이 ASL-4 임계치를 넘지는 않았지만, 경계가 불분명해지는 상황에서 선제적으로 더 높은 안전 기준(ASL-4)을 적용. 모델의 자율 AI R&D 위험성을 상세히 평가.
배경
- 2023-09-19Anthropic RSP v1.0 발표
- 2025-10-01Claude Opus 4.5 출시, 사보타주 리포트 약속
- 2026-02-05Claude Opus 4.6 출시
- 2026-02-11Opus 4.6 사보타주 리스크 리포트 공개
주요 입장
전망
- · TheRift: Anthropic의 선제적 ASL-4 적용이 업계 투명성 기준을 높일 것
- · 향후 12-24개월 내 안전 통합 아키텍처에 대한 투자 가속 전망
한국 영향
- 한국 AI 안전 가이드라인 업데이트 동향
- ASL-4 수준 평가 체계 국내 도입 가능성
Anthropic, 데이터센터 전력비용 100% 자체 부담 — AI 기업 최초 전력 공약
주요 사건
Anthropic이 자사 데이터센터로 인한 전기료 인상분을 100% 자체 부담하겠다고 공약. 그리드 업그레이드 비용 전액 부담, 신규 전력 확보, 그리드 부하 감소 시스템 투자 약속. 일반 요금 부담자에게 비용을 전가하지 않겠다는 선언.
배경
- 2024-01-01AI 데이터센터 전력 소비 급증 이슈화
- 2025-06-01Microsoft, Three Mile Island 원자력 재가동 계약
- 2026-02-11Anthropic 전력비용 100% 자체 부담 공약
주요 입장
전망
- · AI 인프라 비용이 기업 경쟁력의 핵심 변수로 부상
- · 전력 공약이 ESG 투자자에게 긍정 신호
한국 영향
- 한국 데이터센터 전력 요금 체계 개편 논의
- 국내 AI 기업 전력 소비 투명성
Google DeepMind, Gemini Deep Think로 연구급 수학·물리 문제 해결 — AI 과학 연구 에이전트 시대
주요 사건
Google DeepMind이 Gemini Deep Think 기반 수학 연구 에이전트 'Aletheia'를 공개. IMO 금메달 수준을 넘어 전문 연구자 수준의 수학·물리·CS 문제를 해결. 자연어 검증기로 솔루션 반복 검증, Google 검색 통합으로 문헌 조사 자동화. 논문 2편 발표.
배경
- 2024-01-01AlphaGeometry IMO 기하 문제 해결
- 2025-07-01Gemini Deep Think IMO 금메달
- 2025-10-01ICPC 수준 달성
- 2026-02-11연구급 수학·물리 문제 해결 에이전트 'Aletheia' 공개
주요 입장
전망
- · Thang Luong: 전문가 방향 설정 하에 AI가 연구 생산성을 근본적으로 변화시킴
- · 실패 인정 기능이 연구자 신뢰의 핵심
한국 영향
- 국내 수학·과학 연구에 Gemini Deep Think 적용 사례
- AI 연구 도구 접근성 격차
TSMC 1월 매출 $12.7B 사상 최고 — AI 반도체 수요 지속 확인
주요 사건
TSMC 2026년 1월 매출 NT$401.3B($12.7B), YoY +42.6%, MoM +19.1%로 월간 사상 최고 기록. 2020년 이후 7년 연속 1월 MoM 성장. Q1 가이던스 $34.6-35.8B 범위 내 상단 트래킹. 1월 YoY 증가분 $3.8B는 역대 2배 수준.
배경
- 2024-01-01TSMC AI 매출 비중 급증 시작
- 2025-01-01연간 매출 30%+ 성장
- 2026-01-011월 매출 $12.7B 사상 최고
주요 입장
전망
- · SemiAnalysis: 1월 YoY 방향이 75% 확률로 연간 방향 예측
- · Bloomberg: AI 지출 지속에도 버블 우려 잔존
한국 영향
- 삼성파운드리 2nm 수율 개선 진척
- TSMC 일본·미국 팹 가동 시점
OpenAI, ChatGPT 무료·Go 티어에 광고 테스트 시작 — AI 비즈니스 모델 전환점
주요 사건
OpenAI가 ChatGPT 무료·Go 티어 미국 사용자 대상 광고 테스트 시작. 대화 주제 기반 매칭, 광고가 답변에 영향 미치지 않음 강조. Plus/Pro/Business/Enterprise/Education은 광고 없음. Anthropic은 즉각 '광고 없는 AI' 카운터 마케팅.
배경
- 2022-11-30ChatGPT 출시
- 2025-01-01ChatGPT 3억+ 주간 사용자 돌파
- 2026-02-09ChatGPT 광고 테스트 시작
주요 입장
전망
- · TechCrunch: AI 어시스턴트 광고는 검색 광고의 진화형
- · Anthropic의 카운터 포지셔닝이 시장 차별화에 효과적
한국 영향
- ChatGPT 한국 시장 광고 확대 시점
- 국내 AI 서비스 광고 도입 여부
Sam Altman: GPT-5.2 업데이트 + Codex 앱 첫 주 100만 다운로드, Deep Research GPT-5.2 탑재
주요 사건
OpenAI가 GPT-5.2(인스턴트 모델)을 ChatGPT에서 업데이트. Deep Research도 GPT-5.2 기반으로 전환, 앱 연동·실시간 진행 추적·전체화면 리포트 기능 추가. Codex 앱은 첫 주 100만 다운로드, GPT-5.3-Codex가 Cursor/GitHub/VS Code에 롤아웃.
배경
- 2025-12-01GPT-5 출시
- 2026-02-03Codex 앱 출시
- 2026-02-09GPT-5.3-Codex Cursor/VS Code 롤아웃
- 2026-02-11GPT-5.2 업데이트, Deep Research 개선
주요 입장
전망
- · Sam Altman: Codex가 결국 이길 것으로 예상, 예상보다 빨리 진행
- · Dylan Patel: GPT-5.3 Codex vs Claude Opus 4.6 직접 비교에서 Opus 우위
한국 영향
- Codex vs Claude Code 국내 개발자 선호도
- GPT-5.3-Codex 한국어 코딩 성능
Windsurf Arena 리더보드 공개 — Claude Opus 4.6 1위, '속도' 선호가 핵심 인사이트
주요 사건
Windsurf의 Arena Mode 리더보드가 공개됨. 첫 주 4만 투표. Claude Opus 4.6가 1위. 주요 서프라이즈: Gemini 3 Flash가 Pro를 이김, Grok Code Fast가 Gemini 3를 이김, Claude Haiku 4.5가 GPT 5.2를 이김. 결론: 사용자는 '속도'를 매우 중시.
배경
- 2025-01-01LMSYS Chatbot Arena 코드 리더보드 확립
- 2026-02-05Windsurf Arena Mode 출시
- 2026-02-11첫 주 리더보드 공개, 4만 투표
주요 입장
전망
- · swyx: 사람들은 속도를 원한다 — Arena가 이를 증명
- · Windsurf: 실제 코딩 태스크 기반 평가가 벤치마크보다 현실적
한국 영향
- 국내 코딩 에이전트 시장의 모델 선호도 변화
- 속도 최적화 인프라 투자
Karpathy, 243줄 순수 Python GPT 공개 + DeepWiki MCP로 '라이브러리 해체' 워크플로우 제안
주요 사건
Andrej Karpathy가 두 가지 프로젝트 공개: 1) 243줄 순수 Python으로 GPT 학습+추론 (의존성 없음, micrograd 기반), 2) DeepWiki MCP + GitHub CLI로 대형 라이브러리에서 필요한 기능만 추출하는 워크플로우. torchao fp8 기능을 150줄로 추출, 오히려 3% 빨라짐.
배경
- 2023-01-01nanoGPT 공개
- 2025-02-01vibe coding 개념 발표
- 2026-02-03nanochat fp8 훈련으로 GPT-2 $20 재현
- 2026-02-11243줄 GPT + DeepWiki MCP 워크플로우 공개
주요 입장
전망
- · Karpathy: 라이브러리의 시대는 끝났다, LLM이 새 컴파일러
- · swyx: vibe coding에서 agentic engineering으로 진화
한국 영향
- DeepWiki MCP 한국 개발자 채택
- 국내 AI 교육 커리큘럼 반영
SemiAnalysis: Amphenol NVL144 커넥터 분석 + 한국 메모리 말레이시아 수출 증가 (Intel 패키징 라인 증거)
주요 사건
SemiAnalysis가 두 가지 반도체 인프라 분석 공개: 1) Amphenol의 Paladin 보드-투-보드 커넥터가 VR200 NVL144에서 GPU당 달러 콘텐츠 대폭 증가. NVIDIA 케이블리스 설계가 오히려 Amphenol에 유리. 2) 한국 메모리 제조사의 말레이시아 수출 증가가 Intel 어드밴스드 패키징 램프의 증거.
배경
- 2024-03-01GB200 NVL72 발표
- 2025-06-01GB300 발표
- 2026-01-01VR200 NVL144 설계 진행
- 2026-02-11SemiAnalysis 커넥터/메모리 수출 분석
주요 입장
전망
- · SemiAnalysis: VR NVL144에서 Paladin 커넥터가 케이블 대체로 ASP 대폭 상승
- · 한국 메모리→말레이시아 수출 증가는 Intel 패키징 램프의 읽기
한국 영향
- SK하이닉스 HBM4 양산 일정
- 삼성 HBM 시장 점유율 회복 여부
- Intel 말레이시아 팹 가동 현황