2026년 2월 12일 · 목요일·기술

높음

sentiment.bullish

GLM-5 오픈소스 744B MoE 공개, Anthropic ASL-4 안전 보고서 선제 발표, Google DeepMind 연구급 수학문제 에이전트 공개

핵심 요약

Zhipu AI, GLM-5 744B MoE 오픈소스 공개 — SWE-bench Verified 77.8%, 오픈소스 1위
Anthropic, Opus 4.6 사보타주 리스크 리포트 발표 — ASL-4 기준 선제 적용
Anthropic, 데이터센터 전력 비용 100% 자체 부담 공약
Google DeepMind, Gemini Deep Think로 연구급 수학·물리 문제 해결 에이전트 공개
TSMC 1월 매출 $12.7B 사상 최고치 (YoY +42.6%)
OpenAI, ChatGPT 무료·Go 티어에 광고 테스트 시작
Sam Altman: GPT-5.2 업데이트 + Codex 앱 첫 주 100만 다운로드
Windsurf Arena 리더보드 공개 — Opus 4.6 1위, '속도' 선호 확인
Karpathy, 243줄 순수 Python GPT + DeepWiki MCP 워크플로우 제안
SemiAnalysis: Amphenol VR200 NVL144 커넥터 분석, 한국 메모리 말레이시아 수출 증가

10개 출처 · 10개 항목

01@_akhaliq, @SemiAnalysis_·2.11 22:45

Zhipu AI, GLM-5 744B MoE 오픈소스 공개 — 오픈소스 최강 코딩·에이전트 모델

주요 사건

중국 Zhipu AI(Z.ai)가 744B 파라미터(40B 활성) MoE 모델 GLM-5를 MIT 라이선스로 오픈소스 공개. 28.5T 토큰 사전학습, DeepSeek Sparse Attention 적용. SWE-bench Verified 77.8%, HLE w/ Tools 50.4%로 오픈소스 1위. 비동기 RL 인프라 'slime'으로 훈련 효율 극대화.

배경

역사적 맥락

GLM 시리즈는 Tsinghua 출신 Zhipu AI가 개발. GLM-4(2024) → GLM-4.5 355B(2025) → GLM-4.7 → GLM-5 744B로 급속 스케일업. DeepSeek-V3, Kimi K2.5 등 중국 오픈소스 모델과 치열한 경쟁. LMSYS Arena에서 'Pony Alpha'로 익명 테스트 후 정체 공개.

원인

중국 AI 경쟁 심화 → MoE 아키텍처 대중화 → RL 포스트트레이닝 고도화 → 오픈소스로 생태계 확보 → 프론티어 모델 격차 축소

타임라인

2024-06-01
GLM-4 공개
2025-01-01
DeepSeek-V3 오픈소스 충격
2025-08-01
GLM-4.5 355B 공개
2026-02-11
GLM-5 744B 오픈소스 공개, LMSYS 오픈소스 1위

주요 입장

Zhipu AI

오픈소스로 생태계 주도

MIT 라이선스로 최대 채택 유도

Anthropic/OpenAI

클로즈드 프론티어 유지

안전·품질 우위

개발자 커뮤니티

환영

자체 호스팅 가능한 프론티어급 모델

전망

high

GLM-5, DeepSeek, Kimi 등 중국 오픈소스가 3-6개월 내 클로즈드 모델 90% 수준 도달

medium

SWE-bench 80%+ 달성하는 오픈소스 모델 등장으로 기업 자체 에이전트 구축 가속

· SemiAnalysis: SGLang Day-0 지원으로 즉시 배포 가능
· LMSYS: 6K+ 투표 기반 오픈소스 최고 평가

한국 영향

직접 영향

삼성SDS, 네이버 등 자체 AI 서비스에 GLM-5 활용 가능. API 비용 절감 기회.

간접 영향

한국 AI 스타트업의 모델 선택지 확대. 오픈소스 생태계 기여 필요성 증가.

주목할 지점

GLM-5 한국어 성능 평가
국내 클라우드 배포 지원 현황

참고 자료

#open-source#moe#zhipu-ai#coding-agent#china-ai

02@AnthropicAI·2.11 01:36

Anthropic, Claude Opus 4.6 사보타주 리스크 리포트 발표 — ASL-4 안전 기준 선제 적용

주요 사건

Anthropic이 Claude Opus 4.6에 대한 사보타주 리스크 리포트를 공개. Opus 4.6이 ASL-4 임계치를 넘지는 않았지만, 경계가 불분명해지는 상황에서 선제적으로 더 높은 안전 기준(ASL-4)을 적용. 모델의 자율 AI R&D 위험성을 상세히 평가.

배경

역사적 맥락

Anthropic RSP v1.0(2023.9) → v2.0(2024.10) → v2.2(2025.5). Opus 4.5 출시 시 향후 프론티어 모델에 사보타주 리포트 작성 약속. Opus 4.6은 1M 토큰 컨텍스트, 에이전트 팀, 128K 출력 토큰 지원.

원인

AI 능력 급속 향상 → ASL 임계치 접근 → 주관적 판단 의존 위험 → 선제적 높은 기준 적용 → 업계 안전 표준 선도

타임라인

2023-09-19
Anthropic RSP v1.0 발표
2025-10-01
Claude Opus 4.5 출시, 사보타주 리포트 약속
2026-02-05
Claude Opus 4.6 출시
2026-02-11
Opus 4.6 사보타주 리스크 리포트 공개

주요 입장

Anthropic

선제적 안전 투명성

임계치 접근 시 더 높은 기준 자발 적용

OpenAI/xAI

성능 우선 경쟁

시장 점유율 확대

규제기관

자발적 안전 평가 환영

산업 자율규제 모델 사례

전망

high

2026년 내 다수 모델이 ASL-4 수준 접근, 의무적 안전 평가 필요

medium

Anthropic의 선례가 OpenAI, Google 등에 파급되어 사보타주 리포트 일반화

· TheRift: Anthropic의 선제적 ASL-4 적용이 업계 투명성 기준을 높일 것
· 향후 12-24개월 내 안전 통합 아키텍처에 대한 투자 가속 전망

한국 영향

직접 영향

한국 AI 안전 정책 수립 시 Anthropic RSP 프레임워크 참고 가능

간접 영향

국내 AI 기업도 자체 모델의 위험 평가 보고서 작성 압박 증가

주목할 지점

한국 AI 안전 가이드라인 업데이트 동향
ASL-4 수준 평가 체계 국내 도입 가능성

참고 자료

#ai-safety#anthropic#asl-4#regulation#responsible-scaling

03@AnthropicAI·2.11 21:15

Anthropic, 데이터센터 전력비용 100% 자체 부담 — AI 기업 최초 전력 공약

주요 사건

Anthropic이 자사 데이터센터로 인한 전기료 인상분을 100% 자체 부담하겠다고 공약. 그리드 업그레이드 비용 전액 부담, 신규 전력 확보, 그리드 부하 감소 시스템 투자 약속. 일반 요금 부담자에게 비용을 전가하지 않겠다는 선언.

배경

역사적 맥락

AI 데이터센터 전력 소비 급증이 사회적 이슈. 미국 각 지역에서 데이터센터 전력 요금 전가 논란 지속. Microsoft, Google, Amazon 등 빅테크는 원자력·재생에너지 계약으로 대응 중.

원인

AI 학습·추론 전력 수요 폭증 → 지역 전력망 부담 → 요금 인상 여론 → Anthropic 선제적 부담 공약

타임라인

2024-01-01
AI 데이터센터 전력 소비 급증 이슈화
2025-06-01
Microsoft, Three Mile Island 원자력 재가동 계약
2026-02-11
Anthropic 전력비용 100% 자체 부담 공약

주요 입장

Anthropic

사회적 책임 선도

AI 성장이 일반 시민에게 부담이 되면 안 됨

타 AI 기업

관망

비용 구조상 전액 부담 어려움

지역 주민/규제기관

환영

전력 요금 안정화

전망

medium

타 AI 기업도 유사 공약 발표 압박

high

전력 비용 부담 의지가 입지 허가의 핵심 조건으로 부상

· AI 인프라 비용이 기업 경쟁력의 핵심 변수로 부상
· 전력 공약이 ESG 투자자에게 긍정 신호

한국 영향

직접 영향

한국 데이터센터 전력 요금 정책에 시사점

간접 영향

국내 AI 기업의 ESG·전력 비용 부담 논의 촉진

주목할 지점

한국 데이터센터 전력 요금 체계 개편 논의
국내 AI 기업 전력 소비 투명성

참고 자료

Anthropic electricity cost commitment—

#ai-infrastructure#anthropic#energy#esg#datacenter

04@GoogleDeepMind·2.11 17:07

Google DeepMind, Gemini Deep Think로 연구급 수학·물리 문제 해결 — AI 과학 연구 에이전트 시대

주요 사건

Google DeepMind이 Gemini Deep Think 기반 수학 연구 에이전트 'Aletheia'를 공개. IMO 금메달 수준을 넘어 전문 연구자 수준의 수학·물리·CS 문제를 해결. 자연어 검증기로 솔루션 반복 검증, Google 검색 통합으로 문헌 조사 자동화. 논문 2편 발표.

배경

역사적 맥락

2025년 여름 Gemini Deep Think가 IMO 금메달, ICPC 수준 달성. 이후 과학·엔지니어링·기업 워크플로우로 확장. AlphaFold(단백질) → AlphaGeometry(기하학) → Deep Think(범용 연구)로 진화.

원인

경시 수준 문제 해결 → 연구 수준 문제로 확장 → 에이전트 워크플로우 통합 → 실패 인정 기능으로 신뢰성 확보 → 연구자 협업 도구로 전환

타임라인

2024-01-01
AlphaGeometry IMO 기하 문제 해결
2025-07-01
Gemini Deep Think IMO 금메달
2025-10-01
ICPC 수준 달성
2026-02-11
연구급 수학·물리 문제 해결 에이전트 'Aletheia' 공개

주요 입장

Google DeepMind

AI 과학 연구 도구 선도

전문 연구자와 협업하는 AI 에이전트

OpenAI

Deep Research로 경쟁

GPT-5.2 기반 심층 조사

학계

기대와 우려 공존

연구 가속화 vs 연구자 역할 변화

전망

high

2026-2027년 주요 학술지 논문에서 AI 에이전트 기여 명시 일반화

medium

AI 에이전트가 오랜 미해결 수학 문제 해결에 실질적 기여

· Thang Luong: 전문가 방향 설정 하에 AI가 연구 생산성을 근본적으로 변화시킴
· 실패 인정 기능이 연구자 신뢰의 핵심

한국 영향

직접 영향

KAIST, 서울대 등 국내 연구기관의 AI 연구 도구 활용 가속

간접 영향

AI 과학 연구 인프라 구축 필요성 증가

주목할 지점

국내 수학·과학 연구에 Gemini Deep Think 적용 사례
AI 연구 도구 접근성 격차

참고 자료

Gemini Deep Think: Redefining the Future of Scientific Research—

#deepmind#gemini#ai-research#mathematics#science

05@SemiAnalysis_·2.10 22:00

TSMC 1월 매출 $12.7B 사상 최고 — AI 반도체 수요 지속 확인

주요 사건

TSMC 2026년 1월 매출 NT$401.3B($12.7B), YoY +42.6%, MoM +19.1%로 월간 사상 최고 기록. 2020년 이후 7년 연속 1월 MoM 성장. Q1 가이던스 $34.6-35.8B 범위 내 상단 트래킹. 1월 YoY 증가분 $3.8B는 역대 2배 수준.

배경

역사적 맥락

TSMC은 Nvidia, Apple, AMD 등의 핵심 파운드리. AI 칩(H100→H200→B200→VR200) 수요 폭증으로 2024년부터 급성장. 2025년 연간 30%+ 성장, 2026년도 유사 성장률 가이던스.

원인

AI 모델 규모 확대 → GPU/ASIC 수요 폭증 → TSMC 선단공정 풀가동 → 매출 기록 경신 → 설비투자 확대

타임라인

2024-01-01
TSMC AI 매출 비중 급증 시작
2025-01-01
연간 매출 30%+ 성장
2026-01-01
1월 매출 $12.7B 사상 최고

주요 입장

TSMC

AI 수요 지속 자신감

선단공정 독점적 지위 유지

Nvidia/빅테크

칩 확보 경쟁

AI 인프라 확장 필수

투자자

AI 버블 우려 vs 실적 확인

실적이 수요를 뒷받침

전망

high

1월 강세가 연간 성장 쿠션 제공, Q1 순차 성장 달성 전망

high

1월이 연간 피크인 경우는 27년 중 2번뿐, 나머지 기간 더 높은 매출 예상

· SemiAnalysis: 1월 YoY 방향이 75% 확률로 연간 방향 예측
· Bloomberg: AI 지출 지속에도 버블 우려 잔존

한국 영향

직접 영향

삼성파운드리와의 격차 심화. 삼성전자 2nm GAA 양산 성공 시급.

간접 영향

한국 반도체 장비·소재 기업에 TSMC 공급망 기회

주목할 지점

삼성파운드리 2nm 수율 개선 진척
TSMC 일본·미국 팹 가동 시점

참고 자료

#tsmc#semiconductor#ai-infrastructure#revenue#foundry

06@OpenAI·2.9 19:03

OpenAI, ChatGPT 무료·Go 티어에 광고 테스트 시작 — AI 비즈니스 모델 전환점

주요 사건

OpenAI가 ChatGPT 무료·Go 티어 미국 사용자 대상 광고 테스트 시작. 대화 주제 기반 매칭, 광고가 답변에 영향 미치지 않음 강조. Plus/Pro/Business/Enterprise/Education은 광고 없음. Anthropic은 즉각 '광고 없는 AI' 카운터 마케팅.

배경

역사적 맥락

ChatGPT 3억+ 주간 사용자. OpenAI는 구독+API 수익 모델에서 광고 수익 추가로 다각화. Google이 검색 광고로 연간 $200B+ 수익 올리는 것처럼 AI 어시스턴트도 광고 가능성 탐색.

원인

ChatGPT 무료 사용자 폭증 → 인프라 비용 부담 → 수익 다각화 필요 → 광고 도입 → 사용자 신뢰 vs 수익 트레이드오프

타임라인

2022-11-30
ChatGPT 출시
2025-01-01
ChatGPT 3억+ 주간 사용자 돌파
2026-02-09
ChatGPT 광고 테스트 시작

주요 입장

OpenAI

광고로 무료 접근성 확대

광고가 답변 독립성 해치지 않음

Anthropic

광고 없는 AI

광고는 AI 신뢰와 양립 불가

사용자

우려와 수용 공존

무료 서비스 유지 vs 프라이버시

전망

high

ChatGPT 광고 성공 시 Google Gemini 등도 유사 모델 도입

medium

광고 불만으로 유료 전환 증가

· TechCrunch: AI 어시스턴트 광고는 검색 광고의 진화형
· Anthropic의 카운터 포지셔닝이 시장 차별화에 효과적

한국 영향

직접 영향

네이버 AI(HyperCLOVA) 광고 모델에 시사점

간접 영향

한국 AI 서비스 비즈니스 모델 논의 촉진

주목할 지점

ChatGPT 한국 시장 광고 확대 시점
국내 AI 서비스 광고 도입 여부

참고 자료

#openai#chatgpt#advertising#business-model#ai-monetization

07@sama, @OpenAI·2.11 05:15

Sam Altman: GPT-5.2 업데이트 + Codex 앱 첫 주 100만 다운로드, Deep Research GPT-5.2 탑재

주요 사건

OpenAI가 GPT-5.2(인스턴트 모델)을 ChatGPT에서 업데이트. Deep Research도 GPT-5.2 기반으로 전환, 앱 연동·실시간 진행 추적·전체화면 리포트 기능 추가. Codex 앱은 첫 주 100만 다운로드, GPT-5.3-Codex가 Cursor/GitHub/VS Code에 롤아웃.

배경

역사적 맥락

GPT-5 시리즈: GPT-5(2025) → GPT-5.2(인스턴트) → GPT-5.3-Codex(코딩 특화). Codex는 OpenAI의 코딩 에이전트 브랜드. Deep Research는 장시간 웹 조사 기능.

원인

GPT-5 기반 확장 → 특화 모델(Codex) 분화 → IDE 통합 → 개발자 생태계 록인 → Anthropic Claude Code와 직접 경쟁

타임라인

2025-12-01
GPT-5 출시
2026-02-03
Codex 앱 출시
2026-02-09
GPT-5.3-Codex Cursor/VS Code 롤아웃
2026-02-11
GPT-5.2 업데이트, Deep Research 개선

주요 입장

OpenAI

코딩 에이전트 시장 공격적 확장

무료 사용자에게도 Codex 접근 유지

Anthropic

Claude Code로 방어

코딩 품질 우위

개발자

도구 전환 가속

최고 코딩 모델로 생산성 극대화

전망

high

IDE 내 AI 에이전트가 개발 워크플로우의 기본이 되는 시대

high

무료 접근으로 신규 개발자 유입 가속

· Sam Altman: Codex가 결국 이길 것으로 예상, 예상보다 빨리 진행
· Dylan Patel: GPT-5.3 Codex vs Claude Opus 4.6 직접 비교에서 Opus 우위

한국 영향

직접 영향

국내 개발자의 AI 코딩 도구 선택에 직접 영향

간접 영향

한국 SW 기업의 AI 도구 도입 전략 수립 필요

주목할 지점

Codex vs Claude Code 국내 개발자 선호도
GPT-5.3-Codex 한국어 코딩 성능

참고 자료

#openai#gpt-5#codex#coding-agent#deep-research

08@swyx·2.11 21:54

Windsurf Arena 리더보드 공개 — Claude Opus 4.6 1위, '속도' 선호가 핵심 인사이트

주요 사건

Windsurf의 Arena Mode 리더보드가 공개됨. 첫 주 4만 투표. Claude Opus 4.6가 1위. 주요 서프라이즈: Gemini 3 Flash가 Pro를 이김, Grok Code Fast가 Gemini 3를 이김, Claude Haiku 4.5가 GPT 5.2를 이김. 결론: 사용자는 '속도'를 매우 중시.

배경

역사적 맥락

Windsurf(구 Codeium)는 AI 코딩 도구. Arena Mode는 제품 내 최초 대규모 아레나. LMSYS Chatbot Arena와 달리 '충분히 좋으면서 빠른' 모델을 패널티 안 줌.

원인

코딩 에이전트 경쟁 심화 → 사용자 피드백 필요 → 제품 내 아레나 도입 → 속도 vs 품질 트레이드오프 데이터 수집

타임라인

2025-01-01
LMSYS Chatbot Arena 코드 리더보드 확립
2026-02-05
Windsurf Arena Mode 출시
2026-02-11
첫 주 리더보드 공개, 4만 투표

주요 입장

Anthropic

품질 1위 확인

Opus 4.6 종합 1위

xAI/Google

속도 모델 경쟁력

Grok Code Fast, Gemini Flash가 상위권

개발자

속도 우선

코딩 워크플로우에서 빠른 반응이 생산성 핵심

전망

high

모든 AI 기업이 latency 최소화에 집중, 2.5x 빠른 Opus 등 실험 확대

high

프론티어(최고 품질) vs 플래시(최고 속도) 2트랙 전략 일반화

· swyx: 사람들은 속도를 원한다 — Arena가 이를 증명
· Windsurf: 실제 코딩 태스크 기반 평가가 벤치마크보다 현실적

한국 영향

직접 영향

국내 개발자의 모델 선택 기준에 속도가 핵심 요소로 부상

간접 영향

한국 AI 서비스의 latency 최적화 중요성 증가

주목할 지점

국내 코딩 에이전트 시장의 모델 선호도 변화
속도 최적화 인프라 투자

참고 자료

#windsurf#arena#coding-agent#benchmark#latency

09@karpathy·2.11 21:14

Karpathy, 243줄 순수 Python GPT 공개 + DeepWiki MCP로 '라이브러리 해체' 워크플로우 제안

주요 사건

Andrej Karpathy가 두 가지 프로젝트 공개: 1) 243줄 순수 Python으로 GPT 학습+추론 (의존성 없음, micrograd 기반), 2) DeepWiki MCP + GitHub CLI로 대형 라이브러리에서 필요한 기능만 추출하는 워크플로우. torchao fp8 기능을 150줄로 추출, 오히려 3% 빨라짐.

배경

역사적 맥락

Karpathy는 nanoGPT(2023) → nanochat(2025)로 미니멀 LLM 구현을 지속. 'vibe coding' 용어 창시(2025.2). 1년 후 'agentic engineering'으로 진화 제안.

원인

LLM 에이전트 능력 향상 → 코드 이해력 증가 → 라이브러리 의존성 불필요 가능 → '박테리아 코드' 철학 → 소프트웨어 개발 패러다임 변화

타임라인

2023-01-01
nanoGPT 공개
2025-02-01
vibe coding 개념 발표
2026-02-03
nanochat fp8 훈련으로 GPT-2 $20 재현
2026-02-11
243줄 GPT + DeepWiki MCP 워크플로우 공개

주요 입장

Karpathy

소프트웨어 유동성 시대

라이브러리 대신 에이전트가 코드를 추출·맞춤화

오픈소스 커뮤니티

흥미와 우려

유지보수·보안 업데이트 파편화 위험

개발자

실용적 채택

100MB 의존성 대신 필요한 150줄만

전망

medium

DeepWiki+MCP 패턴이 개발자 도구 표준으로 부상

medium

'박테리아 코드' 철학이 모듈화·마이크로서비스 트렌드 가속

· Karpathy: 라이브러리의 시대는 끝났다, LLM이 새 컴파일러
· swyx: vibe coding에서 agentic engineering으로 진화

한국 영향

직접 영향

국내 AI 교육·개발 커뮤니티에 미니멀 구현 학습 자료로 활용

간접 영향

소프트웨어 개발 방법론 변화에 대한 국내 논의 촉진

주목할 지점

DeepWiki MCP 한국 개발자 채택
국내 AI 교육 커리큘럼 반영

참고 자료

#karpathy#education#agentic-engineering#deepwiki#open-source

10@SemiAnalysis_·2.11 18:02

SemiAnalysis: Amphenol NVL144 커넥터 분석 + 한국 메모리 말레이시아 수출 증가 (Intel 패키징 라인 증거)

주요 사건

SemiAnalysis가 두 가지 반도체 인프라 분석 공개: 1) Amphenol의 Paladin 보드-투-보드 커넥터가 VR200 NVL144에서 GPU당 달러 콘텐츠 대폭 증가. NVIDIA 케이블리스 설계가 오히려 Amphenol에 유리. 2) 한국 메모리 제조사의 말레이시아 수출 증가가 Intel 어드밴스드 패키징 램프의 증거.

배경

역사적 맥락

AI 랙 아키텍처: GB200 NVL72 → GB300 → VR200 NVL144. 세대마다 케이블→보드 커넥터 전환으로 신뢰성 향상. Intel은 말레이시아 페낭에 어드밴스드 패키징 확장 중.

원인

AI 칩 밀도 증가 → 케이블 장애 리스크 → 케이블리스 보드 커넥터 전환 → 커넥터 ASP 상승 → Amphenol 수혜

타임라인

2024-03-01
GB200 NVL72 발표
2025-06-01
GB300 발표
2026-01-01
VR200 NVL144 설계 진행
2026-02-11
SemiAnalysis 커넥터/메모리 수출 분석

주요 입장

Amphenol

AI 인프라 핵심 수혜주

Paladin 커넥터로 세대별 콘텐츠 증가

삼성/SK하이닉스

HBM 공급 확대

다변화 공급망으로 말레이시아 수출 증가

Intel

파운드리 사업 회복

말레이시아 어드밴스드 패키징으로 외부 고객 확보

전망

high

커넥터, PCB, 냉각 등 부품사 AI 매출 비중 50%+ 도달

medium

한국 메모리 수출 데이터가 Intel 고객 확보 증거

· SemiAnalysis: VR NVL144에서 Paladin 커넥터가 케이블 대체로 ASP 대폭 상승
· 한국 메모리→말레이시아 수출 증가는 Intel 패키징 램프의 읽기

한국 영향

직접 영향

삼성전자·SK하이닉스의 HBM 공급처 다변화 확인. Intel 패키징 물량 직접 수혜.

간접 영향

국내 반도체 부품·소재 기업의 AI 인프라 시장 진출 기회

주목할 지점

SK하이닉스 HBM4 양산 일정
삼성 HBM 시장 점유율 회복 여부
Intel 말레이시아 팹 가동 현황

참고 자료

#semiconductor#nvidia#amphenol#hbm#intel-foundry