Lleejh.in/ 뉴스
2026년 2월 15일 · 요일·기술
높음
sentiment.bullish-cautious

AI 연구 경쟁 격화: OpenAI '최초 증명' 도전·GPT-5.2 물리학 발견, Anthropic $300억 펀딩, Google Deep Think ARC-AGI-2 SOTA, 중국 GLM-5·DeepSeek V4 임박

핵심 요약
  • OpenAI 내부 모델이 6개 프론티어 수학 연구문제 해결 주장 — AI의 '새로운 지식 생산' 이정표
  • GPT-5.2가 글루온 산란 진폭에서 물리학자들이 놓친 결과 발견, arXiv 프리프린트 발표
  • Anthropic $300억 시리즈G 펀딩, $3,800억 밸류에이션 — 역대 2번째 규모 VC 딜
  • Google Gemini 3 Deep Think, ARC-AGI-2 84.6% SOTA 달성 — GPT-5.2(52.9%), Claude(68.8%) 압도
  • 중국 Zhipu AI GLM-5 출시: 744B MoE, 화웨이 Ascend 칩으로 완전 국산 훈련
  • ByteDance Seedance 2.0 AI 비디오 생성기, 할리우드 저작권 침해 논란 폭발
  • Applied Materials GAA 나노시트용 Viva 시스템 공개 — 2nm 이하 반도체 핵심
  • DeepSeek V4, 2월 중순 출시 임박 — 100만+ 토큰 컨텍스트, 오픈 웨이트
14개 출처 · 14개 항목
01@sama·2.14 17:46

OpenAI 내부 모델, 6개 프론티어 수학 연구문제 해결 주장 — 'First Proof' 챌린지

주요 사건

OpenAI가 'First Proof' 챌린지에서 내부 훈련 중인 모델이 10개 프론티어 수학 연구문제 중 6개를 해결했다고 발표. Sam Altman은 '초등학교 수학도 못 풀던 AI가 연구 수준 수학을 푸는 데 불과 몇 년'이라며, 이를 '새로운 지식 생산 능력'의 이정표로 평가.

배경

역사적 맥락
2024년 IMO 은메달(AlphaProof), 2025년 IMO 금메달 달성 후 '그건 고등학교 수학'이라는 비판이 있었음. 이번은 대학원 수준 이상의 미해결 연구문제. Jakub Merett(OpenAI)는 '새로운 프론티어 연구가 가장 중요한 평가 기준'이라고 주장.
원인
[수학 올림피아드 AI 해결] → [연구 수준 문제로 확대] → [First Proof 챌린지 설계] → [내부 모델 6/10 해결 주장]
타임라인
  1. 2024-07-01
    Google AlphaProof IMO 은메달급 달성
  2. 2025-07-01
    AI 시스템 IMO 금메달 달성
  3. 2026-02-14
    OpenAI First Proof 챌린지 결과 발표

주요 입장

OpenAI
낙관적 발표
AI가 진정한 새로운 지식을 생산하기 시작
수학/과학 커뮤니티
회의적 대기
실제 증명이 공개·검증되기 전까지 판단 유보
경쟁사(Google/Anthropic)
유사 역량 과시
자사 모델도 연구 수준 문제 해결 가능

전망

high
2026년 내 AI 공동저자 논문 급증, 수학·물리학 분야 증명 보조 도구로 정착
medium
자체 평가의 객관성 문제, 제3자 검증 프로세스 필요성 대두
medium
AI가 가설 생성·증명 초안을 담당하고 인간은 방향 설정·검증에 집중
  • · Sam Altman: '작은 발견이지만 새로운 지식 생산 능력은 중요한 이정표'
  • · Reddit/학계: '실제 솔루션 공개 전까지 회의적 — OpenAI는 과거에도 백페달한 적 있음'

한국 영향

직접 영향
한국 수학·과학 연구기관의 AI 도구 도입 가속화 가능
간접 영향
KAIST, 서울대 등 AI-과학 융합 연구 투자 확대 필요
주목할 지점
  • 공개된 증명의 실제 검증 결과
  • 한국 연구자들의 AI 연구 도구 접근성
#ai-research#openai#mathematics#agi#benchmark
02@OpenAI·2.13 19:19

GPT-5.2, 글루온 산란에서 물리학자들이 놓친 새로운 결과 발견 — arXiv 프리프린트 공동 발표

주요 사건

GPT-5.2 Pro가 글루온(강력 매개 입자) 산란 진폭에서 많은 물리학자들이 '발생하지 않을 것'으로 예상한 상호작용의 일반 공식을 먼저 제안하고, IAS·Vanderbilt·Cambridge·Harvard 연구자들이 엄밀히 증명. arXiv 프리프린트로 공개.

배경

역사적 맥락
산란 진폭 이론에서 파인만 다이어그램 수는 입자 수 증가에 따라 기하급수적으로 증가하지만, 최종 답은 종종 놀라울 정도로 간결. 특정 글루온 배열에서의 상호작용은 '가장 단순한 계산 수준에서 불가능'으로 여겨졌으나, AI가 특정 조건에서 깔끔한 수학적 형태를 발견.
원인
[양자색역학 진폭 이론 발전] → [AI 수학 추론 능력 향상] → [GPT-5.2가 공식 추측] → [인간 물리학자가 엄밀 증명]
타임라인
  1. 1986-01-01
    Parke-Taylor 공식 발견 (간결한 글루온 산란 진폭)
  2. 2026-02-13
    GPT-5.2 + 연구진, 새로운 글루온 상호작용 결과 발표

주요 입장

OpenAI + 공동 연구자
AI가 과학 연구 파트너
AI가 인간이 놓친 수학적 구조 발견
물리학계
흥미로운 결과지만 검증 필요
동료 심사 전 판단 유보
중력파·이론물리 분야
확장 가능성 주목
중력자(graviton) 등 관련 계산에도 적용 가능

전망

high
이론물리학에서 AI가 가설 생성 도구로 자리잡음
medium
AI를 논문 공동저자로 인정할지 학계 논쟁 심화
  • · The Quantum Insider: '오래 기각된 입자 상호작용 클래스가 실제 존재할 수 있음을 보여줌'
  • · OpenAI: '간단한 공식은 종종 더 깊은 구조를 신호' — 중력 확장도 가능

한국 영향

직접 영향
한국 이론물리학 연구진의 AI 활용 연구 가속 기회
간접 영향
기초과학연구원(IBS) 등에서 AI-물리학 융합 프로그램 검토 가능
주목할 지점
  • 동료 심사 결과
  • 후속 중력·게이지 이론 확장 연구
#ai-science#openai#physics#particle-physics#research
03@AnthropicAI·2.12 19:01

Anthropic, $300억 시리즈G 펀딩 완료 — 역대 2번째 규모 VC 딜, $3,800억 밸류에이션

주요 사건

Anthropic이 GIC·Coatue 주도의 $300억 시리즈G 펀딩을 완료. 포스트머니 밸류에이션 $3,800억. 연환산 매출 $140억으로 3년 연속 10배 성장. Claude Code 연환산 매출만 $25억 돌파, 1월 이후 2배 성장.

배경

역사적 맥락
OpenAI $400억(2025) 다음으로 역대 2번째 규모. Anthropic은 2021년 설립 후 3년 만에 매출 $0→$140억 달성. Claude Code가 성장 핵심 동력으로, 전 세계 GitHub 퍼블릭 커밋의 4% 추정.
원인
[Claude Code 폭발적 성장] → [엔터프라이즈 수요 급증] → [투자자 확신] → [$300억 메가 라운드]
타임라인
  1. 2021-01-01
    Anthropic 설립
  2. 2025-05-01
    Claude Code 일반 공개
  3. 2025-10-01
    OpenAI $400억 펀딩
  4. 2026-02-12
    Anthropic $300억 시리즈G

주요 입장

Anthropic
인프라 확장 + 연구 심화
Claude가 기업 AI 플랫폼의 표준
OpenAI
경쟁 의식
Codex 등으로 반격 중
투자자
AI 인프라에 올인
수조 달러 시장 기회

전망

high
2026년 내 IPO 추진 가능성 — OpenAI와 함께 검토 중
high
Claude Code vs Codex vs Gemini Code Assist 3파전
  • · Crunchbase: '역대 2번째 규모 VC 딜, OpenAI $400억 다음'
  • · Krishna Rao(CFO): 'Claude는 기업 업무 방식의 핵심이 되고 있다'

한국 영향

직접 영향
한국 기업의 Claude API/Claude Code 도입 가속화
간접 영향
한국 AI 스타트업 밸류에이션 기준점 상향 — 국내 VC 시장에 간접 영향
주목할 지점
  • Anthropic 아시아 데이터센터 확장 계획
  • 한국어 성능 개선 로드맵
#anthropic#funding#ai-business#enterprise#claude-code
04@GoogleDeepMind·2.12 16:15

Google Gemini 3 Deep Think, ARC-AGI-2 84.6% SOTA — GPT-5.2(52.9%)·Claude(68.8%) 크게 앞서

주요 사건

Google이 Gemini 3 Deep Think를 업그레이드하여 ARC-AGI-2에서 84.6% 달성(SOTA). 인간 평균 60%를 크게 상회. Humanity's Last Exam 48.4%, Codeforces Elo 3455, 물리/화학 올림피아드 금메달급. 추론 비용은 태스크당 $13.62.

배경

역사적 맥락
ARC-AGI는 패턴 암기가 아닌 새로운 시각적 추론 퍼즐 해결 능력 테스트. 이전 AI 모델은 원본 ARC-AGI에서 20% 이하. Gemini 3 Deep Think는 원본 96%, 후속 버전 84.6%. 2위(Claude 68.8%)와 15.8%p 차이.
원인
[ARC-AGI 벤치마크 등장] → [추론 모델 경쟁] → [테스트타임 컴퓨트 스케일링] → [Deep Think 84.6% SOTA]
타임라인
  1. 2024-06-01
    ARC-AGI 벤치마크 공개, AI 모델 20% 미만
  2. 2025-11-01
    ARC-AGI-2 공개 (더 어려운 버전)
  3. 2026-02-12
    Gemini 3 Deep Think 84.6% SOTA 달성

주요 입장

Google DeepMind
추론 능력 선도
과학·공학 문제 해결의 실질적 협력자
OpenAI/Anthropic
다른 벤치마크에서 강점
단일 벤치마크가 전체 능력을 대변하지 않음
사용자
비용 우려
$13.62/태스크는 프로덕션 배포에 비쌈

전망

high
성능과 비용 균형이 핵심 — 저비용 추론 모드 등장 예상
high
Duke 대학 반도체 재료 설계 등 실제 연구에 즉시 적용 중
  • · ARC Prize Foundation: 'ARC-AGI-2에서 84.6%는 독립 검증됨'
  • · Implicator.ai: '리드가 15.8%p로, 2위와 인간 평균 차이(8.8%p)의 거의 두 배'

한국 영향

직접 영향
한국 연구기관의 Gemini Deep Think API 접근성 확인 필요 (현재 Ultra 구독자·Vertex AI 얼리액세스)
간접 영향
국내 AI 추론 벤치마크 연구 촉진, KAIST 등 연구 협력 가능
주목할 지점
  • 한국 개발자 API 접근 시기
  • 추론 비용 하락 추이
#google#gemini#reasoning#benchmark#arc-agi
05@SemiAnalysis_·2.14 20:15

중국 Zhipu AI, GLM-5 출시 — 744B MoE, 화웨이 Ascend 칩으로 완전 국산 훈련

주요 사건

Zhipu AI(智谱AI)가 GLM-5를 공식 출시. 총 744B 파라미터(40B 활성), 256개 전문가 중 토큰당 8개 활성화하는 MoE 아키텍처. 200K 컨텍스트 윈도우, 28.5T 토큰 사전훈련. 핵심: 화웨이 Ascend 칩 + MindSpore 프레임워크로 100% 중국 국산 컴퓨팅으로 훈련. Apache-2.0 오픈소스. vLLM 데이0 지원.

배경

역사적 맥락
GLM 시리즈: GLM-4(2024) → GLM-4.5 355B MoE(2025.03) → GLM-5 744B(2026.02). 환각률 56% 감소. 미국 반도체 수출 통제에도 불구하고 화웨이 Ascend으로 대규모 모델 훈련 가능 입증.
원인
[미국 반도체 수출 통제] → [중국 국산 칩 개발 가속] → [화웨이 Ascend 성숙] → [GLM-5 국산 훈련 성공]
타임라인
  1. 2024-01-01
    GLM-4 멀티모달 출시
  2. 2025-03-01
    GLM-4.5 355B MoE 아키텍처 도입
  3. 2026-02-11
    GLM-5 744B 공식 출시

주요 입장

Zhipu AI
국산 자립 선언
미국 칩 없이도 세계 최대급 오픈소스 모델 가능
미국 정부
수출 통제 효과 재평가
제재가 중국 AI 발전을 막지 못하고 있음
오픈소스 커뮤니티
환영
Apache-2.0 + vLLM 지원으로 즉시 활용 가능

전망

high
화웨이 Ascend 기반 대규모 훈련이 표준화되면서 미국 의존도 급감
high
GLM-5 vs DeepSeek V4 vs Kimi K2.5 — 중국발 오픈소스 모델 전성기
  • · SemiAnalysis: 'vLLM의 DeepSeek Sparse Attention 지원으로 높은 입력 토큰 처리량 확인'
  • · SCMP: 'GLM-5는 중국 AI의 경쟁력을 보여주는 또 하나의 증거'

한국 영향

직접 영향
한국 기업이 GLM-5를 온프레미스/프라이빗 클라우드에서 활용 가능 (Apache-2.0)
간접 영향
한국 반도체 수출(삼성 HBM 등)에 간접 영향 — 중국 국산 칩 생태계 성장 시 수요 변화
주목할 지점
  • GLM-5 한국어 성능
  • 화웨이 Ascend 칩 성능 vs NVIDIA 격차 추이
#china-ai#glm-5#open-source#huawei#semiconductor
06TechCrunch·2.14 18:26

ByteDance Seedance 2.0 AI 비디오 생성기 출시, 할리우드·SAG-AFTRA '대규모 저작권 침해' 강력 규탄

주요 사건

ByteDance가 Seedance 2.0 AI 비디오 생성기를 출시. 텍스트 프롬프트만으로 15초 영상 생성. 실제 배우 얼굴(톰 크루즈 vs 브래드 피트 등) 생성이 가능해지면서 MPA(영화협회) CEO가 '즉시 침해 행위 중단' 요구. SAG-AFTRA, Human Artistry Campaign도 규탄.

배경

역사적 맥락
OpenAI Sora(2024) 이후 AI 비디오 생성 급속 발전. Seedance 2.0은 실명인 얼굴 가드레일 부재가 핵심 논란. ByteDance는 최근 TikTok 미국 사업 매각 완료(지분 유지) 직후라 정치적으로도 민감.
원인
[AI 비디오 생성 기술 발전] → [가드레일 없는 출시] → [실명인 딥페이크 폭증] → [할리우드·노조 강력 반발]
타임라인
  1. 2024-02-01
    OpenAI Sora 최초 공개
  2. 2026-02-01
    Seedance 2.0 중국 출시 (Jianying 앱)
  3. 2026-02-14
    MPA·SAG-AFTRA 규탄 성명

주요 입장

ByteDance
기술 혁신
크리에이터 도구 제공
할리우드/노조
강력 반대
대규모 저작권 침해, 수백만 일자리 위협
규제 기관
입법 압력 증가
기존 저작권법으로 대응 가능

전망

high
미국·EU에서 딥페이크 가드레일 의무화 법안 가속
medium
저비용 비디오 생성이 콘텐츠 제작 비용 구조 근본적 변화
  • · Deadpool 각본가 Rhett Reese: '우리에게는 끝일 수 있다'
  • · MPA CEO Charles Rivkin: '중국 AI 서비스가 하루 만에 미국 저작물을 대규모로 무단 사용'

한국 영향

직접 영향
한국 영화·엔터 산업도 동일한 딥페이크·저작권 위협 직면
간접 영향
한국의 AI 저작권법 논의 가속화 필요 — '디지털 초상권' 입법 모멘텀
주목할 지점
  • CapCut 글로벌 출시 시 한국 포함 여부
  • 한국 저작권법 개정 동향
#ai-video#bytedance#copyright#regulation#deepfake
07@_akhaliq·2.13 16:59

MiniMax-M2.5 출시 — 에이전틱 성능 대폭 향상, 오픈 웨이트 3위권

주요 사건

MiniMax가 M2.5를 출시. 229B/10B 활성 MoE 아키텍처. Agentic Index 47→56, GDPval-AA ELO 1079→1215로 크게 향상. 오픈 웨이트 모델 중 GLM-5, Kimi K2.5에 이어 3위. 다만 환각률 67%→88%로 악화.

배경

역사적 맥락
MiniMax는 중국 AI 스타트업으로, M2→M2.1→M2.5로 빠른 반복. 에이전틱(자율적 도구 사용) 성능이 핵심 경쟁력. 오픈 웨이트 모델 시장에서 중국 기업들의 빠른 반복 속도가 두드러짐.
원인
[에이전트 AI 수요 증가] → [GDPval 벤치마크 중시] → [M2.5 에이전틱 최적화] → [환각률 트레이드오프]
타임라인
  1. 2025-12-01
    MiniMax-M2.1 출시
  2. 2026-02-13
    MiniMax-M2.5 출시, HuggingFace 공개

주요 입장

MiniMax
에이전틱 특화
실제 생산성 작업에서 우수한 성능
사용자
혼합 반응
에이전틱은 좋지만 환각률 88%는 우려
경쟁 모델(GLM-5, Kimi)
선두 유지
더 큰 모델로 종합 성능 우위

전망

high
에이전틱 최적화 시 환각 증가는 구조적 문제 — 향후 모델에서 해결 필요
medium
GLM-5, Kimi K2.5, MiniMax M2.5, DeepSeek V4 등 동시다발적 출시
  • · Artificial Analysis: 'Intelligence Index 42, 토큰 효율적이나 환각 악화가 약점'
  • · SemiAnalysis: '중국 온라인 채용 플랫폼이 Qwen을 능가하는 3B 모델을 훈련할 수 있는 시대'

한국 영향

직접 영향
한국 개발자들이 Modified MIT 라이선스로 상용 활용 가능
간접 영향
한국어 에이전틱 벤치마크 부재 — 국내 평가 기준 마련 필요
주목할 지점
  • M2.5 한국어 성능
  • 환각률 개선 후속 버전
#minimax#open-source#agentic-ai#china-ai#benchmark
08TechCrunch·2.14 21:55

xAI에서 '안전은 죽었다' — 공동창업자 2명 포함 11명+ 엔지니어 퇴사, 내부자 '머스크가 모델을 더 거칠게 만들려 한다'

주요 사건

SpaceX의 xAI 인수 발표 후 공동창업자 2명 포함 11명 이상의 엔지니어 퇴사. 전직 직원들이 The Verge에 'Safety is a dead org at xAI'라고 증언. Grok이 100만 건 이상의 성적 이미지(미성년자 딥페이크 포함) 생성에 사용된 이후에도 머스크가 '더 거칠게' 만들라고 지시했다고 폭로.

배경

역사적 맥락
xAI는 2023년 설립, Grok 챗봇 운영. 2025년 X(트위터) 인수 후 SpaceX가 xAI 인수. 머스크에게 '안전=검열'이라는 철학이 문제의 근원. 경쟁사 대비 '따라잡기 단계에 갇혀있다'는 내부 불만도.
원인
[머스크의 반-검열 철학] → [안전 조직 무력화] → [Grok 딥페이크 사건] → [엔지니어 대거 퇴사]
타임라인
  1. 2023-07-01
    xAI 설립
  2. 2025-01-01
    Grok 성적 딥페이크 논란
  3. 2026-02-14
    SpaceX xAI 인수, 대규모 퇴사

주요 입장

xAI/머스크
조직 효율화
새 출발을 위한 구조조정
퇴사 직원
안전 경시 비판
안전 없는 AI 개발은 무책임
규제 기관/시민사회
우려
딥페이크 가드레일 의무화 필요

전망

high
핵심 인재 유출로 안전·정렬 역량 더욱 약화
medium
xAI 사례가 AI 안전 규제 논의의 촉매제 역할
  • · 전직 직원: '머스크에게 안전은 검열이다 — 이게 근본 문제'
  • · TechCrunch: '경쟁사 따라잡기에도 방향이 없다는 내부 불만'

한국 영향

직접 영향
한국에서도 AI 안전·윤리 논의에 사례로 활용 가능
간접 영향
글로벌 AI 안전 기준 수립 시 한국 참여 필요성 부각
주목할 지점
  • xAI/Grok의 한국 서비스 확대 여부
  • AI 안전 규제 국제 협력 동향
#xai#ai-safety#elon-musk#regulation#talent
09@SemiAnalysis_·2.13 14:00

Applied Materials, GAA 나노시트용 Viva 시스템 공개 — 2nm 이하 AI 칩 핵심 공정

주요 사건

Applied Materials가 Producer Viva Radical Treatment System을 포함한 3개 신규 반도체 장비를 발표. GAA(Gate-All-Around) 트랜지스터의 나노시트 표면을 원자 수준 정밀도로 처리. 2nm급 GAA 칩 올해 양산 시작에 맞춰 차세대 앙스트롬 노드용.

배경

역사적 맥락
FinFET→GAA 전환은 반도체 업계 최대 기술 전환. GAA에서 나노시트 표면 상태가 전하 수송 효율 직결. 원자 수준 거칠기/오염도 성능에 큰 영향. AMAT은 Spectral ALD(몰리브데넘 접촉), Sym3 Z Magnum(식각), Viva(래디컬 처리) 3종 동시 발표.
원인
[AI 칩 수요 폭증] → [GAA 트랜지스터 전환 가속] → [나노시트 표면 처리 한계] → [AMAT Viva 시스템 개발]
타임라인
  1. 2022-01-01
    삼성 3nm GAA 첫 양산
  2. 2025-01-01
    TSMC 2nm GAA N2 양산 시작
  3. 2026-02-10
    AMAT Viva/Spectral/Sym3 발표

주요 입장

Applied Materials
기술 리더십 강화
원자 수준 정밀도로 GAA 성능 획기적 향상
TSMC/삼성
핵심 공급업체 의존
2nm 이하 양산에 AMAT 장비 필수
AI 칩 기업(NVIDIA 등)
환영
더 빠르고 효율적인 AI 칩 가능

전망

high
2026년 2nm GAA 양산 본격화, AMAT 장비 수주 급증 예상
medium
Viva + Pyra 조합으로 구리 배선 저항 감소, 앙스트롬 노드까지 구리 유지 가능
  • · AMAT Prabu Raja: '트랜지스터에서 시작되는 AI 컴퓨팅 돌파구'
  • · SemiAnalysis: '초순수 래디컬로 손상 없는 나노시트 처리 — 전자 이동도·스위칭 속도 대폭 향상'

한국 영향

직접 영향
삼성전자 파운드리의 2nm GAA 양산에 직접 영향 — AMAT 장비 도입 결정
간접 영향
한국 반도체 장비업체(SEMES 등)의 경쟁력 평가 필요
주목할 지점
  • 삼성 2nm GAA 수율 개선 추이
  • AMAT 장비 한국 납품 시기
#semiconductor#applied-materials#gaa#2nm#manufacturing
10@swyx·2.14 06:29

DeepSeek V4, 2월 중순 출시 임박 — 100만+ 토큰 컨텍스트, 오픈 웨이트, swyx '오픈소스 AI에 대한 입장 전환 계기'

주요 사건

swyx가 DeepSeek V4가 다음 주 출시될 것으로 언급, '3년간 오픈소스 AI에 회의적이었지만 처음으로 입장을 바꿀 계기'라고 평가. V4는 100만+ 토큰 컨텍스트, Manifold-Constrained Hyper-Connections(mHC), Engram 조건부 메모리, DeepSeek Sparse Attention(DSA) 등 혁신 아키텍처 탑재.

배경

역사적 맥락
DeepSeek R1(2025)이 저비용 훈련으로 업계 충격. V3에서 MoE 전문성 입증. V4는 코딩 특화 + 100만 토큰 컨텍스트로 레포 전체 처리 가능. DSA로 연산 비용 50% 절감 주장.
원인
[DeepSeek R1 충격] → [중국 AI 오픈소스 경쟁] → [V4 아키텍처 혁신] → [오픈소스 진영의 게임 체인저 기대]
타임라인
  1. 2025-01-01
    DeepSeek R1 출시, 저비용 훈련 충격
  2. 2025-06-01
    DeepSeek V3 MoE 모델 출시
  3. 2026-02-17
    DeepSeek V4 출시 예상 (음력 설 전후)

주요 입장

DeepSeek
오픈소스 리더십
100만 토큰 + DSA로 가성비 최강
OpenAI/Anthropic
경계
클로즈드 모델의 성능·안전 우위 유지
개발자 커뮤니티
기대감 고조
셀프호스팅 가능한 최강 코딩 모델

전망

high
V4가 기대치 충족 시 오픈소스 모델의 엔터프라이즈 채택 가속
medium
미국 정부의 중국 AI 모델 사용 제한 논의 촉발 가능
  • · swyx: '3년간 회의적이었으나 V4로 처음 입장 변경 — Whalefall을 기대'
  • · WaveSpeedAI: 'DSA로 100만 토큰에서도 연산비 50% 절감'

한국 영향

직접 영향
한국 기업의 온프레미스 AI 코딩 도구 도입 옵션 확대
간접 영향
한국 AI 스타트업의 모델 선택지 다양화 — 비용 구조 개선
주목할 지점
  • V4 실제 벤치마크 vs 기대치
  • 한국어 코딩 성능
#deepseek#open-source#china-ai#coding#architecture
11@sama·2.12 18:15

GPT-5.3-Codex-Spark 리서치 프리뷰 출시 — 1,000+ 토큰/초, 코딩 에이전트 경쟁 가열

주요 사건

OpenAI가 GPT-5.3-Codex-Spark를 Pro 사용자 대상 리서치 프리뷰로 출시. 1,000+ 토큰/초의 초고속 추론. Codex 앱, CLI, IDE 확장에서 사용 가능. Sam Altman은 'Codex가 결국 이길 것이라 생각했지만 이렇게 빨리 일어날 줄은 몰랐다'고 언급.

배경

역사적 맥락
Claude Code의 폭발적 성장($25억 연환산)에 자극받아 OpenAI가 Codex 강화에 집중. GPT-5.3은 속도에 최적화된 코딩 특화 모델. Dylan Patel(SemiAnalysis)에 따르면 자사 Claude Code 지출이 하루 $6,000까지 급증했다고 언급, 코딩 에이전트 수요의 폭발적 증가를 보여줌.
원인
[Claude Code 시장 장악] → [OpenAI Codex 강화 결정] → [GPT-5.3-Codex-Spark 속도 특화] → [코딩 에이전트 3파전]
타임라인
  1. 2025-05-01
    Claude Code 일반 공개
  2. 2026-01-01
    Claude Code $25억 연환산 매출
  3. 2026-02-12
    GPT-5.3-Codex-Spark 리서치 프리뷰

주요 입장

OpenAI
속도로 차별화
1,000 tok/s로 실시간 코딩 경험
Anthropic
품질·안정성 강조
Claude Code의 코드 품질이 핵심
개발자
양쪽 테스트
최고의 코딩 에이전트를 찾는 중

전망

high
2026년 코딩 에이전트 시장 $100억+ 규모 예상
high
Codex(속도) vs Claude Code(품질) vs Gemini(추론) 삼파전 구도 고착화
  • · Dylan Patel: 'SemiAnalysis Claude Code 일일 지출 $6k — 2주 전 $1k 미만에서 폭증'
  • · Sam Altman: 'Codex가 이렇게 빨리 이길 줄 놀랐다'

한국 영향

직접 영향
한국 개발자의 AI 코딩 도구 선택지 확대
간접 영향
한국 SW 기업의 개발 생산성 경쟁력에 직접 영향
주목할 지점
  • Codex Spark 한국어 코드 주석·문서 지원
  • 한국 기업 코딩 에이전트 도입률
#openai#codex#coding-agent#ai-tools#developer
12@AnthropicAI·2.11 01:36

Anthropic, Claude Opus 4.6 사보타주 리스크 보고서 발표 + CodePath 파트너십으로 2만 학생에 Claude 제공

주요 사건

Anthropic이 두 가지 중요 발표: (1) Claude Opus 4.6의 사보타주 리스크 보고서 공개 — ASL-4(자율적 AI R&D) 임계치에 근접함을 인정하고 선제적으로 높은 안전 기준 적용. (2) CodePath와 파트너십으로 커뮤니티 칼리지·주립대·HBCU 2만+ 학생에 Claude/Claude Code 무료 제공. 또한 Chris Liddell(전 마이크로소프트 CFO, 전 트럼프 행정부)을 이사회에 임명.

배경

역사적 맥락
Anthropic은 Opus 4.5 출시 시 '향후 모델이 ASL-4 임계치에 근접할 것'을 예고하고, 프론티어 모델에 대한 사보타주 리스크 보고서를 약속. 이번이 그 약속 이행. CodePath 파트너십은 AI 접근성 확대 전략의 일환.
원인
[Claude Opus 4.6 능력 향상] → [ASL-4 근접] → [선제적 안전 보고서] → [신뢰 구축 + 교육 확대]
타임라인
  1. 2025-10-01
    Claude Opus 4.5 출시, ASL-4 근접 경고
  2. 2026-02-11
    Opus 4.6 사보타주 리스크 보고서 발표
  3. 2026-02-13
    CodePath 파트너십 발표

주요 입장

Anthropic
선제적 안전 + 접근성
능력과 안전의 균형, 교육 투자
AI 안전 커뮤니티
긍정적 평가
자발적 안전 보고서는 업계 모범
경쟁사
압력
Anthropic 수준의 투명성 요구 증가

전망

medium
Anthropic의 사보타주 리스크 보고서가 업계 표준으로 자리잡을 가능성
high
2만 학생에 무료 Claude 제공은 AI 인재 파이프라인 확대
  • · Anthropic: '어려운 임계치 결정 대신 선제적으로 높은 안전 기준 적용'
  • · 전략적 분석: 'Chris Liddell 임명은 워싱턴 관계 강화 신호'

한국 영향

직접 영향
한국 대학의 AI 교육 프로그램에 Claude 도입 논의 가능
간접 영향
한국 AI 안전 정책 수립 시 Anthropic ASL 프레임워크 참고 가치
주목할 지점
  • 한국 교육기관 대상 유사 프로그램 확대 여부
  • ASL-4 실제 도달 시기
#anthropic#ai-safety#education#asl-4#governance
13@SemiAnalysis_·2.14 02:00

SemiAnalysis: NVIDIA AI 수요가 수십억 달러 신규 성장 동력 — 데이터센터 인프라 경쟁과 크립토마이너 전환

주요 사건

SemiAnalysis가 두 가지 분석 발표: (1) NVIDIA AI 수요가 수십억 달러 신규 성장을 창출 중. (2) 데이터센터 경쟁에서 '시간 대 시장(time-to-market)'이 지배적 요인이 되면서 크립토마이너들이 기존 인프라(100MW+ 규모, 이머전 냉각, 공급망)를 활용해 AI 데이터센터로 전환 중.

배경

역사적 맥락
AI 추론/훈련 수요 폭증으로 데이터센터 전력·부지 확보가 핵심 병목. 크립토마이너들은 대규모 전력 인프라, 냉각 시스템, 산업 장비 공급망 경험을 보유. 저비용 채굴 DC를 AI DC로 빠르게 전환 가능.
원인
[AI 수요 폭증] → [데이터센터 부지·전력 부족] → [time-to-market 경쟁] → [크립토마이너 인프라 전환 기회]
타임라인
  1. 2024-01-01
    NVIDIA H100 수요 폭발
  2. 2025-06-01
    GB200 출하 시작
  3. 2026-02-14
    SemiAnalysis: 크립토→AI DC 전환 트렌드 분석

주요 입장

NVIDIA
수요 지속 성장
H100→GB300 전 라인업에서 수요 초과
크립토마이너
AI 피벗
기존 인프라 활용으로 빠른 시장 진입
하이퍼스케일러
경쟁 심화 우려
전력·부지 확보 경쟁 격화

전망

high
2027년까지 주요 크립토마이닝 시설의 30%+ AI 전환 예상
high
온사이트 가스, 파워드 랜드 등 새로운 비즈니스 모델 성장
  • · SemiAnalysis: '크립토마이너는 100MW+ 규모, 이머전 냉각, 장비 공급망에 익숙 — AI DC 전환에 최적'
  • · SemiAnalysis: 'time-to-market이 데이터센터 경쟁을 지배 — 새로운 비즈니스 기회 창출'

한국 영향

직접 영향
한국 데이터센터 시장(삼성 SDS, KT 등)의 AI 인프라 투자 방향에 참고
간접 영향
삼성 HBM·SK하이닉스 DRAM 수요 지속 성장 신호
주목할 지점
  • NVIDIA GB300 한국 데이터센터 납품 현황
  • 한국 전력 인프라 확충 계획
#nvidia#datacenter#infrastructure#crypto#ai-demand
14@_akhaliq·2.14 05:58

InternAgent-1.5: 장기 자율 과학 발견을 위한 통합 에이전트 프레임워크 공개

주요 사건

InternAgent-1.5가 공개됨. 장기 수평(long-horizon) 자율 과학 발견을 위한 통합 에이전트 프레임워크. 생성·실험·분석 과정을 자율적으로 조율하는 시스템. AI가 연구 가설 생성부터 실험 설계·실행·결과 분석까지 자동화하는 방향의 중요한 진전.

배경

역사적 맥락
AI 에이전트의 과학 연구 적용은 2024년부터 급속 발전. AlphaFold(단백질 구조), AI Scientist(Sakana AI) 등 선행 사례. InternAgent-1.5는 단일 작업이 아닌 장기적 연구 워크플로우 전체를 통합.
원인
[개별 AI 과학 도구 성숙] → [통합 에이전트 필요성] → [InternAgent-1.5 장기 자율 연구 프레임워크]
타임라인
  1. 2024-07-01
    AlphaFold 3, AI Scientist 등 공개
  2. 2026-02-14
    InternAgent-1.5 공개

주요 입장

연구팀
자율 과학 발견 가능
장기 연구 워크플로우의 AI 자동화
과학자 커뮤니티
흥미 + 우려
보조 도구로는 환영하지만 자율성에 우려
AI 안전 커뮤니티
주의
자율 연구 AI의 통제 가능성 문제

전망

high
2026년 내 주요 연구기관의 AI 에이전트 도입 가속
medium
AI 자율 연구의 윤리적 가이드라인 필요성 대두
  • · HuggingPapers: '장기 자율 과학 발견의 통합 프레임워크 — 주요 이정표'

한국 영향

직접 영향
한국 연구기관(KIST, KAIST 등)의 AI 연구 자동화 도구 채택 검토
간접 영향
한국 과학 연구 경쟁력에 AI 에이전트 역량이 핵심 변수로 부상
주목할 지점
  • InternAgent-1.5 오픈소스 공개 여부
  • 한국 연구 분야 적용 사례
#ai-agent#science#research-automation#framework#autonomous