Karpathy가 'Claw'를 AI 스택의 새 레이어로 선언, GGML/llama.cpp가 Hugging Face 합류, Google Gemini 3.1 Pro 출시로 ARC-AGI-2 점수 2배, Anthropic은 AI 에이전트 자율성 연구와 Claude Code Security 발표
- Andrej Karpathy가 OpenClaw/NanoClaw 등 'Claw' 생태계를 LLM 에이전트 위의 새로운 AI 스택 레이어로 정의
- GGML 창시자 Georgi Gerganov와 llama.cpp 팀이 Hugging Face에 합류하며 로컬 AI 추론 인프라 통합
- Google Gemini 3.1 Pro 출시: ARC-AGI-2에서 이전 모델 대비 2배 이상 성능, 고급 추론 워크플로우 지원
- Anthropic, AI 에이전트 자율성 실측 연구 발표: Claude Code 자율 작업 시간 25분→45분으로 2배 증가
- Taalas HC1 커스텀 ASIC 출시: Llama 3.1 8B 기준 17,000 tok/s 추론 속도 달성
- SpargeAttention2 논문: 비디오 디퓨전 모델에서 95% 어텐션 희소성, 16.2배 속도 향상
- OpenAI, 캐나다 총격범의 ChatGPT 사용 사전 감지했으나 경찰 신고 기준 미달로 미통보 논란
Karpathy, 'Claw'를 AI 스택의 새로운 레이어로 정의 — OpenClaw·NanoClaw 등 개인 AI 에이전트 생태계 급성장
주요 사건
Andrej Karpathy가 Mac Mini를 구입해 'Claw'(OpenClaw류 개인 AI 에이전트 시스템)를 직접 테스트하겠다고 밝히며, Claw를 'LLM 위의 에이전트, 에이전트 위의 Claw'라는 새로운 AI 스택 레이어로 정의했다. OpenClaw의 40만 줄 코드베이스에 대한 보안 우려를 표명하면서도 NanoClaw(~4,000줄, 컨테이너 기반)를 대안으로 언급. 'config 파일 대신 skill로 코드 자체를 수정하는' 접근법에 감탄했다.
배경
- 2024-10-01OpenClaw 오픈소스 출시
- 2025-06-01Claude Code, Codex CLI 대중화
- 2026-02-02NanoClaw 등 경쟁 Claw 프로젝트 다수 등장
- 2026-02-21Karpathy, Claw를 AI 스택 새 레이어로 정의
주요 입장
전망
- · Simon Willison: 'Claw'는 Karpathy의 'vibe coding'처럼 카테고리명으로 정착할 것
- · Swyx: NanoClaw의 미니멀 접근이 DeepWiki 코드맵과 잘 맞음
한국 영향
- OpenClaw 보안 취약점 동향
- 한국어 특화 Claw 스킬 생태계
참고 자료
GGML/llama.cpp 창시자 Georgi Gerganov, Hugging Face 합류 — 로컬 AI 추론의 핵심 인프라 통합
주요 사건
llama.cpp와 GGML의 창시자 Georgi Gerganov가 팀과 함께 Hugging Face에 합류했다. llama.cpp는 로컬 LLM 추론의 사실상 표준이고, Hugging Face의 transformers는 모델 정의의 표준이므로, 이 합류는 오픈소스 AI 인프라의 핵심 두 축이 합쳐진 것이다.
배경
- 2023-03-10llama.cpp 프로젝트 시작
- 2023-08-01GGUF 포맷 도입
- 2025-01-01llama.cpp GitHub 스타 80,000+ 돌파
- 2026-02-20GGML/llama.cpp가 Hugging Face에 공식 합류
주요 입장
전망
- · Karpathy: llama.cpp는 Claw 생태계의 핵심 빌딩 블록
- · HF 커뮤니티: 'match made in heaven'
한국 영향
- GGUF 포맷의 한국어 모델 최적화
- 로컬 AI 하드웨어 시장 동향
Google Gemini 3.1 Pro 출시 — ARC-AGI-2에서 이전 모델 대비 2배 이상 성능, 복합 추론 강화
주요 사건
Google DeepMind가 Gemini 3.1 Pro를 출시했다. ARC-AGI-2 벤치마크에서 Gemini 3 Pro 대비 2배 이상 성능을 달성했으며, 복잡한 데이터 합성, 시각화, 창의적 프로젝트에 특화된 고급 추론 능력을 갖췄다. Gemini App, Google AI Studio, NotebookLM에서 사용 가능.
배경
- 2025-06-01Gemini 3 Pro 출시
- 2025-12-01ARC-AGI-2 벤치마크 공개
- 2026-02-19Gemini 3.1 Pro 출시, ARC-AGI-2 2배 성능
주요 입장
전망
- · 업계: 추론 능력이 2026년 모델 경쟁의 핵심 축으로 부상
한국 영향
- Gemini 3.1 Pro의 한국어 성능
- NotebookLM 한국 출시 확대
Anthropic, AI 에이전트 자율성 실측 연구 발표 — Claude Code 자율 작업 시간 3개월 만에 2배 증가
주요 사건
Anthropic이 수백만 건의 Claude Code 및 API 상호작용을 분석한 AI 에이전트 자율성 연구를 발표했다. 주요 발견: (1) 가장 긴 세션 기준 Claude Code의 자율 작업 시간이 3개월 만에 25분→45분으로 2배 증가, (2) 숙련 사용자의 auto-approve 비율 20%→40%+, (3) Claude가 인간보다 2배 이상 자주 스스로 멈춰서 확인 요청, (4) SW 엔지니어링이 에이전트 도구 호출의 ~50%.
배경
- 2025-05-01Claude Code 출시
- 2025-10-01Claude Code 자율 세션 평균 25분
- 2026-01-01자율 세션 45분+으로 증가
- 2026-02-18Anthropic 자율성 연구 논문 발표
주요 입장
전망
- · Anthropic 연구팀: '에이전트가 자신의 불확실성을 인식하는 것이 안전의 핵심'
- · AwesomeAgents: '신뢰는 누적된 긍정 경험에서 점진적으로 형성'
한국 영향
- Claude Code 한국 기업 도입 현황
- 에이전트 자율성 관련 한국 정부 정책
참고 자료
Anthropic, Claude Code Security 출시 — AI 기반 코드 보안 취약점 스캔 도구
주요 사건
Anthropic이 Claude Code Security를 리미티드 리서치 프리뷰로 출시했다. 코드베이스를 스캔하여 보안 취약점을 탐지하고 타깃 수정을 제안하는 AI 기반 보안 도구다.
배경
- 2025-05-01Claude Code 출시
- 2026-02-20Claude Code Security 리서치 프리뷰 출시
주요 입장
전망
- · TheHackerNews: AI 에이전트 보안이 2026년 핵심 과제로 부상
한국 영향
- 한국어 코드베이스 지원 여부
- 기존 보안 도구와의 통합성
Taalas HC1 커스텀 ASIC 출시 — Llama 3.1 8B 기준 17,000 tok/s 추론, GPU 독점에 도전
주요 사건
Taalas(구 Taalas Inc)가 HC1 커스텀 ASIC을 출시했다. Llama 3.1 8B 기준 17,000 tok/s 추론 속도를 달성했다. 현재는 소형 모델에 특화되어 있지만, HC2(2026년 겨울)는 대형 모델 지원 예정. Swyx는 '이 타임라인이 2년 내 0으로 수렴할 것'이라며 커스텀 ASIC이 GPU 추론을 대체할 가능성을 강조.
배경
- 2024-01-01추론 비용이 AI 기업 주요 비용 항목으로 부상
- 2025-06-01AWS Trainium2, Google TPU v6 출시
- 2026-02-21Taalas HC1 ASIC 출시, 17k tok/s
주요 입장
전망
- · Swyx: 'ASIC-GPU 성능 격차가 2년 내 0으로 수렴'
- · Latent Space Pod: Martin Casado의 ASIC 경제성 분석과 일치
한국 영향
- HC2 대형 모델 지원 성능
- 한국 팹리스 AI ASIC 개발 동향
SpargeAttention2 논문 — 비디오 디퓨전 모델에서 95% 어텐션 희소성, 16.2배 속도 향상 달성
주요 사건
SpargeAttention2가 발표되었다. 학습 가능한 희소 어텐션 방법으로, Top-k와 Top-p 마스킹을 결합한 하이브리드 방식과 증류 기반 파인튜닝을 사용한다. 비디오 디퓨전 모델에서 95% 어텐션 희소성과 16.2배 어텐션 속도 향상을 달성하면서도 생성 품질을 유지했다.
배경
- 2025-01-01SpargeAttention v1 발표
- 2025-12-01다수 학습 가능 희소 어텐션 방법 등장
- 2026-02-20SpargeAttention2: 95% 희소성, 16.2x 속도 향상
주요 입장
전망
- · CVPR 2026 채택 수준의 기술적 기여
한국 영향
- 상용 비디오 생성 서비스 적용 시점
- 한국어 비디오 생성 모델 적용
SemiAnalysis: AI 서버 PCB 층수 급증으로 드릴 비트 소비 4배 증가, 공급망 병목 심화
주요 사건
SemiAnalysis가 AI 서버 설계로 인한 PCB 산업 변화를 분석했다. AI 서버 PCB 층수가 8-24층에서 28-46층으로 증가하면서, 드릴링 종횡비가 8-10x에서 12-14x로 상승. 드릴 비트 수명이 3,000홀→600홀로 급감하여 소비량 4배 증가. 드릴 비트, 백드릴링 머신, PCB 지지판 모두 공급 부족 상태.
배경
- 2024-01-01AI 서버 PCB 8-24층 표준
- 2025-06-0128-46층 PCB 설계 확산
- 2026-02-20드릴 비트 소비 4x, 공급 부족 심화
주요 입장
전망
- · SemiAnalysis: 'PCB 드릴링이 AI 인프라의 숨겨진 보틀넥'
한국 영향
- 삼성전기 AI 서버용 PCB 기술 로드맵
- 대만 PCB 장비 업체 동향
SemiAnalysis: Wide Expert Parallelism이 프론티어 MoE 모델 서빙의 표준 — 랙 스케일 인프라가 핵심
주요 사건
SemiAnalysis가 프론티어 MoE(Mixture-of-Experts) 모델 서빙에서 Wide Expert Parallelism(WideEP) + 분리형 서빙이 표준이 되었다고 분석했다. Google TPU, AWS Trainium, NVIDIA NVL72 모두 대규모 랙 스케일업 인프라로 프로덕션 토큰을 서빙 중. 밀집 모델은 이미 업계가 넘어섰다고 진단.
배경
- 2025-01-01DeepSeek v3 등 MoE 모델 대중화
- 2025-06-01분리형 서빙(prefill/decode 분리) 등장
- 2026-02-20WideEP가 프론티어 랩 표준으로 정착
주요 입장
전망
- · SemiAnalysis: '소프트웨어-하드웨어 공동 설계 조직만이 미래 모델 아키텍처를 서빙할 수 있다'
한국 영향
- NVL72 한국 도입 시점
- 한국형 AI 클라우드 인프라 경쟁력
Google VP, LLM 래퍼와 AI 어그리게이터 스타트업의 생존 어려움 경고
주요 사건
Google Cloud VP Darren Mowry가 두 가지 유형의 AI 스타트업이 생존하기 어려울 것이라고 경고했다: (1) LLM 래퍼 — 기존 모델 위에 얇은 UI를 입힌 서비스, (2) AI 어그리게이터 — 여러 모델을 묶어 제공하는 서비스. 마진 축소와 제한된 차별화가 장기 생존을 위협한다고 진단.
배경
- 2023-03-01ChatGPT 기반 래퍼 스타트업 급증
- 2025-01-01빅테크 자체 에이전트 플랫폼 출시
- 2026-02-21Google VP, 래퍼/어그리게이터 생존 어려움 경고
주요 입장
전망
- · Google Cloud VP Darren Mowry: '축소되는 마진과 제한된 차별화가 장기 생존을 위협'
한국 영향
- 한국 AI 스타트업 생태계의 래퍼 비중
- 차별화 전략 부재 기업 파악
OpenAI, 캐나다 총격범의 ChatGPT 폭력 대화를 사전 감지했으나 경찰 미신고 — AI 안전 정책 논란
주요 사건
2026년 2월 10일 캐나다 Tumbler Ridge 학교 총격 사건의 범인이 사전에 ChatGPT에서 총기 폭력 관련 대화를 나눴고, OpenAI의 자동 모니터링 시스템이 이를 감지했다. 그러나 '임박하고 신뢰할 만한 심각한 신체적 위해 위험'이라는 신고 기준을 충족하지 않는다고 판단하여 경찰에 신고하지 않았다. 일부 직원은 신고를 원했으나 거부당했다고 WSJ가 보도.
배경
- 2025-06-01총격범의 ChatGPT 폭력 대화 감지, 계정 정지
- 2026-02-10Tumbler Ridge 학교 총격 사건 (8명 사망)
- 2026-02-21WSJ/Globe and Mail, OpenAI 내부 신고 논의 보도
주요 입장
전망
- · TechCrunch: 'AI 안전과 프라이버시 사이의 트레이드오프가 현실화'
한국 영향
- 한국 AI 기본법의 안전 의무 규정
- 한국 AI 챗봇의 위험 감지 현황
참고 자료
Sam Altman 인도 방문 — Codex가 인도에서 글로벌 최고 성장률, 주간 사용자 2주 만에 4배
주요 사건
Sam Altman이 인도 총리 Narendra Modi를 만나 AI에 대해 논의했다. 인도가 Codex의 글로벌 최고 성장 시장으로, 주간 사용자가 2주 만에 4배 성장했다고 발표. Anthropic도 같은 주에 벵갈루루 사무소를 공식 개설하며 인도를 두 번째로 큰 시장으로 지목.
배경
- 2026-02-16Anthropic 벵갈루루 사무소 공식 개설
- 2026-02-20Sam Altman 인도 방문, Codex 4x 성장 발표
주요 입장
전망
- · Sam Altman: '인도의 AI 에너지가 놀라움'
한국 영향
- Codex 한국 사용량 추이
- 한국 AI 코딩 도구 도입률
Google DeepMind, Lyria 3 음악 생성 모델 출시 — 텍스트/이미지→보컬 포함 음악 트랙 생성
주요 사건
Google DeepMind가 Lyria 3를 출시했다. 텍스트와 사진을 보컬·가사 포함 음악 트랙으로 변환할 수 있는 최신 생성 음악 모델이다. 템포 설정, 특정 보컬 스타일, 정확한 가사 제어 등 세밀한 창작 통제가 가능하며, 모든 출력에 SynthID 워터마크가 포함된다. Gemini App에서 글로벌 베타로 무료 제공.
배경
- 2024-12-01Lyria 2 출시
- 2025-06-01Suno v4, Udio v2 등 경쟁 모델 출시
- 2026-02-18Lyria 3 글로벌 베타 출시
주요 입장
전망
- · 업계: SynthID가 AI 콘텐츠 식별의 업계 표준이 될 가능성
한국 영향
- 한국어 가사 생성 품질
- K-POP 기획사의 AI 음악 도입 현황