GGML/llama.cpp가 Hugging Face에 합류하며 로컬 AI 생태계 통합 가속, Google Gemini 3.1 Pro 출시로 ARC-AGI-2 점수 2배 달성, Anthropic Claude Code Security 공개로 AI 보안 새 장 열어
- GGML/llama.cpp가 Hugging Face에 합류 — 로컬 AI 추론의 핵심 프로젝트가 HF 생태계로 편입
- Google Gemini 3.1 Pro 출시 — ARC-AGI-2에서 이전 모델 대비 2배 이상 성능, 추론 능력 대폭 향상
- Anthropic Claude Code Security 리서치 프리뷰 — AI 기반 코드 보안 취약점 스캐닝
- Sam Altman 인도 방문, Codex 주간 사용자 3배 증가 — 인도가 글로벌 최대 성장 시장
- OpenClaw 창립자 Peter Steinberger OpenAI 합류, OpenClaw 오픈소스 재단으로 전환
- SemiAnalysis: AI 서버용 PCB 드릴링 생태계 공급 부족, 반도체 장비 리드타임 3개월
- Karpathy: '앱스토어는 구시대적 개념' — 비스포크 소프트웨어 시대 도래 전망
- SpargeAttention2: 비디오 확산 모델에서 95% 어텐션 희소성, 16.2배 속도 향상 달성
GGML/llama.cpp가 Hugging Face에 합류 — 로컬 AI 생태계의 역사적 통합
주요 사건
Georgi Gerganov가 만든 ggml.ai(llama.cpp의 모회사)가 Hugging Face에 합류했다. llama.cpp는 로컬 기기에서 대형 언어모델을 실행할 수 있게 해주는 가장 인기 있는 오픈소스 추론 엔진으로, 이번 합류로 GGML 포맷과 HF 생태계의 직접 통합이 가속화된다.
배경
- 2023-03-10llama.cpp 첫 커밋
- 2023-08-21GGUF 포맷 도입
- 2024-01-01ggml.ai 법인 설립
- 2026-02-20ggml.ai가 Hugging Face에 합류
주요 입장
전망
- · AK(HF): '가장 뛰어난 엔지니어들이 HF에 합류하고 있다'
- · Gerganov: 'llama.cpp를 더 접근 가능하게 만들고 로컬 AI의 장기적 발전을 보장할 것'
한국 영향
- HF-GGML 통합 API 변화 추적
- 한국어 모델의 GGUF 최적화 상태
Google Gemini 3.1 Pro 출시 — ARC-AGI-2에서 이전 버전 대비 2배 이상 점수, 추론 능력 대폭 강화
주요 사건
Google DeepMind이 Gemini 3.1 Pro를 출시했다. 새 모델은 전반적 지능이 크게 향상되어 복잡한 문제 해결 능력이 개선됐다. 특히 새로운 논리 패턴을 테스트하는 ARC-AGI-2 벤치마크에서 3 Pro 대비 2배 이상의 점수를 기록했다. Gemini 앱, Google AI Studio, NotebookLM에서 이용 가능.
배경
- 2023-12-06Gemini 1.0 출시
- 2025-06-10Gemini 3 Pro 출시
- 2026-02-19Gemini 3.1 Pro 출시, ARC-AGI-2에서 2배 성능
주요 입장
전망
- · PCMag: 'Gemini 3.1 Pro가 주요 벤치마크에서 ChatGPT, Claude를 능가'
- · Google: '가장 어려운 도전을 해결하도록 설계된 모델'
한국 영향
- 한국어 추론 성능 실제 테스트
- Google AI Studio 가격 정책 변화
Anthropic, Claude Code Security 리서치 프리뷰 공개 — AI 기반 코드 보안 취약점 탐지·패치 제안
주요 사건
Anthropic이 Claude Code에 내장된 보안 스캐닝 기능 'Claude Code Security'를 제한적 리서치 프리뷰로 공개했다. 기존 정적 분석 도구가 알려진 패턴만 탐지하는 것과 달리, Claude가 인간 보안 연구자처럼 코드를 읽고 추론하여 비즈니스 로직 결함, 접근 제어 문제 등 복잡한 취약점을 탐지한다. 다단계 검증 프로세스로 오탐을 줄이고, 모든 수정은 인간 승인을 거쳐야 적용된다.
배경
- 2025-01-01Anthropic 사이버보안 연구 본격화
- 2025-12-01Claude의 새로운 취약점 탐지 능력 입증 발표
- 2026-02-20Claude Code Security 리서치 프리뷰 공개
주요 입장
전망
- · CyberScoop: '기존 도구가 놓치는 맥락 의존적 취약점을 탐지할 수 있는 잠재력'
- · Anthropic: '같은 AI 역량이 공격에도 쓰일 수 있어 방어자에게 먼저 제공'
한국 영향
- 한국어 코드베이스 지원 범위
- 국내 보안 규제 프레임워크와의 호환성
Sam Altman 인도 총리 모디와 회동 — Codex 인도 사용자 2주 만에 4배 증가, 글로벌 최대 성장 시장
주요 사건
Sam Altman이 인도 총리 나렌드라 모디와 만나 인도의 AI 발전에 대해 논의했다. 인도는 OpenAI Codex의 글로벌 최대 성장 시장으로, 주간 사용자가 2주 만에 4배 증가했다. 연초 대비 Codex 전체 주간 사용자는 3배 이상 증가.
배경
- 2025-06-01OpenAI 인도 시장 본격 진출
- 2026-02-16Anthropic 방갈로르 사무소 개설
- 2026-02-20Altman-모디 회동, 인도 Codex 사용 4배 증가 발표
주요 입장
전망
- · Altman: '인도 주변의 AI 에너지가 놀랍다'
- · TechCrunch: '크리에이터 경제와 인도 AI 야망이 교차하는 시점'
한국 영향
- 한국 Codex/Cursor 사용률 추이
- 인도 AI 인재 유출이 한국 스타트업에 미치는 영향
OpenClaw 창립자 Peter Steinberger, OpenAI 합류 — OpenClaw은 오픈소스 재단으로 전환
주요 사건
오픈소스 AI 에이전트 프레임워크 OpenClaw의 창립자 Peter Steinberger가 OpenAI에 합류하여 차세대 개인 에이전트를 이끌게 됐다. OpenClaw은 오픈소스 재단으로 독립하며 OpenAI가 계속 지원한다. OpenClaw은 GitHub 스타 10만+, 한 주에 방문자 200만 명을 기록한 바이럴 프로젝트.
배경
- 2025-11-01OpenClaw 첫 공개
- 2026-01-01GitHub 스타 10만+ 돌파
- 2026-02-15Steinberger OpenAI 합류, OpenClaw 재단 전환
주요 입장
전망
- · Altman: '멀티에이전트 미래는 극도로 중요하며 오픈소스 지원이 필수'
- · Reuters: '중국 당국도 OpenClaw의 보안 위험을 경고한 바 있다'
한국 영향
- OpenClaw 재단 거버넌스 구조
- 한국 AI 에이전트 프레임워크 생태계 현황
SemiAnalysis: AI 서버 PCB 복잡성 급증으로 드릴비트·장비 공급 부족 심화
주요 사건
AI 서버 설계에서 PCB 레이어 수가 8-24층에서 28-46층으로 증가하면서 드릴링 공정 복잡성이 기하급수적으로 상승하고 있다. 드릴비트 수명이 3,000홀에서 600홀로 급감(5배 소모 증가), 드릴비트·백드릴링 머신·PCB 지지판 모두 공급 부족 상태. 장비 리드타임 약 3개월, 상반기 물량은 이미 확정.
배경
- 2024-01-01AI 서버 PCB 8-24층 표준
- 2025-06-01NVL72 등 차세대 서버로 28-46층 PCB 수요 시작
- 2026-02-20드릴비트·장비 공급 부족 심화 보고
주요 입장
전망
- · SemiAnalysis: '드릴비트 수명 5배 감소는 AI 서버 비용 구조에 직접 영향'
- · 대만 ToPoint, Ta Liang 등이 핵심 수혜 기업
한국 영향
- 대덕전자·삼성전기의 AI 서버용 고다층 PCB 수주 동향
- 한국 드릴링 장비 국산화 현황
SemiAnalysis: Frontier MoE 모델에 Wide Expert Parallelism + Disaggregated Serving이 업계 표준으로 정착
주요 사건
SemiAnalysis가 프론티어 MoE(Mixture of Experts) 모델의 서빙 최적화에 대해 분석했다. 대규모 스케일업 월드 사이즈를 활용한 Wide Expert Parallelism(wideEP)이 여러 8-way 박스를 클러스터링하는 방식보다 경제성과 속도의 균형에서 우수하다. Google TPU, AWS Trainium, NVIDIA NVL72 모두 대규모 랙 스케일업 인프라로 프로덕션 토큰을 서빙 중이다.
배경
- 2024-03-01MoE 모델(Mixtral 등) 상용화 시작
- 2025-06-01NVL72 등 대규모 랙 스케일업 인프라 도입
- 2026-02-20wideEP가 프론티어 MoE 서빙의 표준으로 확인
주요 입장
전망
- · SemiAnalysis: '업계는 이미 dense 모델을 넘어섰다. 소프트웨어-하드웨어 공동 설계 조직의 가치가 핵심'
한국 영향
- NVL72 한국 공급 일정
- 리벨리온/퓨리오사 등의 MoE 지원 로드맵
Karpathy: '앱스토어는 구시대적 개념' — AI가 맞춤형 앱을 즉석 생성하는 비스포크 소프트웨어 시대 전망
주요 사건
Andrej Karpathy가 Claude를 사용해 1시간 만에 개인 맞춤형 심박수 추적 대시보드를 만든 경험을 공유하며, '앱스토어에서 기성 앱을 고르는 개념 자체가 구시대적'이라고 주장했다. 300줄 코드로 LLM이 몇 초 만에 생성할 수 있는 것을 별도 앱으로 다운받을 이유가 없다는 것. 다만 이런 1시간 작업이 1분으로 줄어들려면 산업 전체가 AI 네이티브 센서·액추에이터 API/CLI를 제공해야 한다고 지적했다.
배경
- 2024-06-01vibe coding 개념 등장
- 2025-12-01Claude/Codex 등 코딩 에이전트 성숙
- 2026-02-19Karpathy '앱스토어는 구시대' 선언
주요 입장
전망
- · Karpathy: '2년 전 10시간 걸리던 작업이 1시간이 됐다. 하지만 1분이 돼야 한다'
- · swyx: 'Karpathy의 AI 정신병 상위 티어는 오늘날 앱스토어와 양립 불가'
한국 영향
- 한국 개발자의 vibe coding 채택률
- 삼성 SmartThings 등의 에이전트용 API 제공 계획
SpargeAttention2: 비디오 확산 모델에서 95% 어텐션 희소성과 16.2배 속도 향상 달성
주요 사건
SpargeAttention2는 비디오 확산 모델을 위한 학습 가능한 희소 어텐션 방법으로, Top-k와 Top-p 마스킹을 결합한 하이브리드 방식과 증류 기반 파인튜닝을 사용한다. 95% 어텐션 희소성과 16.2배 어텐션 속도 향상을 달성하면서 생성 품질을 유지한다.
배경
- 2023-01-01비디오 확산 모델 연구 활성화
- 2025-06-01SpargeAttention1 등 학습 가능 희소 어텐션 등장
- 2026-02-20SpargeAttention2 논문 공개, 95% 희소성 달성
주요 입장
전망
- · 논문: 'SpargeAttention2가 기존 모든 희소 어텐션 방법을 일관되게 능가'
한국 영향
- 국내 연구팀의 희소 어텐션 연구 동향
- 비디오 생성 모델 상용 서비스 비용 변화
Anthropic, AI 에이전트 자율성 측정 연구 발표 — 소프트웨어 엔지니어링이 에이전틱 호출의 50%
주요 사건
Anthropic이 Claude Code와 API에서 수백만 건의 상호작용을 분석한 AI 에이전트 자율성 연구를 발표했다. 사람들이 에이전트에 부여하는 자율성 수준, 배포 위치, 잠재적 위험을 분석했다. 소프트웨어 엔지니어링이 API에서 에이전틱 도구 호출의 약 50%를 차지하지만, 다른 산업으로의 확장도 관찰됐다.
배경
- 2025-06-01AI 에이전트 상용화 본격화
- 2025-12-01Anthropic 에이전트 자율성 연구 시작
- 2026-02-18연구 결과 발표
주요 입장
전망
- · Anthropic: '자율성의 프론티어가 확장됨에 따라 포스트-배포 모니터링이 필수적'
한국 영향
- 한국 AI 안전 규제 동향
- 국내 기업의 AI 에이전트 자율성 관리 현황
Google DeepMind, Lyria 3 음악 생성 모델 출시 — 사진·텍스트에서 보컬 포함 트랙 생성
주요 사건
Google DeepMind이 최신 생성형 음악 모델 Lyria 3를 공개했다. 사진과 텍스트를 다이내믹 트랙으로 변환할 수 있으며, 보컬과 가사까지 포함한다. 템포, 보컬 스타일, 가사를 세밀하게 제어할 수 있으며, SynthID 워터마크가 모든 생성물에 포함된다. Gemini 앱에서 글로벌 베타로 출시.
배경
- 2023-05-01MusicLM 공개
- 2025-03-01Lyria 2 출시
- 2026-02-18Lyria 3 글로벌 베타 출시
주요 입장
전망
- · Google: '크리에이터에게 더 많은 제어권을 부여하는 것이 핵심'
한국 영향
- 한국어 가사 생성 지원 여부
- 한국 저작권법의 AI 음악 대응
Augment, 포스트-IDE 시대의 'ADE' 도구 공개 — Cursor를 넘어서는 에이전틱 개발 환경
주요 사건
Augment의 Amelia Wattenberger가 'IDE 이후 무엇이 오는가'에 대한 비전을 공개했다. swyx는 이를 '모든 좋은 아이디어를 하나의 앱에 통합한 ADE(Agent Development Environment)'라고 평가했다. Cursor 2.0은 첫 발걸음, Claude는 채팅 앱에 통합, Codex는 Conductor 패턴을 공식화, Amazon Kiro는 스펙 기반 개발을 추구했지만, Augment의 Intent는 이 모든 패턴을 결합했다.
배경
- 2025-11-01AI Engineer Summit에서 포스트-IDE 예언
- 2026-01-01Codex Conductor, Kiro Spec-Driven Dev 등장
- 2026-02-19Augment Intent 공개, ADE 개념 구체화
주요 입장
전망
- · swyx: '소프트웨어가 만들어지는 미래가 내 눈앞에서 펼쳐지고 있다. 이 황금기에 대해 사람들이 평생 물어볼 것'
한국 영향
- Augment Intent 한국 시장 출시 일정
- 국내 개발자의 ADE 도구 채택률
Tesla AI4 칩, 완전 이중화 설계 공개 — 두 컴퓨터가 병렬 실행하며 상호 검증
주요 사건
Tesla AI 공식 계정이 AI4 칩의 완전 이중화(fail-over redundancy) 설계를 공개했다. 두 대의 컴퓨터가 병렬로 실행되며 서로를 지속적으로 검증하는 구조로, 자율주행의 안전성을 보장한다. 별도로 Tesla는 AI4.5 컴퓨터(3-SoC 설계)를 Model Y에 조용히 탑재하기 시작한 것으로 알려졌다.
배경
- 2019-04-01Tesla HW3 FSD 컴퓨터 도입
- 2023-02-01HW4/AI4 유출, 이중 SoC 설계
- 2026-01-25AI4.5(3-SoC) Model Y에 탑재 확인
- 2026-02-20AI4 이중화 설계 공식 공개
주요 입장
전망
- · Electrek: 'AI4.5의 3-SoC 설계는 기존 이중화를 넘어선 중요한 변화'
- · @greentheonly(Tesla 해커): '펌웨어 분석에서 3-SoC 설계 확인'
한국 영향
- 현대 자율주행 컴퓨터 아키텍처 로드맵
- 삼성 Exynos Auto 자율주행 칩 경쟁력
AMAT, Centris Sym3 Z Magnum 에칭 시스템 발표 — 2nm GAA·HBM 제조의 핵심 장비
주요 사건
Applied Materials(AMAT)가 Centris Sym3 Z Magnum 에칭 시스템을 발표했다. 2nm 및 옹스트롬 시대의 GAA(Gate-All-Around) 트랜지스터 제조에 필요한 극도로 정밀한 깊은 트렌치 에칭을 수행한다. 리딩엣지 로직뿐 아니라 4F2 DRAM과 HBM 개발도 가속화한다. Sym3 Z 제품군은 이미 2nm 로직 제조에서 POR(Process of Record) 지위를 확보, 250대 이상 현장 배치.
배경
- 2022-06-01삼성 3nm GAA 최초 양산
- 2025-01-01TSMC 2nm GAA 양산 시작
- 2026-02-19AMAT Sym3 Z Magnum 발표, 250대+ 배치 완료
주요 입장
전망
- · SemiAnalysis: 'Sym3 Z가 2nm POR을 이미 확보했다는 것은 AMAT의 기술적 우위를 보여준다'
한국 영향
- 삼성 2nm GAA 수율 개선 동향
- SK하이닉스 HBM4 에칭 공정 장비 선택