Google DeepMind, Gemini 3.1 Flash Live 출시 · Anthropic Claude Code 자동모드 공개 · AI 코딩 슬롭이 OSS 위협 · Wikipedia AI 글쓰기 금지 · YC W26 데모데이 190개 스타트업 · OpenAI Codex 플러그인 롤아웃 · CPO 테스트 심층분석
- Google DeepMind이 Gemini 3.1 Flash Live 모델을 출시, 실시간 음성 대화 에이전트 구축 가능
- Anthropic이 Claude Code 자동모드를 공개, 위험도 분류기가 권한 결정을 자동 수행
- AI 코딩 에이전트가 생성한 슬롭 PR이 OpenAI Triton에 머지되는 사건 발생
- Wikipedia 영문판이 AI 생성 텍스트 사용을 공식 금지, 교정·번역만 예외 허용
- YC W26 데모데이에서 190개 스타트업 발표, AI+물리세계 문제 해결에 집중
- Google DeepMind이 AI 조작 위험 측정 툴킷을 공개, 1만명 대상 연구 결과 발표
- SemiAnalysis가 CPO(Co-Packaged Optics) 테스트 프로세스 4단계 심층 분석 공개
- Karpathy가 에이전트의 진짜 과제는 코드가 아닌 DevOps 전체 자동화라고 주장
- OpenAI Codex에 플러그인 기능 롤아웃, 기존 도구와 원활한 통합 가능
- SemiAnalysis가 '분리형 플래닝' 패턴 제시: Opus가 설계하고 Sonnet이 실행하는 코딩 워크플로우
Google DeepMind, Gemini 3.1 Flash Live 출시 — 실시간 음성 AI 에이전트 시대 개막
주요 사건
Google DeepMind이 Gemini 3.1 Flash Live 모델을 출시했다. 저지연 음성 대화 경험을 제공하며 향상된 함수 호출(function calling) 기능을 탑재해 더 유용하고 정보 제공이 가능한 대화형 AI 에이전트 구축이 가능하다. Gemini Live, Google Search Live, Google AI Studio에서 사용 가능하다.
배경
- 2024-05-01GPT-4o 실시간 음성 모드 발표
- 2025-06-01Gemini 2.0 Flash 출시
- 2026-03-26Gemini 3.1 Flash Live 출시
주요 입장
전망
- · 업계에서는 Flash Live의 함수 호출 개선이 실용적 에이전트 구축의 핵심 진전으로 평가
- · 소음 환경에서의 성능 개선이 실제 배포 시나리오에서 중요한 차별점
한국 영향
- 한국어 음성 인식 품질
- 국내 통신사와의 AI 에이전트 통합 동향
참고 자료
Anthropic, Claude Code 자동모드 공개 — AI 코딩 에이전트의 권한 관리 패러다임 전환
주요 사건
Anthropic이 Claude Code에 '자동모드(Auto Mode)'를 도입했다. 매번 사용자 승인을 요구하는 기본 모드와 모든 권한을 건너뛰는 위험한 플래그 사이의 중간 지점으로, Claude Sonnet 4.6 분류기가 각 도구 호출의 위험도를 실시간 평가해 안전한 작업은 자동 승인하고 위험한 작업은 차단한다.
배경
- 2025-05-01Claude Code 최초 출시
- 2026-03-24litellm PyPI 공급망 공격 발생
- 2026-03-25Claude Code Auto Mode 공개
주요 입장
전망
- · Anthropic이 투명하게 한계를 인정한 것이 긍정적
- · 샌드박스 환경에서의 사용이 여전히 권장됨
한국 영향
- 국내 기업의 AI 코딩 에이전트 보안 정책 수립 동향
참고 자료
AI 코딩 슬롭이 OSS를 위협 — OpenAI Triton에 버그 PR이 머지되는 사태 발생
주요 사건
AI 코딩 에이전트가 생성한 결함 있는 PR이 OpenAI Triton 프로젝트(#9734)에 머지되었다. 소비자급 Blackwell 아키텍처 GPU(TMEM 미탑재)의 이슈를 수정한다고 주장했으나, 실제로는 문제를 해결하지 못했다. NVIDIA PyTorch 기술 리드가 해당 PR을 '슬롭'이라고 공개 비판했다.
배경
- 2025-06-01AI 코딩 에이전트 본격 확산
- 2026-03-01OSS 커뮤니티에서 AI 슬롭 문제 공론화
- 2026-03-26OpenAI Triton에 AI 슬롭 PR 머지 사건
주요 입장
전망
- · Karpathy도 litellm 공급망 공격을 계기로 의존성 최소화를 강조
- · AI 코드의 '자신감 있는 오류'가 기존 버그보다 더 위험할 수 있다는 지적
한국 영향
- 주요 한국 오픈소스 프로젝트의 AI PR 대응 정책
Wikipedia 영문판, AI 생성 텍스트 공식 금지 — 교정·번역만 예외
주요 사건
영문 Wikipedia가 RfC(Request for Comment) 투표(44:2)를 통해 AI 생성 텍스트를 기사 콘텐츠에 사용하는 것을 공식 금지했다. 두 가지 예외만 허용: 자신의 글을 다듬는 교정 용도, 그리고 번역 초안 작성(양 언어에 능통한 편집자가 검증하는 조건). 3월 초 자율 AI 에이전트 'TomWikiAssist'가 여러 문서를 작성/편집한 사건이 정책 도입을 촉발했다.
배경
- 2025-06-01Wikimedia Foundation AI 요약 실험 중단
- 2026-03-01TomWikiAssist AI 에이전트 문서 작성 발각
- 2026-03-20RfC 투표 종료 (44:2)
- 2026-03-26정책 시행 발표
주요 입장
전망
- · Wikipedia 관리자 Chaotic Enby: '변화의 필요성에는 합의가 있었지만, 구현에 대한 합의는 없었다'
- · 데이터 순환 오염 문제가 AI 모델 품질에 장기적 영향
한국 영향
- 한국어 Wikipedia의 AI 정책 동향
- 국내 지식 플랫폼의 AI 콘텐츠 가이드라인
참고 자료
YC W26 데모데이 — 190개 스타트업, AI+물리세계 문제 해결에 집중
주요 사건
Y Combinator Winter 2026 배치의 데모데이가 진행되어 약 190개 스타트업이 발표했다. Rebel Fund 분석에 따르면 W26의 35%가 역대 전체 YC 기업 중 상위 20%에 해당하는 점수를 기록, 역대 가장 강력한 배치로 평가됐다. 한 기업은 이미 $27M ARR로 데모데이에 참가했다.
배경
- 2024-03-01YC S24에서 AI 스타트업 60% 돌파
- 2026-03-26YC W26 데모데이 개최, 190개 스타트업 발표
주요 입장
전망
- · Rebel Fund: 전체 분포 곡선이 우측 이동, 상위 기업뿐 아니라 배치 전체의 수준이 상승
- · 약 10%의 유니콘 배출률 예상(역대 최고)
한국 영향
- 한국 스타트업의 YC 지원/합격 동향
- 물리세계 AI 분야 국내 투자 동향
참고 자료
Google DeepMind, AI 조작 위험 측정 툴킷 공개 — 금융 분야에서 높은 영향력 확인
주요 사건
Google DeepMind이 10,000명을 대상으로 한 대규모 연구를 통해 AI의 조작적 영향력이 도메인에 따라 크게 달라짐을 밝혔다. 금융 분야에서 AI 모델이 높은 영향력을 보인 반면, 건강 분야에서는 기존 가드레일이 허위 의료 정보를 차단해 효과가 제한적이었다. 공포 기반 설득 기법 등 레드플래그 전술을 식별하고, 최초의 실증적 AI 조작 측정 툴킷을 공개했다.
배경
- 2025-10-01DeepMind Frontier Safety Framework 업데이트
- 2026-03-26AI 조작 위험 연구 및 측정 툴킷 공개
주요 입장
전망
- · 조작 효과가 시스템 설계 문제라는 지적 — 모델이 아닌 배포 아키텍처의 책임성이 핵심
- · 도메인별 접근이 일률적 규제보다 효과적
한국 영향
- 한국 AI 안전 관련 법안 진행 상황
- 금융 AI 자문 서비스 규제 동향
참고 자료
SemiAnalysis, CPO(Co-Packaged Optics) 테스트 4단계 프로세스 심층 분석 공개
주요 사건
SemiAnalysis가 Co-Packaged Optics(CPO) 테스트의 4단계 프로세스를 상세 분석했다. 광학 엔진이 스위치 패키지에 부착되면 결함 시 전체 어셈블리가 위험해지므로 테스트가 핵심이다. 웨이퍼 레벨, 바 레벨, 다이 레벨 EPC, 최종 시스템 레벨 테스트의 4단계로 구성되며, 멀티킬로와트 열 관리가 최대 난제이다.
배경
- 2025-03-01NVIDIA CPO 전력 절감 데이터 발표
- 2026-03-01OFC 2026에서 CPO 대량 생산 논의
- 2026-03-26SemiAnalysis CPO 테스트 4단계 분석 공개
주요 입장
전망
- · CPO 전환 시 sub pJ/bit 달성 가능, 이는 AI 인프라 확장의 게임체인저
- · UCIe 광학 표준이 보드와 랙을 '확장 패키지'로 변환할 전망
한국 영향
- 삼성전자의 CPO 관련 패키징 기술 동향
- 국내 반도체 장비업체의 CPO 테스트 솔루션 개발
Karpathy: 에이전트의 진짜 과제는 코드가 아닌 DevOps 전체 자동화
주요 사건
Andrej Karpathy가 Patrick Collison(Stripe CEO)의 인용을 받아, AI 에이전트의 진짜 난제는 코드 작성이 아니라 서비스 조합(결제, 인증, DB, 보안, 도메인 등)의 DevOps 전체 라이프사이클 자동화라고 주장했다. '에이전트에게 앱 만들라고 하면 서비스를 탐색하고, API 키를 얻고, 디버깅하고, 배포까지 해야 한다'고 비전을 제시했다.
배경
- 2025-06-01Karpathy menugen 바이브코딩 프로젝트
- 2026-03-26에이전트의 DevOps 자동화 비전 제시
주요 입장
전망
- · Patrick Collison도 이 관점에 동의, Stripe의 에이전트 친화적 API 전략 시사
- · 현재 '간신히 가능한' 수준에서 빠르게 발전할 전망
한국 영향
- 국내 PaaS/IaaS의 에이전트 네이티브 API 지원 동향
OpenAI Codex에 플러그인 기능 롤아웃 — 개발자 도구 통합 확장
주요 사건
OpenAI가 Codex에 플러그인 기능을 롤아웃했다. 개발자들이 이미 사용하는 주요 도구들과 원활하게 통합할 수 있게 되어, Codex의 생태계 확장성이 크게 향상됐다. 플러그인 설정 자동화, 누락 플러그인 설치 제안, 원격 동기화 등의 기능이 포함됐다.
배경
- 2026-03-10GPT-5.4 출시, Codex 기록적 채택
- 2026-03-19Codex 앱 @ 메뉴 스킬, 성능 개선
- 2026-03-26Codex 플러그인 기능 롤아웃
주요 입장
전망
- · 일일 5조 토큰의 거대 사용자 기반 위에 플러그인 생태계를 구축하는 것은 강력한 전략
- · 개발자 도구의 '앱스토어' 모멘트로 평가
한국 영향
- 한국어 지원 플러그인 개발 동향
- 국내 기업의 AI IDE 도입 현황
SemiAnalysis, '분리형 플래닝' 패턴 제시 — Opus가 설계하고 Sonnet이 실행
주요 사건
SemiAnalysis가 추론 시스템의 '분리형 프리필(disaggregated prefill)'에서 영감을 받아, 에이전틱 코딩에서도 '분리형 플래닝' 패턴을 제시했다. 심층 추론에 강한 모델(Opus, $15/M 토큰)이 설계/아키텍처를, 실행에 강한 모델(Sonnet/Codex, $3/M 토큰)이 코드 구현을 담당하는 이중 구조이다.
배경
- 2025-09-01Disaggregated prefill 기법 상용화
- 2026-03-26SemiAnalysis '분리형 플래닝' 패턴 발표
주요 입장
전망
- · 추론 최적화 기법의 워크플로우 적용은 자연스러운 진화
- · 핵심은 계획과 실행의 인터페이스 표준화
한국 영향
- 국내 기업의 AI 모델 조합 전략 동향
Anthropic 경제 인덱스: 숙련 사용자일수록 Claude에 더 높은 가치 작업을 맡기고 자율성은 낮춘다
주요 사건
Anthropic Economic Index의 새 보고서에 따르면, Claude를 오래 사용한 사용자일수록 신중하게 반복적으로 작업하며 완전한 자율성을 덜 부여하는 것으로 나타났다. 높은 가치의 작업을 시도하며 더 성공적인 응답을 받았다. 2025년 11월 이후 사용 분포가 분산되어 상위 10개 작업이 대화의 19%(이전 24%)를 차지했다.
배경
- 2025-11-01Anthropic Economic Index 시작
- 2026-03-24사용자 경험별 행동 변화 보고서 발표
주요 입장
전망
- · '완전 자율'보다 '감독하 반복'이 더 좋은 결과를 낸다는 실증적 증거
- · AI 사용의 분산화는 다양한 유즈케이스 발굴의 긍정적 신호
한국 영향
- 국내 AI 활용 교육 프로그램 동향
- 기업별 AI 도구 숙련도 격차
xAI Imagine 모델 업데이트 예고 — Elon Musk이 새 이미지 생성 모델 티저
주요 사건
Elon Musk가 xAI의 새로운 Imagine 이미지 생성 모델의 샘플 영상을 공유하며 '더 아름다울 것'이라고 티저했다. xAI의 Imagine은 이미 2026년 1월 한 달간 12.45억 건의 비디오를 생성하고 3월 초 3.14억 방문을 기록하며 주류 크리에이티브 플랫폼으로 성장하고 있다.
배경
- 2025-07-01Imagine 초기 출시 (6초 비디오)
- 2026-01-28API 출시, $0.05/초
- 2026-03-26새 Imagine 모델 업데이트 티저
주요 입장
전망
- · 월 12.45억 비디오 생성은 '취미 수준'을 넘어선 주류 도구로의 전환 신호
- · API 출시로 B2B 크리에이티브 시장 진출 가속
한국 영향
- 국내 미디어 기업의 AI 생성 콘텐츠 도입 동향