LiteLLM 공급망 공격으로 AI 생태계 보안 경종, OpenAI 재단 $1B 투입 선언·Sora 서비스 종료, Google TurboQuant으로 LLM 메모리 6배 압축, Grok Imagine 비디오 생성 1위 등재
- LiteLLM PyPI 공급망 공격 — TeamPCP가 Trivy 보안 스캐너 경유해 LiteLLM 패키지 변조, SSH키·클라우드 자격증명 탈취 시도
- OpenAI 재단 1년 내 $1B 지출 선언, Wojciech Zaremba AI Resilience 수장 임명
- OpenAI Sora 공식 종료 — IPO 앞두고 비디오 생성 사업 철수, Disney 파트너십도 해소
- Google TurboQuant 발표 — KV 캐시 3비트 압축으로 메모리 6배 절감, 정확도 손실 제로
- Grok Imagine DesignArena 비디오·이미지-투-비디오·편집 3관왕
- Anthropic Claude Code 'auto mode' 출시 — 안전한 자율 코딩을 위한 분류기 기반 권한 시스템
- Anthropic Economic Index — 숙련 사용자일수록 AI에 전권위임 줄고, 반복적 협업·고가치 작업 증가
- SemiAnalysis: 에이전틱 AI로 GPU 렌탈 시장 재편 — 제번스 역설로 구형 GPU 가격 반등
- 삼성전자 노조 93% 파업 찬성 — 5월 21일 18일간 파업 시 메모리 공급 위기
- WebGPU로 24B 파라미터 모델 브라우저 내 50 tok/s 실행 시연
LiteLLM PyPI 공급망 공격 — AI 인프라 핵심 패키지 변조로 자격증명 대규모 탈취 시도
주요 사건
3월 24일, Python 패키지 litellm의 PyPI 배포판(v1.82.7, 1.82.8)이 공격자 'TeamPCP'에 의해 변조되었다. 공격자는 먼저 Aqua Security의 Trivy 보안 스캐너를 경유해 CI/CD 파이프라인에서 PyPI 배포 자격증명을 탈취, 이를 이용해 악성 코드가 삽입된 패키지를 직접 업로드했다. 악성 코드는 SSH 키, AWS/GCP/Azure 자격증명, Kubernetes 시크릿, 환경변수(API 키 포함), git 자격증명, 암호화폐 지갑 등을 수집해 공격자 서버(models.litellm.cloud)로 전송했다. litellm은 일일 300만 다운로드, 월 9,700만 다운로드 규모의 LLM 프록시 라이브러리로, 이를 의존성으로 사용하는 dspy 등 다른 프로젝트도 연쇄 영향을 받았다. 약 2-3시간 후 PyPI가 격리 조치했다.
배경
- 2026-02-27TeamPCP, Trivy의 pull_request_target 워크플로우 취약점 악용
- 2026-03-19변조된 Trivy가 litellm CI에서 PyPI 자격증명 탈취
- 2026-03-23공격자 litellm.cloud 도메인 등록
- 2026-03-24악성 litellm 1.82.7/1.82.8 PyPI 업로드, 약 2-3시간 후 격리
주요 입장
전망
- · Karpathy: '의존성은 피라미드가 아니라 공격면. LLM으로 기능을 직접 구현하는 게 나을 수 있다'
- · Sonatype: 'AI 에코시스템의 신뢰받는 패키지가 공급망 공격의 고가치 타겟이 되고 있다'
한국 영향
- 국내 CI/CD 파이프라인 보안 점검
- AI 관련 PyPI 패키지 의존성 감사
참고 자료
OpenAI 재단, 1년 내 $1B 지출 선언 — Wojciech Zaremba 'AI Resilience' 수장으로 전환
주요 사건
Sam Altman이 OpenAI 재단의 첫 해 $1B 지출 계획을 발표했다. OpenAI 공동창업자 Wojciech Zaremba가 'AI Resilience' 수장으로 전환, Jacob Tref가 생명과학/질병 치료 책임자, Anna Adeola가 시민사회·자선 책임자로 임명되었다. 재단은 신종 바이오 위협, 경제 급변, 복잡한 사회적 영향 등에 초점을 맞춘다.
배경
- 2015-12-01OpenAI 비영리 설립
- 2019-03-01영리 자회사(capped-profit) 설립
- 2025-10-01$25B 질병치료·AI안전 투자 약속
- 2025-12-01첫 보조금 $40.5M 배분
- 2026-03-24재단 $1B/년 지출 계획 발표
주요 입장
전망
- · Brian Mittendorf(회계학 교수): '재무적 가치 창출이 자선 목적에 사용되는지가 핵심 질문'
- · Bret Taylor(재단 이사회 의장): '12개월 약속에 이름·프로그램이 명시된 것은 책임성 문서'
한국 영향
- 재단의 실제 보조금 배분 현황
- 한국 대상 프로그램 포함 여부
OpenAI Sora 공식 종료 — IPO 앞두고 비디오 생성 사업 철수, Disney 파트너십 해소
주요 사건
OpenAI가 비디오 생성 서비스 Sora의 종료를 공식 발표했다. 2024년 하반기 출시 후 2025년 확장했으나, IPO를 앞두고 자원 집약적인 비디오 생성 사업을 중단한다. Disney와의 IP 활용 파트너십도 동시에 해소되었다. swyx는 이를 'OpenAI의 Side Quest 정리 첫 번째 희생양'으로 평가했다.
배경
- 2024-02-15Sora 첫 공개 데모
- 2024-12-01Sora 일반 공개
- 2025-11-01Sora Android 앱 출시
- 2026-03-24Sora 공식 종료 발표
주요 입장
전망
- · swyx: 'OpenAI의 Side Quest 정리 첫 번째 희생양'
- · NBC News: 'IPO를 앞둔 자원 집약적 사업 축소'
한국 영향
- Sora 사용자 데이터 보존 정책
- 국내 비디오 AI 대안 현황
Google TurboQuant — LLM KV 캐시 3비트 압축으로 메모리 6배 절감, 정확도 손실 제로
주요 사건
Google Research가 ICLR 2026에서 발표할 TurboQuant 압축 알고리즘을 공개했다. PolarQuant(직교좌표→극좌표 변환)와 QJL(Johnson-Lindenstrauss 변환 기반 잔차 압축)을 결합해, LLM의 KV 캐시를 3비트까지 압축하면서 정확도 손실이 없다. H100 GPU에서 어텐션 로짓 연산 최대 8배 속도 향상, 메모리 최소 6배 절감. 모델 재학습 불필요.
배경
- 2017-06-01Transformer 아키텍처 발표
- 2024-01-011M 토큰 컨텍스트 윈도우 등장
- 2026-03-25Google TurboQuant 발표 (ICLR 2026)
주요 입장
전망
- · Reddit r/accelerate: '메모리 시장 압력을 완화할 수 있는 기술, Google이 AGI 레이스에서 앞설 수 있다'
- · HelpNetSecurity: 'data-oblivious 특성으로 배포 파이프라인 단순화에 기여'
한국 영향
- ICLR 2026 정식 발표 후 벤치마크 검증
- HBM 시장 수요 영향 분석
참고 자료
Anthropic Claude Code 'auto mode' 출시 — 분류기 기반 안전 자율 코딩 시스템
주요 사건
Anthropic이 Claude Code에 'auto mode'를 도입했다. 매번 파일 쓰기·bash 명령마다 사용자 승인을 요구하는 기본 모드와 모든 권한을 건너뛰는 dangerously-skip-permissions 모드 사이의 안전한 중간지대다. 분류기 시스템이 안전한 동작은 자동 승인하고, 위험한 동작(대량 삭제, 민감 데이터 추출, 악성 코드 실행)은 차단하거나 대안을 제시한다.
배경
- 2025-06-01Claude Code 출시
- 2026-02-01AWS AI 도구 관련 13시간 장애
- 2026-03-25Claude Code auto mode 프리뷰 출시
주요 입장
전망
- · Engadget: 'AWS 장애 사건이 auto mode 개발의 직접적 계기'
- · Medium/Joe Njenga: 'YOLO 모드의 위험성과 기본 모드의 비효율성 사이 최적 해법'
한국 영향
- Enterprise 버전 출시 일정
- 분류기 오탐율/미탐율 공개 데이터
Grok Imagine, DesignArena 비디오 생성·편집·이미지-투-비디오 3관왕 달성
주요 사건
xAI의 Grok Imagine이 DesignArena 리더보드에서 Video Arena(Elo 1337), Image-to-Video Arena(Elo 1298), Video Editing Arena(Elo 1291) 모두 1위를 차지했다. Artificial Analysis에서도 image-to-video Elo 1329로 1위. Google Veo 3.1, Kling, Sora를 모두 제쳤다. 2026년 2월 1.0 출시 후 5개월 만의 성과.
배경
- 2025-10-01Grok Imagine v0.9 출시
- 2026-01-28Grok Imagine API 출시
- 2026-02-02Grok Imagine 1.0 출시
- 2026-03-25DesignArena 3관왕 확인
주요 입장
전망
- · Basenor: 'v0.9에서 1위까지 5개월은 유례없는 속도, 레거시 플레이어를 집중 실행으로 추월'
- · API 가격 $4.20/분은 최상위 품질 대비 경쟁력 있는 수준
한국 영향
- Grok Imagine API 한국 접근성
- 국내 크리에이터 채택 현황
SemiAnalysis: 에이전틱 AI로 GPU 렌탈 시장 패러다임 전환 — 제번스 역설로 구형 GPU도 반등
주요 사건
SemiAnalysis가 GPU 렌탈 시장의 패러다임 전환을 분석했다. GPT-5.4 같은 효율적 모델이 나와도 GPU당 토큰 생산량 증가가 수요를 줄이지 않고, 오히려 ROI가 명확해지면서 수요가 가격에 비탄력적으로 가속되고 있다. 제번스 역설(Jevons' Paradox) 그대로 — 효율화가 절약이 아닌 사용 확대로 이어진다. Hopper급 구형 GPU 가격도 반등세.
배경
- 2024-01-01GPU 렌탈 가격 지속 하락기
- 2025-06-01에이전틱 AI 본격 확산
- 2026-03-25SemiAnalysis 패러다임 전환 분석 발표
주요 입장
전망
- · SemiAnalysis: '이 패러다임은 유지되거나 강화될 것'
- · LinkedIn 댓글: '클라우드 컴퓨트 2013-16년 상용화와 유사하나 속도가 18개월로 압축'
한국 영향
- 국내 GPU 클라우드 가격 동향
- 데이터센터 전력 공급 계획
삼성전자 노조 93% 파업 찬성 — 5월 21일 18일간 파업 시 글로벌 메모리 공급 위기
주요 사건
삼성전자 노조가 66,019명 투표에서 93% 찬성으로 파업을 승인했다. 보너스 산정 투명성, 50% 보너스 상한 철폐, 7% 임금인상을 요구. 정부 중재위 조정도 결렬. 협상 실패 시 4월 23일 집회 후 5월 21일부터 18일간 파업 예정. 삼성은 DRAM 100%, NAND의 2/3를 국내에서 생산해 파업 시 글로벌 메모리 공급 직격탄.
배경
- 2024-07-01삼성전자 첫 노조 파업
- 2025-11-012026년 임금 교섭 시작
- 2026-03-09파업 찬반 투표 시작
- 2026-03-1893% 찬성으로 파업 승인
- 2026-05-21파업 예정일(18일간)
주요 입장
전망
- · Reuters/연합뉴스: '세계 최대 메모리 칩메이커의 생산 차질 리스크'
- · SemiAnalysis: '이미 존재하는 메모리 부족을 악화시킬 수 있는 파업'
한국 영향
- 4월 23일 집회 규모
- 5월 교섭 진행 상황
- 메모리 스팟 가격 동향
Anthropic Economic Index: 숙련 AI 사용자일수록 자율성 위임 줄고 반복 협업·고가치 작업 증가
주요 사건
Anthropic이 Economic Index 최신 보고서를 발표했다. 장기 사용자일수록 Claude에 전권위임보다 신중한 반복 협업을 선호하고, 더 높은 가치의 작업을 시도하며, 성공 응답률도 높다. 2025년 11월 이후 소비자 사용은 분산화되어 상위 10개 작업이 전체 대화의 19%(기존 24%)로 줄었다.
배경
- 2025-01-01Anthropic Economic Index 시작
- 2025-11-01소비자 사용 분산화 시작점
- 2026-03-24최신 보고서 발표
주요 입장
전망
- · TechCrunch: 'AI가 아직 일자리를 대체하지 않지만, 경험 사용자의 우위가 향후 displacement 우려를 키운다'
- · Anthropic: '사용 다양화는 AI가 범용 도구로 성숙하고 있음을 시사'
한국 영향
- 국내 AI 사용 패턴 유사 연구
- 기업 AI 교육 프로그램 현황
Google Lyria 3 Pro — 최대 3분 고음질 AI 음악 생성, API 및 Gemini 앱 공개
주요 사건
Google DeepMind가 Lyria 3 Pro를 출시했다. 인트로·절·코러스·브릿지를 구분해 최대 3분 길이의 고음질 작곡이 가능하다. Google AI Studio API와 Gemini 앱 유료 구독자에게 제공.
배경
- 2023-11-01Google Lyria 1.0 발표
- 2025-06-01Suno v4 출시로 음악 AI 대중화
- 2026-03-25Lyria 3 Pro 출시 (3분 작곡)
주요 입장
전망
- · 구조화 작곡(인트로-절-코러스-브릿지)은 단순 생성을 넘어 음악적 이해를 보여주는 발전
한국 영향
- Lyria 3 Pro 한국어 가사 지원 여부
- 음악 저작권 관련 국내 법적 이슈
WebGPU로 24B 파라미터 모델 브라우저 내 50 tok/s 실행 — 로컬 AI 새 이정표
주요 사건
Xenova(HuggingFace)가 WebGPU를 활용해 24B 파라미터 모델을 웹 브라우저에서 약 50 tok/s로 실행하는 데모를 공개했다. M4 Mac에서 구동. 서버 없이 브라우저만으로 대형 AI 모델을 돌릴 수 있음을 증명.
배경
- 2023-04-01Chrome WebGPU 지원 시작
- 2025-01-01브라우저 내 7B 모델 실행 달성
- 2026-03-2524B 모델 50 tok/s 브라우저 실행 데모
주요 입장
전망
- · AK: 'WebGPU is INSANE!' — M4에서 24B 모델이 50 tok/s는 놀라운 성능
한국 영향
- 크로스 브라우저 WebGPU 지원 현황
- 양자화 모델 한국어 성능
SemiAnalysis GTC 해커톤 — 296명, 18,432 B200 GPU 시간, $180K 크레딧 투입
주요 사건
SemiAnalysis가 FluidStack과 공동으로 GTC 기간 'From Silicon to Scale' 해커톤을 개최. 296명 참가, 18,432 B200 GPU 시간, $180K 크레딧(OpenAI, Cursor, Windsurf 등 후원). 우수작: 6.2x 레이턴시 감소 음성 에이전트, torch.compile 커스텀 CUDA 커널 주입, 2.2B VLA 로봇 정책 등. NVIDIA DGX Spark가 대상.
배경
- 2026-03-23GTC 2026 주간 시작
- 2026-03-25해커톤 결과 발표
주요 입장
전망
- · SemiAnalysis: 'GTC 주간은 이렇게 느껴져야 한다'
- · 특히 6.2x 레이턴시 감소(음성 에이전트)와 torch.compile 커널 주입 프로젝트가 실용적 가치 높음
한국 영향
- 한국 GTC 행사 계획
- 국내 AI 해커톤 GPU 인프라 수준