NVIDIA NVLink 6 448G SerDes 공개, AI 추론 마진 양극화 심화, SoftBank $40B 대출로 OpenAI IPO 신호탄
- NVIDIA Vera Rubin NVL72의 NVLink 6이 양방향 SerDes로 레인당 448G 달성 — 대역폭 2배
- SemiAnalysis: AI 추론은 commodity가 아닌 managed experience — 인터랙티비티 차별화로 60%+ 마진 가능
- AMD, vLLM에서 Kimi K2.5 1T 모델 인터랙티비티 18배 개선 (30일 만에)
- Google DeepMind, Gemini 3.1 Flash Live 출시 — 저지연 자연스러운 음성 AI
- SoftBank, JPMorgan/Goldman Sachs로부터 $40B 대출 확보 — OpenAI IPO 2026년 전망 강화
- Meta SAM 3.1 출시 — 오브젝트 멀티플렉싱으로 비디오 처리 대폭 개선
- LiteLLM PyPI 공급망 공격 — SSH 키·클라우드 자격증명 탈취, Karpathy 경고
- Meta TRIBE v2: 비디오·오디오·텍스트 3가지 모달리티로 뇌 fMRI 반응 예측하는 기초 모델
NVIDIA NVLink 6, 양방향 SerDes로 레인당 448Gbps 달성 — Vera Rubin NVL72 대역폭 2배 증가
주요 사건
NVIDIA의 차세대 Vera Rubin NVL72 플랫폼에 탑재될 NVLink 6.0이 기존 NVLink 5 대비 논리 GPU당 대역폭을 2배로 늘린다. 핵심은 보 레이트(baud rate)나 변조 방식을 바꾸지 않고, 동시 양방향(simultaneous bi-directional) SerDes를 사용해 하나의 차동 페어에서 448Gbps를 달성하는 것이다.
배경
- 2016-04-01NVLink 1.0 (P100), 레인당 20GB/s
- 2024-03-18NVLink 5.0 (Blackwell), 224G SerDes
- 2025-03-17Vera Rubin 아키텍처 발표 (GTC 2025)
- 2026-03-27NVLink 6.0 양방향 SerDes 448G 기술 상세 공개
주요 입장
전망
- · SemiAnalysis: 양방향 SerDes는 신호 무결성 측면에서 기술적 도전이나 NVIDIA가 이를 해결
- · 업계: 구리 기반 인터커넥트의 물리적 한계에 가까워지고 있어 차세대는 광학 전환 가능성
한국 영향
- HBM4-Vera Rubin 호환성 검증 일정
- 국내 클라우드(KT/네이버)의 차세대 GPU 도입 계획
참고 자료
SemiAnalysis: AI 추론은 commodity가 아니다 — 인터랙티비티가 60%+ 마진의 열쇠
주요 사건
SemiAnalysis가 AI 추론 마진 분석을 공개했다. Anthropic의 2024년 매출총이익률은 -94%, MiniMax는 -25%였지만, 인터랙티비티(응답 지연시간)를 차별화한 랩들은 60%+ 마진을 달성하고 있다. Moonshot은 공격적 배칭으로 비용을 줄였지만 사용자 이탈이 발생했고, DeepSeek도 같은 방식으로 점유율을 잃었다.
배경
- 2024-01-01Anthropic 매출총이익률 -94%
- 2025-06-01Moonshot 공격적 배칭 → 사용자 이탈
- 2026-03-27SemiAnalysis: 인터랙티비티 중심 마진 분석 공개
주요 입장
전망
- · SemiAnalysis: Speed is the moat — 추론 인터랙티비티가 진정한 해자
- · 업계: 2026년 말까지 추론 시장 $50B+ 전망
한국 영향
- 국내 LLM 서비스의 인터랙티비티 벤치마크 비교
- 추론 전용 칩(FuriosaAI 등) 경쟁력 재평가
AMD, vLLM에서 Kimi K2.5 1T MoE 모델 인터랙티비티 18배 개선 — 30일 만의 성과
주요 사건
AMD가 30일 만에 vLLM AITER 통합을 수정해 Kimi K2.5 1T MXFP4 모델의 인터랙티비티를 등처리량(iso-throughput) 기준 최대 18배 개선했다. 주요 변경은 MLA(Multi-head Latent Attention)에서 TP8의 num_head=8, TP4의 num_head=16을 지원하도록 수정한 것과 GEMM 튜닝이다. 모든 수정사항은 vLLM 0.18에 업스트림됐다.
배경
- 2025-01-01DeepSeek MLA 어텐션 메커니즘 공개
- 2026-02-25Kimi K2.5 1T MoE 모델 출시
- 2026-03-27AMD vLLM 최적화로 18x 인터랙티비티 개선 달성
주요 입장
전망
- · SemiAnalysis: Speed is the Moat — 추론 최적화가 경쟁력의 핵심
- · 업계: AMD의 소프트웨어 생태계 성숙이 가장 큰 변수
한국 영향
- MI400 출시 일정과 국내 가용성
- 국내 LLM 서비스의 AMD GPU 채택 여부
Google DeepMind, Gemini 3.1 Flash Live 출시 — 저지연·고정밀 음성 AI 모델
주요 사건
Google DeepMind가 Gemini 3.1 Flash Live를 출시했다. 이 모델은 더 자연스러운 대화, 향상된 함수 호출(function calling), 시끄러운 환경에서의 세부사항 이해, 긴 대화 추적 등을 제공한다. Gemini Live 및 Google Search Live에서 사용 가능하며, Google AI Studio에서 개발자 빌드 가능.
배경
- 2024-05-13GPT-4o Advanced Voice Mode 발표
- 2025-03-01Gemini 3.0 Flash Live 출시
- 2026-03-26Gemini 3.1 Flash Live 출시
주요 입장
전망
- · Google: 정밀도와 지연시간의 균형이 음성 AI의 핵심 과제
- · 업계: 2026년은 음성 AI의 '아이폰 모멘트'가 될 수 있다
한국 영향
- 한국어 지원 품질/정확도
- 국내 통신사 AI 어시스턴트 전략 변화
참고 자료
SoftBank, JPMorgan·Goldman Sachs로부터 $40B 대출 확보 — OpenAI IPO 2026년 시사
주요 사건
소프트뱅크 그룹이 JPMorgan과 Goldman Sachs로부터 12개월 무담보 대출로 $40B(약 58조원)을 확보했다. 이 자금은 OpenAI 투자 확대에 사용될 예정이며, TechCrunch는 이를 2026년 OpenAI IPO의 신호탄으로 분석했다.
배경
- 2025-01-21트럼프, Stargate $500B 프로젝트 발표
- 2026-03-07소프트뱅크 $40B 브릿지론 추진 보도
- 2026-03-27JPMorgan/Goldman Sachs 대출 공식 확보
주요 입장
전망
- · TechCrunch: $40B 브릿지론의 12개월 만기가 2026년 IPO 타임라인과 일치
- · 로이터: 소프트뱅크의 가장 공격적인 단일 투자 베팅
한국 영향
- OpenAI IPO 밸류에이션 범위
- 국내 AI 기업 IPO 파이프라인(뤼튼, 업스테이지 등)
참고 자료
Meta SAM 3.1 출시 — 오브젝트 멀티플렉싱으로 비디오 처리 성능 대폭 개선
주요 사건
Meta AI가 Segment Anything Model 3.1(SAM 3.1)을 출시했다. SAM 3의 드롭인 업데이트로, 핵심 개선은 'object multiplexing' 도입으로 비디오 처리 속도를 크게 향상시킨 것이다. 기존 SAM 3의 통합 감지/세그멘테이션/추적 능력을 유지하면서 효율성을 높였다.
배경
- 2023-04-05SAM 1 출시
- 2024-07-29SAM 2 출시 (비디오)
- 2025-11-19SAM 3 출시 (통합 모델)
- 2026-03-27SAM 3.1 출시 (오브젝트 멀티플렉싱)
주요 입장
전망
- · Meta AI: 오브젝트 멀티플렉싱이 비디오 세그멘테이션의 병목을 해결
- · CV 커뮤니티: SAM의 오픈소스 전략이 컴퓨터 비전 민주화의 핵심
한국 영향
- SAM 3.1의 한국 데이터 대상 성능 검증
- 국내 산업용 비디오 AI 스타트업 활용 사례
LiteLLM PyPI 공급망 공격 — AI 개발 생태계의 보안 경종
주요 사건
LiteLLM PyPI 패키지(v1.82.7~1.82.8)에 악성 코드가 주입돼 SSH 키, AWS/GCP/Azure 자격증명, Kubernetes 설정, 환경변수, 암호화폐 지갑 등을 원격 서버로 탈취하는 공급망 공격이 발생했다. 월 9,700만 다운로드인 LiteLLM을 의존하는 dspy 등 수많은 프로젝트가 영향권에 있었다. 공격자의 코드 버그로 RAM 과다 사용이 발생해 약 1시간 만에 발견됐다.
배경
- 2026-03-24LiteLLM v1.82.7-8 악성 버전 PyPI 등록
- 2026-03-24약 1시간 후 RAM 과다 사용으로 발견·신고
- 2026-03-24Karpathy 공급망 공격 경고 트윗
- 2026-03-25Trend Micro, Threat Landscape 등 상세 분석 공개
주요 입장
전망
- · Karpathy: 의존성은 벽돌이 아니라 지뢰밭, LLM으로 기능 yoink 권장
- · Trend Micro: AI 스택이 새로운 공격 벡터의 핵심 타깃
한국 영향
- 국내 AI 기업의 의존성 관리 현황
- KISA/과기정통부의 오픈소스 보안 가이드라인
참고 자료
Google DeepMind, 1만 명 대상 연구로 AI 조작 위험 매핑 — 금융 분야 취약
주요 사건
Google DeepMind가 1만 명을 대상으로 AI의 감정 착취·유해한 선택 조작 가능성을 연구한 결과를 공개했다. AI 조작은 도메인에 따라 크게 다르며, 금융 분야에서 높은 영향력을 보인 반면, 건강 분야에서는 기존 가드레일이 허위 의료 조언을 차단했다. 공포심 활용 등 '레드 플래그 전술'을 식별해 보호 장치 구축 방법론을 제시했다.
배경
- 2025-01-01AI persuasion 연구 본격화
- 2026-03-26DeepMind 1만 명 대상 AI 조작 연구 공개
주요 입장
전망
- · DeepMind: 도메인별 맞춤 보호가 일률적 규제보다 효과적
- · 업계: 건강 분야의 가드레일 성공 사례를 금융에 적용 필요
한국 영향
- 국내 AI 챗봇의 금융 조언 가이드라인 현황
- EU AI Act의 국내 적용 논의
참고 자료
OpenAI Stargate 미시간 현장 첫 철골 설치 — $500B 프로젝트 가시화
주요 사건
Sam Altman이 미시간 Stargate 현장에서 Oracle, Related Digital과 함께 첫 철골 빔 설치를 공개했다. 1GW+ 규모의 초대형 데이터센터 파크로, OpenAI의 $500B Stargate 프로젝트의 핵심 거점이다.
배경
- 2025-01-21Stargate $500B 프로젝트 발표
- 2025-10-30미시간 Saline 현장 발표
- 2026-02-11건설 교통 문제 보도
- 2026-03-27첫 철골 빔 설치
주요 입장
전망
- · Sam Altman: AI 인프라 투자는 수십 년의 가치를 창출할 것
- · 업계: 전력 공급이 AI 성장의 최대 제약 요인
한국 영향
- Stargate에 공급되는 한국산 HBM/DRAM 규모
- 국내 1GW급 AI 데이터센터 계획
참고 자료
Meta TRIBE v2: 비디오·오디오·텍스트로 뇌 fMRI 반응 예측하는 3중 모달 기초 모델
주요 사건
Meta AI가 TRIBE v2(TRImodal Brain Encoder)를 공개했다. 비디오, 오디오, 텍스트 세 가지 모달리티 자극에 대한 인간 뇌의 fMRI 반응을 예측하는 기초 모델이다. 뇌가 복잡한 자극을 어떻게 처리하는지 이해하기 위한 연구용 모델이다.
배경
- 2025-07-01TRIBE v1 논문 발표
- 2026-03-27TRIBE v2 공개 — 비디오+오디오+텍스트 3중 모달
주요 입장
전망
- · Meta AI: 3중 모달리티 통합이 뇌의 통합적 정보 처리 이해에 핵심
- · 업계: 뇌 인코딩 모델이 AR/VR UX 설계의 새로운 도구가 될 것
한국 영향
- 국내 fMRI 데이터셋과의 호환성
- 뇌-AI 인터페이스 관련 국가 R&D 방향
AI 코딩 슬롭 문제 심화 — OpenAI Triton에 AI 생성 무효 PR 머지
주요 사건
SemiAnalysis가 OSS 코드베이스에서 AI 코딩 에이전트의 '슬롭(slop)' 문제를 지적했다. OpenAI Triton 레포에 소비자 Blackwell GPU(TMEM 없는) 이슈를 수정한다는 PR #9734가 머지됐으나, 실제로는 문제를 해결하지 않는 것으로 밝혀졌다. NVIDIA PyTorch 기술 리드가 해당 PR을 'slop'이라 비판했다.
배경
- 2025-06-01AI 코딩 에이전트 OSS 기여 급증 시작
- 2026-03-26OpenAI Triton에 AI slop PR 머지 사건
주요 입장
전망
- · SemiAnalysis: 가치 있는 AI diff와 슬롭을 구분하기가 점점 어려워지고 있다
- · 업계: 코드 리뷰 자동화가 필수적 인프라로 부상
한국 영향
- 국내 기업의 AI 코딩 도구 도입 현황과 품질 관리 방안
중국 반도체 장비(WFE) 수입 둔화 시작 — 검사장비 가장 큰 타격
주요 사건
SemiAnalysis가 중국의 반도체 제조장비(WFE) 수입이 둔화되기 시작했다고 보고했다. 초기 데이터에서 검사장비(Inspection Equipment)가 가장 큰 타격을 받고 있다. 동시에 중국의 IC 수출은 사상 최고치를 경신 중이며, 메모리 IC가 주요 동인이다.
배경
- 2022-10-07미국 대중 반도체 수출 규제 1차
- 2025-01-01중국 WFE 비축 수입 정점
- 2026-03-27SemiAnalysis: 중국 WFE 수입 둔화 보고
주요 입장
전망
- · SemiAnalysis: 검사장비 둔화가 선행지표 — 전반적 둔화 예고
- · 업계: 중국 메모리 수출 ATH는 NAND 자급률 향상 반영
한국 영향
- 중국 YMTC/CXMT의 기술 수준과 수출 물량 추이
- 미국 규제의 한국 장비 기업 영향
NVIDIA Alpamayo 1.5 — 10B 파라미터 자율주행용 VLA 모델 커뮤니티 피드백 반영 업데이트
주요 사건
NVIDIA Drive가 Alpamayo 1.5를 발표했다. 10B 파라미터의 체인오브쏘트(chain-of-thought) 추론 VLA(Vision-Language-Action) 모델로, 커뮤니티 피드백을 반영한 업데이트다. 자율주행 차량의 시각 이해→언어 추론→행동 결정을 단일 모델로 통합한다.
배경
- 2026-03-03Alpamayo 1.0 GitHub 공개
- 2026-03-27Alpamayo 1.5 출시 — 커뮤니티 피드백 반영
주요 입장
전망
- · NVIDIA: VLA가 자율주행의 GPT 모멘트가 될 것
- · 업계: 10B 규모에서 실시간 추론 가능성이 상용화의 핵심
한국 영향
- 현대차의 NVIDIA Drive 플랫폼 채택 여부
- 국산 VLA 모델 개발 현황