AMD MI355, Blackwell 추론 성능 추월 — OpenAI 내부 코딩 에이전트 정렬 모니터링 시스템 공개, GPT-5.4 mini/nano 출시, xAI Grok 4.20 Heavy 멀티에이전트, 한국 메모리 반도체 '마진 전쟁' 돌입
- AMD MI355 FP8 ROCm SGLang 비집계 추론에서 NVIDIA Blackwell 성능 추월 — GPU 추론 경쟁 격화
- OpenAI, GPT-5.4 Thinking으로 내부 코딩 에이전트 99.9% 모니터링하는 정렬 감시 시스템 공개
- OpenAI GPT-5.4 mini·nano 출시 — 코딩·서브에이전트·컴퓨터 사용 최적화, 2배 빠른 속도
- xAI Grok 4.20 Heavy 공개 — 4개(최대 16개) 독립 에이전트가 토론 후 최적 답변 도출
- Meta V-JEPA 2.1 공개 — 비디오 자기지도학습 밀집 특징, 로봇 그래스핑 20%p 향상
- Jeff Bezos, $1000억 제조업 AI 전환 펀드 조성 논의 (Project Prometheus)
- Cloudflare CEO: 2027년까지 AI 봇 트래픽이 인간 트래픽 추월 전망
- 삼성·SK하이닉스, 메모리 가격 130-180% 급등 — 시장점유율에서 마진 경쟁으로 패러다임 전환
- Anthropic, 8만명 대상 AI 인식 대규모 정성조사 결과 공개
- GitHub, AI 생성 슬롭 PR로 오픈소스 레포 운영 불능 수준 — Hugging Face CEO 경고
AMD MI355 FP8, SGLang 비집계 추론에서 NVIDIA Blackwell 성능 추월
주요 사건
AMD의 차세대 데이터센터 GPU MI355가 FP8 정밀도에서 ROCm 소프트웨어 스택과 SGLang 비집계 서빙 프레임워크를 사용해 NVIDIA Blackwell GPU의 추론 성능을 넘어섰다. 10x AMD 중국 엔지니어링 팀이 주도한 성과로, AMD가 AI 추론 시장에서 NVIDIA에 대한 실질적 대안이 되고 있음을 보여준다.
배경
- 2023-12-01AMD MI300X 출시
- 2024-03-01NVIDIA B200 Blackwell 발표
- 2025-06-01AMD MI350 시리즈 발표
- 2026-03-19MI355 FP8 SGLang 비집계 추론에서 Blackwell 추월 확인
주요 입장
전망
- · SemiAnalysis: AMD 중국 팀의 엔지니어링 역량이 핵심 차별화 요인
- · 업계: SGLang 비집계 서빙이 차세대 추론 아키텍처의 표준이 될 가능성
한국 영향
- AMD MI355 국내 클라우드 도입 현황
- ROCm 국내 개발자 생태계 성장
OpenAI, 내부 코딩 에이전트 99.9% 정렬 모니터링 시스템 공개
주요 사건
OpenAI가 내부에서 사용하는 코딩 에이전트의 정렬(alignment) 상태를 모니터링하는 시스템을 공개했다. GPT-5.4 Thinking을 최대 추론 강도로 활용해 에이전트의 행동과 내부 추론을 실시간 감시하며, 사용자 의도와 불일치하거나 보안/규정 위반 가능성이 있는 행동을 탐지한다. 내부 코딩 트래픽의 99.9%를 커버한다.
배경
- 2025-01-01OpenAI 내부 코딩 에이전트 본격 배포
- 2025-06-01에이전트 자율성 확대에 따른 정렬 모니터링 필요성 대두
- 2026-03-19내부 모니터링 시스템 공개, 99.9% 커버리지
주요 입장
전망
- · 에이전트 정렬 모니터링은 '에이전트 시대'의 핵심 안전 인프라
- · 내부 배포 환경이 가장 위험한 테스트베드
한국 영향
- 국내 AI 안전 가이드라인에 에이전트 모니터링 포함 여부
OpenAI GPT-5.4 mini·nano 출시 — 코딩·서브에이전트 최적화, 2배 빠른 속도
주요 사건
OpenAI가 GPT-5.4 mini와 nano를 출시했다. mini는 GPT-5 mini 대비 SWE-Bench Pro 45.7%→54.4%, 속도 2배 이상 향상. nano는 최저 비용/최고 속도 모델로 분류·추출·코딩 서브에이전트용. GPT-5.4 API는 출시 1주 만에 일 5조 토큰, 연간 $10억 순신규 매출 달성.
배경
- 2026-03-07GPT-5.4 출시, Codex Security 프리뷰
- 2026-03-17GPT-5.4 mini/nano 출시
- 2026-03-19GPT-5.4 API 일 5T 토큰, 연 $10억 순신규 매출 달성
주요 입장
전망
- · Sam Altman: 5.3→5.4 업그레이드에서 '인간성'이 가장 큰 차별화
- · API 1주 5T 토큰은 1년 전 전체 API 볼륨을 초과
한국 영향
- GPT-5.4 mini 한국어 성능 벤치마크
- 국내 스타트업 채택 현황
xAI Grok 4.20 Heavy — 4~16개 에이전트 토론 기반 멀티에이전트 아키텍처
주요 사건
xAI가 Grok 4.20 Heavy를 공개했다. 4개 독립 에이전트가 질문을 분석하고 서로 토론한 후 최적 답변을 도출하는 멀티에이전트 아키텍처. 최대 16개 전문 에이전트가 협력하며, 실시간 X 데이터 파이프라인과 결합된다.
배경
- 2025-09-01Colossus 2 기가와트 데이터센터 가동
- 2026-02-01Grok 4.20 멀티에이전트 출시
- 2026-03-19Grok 4.20 Heavy 프로모션 강화
주요 입장
전망
- · eWeek: 토론 기반 접근이 환각(hallucination) 감소에 효과적일 수 있음
한국 영향
- 멀티에이전트 vs 단일 모델 성능 비교 벤치마크
Meta V-JEPA 2.1 — 비디오 자기지도학습 밀집 특징 모델, 로봇 그래스핑 20%p 향상
주요 사건
Meta가 V-JEPA 2.1을 공개했다. 비디오 자기지도학습 모델로, 밀집 예측 손실, 심층 자기지도, 멀티모달 토크나이저를 결합해 이미지·비디오의 고품질 시각 표현을 학습한다. Ego4D 7.71 mAP, EPIC-KITCHENS 40.8 Recall@5 달성. 실제 로봇 그래스핑 성공률이 V-JEPA 2 대비 20%p 향상.
배경
- 2024-02-01V-JEPA 최초 공개
- 2025-06-01V-JEPA 2 출시
- 2026-03-15V-JEPA 2.1 논문 공개(arXiv)
주요 입장
전망
- · 논문: 밀집 특징과 글로벌 이해를 동시에 달성한 최초의 비디오 SSL 모델
한국 영향
- V-JEPA 2.1 오픈소스 공개 여부
- 국내 로봇 비전 벤치마크 적용
Jeff Bezos, $1000억 AI 제조업 전환 펀드 조성 논의 — Project Prometheus 확장
주요 사건
Jeff Bezos가 $1000억 규모의 펀드를 조성해 제조업 기업을 인수하고 AI로 자동화를 가속화하는 계획을 논의 중이다. 반도체, 방위, 항공우주 등 주요 산업을 타겟. 중동 국부펀드와 글로벌 자산운용사들과 협의 중. 별도로 Project Prometheus는 $62억을 조달한 바 있다.
배경
- 2025-01-01Project Prometheus 설립 보도 (NYT)
- 2025-12-01Project Prometheus $62억 조달 (FT)
- 2026-03-19$1000억 제조업 인수 펀드 논의 보도 (WSJ)
주요 입장
전망
- · WSJ: 규모와 야심 면에서 전례 없는 제조업 AI 투자
한국 영향
- Project Prometheus의 반도체 제조 진출 구체화 여부
- 한국 제조업 AI 전환 정책
Cloudflare CEO: 2027년까지 AI 봇 트래픽이 인간 트래픽 추월할 것
주요 사건
Cloudflare CEO Matthew Prince가 SXSW에서 2027년까지 AI 봇 트래픽이 인간 트래픽을 초과할 것이라 전망했다. AI 에이전트가 인간보다 1000배 많은 사이트를 방문하기 때문. GenAI 이전에는 웹 트래픽의 20%만 봇이었으나 급증 중.
배경
- 2023-01-01GenAI 등장으로 봇 트래픽 증가 시작
- 2026-03-19Cloudflare CEO, 2027년 봇 > 인간 트래픽 전망
주요 입장
전망
- · Prince: 에이전트용 즉석 샌드박스 인프라가 미래의 핵심
한국 영향
- 국내 주요 포털/서비스의 봇 트래픽 비중 변화
삼성·SK하이닉스, 메모리 가격 130-180% 급등 — 마진 경쟁 시대 돌입
주요 사건
SemiAnalysis가 한국 메모리 반도체 기업들의 호실적을 조명. Counterpoint Research에 따르면 1분기 메모리 가격이 전분기 대비 130-180% 급등, 예상(~100%)을 크게 상회. 구조적 공급 부족은 2027년 하반기까지 지속 전망. 삼성·SK하이닉스는 시장점유율 경쟁에서 마진 극대화 경쟁으로 전환.
배경
- 2025-01-01AI 메모리 수요 본격 급증
- 2026-01-01설 연휴 후 하이퍼스케일러 메모리 확보 경쟁 심화
- 2026-03-12Counterpoint: 1분기 130-180% 가격 상승 확인
주요 입장
전망
- · Counterpoint 황민성: NVIDIA 메모리 구매량이 Apple의 3배, 시장 구조 근본 변화
한국 영향
- HBM4 양산 일정
- 메모리 가격 하반기 전망
- 삼성 vs SK하이닉스 마진 격차
Anthropic, 8만명 AI 인식 대규모 정성조사 결과 공개
주요 사건
Anthropic이 'Anthropic Interviewer'를 통해 80,508명의 Claude 사용자를 대상으로 AI에 대한 기대, 꿈, 우려를 1주간 수집한 사상 최대 규모의 정성(qualitative) 조사 결과를 공개했다. 설문이 잡지 못하는 질감(texture)을 포착하는 것이 목표.
배경
- 2026-03-11Anthropic Institute 설립 발표
- 2026-03-1880,508명 AI 인식 정성조사 결과 공개
주요 입장
전망
- · Anthropic: 설문이 잡지 못하는 질감을 포착, AI의 기회와 위험에 대한 사람들의 경험을 상세히 보여줌
한국 영향
- 한국 사용자 비중 및 주요 의견
- 국내 AI 인식 조사 현황
참고 자료
AI 슬롭 PR이 GitHub 오픈소스 레포를 마비시키고 있다 — HuggingFace CEO 경고
주요 사건
HuggingFace CEO Clement Delangue가 자사의 주요 오픈소스 레포지토리들이 AI가 생성한 저품질 PR(Pull Request)로 인해 '사실상 사용 불능' 상태가 되고 있다고 경고했다. 거의 매 시간 새로운 AI 슬롭 PR이 제출되고 있다.
배경
- 2025-06-01AI 코딩 도구 대중화 본격화
- 2026-03-19HuggingFace CEO, AI 슬롭 PR 위기 경고
주요 입장
전망
- · Clement Delangue: '사실상 GitHub이 사용 불능해지고 있다'
한국 영향
- 국내 주요 오픈소스 프로젝트의 AI PR 비율
SemiAnalysis: AI 디플레이션은 고소득층에 더 유리 — 소비 구조별 불평등 분석
주요 사건
SemiAnalysis가 Felten et al.의 AI 노출 점수를 BLS 소득분위별 소비 데이터에 매핑한 결과, 상위 20%(Q5) 가구의 소비 바스켓이 하위 20%(Q1)보다 29% 더 AI 비용 절감에 노출되어 있다고 분석. 10% 비용 절감 시 Q5는 연 $2,325(1.5%), Q1은 $346(1.0%) 절약. 핵심 메커니즘은 금융서비스(Q5 예산의 17.7% vs Q1의 2.1%).
배경
- 2026-03-19SemiAnalysis AI 디플레이션 분배 분석 공개
주요 입장
전망
- · SemiAnalysis: 금융서비스 AI화가 분배 문제의 핵심 메커니즘
한국 영향
- 한국 소득분위별 AI 노출도 분석
- 의료 AI 도입에 따른 분배 효과
Karpathy, 최초 DGX Station GB300 수령 — Dobby AI 개발에 활용 예정
주요 사건
Andrej Karpathy가 NVIDIA로부터 최초의 DGX Station GB300(Dell Pro Max with GB300)을 받았다. Jensen Huang이 직접 선물한 것으로, 20암페어 전력이 필요한 하이엔드 개인용 AI 워크스테이션. Karpathy는 자신의 오픈소스 프로젝트 'Dobby the House Elf'(자유로운 AI 모델) 개발 등에 활용할 예정.
배경
- 2026-03-16GTC 2026 키노트, Jensen Huang이 Karpathy/SemiAnalysis 언급
- 2026-03-18Karpathy, 최초 DGX Station GB300 수령
주요 입장
전망
- · Karpathy: autoresearch가 첫 시도에서 11% 학습 시간 단축, GB300에서 더 큰 규모 실험 기대
한국 영향
- DGX Station GB300 가격 및 국내 출시 일정
Anthropic·AWS·Google 등, Linux Foundation에 $1250만 오픈소스 보안 펀딩
주요 사건
Anthropic, AWS, GitHub, Google, DeepMind, Microsoft, OpenAI가 Linux Foundation(AlphaOmega/OpenSSF)에 $1250만을 공동 투자해 오픈소스 소프트웨어의 보안을 강화한다. AI가 오픈소스에 점점 더 의존함에 따라 기반 인프라 보안이 중요해지고 있다.
배경
- 2021-12-01Log4j 취약점으로 오픈소스 보안 위기
- 2026-03-17AI 빅테크 7개사 Linux Foundation $1250만 공동 투자
주요 입장
전망
- · Anthropic: AI가 더 강력해질수록 오픈소스 보안이 더 중요해진다
한국 영향
- 국내 오픈소스 보안 투자 현황
- AI 기반 보안 감사 도구 도입