AI 경쟁, 모델 성능에서 추론속도·데이터·전력·보안 병목으로 이동한다
- OpenAI·Cerebras 750MW 추론 계약과 Codex 무료 전환전이 AI의 새 전장을 속도·업무당 비용으로 옮긴다
- OSAT·ROCm·가스터빈 논란은 AI 인프라 병목이 칩 성능보다 패키징·소프트웨어·전력 인허가로 넓어졌음을 보여준다
- Notion·Edge·Origin Lab·LeCun 흐름은 에이전트가 협업툴·브라우저·게임데이터·세계모델을 흡수하는 단계에 들어섰다는 신호다
- MIT TR 개인정보 노출과 swyx의 API 키 경고는 에이전트 확산의 선결조건이 프라이버시·시크릿 격리임을 확인시킨다
OpenAI·Cerebras, 750MW 추론 계약으로 ‘빠른 토큰’ 시장을 연다
주요 사건
SemiAnalysis가 Cerebras의 OpenAI·AWS 파트너십, 토큰경제, WSE 아키텍처와 데이터센터 로드맵을 분석했다. 핵심은 대형 GPU 배치보다 낮은 지연시간 추론에 최적화된 wafer-scale 시스템이 별도 시장으로 인정받기 시작했다는 점이다.
배경
- 2017-01-01OpenAI와 Cerebras가 초기 연구 교류를 시작
- 2026-05-13SemiAnalysis가 Cerebras의 OpenAI 750MW 계약과 토큰경제를 분석
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- Cerebras 실제 OpenAI 배치 속도
- GPU 대비 토큰당 비용과 지연시간 벤치마크
- 전력 인허가 병목
OpenAI, 기업 Codex 전환에 2개월 무료 사용권을 걸고 개발자 시장을 압박한다
주요 사건
Sam Altman과 OpenAI가 기업 고객에게 Codex 전환 시 30일간 신청 가능한 2개월 무료 사용권을 제시했다. OpenAI는 Codex를 AI 코딩의 업무 표준으로 밀어붙이고 있다.
배경
- 2026-04-02OpenAI가 팀용 Codex 종량제 가격을 발표
- 2026-05-13Altman이 기업 전환 2개월 무료 사용권을 공지
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- Codex 실제 기업 전환율
- Claude Code와의 비용/성능 비교
- 국내 망분리 환경 지원
SemiAnalysis, OSAT가 AI 패키징 병목의 핵심 수혜자로 부상한다고 지목한다
주요 사건
SemiAnalysis가 Amkor와 ASE 같은 OSAT가 더 이상 ‘지루한’ 후공정 업체가 아니라 AI 칩 성능과 공급을 좌우하는 핵심 인프라로 바뀌고 있다고 평가했다.
배경
- 2024-12-01Amkor가 미국 첨단 패키징 시설 보조금 4.07억달러를 확보
- 2026-05-13SemiAnalysis가 OSAT 재평가 논리를 제시
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- CoWoS 외주 비중
- HBM-패키징 턴키 수주
- 미국 내 패키징 보조금
AMD, MI355X 클러스터를 vLLM·SGLang 유지관리자에 열어 ROCm 생태계를 키운다
주요 사건
SemiAnalysis는 AMD가 360만달러 규모 MI355X 상호연결 개발 클러스터를 vLLM·SGLang 오픈소스 유지관리자에게 지속 제공하기 시작했다고 평가했다. Nvidia가 CUDA 생태계를 키운 방식과 유사한 플라이휠 전략이다.
배경
- 2026-02-16InferenceX가 MI355X SGLang 성능 개선과 vLLM CI 부족을 지적
- 2026-05-13SemiAnalysis가 AMD의 MI355X 클러스터 제공을 플라이휠 전환점으로 평가
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- vLLM MI355X CI 통과율
- SGLang MoRI 성능
- AMD GPU 클라우드 가격 할인폭
xAI, 콜로서스 전력용 가스터빈 46기 논란으로 AI 데이터센터 규제 리스크를 키운다
주요 사건
TechCrunch는 xAI가 미시시피 데이터센터 전력 공급을 위해 약 46기의 천연가스 터빈을 운용 중이며, ‘이동식’ 장비라는 이유로 규제 공백을 활용한다는 소송 논란을 보도했다.
배경
- 2025-08-01미시시피가 일부 xAI 터빈을 임시·이동식으로 허용
- 2026-05-13TechCrunch가 xAI의 46기 터빈 운용 논란을 보도
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- xAI 소송 결과
- AI 데이터센터 전력 PPA 구조
- 국내 데이터센터 전력망 접속 대기
Notion, AI 에이전트 허브로 워크스페이스를 재편하며 업무 자동화 플랫폼 경쟁에 뛰어든다
주요 사건
TechCrunch는 Notion이 워크스페이스를 AI 에이전트 허브로 바꾸는 개발자 플랫폼을 내놨다고 보도했다. Notion은 문서·DB·Slack·메일·캘린더·MCP 연동을 에이전트 실행 환경으로 묶고 있다.
배경
- 2026-02-24Notion이 Custom Agents를 공개 베타로 출시
- 2026-05-13TechCrunch가 Notion의 에이전트 허브화를 보도
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- Notion Credits 단가와 실제 사용량
- MCP 권한 사고 사례
- 국내 협업툴의 에이전트 대응
Origin Lab, 800만달러를 조달해 게임 데이터를 세계모델 훈련시장에 연결한다
주요 사건
Origin Lab이 Lightspeed 주도로 800만달러 시드 투자를 유치해 게임사가 보유한 3D 자산·플레이 영상을 세계모델 개발사에 판매하는 데이터 마켓플레이스를 만들고 있다.
배경
- 2024-12-01Sora의 게임·스트리밍 데이터 학습 논란이 부상
- 2026-05-13Origin Lab이 800만달러 시드 라운드를 발표
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- Origin Lab 데이터 품질 벤치마크
- 게임 IP 라이선스 조건
- 국내 게임사 AI 데이터 사업화
LeCun, LLM 에이전트의 신뢰성 한계를 지적하며 세계모델 경쟁을 재점화한다
주요 사건
Yann LeCun이 ‘신뢰 가능한 에이전트 시스템에는 세계모델이 필요하다’는 주장을 재확산했다. 최근 인터뷰와 강연에서 그는 LLM이 행동 결과를 예측하는 내부 모델을 갖지 못한다고 비판했다.
배경
- 2018-03-01월드모델 논문들이 비디오게임 기반 예측·계획 가능성을 보여줌
- 2026-05-13LeCun의 세계모델 발언이 X에서 재확산
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- AMI Labs 연구 공개
- 세계모델 벤치마크
- 국내 로봇 데이터셋 구축
MIT TR, AI 챗봇의 실제 전화번호 노출 사례가 개인정보 규제 공백을 드러낸다고 보도한다
주요 사건
MIT Technology Review는 Gemini 등 AI 챗봇이 실제 개인 전화번호를 잘못된 고객센터 번호처럼 제시한 사례들을 보도했다. DeleteMe는 생성AI 관련 개인정보 삭제 문의가 7개월간 400% 늘었다고 밝혔다.
배경
- 2025-07-18MIT TR이 대형 학습 데이터셋의 개인정보 포함 문제를 보도
- 2026-05-13AI 챗봇 전화번호 노출 사례와 DeleteMe 400% 증가 수치가 보도
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- 국내 개인정보위 가이드라인
- AI 검색 PII 출력 테스트
- 학습데이터 삭제권 집행 사례
Microsoft Edge, 모든 열린 탭을 읽는 Copilot 기능으로 AI 브라우저 경쟁을 강화한다
주요 사건
The Verge는 Microsoft Edge가 Copilot이 사용자의 열린 탭 전체 정보를 읽고 비교·요약·질문응답을 수행하는 기능을 추가한다고 보도했다. 모바일에서는 화면 공유 기반 질의도 강화된다.
배경
- 2025-10-23Microsoft가 Edge Copilot Mode의 다중탭·브라우징 맥락 기능을 소개
- 2026-05-13The Verge가 Edge의 열린 탭 Copilot 업데이트를 보도
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- Edge 정책관리 템플릿
- Copilot 탭 접근 기본값
- Chrome Gemini 대응
swyx, AI 에이전트 시대의 API 키 노출 위험을 다시 환기한다
주요 사건
swyx가 API 키와 프롬프트 인젝션을 둘러싼 농담성 게시물을 인용하며, AI 도구가 환경변수와 비밀정보를 다루는 방식의 위험을 지적했다. 최근 보안 연구들은 Claude Code, Gemini CLI, Copilot Agent류가 프롬프트 인젝션으로 비밀정보를 노출할 수 있음을 보여줬다.
배경
- 2026-04-16대형 AI 에이전트의 API 키 유출 프롬프트 인젝션 연구가 보도
- 2026-05-13swyx가 에이전트 API 키 노출 문제를 재언급
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- 에이전트 런타임 시크릿 스캔
- MCP 설정 파일 노출
- PR 기반 프롬프트 인젝션 테스트
Sam Altman, 모델 선택 기준을 지능보다 속도·가격 조합으로 옮겨야 한다고 시사한다
주요 사건
Sam Altman은 가장 똑똑한 모델을 쓰지 않으면 불안하지만 느린 경우도 감수한다며, 가격/지능보다 가격/속도 트레이드오프를 더 중시해야 할지 묻는 글을 올렸다. 이는 AI 상품화의 축이 벤치마크 최고점에서 응답속도와 비용으로 이동한다는 신호다.
배경
- 2026-04-19Altman이 hard problem 추론비용 1000배 하락을 언급
- 2026-05-13Altman이 가격/속도 트레이드오프를 공개 질문
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- 모델별 업무당 비용
- 추론 지연시간 SLA
- 국내 NPU 실서비스 벤치마크
AMD, Ryzen PRO 9000에 3D V-Cache를 넣어 워크스테이션 AI·시뮬레이션 시장을 겨냥한다
주요 사건
AMD가 Ryzen PRO 9000 워크스테이션 라인에 처음으로 3D V-Cache를 적용한다. 신제품은 Zen 5 기반, 6~16코어, 12~32스레드, 최대 256GB ECC DDR5, PCIe 5.0을 지원하며 하반기 OEM 출시가 예고됐다.
배경
- 2024-11-06Ryzen 7 9800X3D가 게임용 캐시 성능을 검증
- 2026-05-13AMD Ryzen PRO 9000 3D V-Cache 워크스테이션 라인이 보도
주요 입장
전망
- · SemiAnalysis·TechCrunch·MIT Technology Review 등은 AI 병목이 모델 성능에서 추론속도·데이터·전력·보안으로 이동한다고 본다.
- · LeCun 계열 연구자들은 LLM 단독 에이전트보다 세계모델·검증 가능한 도구 결합이 장기 신뢰성을 좌우한다고 주장한다.
한국 영향
- Lenovo ThinkStation P4 출시
- 3D V-Cache 워크로드 벤치마크
- 국내 OEM 공급 일정