AI칩 통제와 에이전트 제품 경쟁이 같은 날 가속했다
- 미국은 AI칩 우회수출 단속을 신고자 포상제로 강화하려 한다
- Perplexity·xAI·Apple은 에이전트와 AI 인터페이스를 Slack·터미널·Siri로 확장한다
- MLSys 연구는 장문맥·MoE 병목을 GPU 증설이 아닌 시스템 최적화로 줄인다
- OpenAI 재판과 AI 졸업식 반발은 기술 성능보다 신뢰·고용 불안이 커졌음을 보여준다
미 의회, AI칩 밀수 신고자에게 벌금 10~30% 포상 추진
주요 사건
SemiAnalysis가 미국의 ‘Stop Stealing our Chips Act’를 지목했다. 법안은 첨단 AI칩 수출통제 위반을 신고한 내부자에게 위반 벌금의 10~30%를 포상하는 제도를 만들자는 내용이다.
배경
- 2022-10-07미 상무부, 대중 첨단 AI칩 수출통제 시작
- 2026-05-17SemiAnalysis가 신고자 포상 조항과 10~30% 포상 범위를 소개
주요 입장
전망
- · Lawfare는 수출통제 신고자 인센티브가 기존 금융범죄 포상 모델을 기술안보에 적용하는 방식이라고 평가했다
- · SemiAnalysis는 위반 벌금의 10~30% 포상 구조가 리셀러 시장에 직접 압박을 줄 수 있다고 봤다
한국 영향
- 법안 통과 여부와 포상 재원
- 말레이시아·싱가포르 경유 거래 단속 사례
- HBM·패키징 장비까지 적용 범위 확대 여부
참고 자료
Perplexity 슬랙 에이전트, SemiAnalysis 사용량 일부를 Claude서 빼앗다
주요 사건
SemiAnalysis는 여러 AI 도구를 시험한 결과 Perplexity Computer의 기업용 Slack 통합이 Claude보다 ‘충격적으로’ 낫다고 평가했다. 이미지 입력, 리서치 리포트, 시각화를 Slack 안에서 반환하는 점이 핵심이다.
배경
- 2026-04-01Perplexity, Computer in Slack 공개
- 2026-05-17SemiAnalysis가 Claude 중심 토큰 예산 일부가 Perplexity로 이동할 수 있다고 언급
주요 입장
전망
- · Perplexity는 Computer가 400개 이상 커넥터를 오케스트레이션한다고 설명한다
- · SemiAnalysis는 자사 토큰 예산의 96% 이상이 Anthropic에 가지만 일부 이동 가능성을 언급했다
한국 영향
- Slack/Teams 에이전트 권한 모델
- Perplexity Computer 기업 레퍼런스
- Claude·ChatGPT 협업툴 통합 속도
참고 자료
MLSys 2026, 장문맥 학습 병목을 ‘어텐션 분리’로 1.9배 줄이다
주요 사건
SemiAnalysis가 MLSys 2026에서 주목할 연구로 Core Attention Disaggregation(CAD)을 꼽았다. CAD는 장문맥 LLM 학습에서 파라미터 없는 핵심 어텐션 계산을 별도 장치 풀로 분리해 GPU 부하 불균형을 줄인다.
배경
- 2017-06-01Transformer 논문 발표
- 2026-05-17SemiAnalysis가 MLSys 2026 CAD 연구를 장문맥 시스템 최적화 사례로 소개
주요 입장
전망
- · MLSys 논문은 DistCA가 512 H200 GPU와 512K context에서 Megatron-LM 대비 최대 1.9배 처리량을 냈다고 보고했다
- · SemiAnalysis는 workload별 전용 리소스 배분이 AI 시스템 최적화의 주요 흐름이라고 평가했다
한국 영향
- DistCA 공개 코드 성숙도
- Megatron-LM 통합 여부
- 512K 이상 컨텍스트 학습 비용 변화
참고 자료
MoE 서빙 연구 CRAFT, 전문가 복제 낭비 줄여 처리량 최대 1.2배 높이다
주요 사건
SemiAnalysis는 MLSys 2026 논문 CRAFT를 소개하며, 대규모 MoE 모델 서빙에서 expert balancing과 replication이 실제 운영 병목이라고 지적했다.
배경
- 2024-01-01오픈 MoE 모델 확산
- 2026-05-17SemiAnalysis가 CRAFT를 생산 서빙 병목 해결 사례로 소개
주요 입장
전망
- · CRAFT 논문은 기존 복제 기법 대비 평균 1.14배, 최대 1.2배 end-to-end serving throughput 개선을 보고했다
- · SemiAnalysis는 MoE expert balancing이 대규모 생산 시스템에서 덜 공개된 핵심 문제라고 평가했다
한국 영향
- CRAFT의 vLLM/SGLang 통합
- DeepSeek류 MoE API 단가
- HBM 용량 대비 expert replica 정책
참고 자료
xAI, Grok Build 베타에 병렬 서브에이전트와 자동화 기능을 밀어넣다
주요 사건
일론 머스크는 Grok 자동화 기능이 곧 온다고 언급했고, 같은 날 Grok Build의 긴 실행·서브에이전트 기능 관련 글을 리포스트했다. xAI는 5월 14일 Grok Build 초기 베타를 SuperGrok Heavy 사용자에게 공개했다.
배경
- 2026-05-14xAI, Grok Build Early Beta 공개
- 2026-05-17머스크가 Grok Build 개선과 자동화 기능을 잇달아 홍보
주요 입장
전망
- · xAI는 Grok Build가 AGENTS.md, plugins, hooks, skills, MCP 서버를 지원한다고 밝혔다
- · 외부 보도는 Grok Build의 ACP 지원과 병렬 서브에이전트를 Codex·Claude Code와의 직접 경쟁 신호로 봤다
한국 영향
- Grok Build 기업 요금제
- 코드 보안·데이터 보존 정책
- 벤치마크와 실제 PR 성공률
DeepSeek V4-Flash, RTX Pro 6000 한 장 구동 가능성이 다시 주목받다
주요 사건
AI 논문·모델 큐레이터 AK가 ‘DeepSeek V4 Flash on a single RTX Pro 6000?’ 글을 리포스트했다. 배경은 284B total/13B active MoE 모델을 96GB급 단일 GPU에 양자화로 올릴 수 있는지에 대한 관심이다.
배경
- 2026-04-24DeepSeek V4-Pro·V4-Flash 공개 보도
- 2026-05-17AK가 단일 RTX Pro 6000 구동 가능성을 리포스트
주요 입장
전망
- · Compute Market은 V4-Flash가 284B total, 약 13B active이며 RTX Pro 6000 96GB에서 Q4_K_M 기준 45~60 tokens/s 가능성을 제시했다
- · 커뮤니티 논의는 1M context 구동에는 8-bit KV와 부분 오프로딩 같은 메모리 관리가 필요하다고 본다
한국 영향
- 실측 tokens/s와 품질 저하
- RTX Pro 6000 국내 가격
- 상업 사용 라이선스와 모델 안전성
르쿤, 오픈 프런티어 AI 해법으로 Project Tapestry를 재부상시키다
주요 사건
Yann LeCun은 ‘미국의 credible open frontier player가 필요하다’는 논의에 Project Tapestry가 해법이라고 답했다. Tapestry는 AI Alliance의 분산·주권형 오픈 프런티어 모델 개발 프로젝트다.
배경
- 2026-04-16AI Alliance, Project Tapestry와 LeCun 수석과학자 합류 발표
- 2026-05-17LeCun이 open frontier 논쟁에서 Tapestry를 재강조
주요 입장
전망
- · AI Alliance는 Tapestry를 글로벌 federated training을 가능하게 하는 오픈소스 플랫폼으로 설명한다
- · LeCun은 foundation model이 문화적 다양성과 주권을 위해 열려 있어야 한다고 주장했다
한국 영향
- Tapestry 기술 아키텍처 공개
- 참여 기관과 컴퓨트 규모
- 한국 연구기관 참여 여부
르쿤, 계층적 월드모델 일반 학습법을 12~18개월 내 전망하다
주요 사건
LeCun은 ‘1년~18개월 안에 계층적 월드모델을 훈련하는 일반 방법이 나올 것’이라는 발언이 담긴 게시물을 리포스트했다. LLM 중심 AGI 경로와 다른, JEPA·world model 계열의 연구 방향이다.
배경
- 2022-06-01LeCun, A Path Towards Autonomous Machine Intelligence 비전 제시
- 2026-05-17LeCun이 12~18개월 내 계층적 월드모델 학습법 전망을 리포스트
주요 입장
전망
- · Meta AI는 LeCun의 비전이 인간·동물처럼 관찰을 통해 세계 모델을 학습하는 방향이라고 설명한다
- · 최근 hierarchical planning with latent world models 연구는 추상 단계별 계획을 world model과 결합하려 한다
한국 영향
- JEPA 후속 모델
- 로봇 벤치마크 성능
- 비디오 생성모델과 planning 결합
참고 자료
Apple, iOS 27 Siri에 30일·1년 자동삭제 대화기록을 준비하다
주요 사건
TechCrunch와 The Verge는 Bloomberg 보도를 인용해 Apple의 새 Siri가 대화기록 자동삭제 옵션을 제공할 수 있다고 전했다. 30일, 1년, 영구 저장 선택지가 거론된다.
배경
- 2024-06-10Apple Intelligence 공개
- 2026-05-17Siri 자동삭제 대화기록 보도 확산
주요 입장
전망
- · 9to5Mac은 새 Siri 앱이 파일 업로드, 새 채팅/음성 대화, 범용 제스처를 포함할 수 있다고 보도했다
- · The Verge는 Apple이 경쟁사보다 프라이버시 메시지를 전면에 내세우려 한다고 봤다
한국 영향
- WWDC 2026 발표 내용
- Gemini 사용 여부와 데이터 처리 조건
- 한국어 Siri 성능 개선폭
참고 자료
Musk-Altman 재판, OpenAI 지배구조 신뢰성을 배심 판단대로 넘기다
주요 사건
TechCrunch는 Elon Musk와 OpenAI/Sam Altman 재판의 막판 쟁점이 ‘신뢰’로 모였다고 전했다. 배심은 OpenAI의 비영리 사명과 영리화 과정의 신뢰성을 판단하게 된다.
배경
- 2015-12-01OpenAI 비영리 출범
- 2026-05-17재판 막판 신뢰성과 지배구조 쟁점 보도
주요 입장
전망
- · MIT Technology Review는 Musk가 최대 1340억달러 손해배상과 구조 개편을 요구한다고 정리했다
- · 법학자들은 비영리 통제력이 실질적으로 작동하는지가 핵심 쟁점이라고 봤다
한국 영향
- 배심 권고와 판사 최종 판단
- OpenAI IPO 일정
- Microsoft·xAI 경쟁구도 변화
미 대학 졸업식서 AI 낙관론에 야유 — 채용 불안이 기술 담론을 압도하다
주요 사건
The Verge는 University of Arizona 졸업식에서 Eric Schmidt가 AI를 언급하자 학생들이 야유했다고 보도했다. AI가 졸업생 노동시장 불안을 상징하는 이슈가 됐다.
배경
- 2022-11-30ChatGPT 공개 후 지식노동 자동화 논쟁 확산
- 2026-05-17The Verge가 Schmidt 졸업식 야유 사건 보도
주요 입장
전망
- · The Verge는 졸업생들이 ‘기계가 오고 일자리가 사라진다’는 공포를 합리적 불안으로 받아들인다고 해석했다
- · TechCrunch도 2026년 졸업식에서 AI 언급이 반발을 부를 수 있다고 보도했다
한국 영향
- 신입 개발자 채용 규모
- 대학 AI 필수교육 커리큘럼
- 청년고용 정책의 AI 대응
참고 자료
Cerebras 25억달러 성과, 물리세계 투자 논리가 AI칩 붐과 맞물리다
주요 사건
TechCrunch는 Eclipse Ventures가 Cerebras 투자에서 약 25억달러 규모 성과를 거두며 ‘physical-world’ 투자 논리가 AI 인프라 붐과 맞물렸다고 보도했다.
배경
- 2016-01-01Eclipse 등 초기 투자자가 Cerebras에 투자
- 2026-05-17TechCrunch가 Eclipse의 Cerebras 성과와 physical-world thesis를 보도
주요 입장
전망
- · Crunchbase는 Cerebras가 첫 거래일 종가 기준 약 860억달러 가치로 평가됐다고 보도했다
- · TechCrunch는 Eclipse의 성과가 하드웨어와 산업기술 투자의 부활을 상징한다고 봤다
한국 영향
- Cerebras 상장 후 매출 지속성
- 국내 AI칩 고객 확보
- HBM·패키징 공급망 수혜