AI 업계, 추론비용·상호작용·공급망 리스크를 동시에 좁힌다
- SemiAnalysis는 B200 추론 최적화가 GPU당 토큰 처리량을 7배 높인다고 제시한다
- Google DeepMind와 xAI는 마우스·음성 인터페이스로 AI 사용 방식을 넓힌다
- Anthropic과 Meta 사례는 AI 확산이 투자·플랫폼 거버넌스 논쟁으로 번진다는 신호다
SemiAnalysis, B200 추론 처리량 7배 개선 사례를 공개한다
주요 사건
SemiAnalysis는 여러 B200 8-GPU 서버를 RoCEv2, ConnectX-7, Tomahawk 스위치로 묶고 vLLM·NVIDIA Dynamo 기반 PD disaggregation을 적용하면 GPU당 토큰 처리량이 최대 7배 증가한다고 설명했다. 핵심은 프리필과 디코드 작업을 분리해 병목을 줄이는 것이다.
배경
- 2023-06-01vLLM이 PagedAttention 기반 고처리량 서빙을 확산
- 2025-03-01NVIDIA Dynamo가 대규모 추론 오케스트레이션을 전면화
- 2026-05-12SemiAnalysis가 B200 PD disaggregation 7배 처리량 사례를 공유
주요 입장
전망
- · SemiAnalysis는 GPU당 처리량 7배 개선이 비용도 최대 7배 낮출 수 있다고 봤다
- · vLLM 커뮤니티는 오픈소스 서빙 엔진이 폐쇄형 클라우드와 경쟁 가능한 비용 구조를 만든다고 본다
한국 영향
- B200/H200 클러스터의 실제 토큰당 비용
- vLLM·Dynamo의 한국 클라우드 도입 속도
SemiAnalysis, 나프타 병목을 AI 반도체 공급망 변수로 지목한다
주요 사건
SemiAnalysis는 이란 전쟁 장기화가 반도체 소재 공급망의 기초 원료인 나프타 가격과 조달 안정성을 흔들 수 있다고 경고했다. 한국 금융당국은 4월 23일 17개 은행의 L/C 한도를 확대해 Jaewon, Chemtronics 같은 소재 기업을 지원했고, 일본 정유사는 톤당 1,190달러 수준의 현물가 급등을 더 크게 겪고 있다고 설명했다.
배경
- 2019-07-01일본 수출규제가 한국 반도체 소재 국산화 논의를 촉발
- 2026-04-23한국 FSC가 17개 은행 공동 지원체계를 가동
- 2026-05-12SemiAnalysis가 나프타를 AI 칩 공급망 리스크로 제시
주요 입장
전망
- · SemiAnalysis는 나프타를 조용하지만 중요한 AI 칩 공급망 제약으로 본다
- · 공급망 분석가들은 원재료 리스크가 선단공정 장비 못지않게 병목이 될 수 있다고 본다
한국 영향
- 나프타 현물가와 중동 항로 리스크
- 삼성·SK하이닉스의 소재 공급계약 변화
Google DeepMind, AI 마우스 포인터 실험을 AI Studio에 공개한다
주요 사건
Google DeepMind는 Gemini가 사용자의 마우스 움직임, 음성, 화면 맥락을 함께 이해해 작업을 돕는 실험을 공개했다. 예시는 손글씨 메모를 대화형 할 일 목록으로 바꾸거나, 멈춘 영상 프레임에서 식당 예약 링크를 만드는 식이다.
배경
- 1968-12-09NLS 데모가 마우스 기반 상호작용을 대중화
- 2023-12-06Google이 Gemini 멀티모달 모델을 발표
- 2026-05-12Google DeepMind가 AI 포인터 실험을 AI Studio에 공개
주요 입장
전망
- · Google DeepMind는 50년 된 포인터를 AI가 이해하는 맥락 입력으로 바꾸겠다고 설명했다
- · UI 연구자들은 포인팅·음성 결합이 긴 프롬프트보다 더 자연스러운 에이전트 제어 방식이라고 본다
한국 영향
- AI Studio 실험의 제품화 경로
- 화면 접근 권한과 개인정보 보호 정책
Hugging Face, 공개 데이터셋 100만 개 돌파를 알린다
주요 사건
Hugging Face는 Hub의 공개 데이터셋이 100만 개를 넘었다고 밝혔다. Exa 검색 기준 Hugging Face 데이터셋 페이지는 약 94만 개 이상을 표시했고, 2026년 봄 보고서는 2025년에 사용자 1,300만 명, 공개 모델 200만 개, 공개 데이터셋 50만 개 이상으로 커졌다고 설명했다.
배경
- 2016-01-01Hugging Face가 NLP 도구 생태계를 구축하기 시작
- 2025-12-31Hub가 사용자 1,300만 명과 공개 모델 200만 개 규모로 성장
- 2026-05-12Hugging Face가 공개 데이터셋 100만 개 돌파를 알림
주요 입장
전망
- · Hugging Face는 2025년 데이터셋 저장소가 50만 개를 넘었다고 보고했다
- · 오픈소스 커뮤니티는 데이터셋 품질과 메타데이터 표준이 다음 병목이라고 본다
한국 영향
- 한국어 데이터셋 증가 속도
- 저작권·개인정보 소송 리스크
참고 자료
Physics-intern, Gemini 3.1 Pro의 CritPhysBench 점수를 31.4%로 높인다
주요 사건
physics-intern은 이론물리 문제 해결을 위한 에이전트 프레임워크로 소개됐고, Gemini 3.1 Pro의 CritPhysBench 점수를 17.7%에서 31.4%로 끌어올렸다고 주장했다. 관련 CritPt 계열 벤치마크는 71개 연구급 물리 문제와 190개 체크포인트로 구성된다.
배경
- 2025-01-01연구급 추론 벤치마크가 GPQA·HLE 이후 확산
- 2026-02-01Gemini 3.1 Pro 평가 문서가 공개
- 2026-05-12physics-intern이 CritPhysBench 31.4% 성능을 주장
주요 입장
전망
- · CritPt 저자들은 현 모델이 연구급 물리 문제에서 아직 큰 격차를 보인다고 평가했다
- · Artificial Analysis 리더보드는 도구와 높은 추론 설정이 성능을 크게 좌우한다고 보여준다
한국 영향
- CritPhysBench 재현성
- 한국 연구기관의 도메인 에이전트 구축 사례
OpenAI, 16MB 모델 경진대회에 검증 계정 1,000개를 모은다
주요 사건
OpenAI는 parameter golf 챌린지가 2,000개 이상 제출과 1,000개 이상 검증 GitHub 계정을 모았다고 리트윗했다. 이 챌린지는 16MB 아티팩트와 8×H100 10분 학습 제한 안에서 FineWeb 검증 압축률, 즉 bits per byte를 낮추는 모델을 겨룬다.
배경
- 2026-02-09OpenAI parameter-golf 저장소 생성
- 2026-03-18챌린지 시작
- 2026-05-12OpenAI가 2,000개 제출과 1,000개 검증 계정 규모를 공유
주요 입장
전망
- · OpenAI 저장소는 기록 제출이 10분 8×H100 제한과 16MB 크기 제한을 만족해야 한다고 명시한다
- · 참가 PR들은 int6·Brotli·depth recurrence 같은 기법이 압축형 LM의 실전 선택지가 되고 있음을 보여준다
한국 영향
- parameter-golf 우승 기법
- 16MB급 모델의 한국어 성능
xAI, Grok Voice가 τ-Voice 음성 에이전트 평가 1위라고 강조한다
주요 사건
Elon Musk는 Artificial Analysis의 τ-Voice 기반 Speech-to-Speech 에이전트 벤치마크에서 Grok Voice가 1위라고 강조했다. τ-Voice는 고객 서비스 시나리오에서 도구 호출과 상호작용 능력을 측정하는 평가로 소개됐다.
배경
- 2024-05-13OpenAI가 GPT-4o 실시간 음성 데모를 공개
- 2025-01-01음성 에이전트가 콜센터 자동화 시장에 본격 진입
- 2026-05-12Artificial Analysis가 τ-Voice 평가를 공개하고 Grok Voice 순위를 제시
주요 입장
전망
- · Artificial Analysis는 강한 S2S 모델도 현실적 고객 서비스 시나리오에서는 아직 차이가 크다고 본다
- · xAI는 Grok의 실시간성과 X 데이터 접근성을 제품 차별점으로 내세운다
한국 영향
- 한국어 Grok Voice 지원 수준
- τ-Voice식 평가의 다국어 확장
xAI, Grok 웹에 슬래시 기반 Skills 기능을 추가한다
주요 사건
Elon Musk는 Grok 웹에서 `/` 입력으로 Skills를 사용할 수 있게 됐다고 밝혔다. Skills는 반복 작업이나 도구 호출을 명령 단위로 묶어 에이전트 사용성을 높이는 기능으로 보인다.
배경
- 2024-01-01개발자용 AI 에이전트가 프로젝트 지침과 도구 호출을 표준화
- 2025-01-01Skills 개념이 코드·업무 에이전트 전반으로 확산
- 2026-05-12Grok 웹 Skills 기능이 공개적으로 포착
주요 입장
전망
- · 에이전트 개발자들은 스킬이 프롬프트 재사용보다 평가·권한·버전관리를 포함해야 한다고 본다
- · Musk는 Grok의 제품 업데이트를 X와 결합해 빠르게 배포하는 전략을 취한다
한국 영향
- Grok Skills의 외부 도구 연동
- 기업용 권한관리 기능
TMAS, 다중 에이전트 메모리로 추론 시점 계산 확장을 제안한다
주요 사건
TMAS 논문은 여러 전문 에이전트가 경험 은행과 가이드라인 은행을 공유하며 반복 추론을 개선하는 test-time compute 확장 프레임워크를 제안했다. 목표는 병렬 추론 경로가 같은 실수를 반복하지 않도록 경험과 전략을 구조화해 재사용하는 것이다.
배경
- 2022-01-01Chain-of-thought prompting이 LLM 추론 성능 개선을 보임
- 2024-01-01test-time scaling과 verifier 기반 추론이 확산
- 2026-05-12TMAS 논문이 arXiv에 공개
주요 입장
전망
- · TMAS 저자들은 기존 structured test-time scaling이 병렬 경로 조율과 정보 재사용이 약하다고 지적한다
- · 추론비용 분석가들은 test-time compute가 API 매출과 비용의 핵심 변수라고 본다
한국 영향
- TMAS 코드 공개와 재현성
- 국내 업무 벤치마크에서 비용 대비 성능
Thinky Machines, 실시간 상호작용 모델로 옴니모델 경쟁을 재점화한다
주요 사건
swyx는 Thinky Machines의 interaction model 발표를 공유하며 실시간 AI 상호작용의 기준이 올라갔다고 평가했다. 인용된 설명은 턴 기반 모델에 실시간 기능을 붙이는 대신, 처음부터 실시간 상호작용을 처리하도록 훈련한 새 모델 계열을 지향한다.
배경
- 2024-05-13GPT-4o가 실시간 멀티모달 대화 기대치를 높임
- 2025-02-01Mira Murati가 Thinky Machines를 창업
- 2026-05-12swyx가 Thinky Machines 상호작용 모델 발표를 공유
주요 입장
전망
- · swyx는 Thinky Machines가 Google DeepMind와 OpenAI의 실시간 정의를 끌어올렸다고 평가했다
- · 멀티모달 연구자들은 latency와 interruption handling이 다음 사용성 병목이라고 본다
한국 영향
- Thinky Machines 모델 공개 범위
- 한국어 실시간 상호작용 품질
Anthropic, 승인 없는 주식 노출 상품을 무효라고 공개 경고한다
주요 사건
Anthropic은 Open Doors Partners, Unicorns Exchange, Pachamama Capital, Lionheart Ventures, Hiive 신규 오퍼링, Forge Global 신규 오퍼링, Sydecar, Upmarket 등 플랫폼의 자사 주식 접근 상품이 승인되지 않았다고 경고했다. 회사는 승인 없는 주식 판매·이전·경제적 지분이 무효이며 장부에 인정되지 않는다고 밝혔다.
배경
- 2023-01-01생성 AI 투자 열풍이 비상장 AI 주식 수요를 키움
- 2026-05-11Anthropic이 승인 없는 주식 이전 무효 방침을 게시
- 2026-05-12TechCrunch가 플랫폼 명단과 반응을 보도
주요 입장
전망
- · TechCrunch는 Anthropic이 선호주와 보통주 모두 이전 제한 대상이라고 설명했다고 보도했다
- · 법률 해설은 'void' 표현이 downstream buyer에게도 강한 리스크를 만든다고 본다
한국 영향
- Forge·Hiive 등 플랫폼의 정정 또는 소송
- OpenAI 등 다른 AI 기업의 유사 공지
참고 자료
Meta, Threads의 Meta AI 계정 차단 불가 테스트로 반발을 부른다
주요 사건
Meta는 Threads에서 사용자가 @meta.ai를 태그해 공개 대화 맥락과 답변을 받는 기능을 아르헨티나, 말레이시아, 멕시코, 사우디아라비아, 싱가포르에서 테스트 중이다. The Verge와 Engadget 보도에 따르면 사용자는 해당 AI 계정을 완전히 차단할 수 없어 반발했다.
배경
- 2023-09-01Meta가 Meta AI를 주요 앱에 통합하기 시작
- 2025-01-01X Grok이 플랫폼 내 공개 AI 응답 경험을 확산
- 2026-05-12Threads Meta AI 차단 불가 테스트가 보도
주요 입장
전망
- · The Verge는 Meta AI 계정 차단 불가가 테스트 초기부터 사용자 반발을 불렀다고 보도했다
- · Engadget은 Threads에서 'Users cannot block Meta AI'가 100만 개 이상 게시물의 주요 트렌드가 됐다고 전했다
한국 영향
- Meta의 차단 정책 변경 여부
- EU·한국 플랫폼 규제기관 반응
참고 자료
Google, Android 침입 로그로 상업용 스파이웨어 추적을 강화한다
주요 사건
Google은 Android Advanced Protection Mode 안에 Intrusion Logging 기능을 추가해 오류와 침입 단서를 기록하고 보안 연구자가 스파이웨어 공격을 조사할 수 있게 한다. Pixel 최신 소프트웨어와 Google 계정 연결 등 조건이 있으며, 고위험 사용자 보호를 겨냥한다.
배경
- 2021-07-01Pegasus 보도가 모바일 스파이웨어 위험을 전세계에 알림
- 2022-07-01Apple이 Lockdown Mode를 발표
- 2026-05-12Google이 Android Intrusion Logging을 공개
주요 입장
전망
- · TechCrunch는 이 기능이 Android 기기에서 사용 가능한 포렌식 데이터의 양과 품질을 바꾸는 중요한 변화라고 평가했다
- · SecurityWeek는 Android 16 Advanced Protection이 Verified Boot, Memory Tagging, USB·2G 차단 등을 묶는다고 설명했다
한국 영향
- Pixel 외 제조사 적용 범위
- 로그 데이터 보관·공유 정책