Lleejh.in/ 뉴스
2026년 5월 13일 · 요일·기술
보통
sentiment.기술 진전은 빠르지만 비용, 공급망, 거버넌스 리스크가 함께 커진다

AI 업계, 추론비용·상호작용·공급망 리스크를 동시에 좁힌다

핵심 요약
  • SemiAnalysis는 B200 추론 최적화가 GPU당 토큰 처리량을 7배 높인다고 제시한다
  • Google DeepMind와 xAI는 마우스·음성 인터페이스로 AI 사용 방식을 넓힌다
  • Anthropic과 Meta 사례는 AI 확산이 투자·플랫폼 거버넌스 논쟁으로 번진다는 신호다
13개 출처 · 13개 항목
01@SemiAnalysis_·5.12 17:01

SemiAnalysis, B200 추론 처리량 7배 개선 사례를 공개한다

주요 사건

SemiAnalysis는 여러 B200 8-GPU 서버를 RoCEv2, ConnectX-7, Tomahawk 스위치로 묶고 vLLM·NVIDIA Dynamo 기반 PD disaggregation을 적용하면 GPU당 토큰 처리량이 최대 7배 증가한다고 설명했다. 핵심은 프리필과 디코드 작업을 분리해 병목을 줄이는 것이다.

배경

역사적 맥락
LLM 추론비용은 2023년 이후 GPU 부족과 긴 컨텍스트 수요로 급등했다. 2024~2026년 vLLM, PagedAttention, disaggregated serving, Dynamo 같은 서빙 스택이 모델 성능보다 비용 절감의 핵심 경쟁축으로 올라왔다.
원인
[B200급 GPU 집적] → [메모리·네트워크 병목 확대] → [프리필/디코드 분리] → [GPU당 처리량 증가] → [토큰 단가 하락 압력]
타임라인
  1. 2023-06-01
    vLLM이 PagedAttention 기반 고처리량 서빙을 확산
  2. 2025-03-01
    NVIDIA Dynamo가 대규모 추론 오케스트레이션을 전면화
  3. 2026-05-12
    SemiAnalysis가 B200 PD disaggregation 7배 처리량 사례를 공유

주요 입장

인프라 기업
서빙 최적화를 전면화
모델 성능보다 토큰당 비용이 상용화의 병목
AI 서비스 기업
비용 절감을 요구
같은 GPU로 더 많은 요청을 처리해야 마진이 개선
사용자/시장
저렴하고 빠른 응답을 기대
품질이 비슷하면 지연시간과 가격이 선택 기준

전망

high
2026년 하반기에는 disaggregated inference가 대형 서비스의 기본 운영 패턴으로 확산된다
medium
GPU 수요는 줄지 않고 네트워크·스위치·서빙 소프트웨어 가치가 함께 오른다
medium
토큰 단가 하락은 개인화 에이전트와 실시간 AI 서비스 확산을 앞당긴다
  • · SemiAnalysis는 GPU당 처리량 7배 개선이 비용도 최대 7배 낮출 수 있다고 봤다
  • · vLLM 커뮤니티는 오픈소스 서빙 엔진이 폐쇄형 클라우드와 경쟁 가능한 비용 구조를 만든다고 본다

한국 영향

직접 영향
네이버·카카오·통신사는 자체 LLM 운영비 절감을 위해 유사한 disaggregation 아키텍처 도입 압력을 받는다
간접 영향
국내 데이터센터 정책은 GPU뿐 아니라 고속 이더넷·스위치 공급망까지 포함해야 한다
주목할 지점
  • B200/H200 클러스터의 실제 토큰당 비용
  • vLLM·Dynamo의 한국 클라우드 도입 속도
#ai-infrastructure#semiconductor#inference#nvidia
02@SemiAnalysis_·5.12 22:01

SemiAnalysis, 나프타 병목을 AI 반도체 공급망 변수로 지목한다

주요 사건

SemiAnalysis는 이란 전쟁 장기화가 반도체 소재 공급망의 기초 원료인 나프타 가격과 조달 안정성을 흔들 수 있다고 경고했다. 한국 금융당국은 4월 23일 17개 은행의 L/C 한도를 확대해 Jaewon, Chemtronics 같은 소재 기업을 지원했고, 일본 정유사는 톤당 1,190달러 수준의 현물가 급등을 더 크게 겪고 있다고 설명했다.

배경

역사적 맥락
첨단 패키징·세정·포토 소재는 원유·나프타 기반 화학 공급망에 기대고 있다. AI 칩 병목은 GPU 제조능력뿐 아니라 고순도 화학품, 기판, HBM, 패키징 장비까지 확장됐다.
원인
[중동 지정학 리스크] → [나프타 운송·가격 불안] → [반도체 소재 조달비 상승] → [한국 정부 금융지원] → [삼성·SK하이닉스 공급망 재편]
타임라인
  1. 2019-07-01
    일본 수출규제가 한국 반도체 소재 국산화 논의를 촉발
  2. 2026-04-23
    한국 FSC가 17개 은행 공동 지원체계를 가동
  3. 2026-05-12
    SemiAnalysis가 나프타를 AI 칩 공급망 리스크로 제시

주요 입장

한국 소재 기업
대체 조달을 확대
비싸더라도 공급 중단을 피해야 한다
삼성·SK하이닉스
공급망 이중화를 선호
HBM·첨단 패키징 생산 차질은 AI 수요 대응을 막는다
정부/은행
신용공급으로 완충
전략산업 소재 공급망을 금융으로 지탱해야 한다

전망

medium
반도체 소재 조달 데이터가 AI 칩 원가 분석의 핵심 변수로 편입된다
high
한국 화학·소재 업체의 전략적 가치가 HBM 호황과 함께 올라간다
medium
지정학 리스크가 AI 서비스 가격과 데이터센터 투자 일정에도 간접 반영된다
  • · SemiAnalysis는 나프타를 조용하지만 중요한 AI 칩 공급망 제약으로 본다
  • · 공급망 분석가들은 원재료 리스크가 선단공정 장비 못지않게 병목이 될 수 있다고 본다

한국 영향

직접 영향
한국은 HBM 강국이지만 소재 원료 변동에 노출돼 있어 정부 보증과 조달 다변화가 중요해진다
간접 영향
소재 국산화 정책은 원료·정제·금융까지 통합한 공급망 전략으로 확장돼야 한다
주목할 지점
  • 나프타 현물가와 중동 항로 리스크
  • 삼성·SK하이닉스의 소재 공급계약 변화
#semiconductor#supply-chain#korea#ai-chips
03@GoogleDeepMind·5.12 17:03

Google DeepMind, AI 마우스 포인터 실험을 AI Studio에 공개한다

주요 사건

Google DeepMind는 Gemini가 사용자의 마우스 움직임, 음성, 화면 맥락을 함께 이해해 작업을 돕는 실험을 공개했다. 예시는 손글씨 메모를 대화형 할 일 목록으로 바꾸거나, 멈춘 영상 프레임에서 식당 예약 링크를 만드는 식이다.

배경

역사적 맥락
PC 인터페이스는 1970년대 마우스와 GUI 이후 포인팅 중심으로 굳어졌다. 2023년 이후 멀티모달 LLM이 화면·음성·이미지를 함께 처리하면서 '클릭'이 아니라 '가리키고 말하기'가 새로운 입력 양식으로 떠올랐다.
원인
[멀티모달 Gemini 발전] → [화면 맥락 이해 가능] → [마우스·음성 결합] → [앱 간 작업 자동화] → [AI 네이티브 UI 경쟁]
타임라인
  1. 1968-12-09
    NLS 데모가 마우스 기반 상호작용을 대중화
  2. 2023-12-06
    Google이 Gemini 멀티모달 모델을 발표
  3. 2026-05-12
    Google DeepMind가 AI 포인터 실험을 AI Studio에 공개

주요 입장

Google DeepMind
차세대 인터페이스를 탐색
AI는 사용자가 무엇을 가리키는지 이해해야 한다
OpenAI·Anthropic
에이전트 UI 경쟁
코딩·브라우징·업무 자동화를 대화형으로 장악해야 한다
사용자
더 낮은 조작 비용을 기대
복잡한 앱 메뉴보다 자연어·포인팅이 쉽다

전망

high
AI Studio 실험은 ChromeOS·Android·Workspace 기능으로 흡수될 가능성이 높다
medium
전통적 RPA와 생산성 소프트웨어가 화면 맥락 기반 에이전트와 경쟁한다
medium
접근성은 개선되지만 화면 감시·권한 관리 논쟁도 커진다
  • · Google DeepMind는 50년 된 포인터를 AI가 이해하는 맥락 입력으로 바꾸겠다고 설명했다
  • · UI 연구자들은 포인팅·음성 결합이 긴 프롬프트보다 더 자연스러운 에이전트 제어 방식이라고 본다

한국 영향

직접 영향
삼성·LG 기기와 네이버 웨일 같은 브라우저도 화면 맥락 AI 기능 경쟁에 들어갈 수 있다
간접 영향
공공·금융 업무 자동화는 권한·감사 로그 설계가 선행돼야 한다
주목할 지점
  • AI Studio 실험의 제품화 경로
  • 화면 접근 권한과 개인정보 보호 정책
#google#multimodal-ai#user-interface#gemini
04@_akhaliq·5.12 15:57

Hugging Face, 공개 데이터셋 100만 개 돌파를 알린다

주요 사건

Hugging Face는 Hub의 공개 데이터셋이 100만 개를 넘었다고 밝혔다. Exa 검색 기준 Hugging Face 데이터셋 페이지는 약 94만 개 이상을 표시했고, 2026년 봄 보고서는 2025년에 사용자 1,300만 명, 공개 모델 200만 개, 공개 데이터셋 50만 개 이상으로 커졌다고 설명했다.

배경

역사적 맥락
오픈소스 AI는 모델 가중치 공개에서 데이터셋·평가셋·어댑터 공유로 확장됐다. 특히 로보틱스 데이터셋은 2024년 1,145개에서 2025년 26,991개로 증가하며 가장 빠른 하위 커뮤니티 중 하나가 됐다.
원인
[오픈 모델 확산] → [학습·평가 데이터 수요 증가] → [Hub 데이터셋 증가] → [파생 모델·벤치마크 생태계 확대] → [데이터 품질·저작권 논쟁 확대]
타임라인
  1. 2016-01-01
    Hugging Face가 NLP 도구 생태계를 구축하기 시작
  2. 2025-12-31
    Hub가 사용자 1,300만 명과 공개 모델 200만 개 규모로 성장
  3. 2026-05-12
    Hugging Face가 공개 데이터셋 100만 개 돌파를 알림

주요 입장

Hugging Face
오픈 데이터 기반 생태계를 강조
오픈 모델에는 오픈 데이터가 필요하다
폐쇄형 AI 기업
독점 데이터와 품질 관리를 중시
대규모 공개 데이터만으로 frontier 성능을 보장할 수 없다
연구자/스타트업
접근성 개선을 환영
데이터셋 공유가 재현성과 실험 속도를 높인다

전망

high
데이터셋 큐레이션·라이선스·평가 자동화 도구 수요가 커진다
medium
작은 팀도 도메인 특화 모델을 빠르게 만들 수 있게 된다
medium
공개 데이터셋의 개인정보·저작권 검증 부담이 커진다
  • · Hugging Face는 2025년 데이터셋 저장소가 50만 개를 넘었다고 보고했다
  • · 오픈소스 커뮤니티는 데이터셋 품질과 메타데이터 표준이 다음 병목이라고 본다

한국 영향

직접 영향
한국어·한국 산업 데이터셋 공개가 부족하면 국내 모델의 경쟁력이 제한된다
간접 영향
공공 데이터 개방 정책은 AI 학습 가능 라이선스와 개인정보 비식별 기준을 함께 다뤄야 한다
주목할 지점
  • 한국어 데이터셋 증가 속도
  • 저작권·개인정보 소송 리스크
#open-source#datasets#hugging-face#ai-research
05@_akhaliq·5.12 15:55

Physics-intern, Gemini 3.1 Pro의 CritPhysBench 점수를 31.4%로 높인다

주요 사건

physics-intern은 이론물리 문제 해결을 위한 에이전트 프레임워크로 소개됐고, Gemini 3.1 Pro의 CritPhysBench 점수를 17.7%에서 31.4%로 끌어올렸다고 주장했다. 관련 CritPt 계열 벤치마크는 71개 연구급 물리 문제와 190개 체크포인트로 구성된다.

배경

역사적 맥락
AI 과학 벤치마크는 MATH·GPQA에서 실제 연구급 문제로 이동하고 있다. CritPt는 50명 이상 물리 연구자가 만든 미공개 문제로, 기존 최고 모델도 단일 자릿수~30%대 정확도에 머무는 어려운 평가다.
원인
[연구급 벤치마크 등장] → [단일 모델 한계 노출] → [도구·에이전트 프레임워크 결합] → [물리 문제 성능 개선] → [AI 과학자동화 경쟁 확대]
타임라인
  1. 2025-01-01
    연구급 추론 벤치마크가 GPQA·HLE 이후 확산
  2. 2026-02-01
    Gemini 3.1 Pro 평가 문서가 공개
  3. 2026-05-12
    physics-intern이 CritPhysBench 31.4% 성능을 주장

주요 입장

프레임워크 개발자
전문 에이전트 구조를 강조
과학 문제는 모델 하나보다 도구·검증 루프가 중요하다
프런티어 모델 기업
기반 모델 성능을 확장
강한 모델이 에이전트 성능의 하한을 높인다
물리 연구자
검증 가능한 도움을 원함
정답률보다 재현성과 오류 탐지가 중요하다

전망

medium
과학 에이전트는 실험 설계·문헌 탐색·수식 검증을 묶는 방향으로 발전한다
medium
제약·소재·반도체 R&D 자동화 도구 시장이 확대된다
low
AI가 논문 초안과 계산 검증을 돕지만 최종 책임은 연구자에게 남는다
  • · CritPt 저자들은 현 모델이 연구급 물리 문제에서 아직 큰 격차를 보인다고 평가했다
  • · Artificial Analysis 리더보드는 도구와 높은 추론 설정이 성능을 크게 좌우한다고 보여준다

한국 영향

직접 영향
KAIST·포스텍·출연연의 과학 AI 도구 도입 경쟁이 빨라질 수 있다
간접 영향
국가 R&D 과제는 AI 에이전트의 검증 가능성과 데이터 공개를 요구해야 한다
주목할 지점
  • CritPhysBench 재현성
  • 한국 연구기관의 도메인 에이전트 구축 사례
#ai-research#science-ai#benchmark#gemini
06@OpenAI·5.12 19:37

OpenAI, 16MB 모델 경진대회에 검증 계정 1,000개를 모은다

주요 사건

OpenAI는 parameter golf 챌린지가 2,000개 이상 제출과 1,000개 이상 검증 GitHub 계정을 모았다고 리트윗했다. 이 챌린지는 16MB 아티팩트와 8×H100 10분 학습 제한 안에서 FineWeb 검증 압축률, 즉 bits per byte를 낮추는 모델을 겨룬다.

배경

역사적 맥락
대형 모델 경쟁이 파라미터 수 확대에 집중된 반면, 2025~2026년에는 양자화, 지식증류, 작은 모델, 추론비용 절감이 별도 축으로 커졌다. GitHub 기록에는 73.7M 파라미터 ternary quantization, 106M 1-bit quantization, 15.7MB LegendreGPT depth parameterization 같은 접근이 등장했다.
원인
[대형 모델 비용 증가] → [소형 모델·압축 관심 확대] → [공개 경진대회 운영] → [양자화·깊이재귀 실험 확산] → [엣지·저비용 AI 가능성 확대]
타임라인
  1. 2026-02-09
    OpenAI parameter-golf 저장소 생성
  2. 2026-03-18
    챌린지 시작
  3. 2026-05-12
    OpenAI가 2,000개 제출과 1,000개 검증 계정 규모를 공유

주요 입장

OpenAI
커뮤니티 실험을 장려
작은 제약이 새로운 모델 설계 아이디어를 만든다
참가 개발자
극단적 압축을 실험
양자화·재귀·압축 목적함수로 작은 모델 성능을 끌어올릴 수 있다
엣지 AI 시장
작은 모델을 선호
기기 내 실행은 비용·개인정보 측면에서 유리하다

전망

high
소형 모델 설계는 양자화 친화 학습과 압축-aware QAT 쪽으로 더 이동한다
medium
저비용 온디바이스 LLM과 임베디드 AI 제품의 성능 개선에 기여한다
medium
개인정보를 로컬에서 처리하는 AI 사용 사례가 늘어난다
  • · OpenAI 저장소는 기록 제출이 10분 8×H100 제한과 16MB 크기 제한을 만족해야 한다고 명시한다
  • · 참가 PR들은 int6·Brotli·depth recurrence 같은 기법이 압축형 LM의 실전 선택지가 되고 있음을 보여준다

한국 영향

직접 영향
삼성·LG·현대차의 온디바이스 AI 전략에 소형 모델 압축 기술이 중요해진다
간접 영향
국내 대학·스타트업도 제한 조건 경진대회로 인재와 아이디어를 모을 수 있다
주목할 지점
  • parameter-golf 우승 기법
  • 16MB급 모델의 한국어 성능
#openai#small-models#quantization#competition
07@elonmusk·5.12 20:40

xAI, Grok Voice가 τ-Voice 음성 에이전트 평가 1위라고 강조한다

주요 사건

Elon Musk는 Artificial Analysis의 τ-Voice 기반 Speech-to-Speech 에이전트 벤치마크에서 Grok Voice가 1위라고 강조했다. τ-Voice는 고객 서비스 시나리오에서 도구 호출과 상호작용 능력을 측정하는 평가로 소개됐다.

배경

역사적 맥락
음성 AI는 음성인식+TTS 파이프라인에서 실시간 Speech-to-Speech 모델로 이동하고 있다. 2024년 이후 OpenAI Advanced Voice, Gemini Live, Grok Voice가 실시간 대화성과 도구 사용을 경쟁축으로 삼았다.
원인
[실시간 음성 모델 발전] → [고객응대 자동화 수요] → [도구 호출 평가 필요] → [τ-Voice 벤치마크 공개] → [Grok Voice 성능 마케팅]
타임라인
  1. 2024-05-13
    OpenAI가 GPT-4o 실시간 음성 데모를 공개
  2. 2025-01-01
    음성 에이전트가 콜센터 자동화 시장에 본격 진입
  3. 2026-05-12
    Artificial Analysis가 τ-Voice 평가를 공개하고 Grok Voice 순위를 제시

주요 입장

xAI
음성 에이전트 성능을 홍보
Grok Voice는 실제 고객응대형 작업에서 앞선다
경쟁 AI 기업
실시간성·정확성 경쟁
대화 자연스러움과 도구 호출 안정성이 모두 필요하다
기업 고객
실전 지표를 요구
환각보다 업무 완료율과 통화 품질이 중요하다

전망

high
음성 에이전트 평가는 지연시간, 말 끊기 처리, 도구 호출 성공률 중심으로 표준화된다
medium
콜센터 BPO와 SaaS 고객지원 시장의 자동화 압력이 커진다
medium
상담 일자리 재편과 AI 상담 고지 의무 논쟁이 커진다
  • · Artificial Analysis는 강한 S2S 모델도 현실적 고객 서비스 시나리오에서는 아직 차이가 크다고 본다
  • · xAI는 Grok의 실시간성과 X 데이터 접근성을 제품 차별점으로 내세운다

한국 영향

직접 영향
국내 콜센터·금융권은 한국어 S2S 벤치마크와 개인정보 규정을 함께 검토해야 한다
간접 영향
AI 상담 품질 인증과 녹취 데이터 활용 규제가 중요해진다
주목할 지점
  • 한국어 Grok Voice 지원 수준
  • τ-Voice식 평가의 다국어 확장
#voice-ai#xai#benchmark#agentic-ai
08@elonmusk·5.12 20:46

xAI, Grok 웹에 슬래시 기반 Skills 기능을 추가한다

주요 사건

Elon Musk는 Grok 웹에서 `/` 입력으로 Skills를 사용할 수 있게 됐다고 밝혔다. Skills는 반복 작업이나 도구 호출을 명령 단위로 묶어 에이전트 사용성을 높이는 기능으로 보인다.

배경

역사적 맥락
Claude Code·Codex·OpenClaw류 에이전트는 프로젝트별 지침, 도구, 워크플로를 '스킬' 형태로 캡슐화해 생산성을 높였다. Grok도 웹 UI에 유사한 명령 계층을 넣으며 범용 챗봇에서 작업 실행형 에이전트로 이동하고 있다.
원인
[챗봇 사용 증가] → [반복 프롬프트 피로] → [명령·스킬 추상화 도입] → [업무 자동화 접근성 개선] → [에이전트 플랫폼 경쟁]
타임라인
  1. 2024-01-01
    개발자용 AI 에이전트가 프로젝트 지침과 도구 호출을 표준화
  2. 2025-01-01
    Skills 개념이 코드·업무 에이전트 전반으로 확산
  3. 2026-05-12
    Grok 웹 Skills 기능이 공개적으로 포착

주요 입장

xAI
Grok을 작업형 플랫폼으로 확장
사용자는 대화보다 실행 가능한 단축 명령을 원한다
OpenAI·Anthropic
도구·커넥터 생태계를 강화
에이전트는 기억과 작업 루틴을 가져야 한다
사용자
간단한 자동화를 기대
복잡한 프롬프트를 매번 다시 쓰기 어렵다

전망

high
Grok Skills는 파일·웹·X 데이터 작업을 묶는 액션으로 확대될 가능성이 높다
medium
AI 앱은 채팅창보다 커맨드 팔레트와 워크플로 마켓으로 진화한다
low
비개발자도 반복 업무 자동화를 만들 수 있지만 권한 오남용 위험도 커진다
  • · 에이전트 개발자들은 스킬이 프롬프트 재사용보다 평가·권한·버전관리를 포함해야 한다고 본다
  • · Musk는 Grok의 제품 업데이트를 X와 결합해 빠르게 배포하는 전략을 취한다

한국 영향

직접 영향
국내 SaaS도 AI 기능을 단순 채팅이 아니라 업무별 스킬로 포장해야 경쟁력이 생긴다
간접 영향
기업 도입 시 스킬별 접근 권한과 감사 로그가 필요하다
주목할 지점
  • Grok Skills의 외부 도구 연동
  • 기업용 권한관리 기능
#xai#agentic-ai#productivity#ai-tools
09@_akhaliq·5.12 13:24

TMAS, 다중 에이전트 메모리로 추론 시점 계산 확장을 제안한다

주요 사건

TMAS 논문은 여러 전문 에이전트가 경험 은행과 가이드라인 은행을 공유하며 반복 추론을 개선하는 test-time compute 확장 프레임워크를 제안했다. 목표는 병렬 추론 경로가 같은 실수를 반복하지 않도록 경험과 전략을 구조화해 재사용하는 것이다.

배경

역사적 맥락
Chain-of-thought, self-consistency, verifier, tree search는 모두 추론 시점 계산을 늘려 성능을 올리는 방법이다. 최근에는 단일 샘플 다수결보다 에이전트 간 역할 분담과 메모리 공유가 더 중요한 연구 주제로 이동하고 있다.
원인
[추론 시점 계산 확장] → [중복 탐색 문제] → [계층형 메모리 도입] → [경험·전략 재사용] → [더 안정적 반복 추론]
타임라인
  1. 2022-01-01
    Chain-of-thought prompting이 LLM 추론 성능 개선을 보임
  2. 2024-01-01
    test-time scaling과 verifier 기반 추론이 확산
  3. 2026-05-12
    TMAS 논문이 arXiv에 공개

주요 입장

TMAS 연구진
협업형 추론 구조를 제안
다중 경로 추론은 기억과 역할 분담이 있어야 효율적이다
모델 제공사
추론 토큰을 성능 상품으로 판매
더 많은 계산은 더 나은 답을 줄 수 있다
사용자/기업
비용 대비 성능을 따짐
추론을 많이 쓰는 만큼 정확도가 올라야 한다

전망

medium
다중 에이전트 메모리는 수학·코딩·연구 문제에서 우선 검증된다
medium
에이전트 플랫폼은 단순 병렬 샘플링보다 작업 기록 재사용 기능을 강화한다
low
높은 정확도가 필요한 법률·의료·과학 보조에서 검증 절차가 촘촘해진다
  • · TMAS 저자들은 기존 structured test-time scaling이 병렬 경로 조율과 정보 재사용이 약하다고 지적한다
  • · 추론비용 분석가들은 test-time compute가 API 매출과 비용의 핵심 변수라고 본다

한국 영향

직접 영향
국내 AI 에이전트 스타트업은 다중 에이전트 메모리와 평가 루프를 제품 차별점으로 삼을 수 있다
간접 영향
공공·금융 자동화는 고비용 추론을 언제 허용할지 정책이 필요하다
주목할 지점
  • TMAS 코드 공개와 재현성
  • 국내 업무 벤치마크에서 비용 대비 성능
#ai-research#agents#test-time-compute#reasoning
10@swyx·5.12 00:03

Thinky Machines, 실시간 상호작용 모델로 옴니모델 경쟁을 재점화한다

주요 사건

swyx는 Thinky Machines의 interaction model 발표를 공유하며 실시간 AI 상호작용의 기준이 올라갔다고 평가했다. 인용된 설명은 턴 기반 모델에 실시간 기능을 붙이는 대신, 처음부터 실시간 상호작용을 처리하도록 훈련한 새 모델 계열을 지향한다.

배경

역사적 맥락
GPT-4o 이후 멀티모달 AI는 텍스트·음성·영상 입력을 실시간으로 처리하는 방향으로 이동했다. 하지만 많은 시스템은 여전히 턴 기반 LLM 위에 음성·영상 레이어를 붙이는 구조라 지연시간과 끊김 문제가 남아 있다.
원인
[멀티모달 모델 확산] → [실시간 상호작용 요구] → [턴 기반 구조 한계] → [interaction model 제안] → [AI 동반작업 UI 경쟁]
타임라인
  1. 2024-05-13
    GPT-4o가 실시간 멀티모달 대화 기대치를 높임
  2. 2025-02-01
    Mira Murati가 Thinky Machines를 창업
  3. 2026-05-12
    swyx가 Thinky Machines 상호작용 모델 발표를 공유

주요 입장

Thinky Machines
실시간 모델 원천 설계를 강조
상호작용은 후처리 기능이 아니라 모델의 기본 능력이어야 한다
Google·OpenAI
기존 옴니모델을 고도화
대규모 배포와 생태계가 성능 못지않게 중요하다
개발자/크리에이터
낮은 지연시간을 원함
실시간 작업에서는 한 박자 지연도 사용성을 망친다

전망

medium
실시간 모델은 음성, 화면, 커서, 제스처를 동시에 처리하는 방향으로 발전한다
medium
회의·교육·디자인 협업 도구가 옴니모델을 핵심 기능으로 채택한다
medium
AI와 사람의 공동작업이 자연스러워지지만 상시 녹화·감시 우려도 커진다
  • · swyx는 Thinky Machines가 Google DeepMind와 OpenAI의 실시간 정의를 끌어올렸다고 평가했다
  • · 멀티모달 연구자들은 latency와 interruption handling이 다음 사용성 병목이라고 본다

한국 영향

직접 영향
국내 협업툴·교육테크 기업은 실시간 멀티모달 AI를 제품 차별화 요소로 검토해야 한다
간접 영향
회의·수업 데이터 처리에 대한 개인정보 동의와 보관 정책이 중요해진다
주목할 지점
  • Thinky Machines 모델 공개 범위
  • 한국어 실시간 상호작용 품질
#multimodal-ai#startup#real-time-ai#interaction-models
11TechCrunch·5.12 17:36

Anthropic, 승인 없는 주식 노출 상품을 무효라고 공개 경고한다

주요 사건

Anthropic은 Open Doors Partners, Unicorns Exchange, Pachamama Capital, Lionheart Ventures, Hiive 신규 오퍼링, Forge Global 신규 오퍼링, Sydecar, Upmarket 등 플랫폼의 자사 주식 접근 상품이 승인되지 않았다고 경고했다. 회사는 승인 없는 주식 판매·이전·경제적 지분이 무효이며 장부에 인정되지 않는다고 밝혔다.

배경

역사적 맥락
생성 AI 기업 가치가 급등하면서 비상장 주식·SPV·토큰화 상품을 통해 일반 투자자에게 노출을 파는 시장이 커졌다. Anthropic 사례는 사적 기업이 'void'라는 강한 표현으로 2차 시장을 공개 차단한 사건이다.
원인
[AI 기업 가치 급등] → [비상장 주식 수요 폭증] → [SPV·토큰화 노출 상품 확산] → [Anthropic 승인 없는 거래 무효 선언] → [2차 시장 법적 리스크 확대]
타임라인
  1. 2023-01-01
    생성 AI 투자 열풍이 비상장 AI 주식 수요를 키움
  2. 2026-05-11
    Anthropic이 승인 없는 주식 이전 무효 방침을 게시
  3. 2026-05-12
    TechCrunch가 플랫폼 명단과 반응을 보도

주요 입장

Anthropic
무단 거래를 차단
이사회 승인 없는 이전은 장부상 인정되지 않는다
2차 거래 플랫폼
합법적 중개 또는 행정 역할을 주장
승인 절차를 따르거나 직접 매매하지 않는다
투자자/규제기관
투명성과 권리확인을 요구
합성 노출과 실제 주식 권리는 다르다

전망

low
직접 기술 변화보다 AI 기업 자본시장 규칙에 더 큰 영향을 준다
high
OpenAI·Anthropic 등 프리IPO AI 주식 노출 상품의 법적 검증이 강화된다
medium
소매 투자자의 AI 버블 노출과 보호 논쟁이 커진다
  • · TechCrunch는 Anthropic이 선호주와 보통주 모두 이전 제한 대상이라고 설명했다고 보도했다
  • · 법률 해설은 'void' 표현이 downstream buyer에게도 강한 리스크를 만든다고 본다

한국 영향

직접 영향
국내 투자자도 해외 AI 프리IPO·토큰화 상품 접근 시 실제 권리 인정 여부를 확인해야 한다
간접 영향
금융당국은 비상장 해외 AI 주식 연계 상품의 광고와 판매 규제를 점검할 필요가 있다
주목할 지점
  • Forge·Hiive 등 플랫폼의 정정 또는 소송
  • OpenAI 등 다른 AI 기업의 유사 공지
#anthropic#ai-investing#regulation#private-markets
12The Verge·5.12 20:35

Meta, Threads의 Meta AI 계정 차단 불가 테스트로 반발을 부른다

주요 사건

Meta는 Threads에서 사용자가 @meta.ai를 태그해 공개 대화 맥락과 답변을 받는 기능을 아르헨티나, 말레이시아, 멕시코, 사우디아라비아, 싱가포르에서 테스트 중이다. The Verge와 Engadget 보도에 따르면 사용자는 해당 AI 계정을 완전히 차단할 수 없어 반발했다.

배경

역사적 맥락
X의 Grok처럼 소셜 플랫폼 안에서 AI가 공개 대화 참여자가 되는 실험이 늘고 있다. 하지만 일반 계정과 달리 플랫폼 소유 AI 계정은 차단·노출·추천 규칙에서 특권을 가질 수 있어 사용자 통제권 논쟁이 커진다.
원인
[소셜 플랫폼 AI 도입] → [공개 대화 AI 참여] → [차단 불가 계정 논란] → [사용자 통제권 반발] → [AI 추천·노출 규제 압력]
타임라인
  1. 2023-09-01
    Meta가 Meta AI를 주요 앱에 통합하기 시작
  2. 2025-01-01
    X Grok이 플랫폼 내 공개 AI 응답 경험을 확산
  3. 2026-05-12
    Threads Meta AI 차단 불가 테스트가 보도

주요 입장

Meta
AI를 소셜 대화에 통합
사용자는 대화 중 맥락·추천·설명을 바로 받을 수 있다
사용자
차단권을 요구
AI 계정도 일반 계정처럼 거부할 수 있어야 한다
규제기관
플랫폼 자기우대와 투명성을 감시
플랫폼 소유 AI가 추천·노출에서 특혜를 받으면 경쟁과 소비자 권리가 훼손될 수 있다

전망

medium
Meta는 차단 대신 숨김·관심없음·뮤트 옵션을 조정하며 테스트를 계속할 가능성이 높다
medium
소셜 AI는 기능 경쟁보다 사용자 통제권 설계가 채택률을 좌우한다
medium
공개 대화에 AI가 끼어드는 경험이 정치·뉴스 맥락에서 신뢰 논쟁을 낳는다
  • · The Verge는 Meta AI 계정 차단 불가가 테스트 초기부터 사용자 반발을 불렀다고 보도했다
  • · Engadget은 Threads에서 'Users cannot block Meta AI'가 100만 개 이상 게시물의 주요 트렌드가 됐다고 전했다

한국 영향

직접 영향
국내 플랫폼이 AI 계정을 도입할 때 차단·숨김·추천 배제 권리를 명확히 해야 한다
간접 영향
AI 서비스 고지와 이용자 선택권은 개인정보보호·플랫폼 규제 논의와 연결된다
주목할 지점
  • Meta의 차단 정책 변경 여부
  • EU·한국 플랫폼 규제기관 반응
#meta#social-ai#platform-governance#regulation
13TechCrunch·5.12 17:00

Google, Android 침입 로그로 상업용 스파이웨어 추적을 강화한다

주요 사건

Google은 Android Advanced Protection Mode 안에 Intrusion Logging 기능을 추가해 오류와 침입 단서를 기록하고 보안 연구자가 스파이웨어 공격을 조사할 수 있게 한다. Pixel 최신 소프트웨어와 Google 계정 연결 등 조건이 있으며, 고위험 사용자 보호를 겨냥한다.

배경

역사적 맥락
Pegasus 같은 상업용 스파이웨어는 휴대전화의 제로클릭 취약점을 악용해 언론인·활동가·공무원을 노렸다. Apple Lockdown Mode 이후 Android도 강한 보호 모드와 포렌식 로그를 확대하는 방향으로 움직이고 있다.
원인
[상업용 스파이웨어 확산] → [피해 증거 확보 어려움] → [Android Advanced Protection 강화] → [침입 로그 제공] → [조사·법적 대응 가능성 확대]
타임라인
  1. 2021-07-01
    Pegasus 보도가 모바일 스파이웨어 위험을 전세계에 알림
  2. 2022-07-01
    Apple이 Lockdown Mode를 발표
  3. 2026-05-12
    Google이 Android Intrusion Logging을 공개

주요 입장

Google
고위험 사용자 보호를 강화
공격 차단뿐 아니라 사후 증거 확보가 필요하다
보안 연구자
포렌식 데이터 확대를 환영
로그가 있어야 스파이웨어 침입 경로를 추적할 수 있다
정부/수사기관
합법 수사와 악성 감시의 경계 논쟁
기기 포렌식 접근권과 사생활 보호를 조율해야 한다

전망

high
모바일 OS는 차단 기능과 함께 검증 가능한 보안 로그를 기본 보안 기능으로 확대한다
medium
MDM·보안관제 업체는 Android 로그를 위협탐지 파이프라인에 통합한다
medium
언론인·활동가 보호는 강화되지만 로그 보관과 계정 연결의 개인정보 논쟁도 남는다
  • · TechCrunch는 이 기능이 Android 기기에서 사용 가능한 포렌식 데이터의 양과 품질을 바꾸는 중요한 변화라고 평가했다
  • · SecurityWeek는 Android 16 Advanced Protection이 Verified Boot, Memory Tagging, USB·2G 차단 등을 묶는다고 설명했다

한국 영향

직접 영향
기자·공익활동가·정치인 등 고위험 Android 사용자는 Advanced Protection 적용을 검토할 필요가 있다
간접 영향
국내 수사기관 포렌식 도구와 민간 보안 로그 사이의 법적 경계 논의가 커질 수 있다
주목할 지점
  • Pixel 외 제조사 적용 범위
  • 로그 데이터 보관·공유 정책
#google#android#cybersecurity#spyware