구글 음성 모델 선두, 오픈소스 OCR·의료 추론 연구 급진전, AI 인프라 병목과 엔터프라이즈 에이전트 경쟁이 동시에 심화됐다.
- X 기준으로는 Google DeepMind·_akhaliq·SemiAnalysis·OpenAI 발 이슈가 가장 밀집했다.
- 연구 쪽은 음성 에이전트 성능, 대규모 문서 OCR, 단계별 보상 기반 추론이 핵심이었다.
- 산업 쪽은 TSMC 집중 리스크, 공급망 탈중국, 엔터프라이즈 에이전트 경쟁, AI 앱 인프라 수요 급증이 눈에 띄었다.
Google DeepMind가 Gemini 3.1 Flash Live의 음성 에이전트 성능 1위를 강조하며 실시간 보이스 경쟁을 재점화했다.
주요 사건
Google DeepMind가 Gemini 3.1 Flash Live (Thinking)가 Sierra의 τ-Voice leaderboard 정상에 올랐다고 알렸다. 음성 모델 경쟁이 단순 대화 자연스러움에서 실제 도구 호출과 멀티스텝 음성 작업 수행 능력으로 옮겨가고 있다는 신호다.
배경
- 2024-05-13실시간 음성 비서 경쟁이 본격화되며 대화형 멀티모달 UX가 핵심 전선으로 부상
- 2026-03-26Gemini 3.1 Flash Live 공개
- 2026-04-13Google DeepMind가 τ-Voice leaderboard 1위 성과를 X에서 강조
주요 입장
전망
- · Implicator 기준 Gemini 3.1 Flash Live는 ComplexFuncBench Audio 90.8%, Audio MultiChallenge 36.1%, BigBench Audio 95.9%로 보고됐다.
- · 보이스 모델 평가는 주관적 선호도보다 실제 툴 수행률이 더 중요해지고 있다.
한국 영향
- 한국어 음성 benchmark 공백
- 통신·금융권 음성 에이전트 규제
- 국내 모델의 멀티스텝 툴콜 정확도
참고 자료
Hugging Face 생태계가 오픈 5B OCR 모델과 16개 L40S 작업으로 2.7만 개 arXiv 논문을 마크다운화했다.
주요 사건
AK가 리트윗한 Hugging Face 사례는 오픈 OCR 모델과 HF Jobs를 이용해 HTML이 없는 약 27,000개 arXiv 논문을 마크다운으로 변환한 작업이다. 논문 챗·검색·요약 인프라의 데이터 공백을 오픈 모델로 메운 사례다.
배경
- 2025-10-21Hugging Face가 오픈 OCR 모델 비교와 배치 추론 가이드를 정리
- 2026-04-07Hugging Face가 27,000개 논문 OCR 사례를 블로그로 공개
- 2026-04-13해당 사례가 X에서 다시 확산
주요 입장
전망
- · HF 블로그 기준 L40S는 시간당 약 60편, A10G는 약 32편 처리로 비교됐다.
- · 16개 L40S 병렬 작업 시 전체 작업은 약 29~30시간, 비용은 약 850달러로 추산됐다.
한국 영향
- 한글 수식/표 OCR 성능
- 공공문서 라이선스 정비
- GPU 배치 추론 비용 최적화
참고 자료
ETH 계열 연구진의 Process Reward Agents가 의료 추론에서 4B급 모델 성능을 크게 끌어올렸다.
주요 사건
AK가 소개한 Process Reward Agents(PRA)는 답을 다 만든 뒤 채점하는 방식이 아니라, 추론 도중 각 단계마다 검색 기반 보상을 주며 경로를 조정하는 테스트타임 기법이다. 특히 의학처럼 중간 단계 검증이 어려운 영역에서 효과를 보였다.
배경
- 2022-11-30CoT와 자기일관성류 추론 기법이 대중화
- 2024-01-01RAG·PRM 계열이 지식집약적 추론 개선책으로 확산
- 2026-04-10PRA 논문 arXiv 제출
- 2026-04-13논문이 X를 통해 빠르게 확산
주요 입장
전망
- · 논문 기준 Qwen3-4B-Instruct에서 MedQA 80.8%를 기록하며 4B 스케일 SOTA를 주장했다.
- · 보이지 않는 정책 모델들에서 최대 25.7% 정확도 향상을 보고했다.
한국 영향
- 국내 의료 QA 데이터셋 확보
- 추론 과정 로그감사
- 전문직 AI 책임 구조
참고 자료
OpenAI가 Axios 공급망 사고 여파로 macOS 코드서명 인증서를 교체하며 데스크톱 앱 신뢰체인을 방어했다.
주요 사건
OpenAI는 GitHub Actions 워크플로우가 악성 Axios 패키지를 실행한 뒤, 증거는 없지만 예방 차원에서 macOS 앱 서명 인증서를 회전·교체한다고 공지했다. 영향 대상은 ChatGPT Desktop, Codex, Codex CLI, Atlas 등 macOS 앱이다.
배경
- 2026-03-31악성 axios 1.14.1 공급망 사고 발생
- 2026-04-11OpenAI가 X에서 인증서 교체 및 앱 업데이트 필요 공지
- 2026-05-08구 인증서 완전 폐기 예정
주요 입장
전망
- · BleepingComputer 보도 기준 구 인증서로 서명된 앱은 2026-05-08 이후 macOS에서 차단될 수 있다.
- · Karpathy도 별도 트윗에서 axios는 주간 다운로드 3억 회 수준의 핵심 의존성이라고 지적했다.
한국 영향
- 국내 npm/pypi 공급망 가이드라인
- 앱 서명 키 HSM 적용
- 에이전트용 로컬 앱 보안 인증
참고 자료
SemiAnalysis는 AI와 빅테크 시가총액이 사실상 TSMC 한 곳의 생산능력에 묶여 있다고 다시 경고했다.
주요 사건
SemiAnalysis는 상위 10대 시총 기업 중 7곳이 TSMC 생산에 거의 절대적으로 의존한다고 지적하며, 대만 내 극도로 집중된 첨단 칩 제조가 글로벌 AI 공급망의 단일 실패지점(single point of failure)이라고 강조했다.
배경
- 2022-11-30생성형 AI 붐이 시작되며 첨단 GPU 수요 급증
- 2026-01-26Stratechery가 TSMC가 AI buildout의 실질 병목이라고 분석
- 2026-04-13SemiAnalysis가 X에서 TSMC single point of failure를 재강조
주요 입장
전망
- · Stanford HAI 2026 AI Index 관련 보도는 글로벌 AI가 여전히 TSMC 단일 파운드리에 과도하게 의존한다고 짚었다.
- · Stratechery는 TSMC의 2025 capex가 410억 달러 수준으로 늘었어도 공급부족 해소는 느리다고 분석했다.
한국 영향
- 삼성 2nm 수율
- HBM4 공급 체인
- 국내 첨단 패키징 투자 속도
참고 자료
SemiAnalysis는 미국향 스마트폰 수입에서 중국 비중이 90%에서 25%로 급락했다고 지적하며 전자조립 탈중국을 강조했다.
주요 사건
SemiAnalysis는 미국향 스마트폰 수입에서 중국 비중이 90%에서 25%로 하락했다고 언급하며, 애플과 폭스콘 중심의 소비자 전자기기 조립 공급망이 계획 수준을 넘어 실질 이동 단계에 들어섰다고 평가했다.
배경
- 2018-07-06미중 관세 전쟁 본격화
- 2020-03-01팬데믹으로 단일국가 생산 리스크 부각
- 2026-03-10Bloomberg가 인도 iPhone 생산 비중 25% 도달 보도
- 2026-04-13SemiAnalysis가 미국향 수입 데이터 변화를 X에서 제시
주요 입장
전망
- · Bloomberg 보도에 따르면 Apple은 2025년 인도에서 약 5,500만 대를 생산해 전체의 약 25% 수준에 도달했다.
- · 이는 1년 전 약 3,600만 대에서 크게 늘어난 수치다.
한국 영향
- 인도 생산 인프라 병목
- 동남아 EMS 투자
- 국내 부품사의 현지화 속도
참고 자료
Stanford HAI의 2026 AI Index는 AI 채택 급증과 함께 전력·물·청년고용 부담이 더 현실화됐다고 보여줬다.
주요 사건
Stanford HAI가 2026 AI Index를 공개했고, MIT Technology Review가 이를 요약 보도했다. 보고서는 AI 성능과 투자 확대와 동시에 환경 비용, 측정 투명성 저하, 청년층 일자리 압박을 함께 부각했다.
배경
- 2017-01-01Stanford AI Index 프로젝트 시작
- 2024-01-01생성형 AI 상용화가 고용·인프라 논의 중심이 됨
- 2026-04-132026 AI Index 및 12가지 핵심 인사이트 공개
주요 입장
전망
- · Stanford HAI에 따르면 AI 데이터센터 전력 용량은 29.6GW까지 상승했다.
- · 동 보고서는 22~25세 소프트웨어 개발자 고용이 2024년 이후 거의 20% 감소했다고 짚었다.
한국 영향
- 국내 데이터센터 전력 허가
- 초급 개발자 채용지표
- 탄소·물 사용 공시
참고 자료
TechCrunch는 Microsoft가 365 Copilot에 상시 동작형 로컬 에이전트 성격의 새 기능을 시험 중이라고 보도했다.
주요 사건
TechCrunch는 Microsoft가 Microsoft 365 Copilot에 OpenClaw-like 성격의 기능을 시험 중이라고 보도했다. 핵심은 단발성 챗봇이 아니라 지속적으로 실행되며 작업을 대신하는 enterprise agent다.
배경
- 2025-01-01기업용 Copilot 도입이 본격화
- 2026-02-01Microsoft가 Copilot Tasks를 preview로 소개
- 2026-03-01Copilot Cowork 발표
- 2026-04-13TechCrunch가 OpenClaw-like agent 실험 보도
주요 입장
전망
- · TechCrunch 보도는 이 기능이 사실상 ‘항상 일하는 365 Copilot’ 형태라고 전했다.
- · Microsoft는 이미 Copilot Cowork, Copilot Tasks를 연속 발표하며 agent 포트폴리오를 넓히고 있다.
한국 영향
- M365 agent 권한모델
- 국내 개인정보/망분리 이슈
- 감사로그 표준화
참고 자료
Vercel은 AI 에이전트가 만든 앱이 이미 전체의 30%라며 인프라 수요 급증을 IPO 논리로 연결했다.
주요 사건
TechCrunch는 Vercel CEO Guillermo Rauch가 AI 에이전트 덕분에 앱 배포량과 매출이 크게 뛰었고, 회사가 사실상 IPO 준비가 된 상태라고 말한 내용을 보도했다. 핵심 포인트는 ‘AI가 코드를 만들면 그 결과물을 호스팅할 인프라도 같이 커진다’는 주장이다.
배경
- 2023-10-01생성형 웹앱 빌더 수요 확대
- 2024-01-01Vercel ARR 약 1억 달러 수준으로 알려짐
- 2026-02-28ARR run-rate 약 3.4억 달러까지 상승
- 2026-04-13TechCrunch가 IPO readiness와 AI agent 수혜를 보도
주요 입장
전망
- · TechCrunch 보도 기준 Vercel ARR은 2024년 초 약 1억 달러에서 2026년 2월 말 약 3.4억 달러 run-rate로 커졌다.
- · Rauch는 현재 플랫폼 앱의 약 30%가 에이전트가 만든 것이라고 밝혔다.
한국 영향
- 국내 AI 앱 호스팅 수요
- 에이전트 생성 앱의 품질관리
- 배포 보안/관측 도구 경쟁
참고 자료
Import AI는 MirrorCode를 통해 최신 AI가 일부 경우 이미 수주 단위 코딩 작업을 자율 수행할 수 있다고 짚었다.
주요 사건
Import AI는 METR·Epoch AI의 MirrorCode 결과를 소개하며, 최신 모델이 소스코드 없이 실행 결과만 보고 상당한 규모의 CLI 프로그램을 재구현할 수 있다고 강조했다. 이는 기존 코딩 벤치마크보다 훨씬 긴 horizon을 다룬다.
배경
- 2023-06-01초기 에이전트 코딩 실험이 주목받기 시작
- 2025-01-01장기 과업 수행시간을 AI capability metric으로 보는 논의 확대
- 2026-04-10METR/Epoch가 MirrorCode 예비 결과 공개
- 2026-04-13Import AI가 이를 핵심 이슈로 소개
주요 입장
전망
- · MirrorCode 결과에서 Claude Opus 4.6는 약 16,905라인 Go 툴킷을 재구현했고 1,901개 테스트 중 1,900개를 통과했다.
- · 연구진은 인간 엔지니어 기준 약 2~17주가 걸릴 수 있는 과제라고 추정했다.
한국 영향
- 국내 코딩 에이전트 도입률
- 레거시 현대화 수요
- 보안상 재구현 자동화 리스크