DeepSeek 커널·Cerebras IPO·ChatGPT 금융 연결이 AI 경쟁축을 바꾼다
- DeepSeek은 MegaMoE 커널로 V4-Flash 추론을 최대 1.96배 높였다
- Cerebras는 상장 첫날 장중 90% 급등하며 AI 칩 수요를 확인했다
- OpenAI는 1만2000개 금융기관 계좌를 ChatGPT에 연결하기 시작했다
- YouTube와 arXiv는 딥페이크·AI 논문 남용 대응을 플랫폼 규칙으로 강화했다
- Tesla Robotaxi 사고와 Tabiq 유출은 AI 서비스 운영 리스크를 드러냈다
DeepSeek, MegaMoE로 V4-Flash MoE 추론 최대 1.96배 가속
주요 사건
SemiAnalysis가 DeepSeek V4의 MegaMoE 커널을 해설했다. 이 커널은 전문가 병렬 MoE 모델의 dispatch, FP8xFP4 선형층, SwiGLU, combine을 하나의 CUDA 커널로 묶고 NVLink 통신과 텐서코어 연산을 겹쳐 실행한다.
배경
- 2017-06-01Transformer 구조가 대형 언어모델의 표준이 됨
- 2021-01-11Switch Transformer가 sparse MoE 확장성을 입증
- 2026-04-24DeepGEMM PR이 MegaMoE 벤치마크를 공개
- 2026-05-15SemiAnalysis가 DeepSeek V4 MegaMoE 구조를 분석
주요 입장
전망
- · DeepGEMM PR은 batch 1에서 56.5us, 1.96배 speedup을 보고했다.
- · SemiAnalysis는 통신을 숨겨 deployment가 network bandwidth에 덜 민감해진다고 평가했다.
한국 영향
- DeepGEMM MegaMoE의 SM90/SM100 의존성
- 국내 NPU에서 FP4/FP8 MoE 지원 여부
- 추론비 인하가 한국 AI 서비스 가격에 반영되는 속도
Cerebras, 상장 첫날 90% 급등하며 AI 칩 IPO 수요 확인
주요 사건
SemiAnalysis가 Cerebras IPO를 다뤘고, 외신은 Cerebras가 공모가 185달러 대비 장중 350달러로 90% 뛰며 올해 최대 IPO 수요를 만들었다고 보도했다. 종가 기준으로도 약 68% 상승, IPO 시가총액은 564억 달러, 조달액은 55억 달러 수준으로 집계됐다.
배경
- 2015-01-01Cerebras 설립
- 2024-01-01Cerebras가 첫 IPO 절차를 추진
- 2025-01-01시장 여건으로 IPO를 철회
- 2026-05-15Cerebras가 나스닥 데뷔 후 장중 90% 상승
주요 입장
전망
- · Yahoo Finance는 IPO가 20배 초과 청약됐다고 전했다.
- · NBC는 상장 후 기업가치가 750억 달러를 넘었다고 보도했다.
한국 영향
- Cerebras 실매출 성장률
- HBM 탑재 방식과 공급망
- 국내 AI 반도체 IPO 가능성
OpenAI, ChatGPT에 1만2000개 금융계좌 연결 기능 출시
주요 사건
Sam Altman이 ChatGPT 개인금융 기능 출시를 공유했다. OpenAI는 미국 Pro 이용자 프리뷰로 Plaid를 통해 1만2000개 이상 금융기관 계좌를 연결하고, 지출·투자·구독·예정 결제를 GPT-5.5 Thinking 기반으로 분석하게 했다.
배경
- 2022-11-30ChatGPT 공개
- 2023-03-01Plaid가 주요 앱의 계좌 연결 표준으로 확산
- 2026-05-15OpenAI가 ChatGPT 개인금융 프리뷰를 미국 Pro에 출시
주요 입장
전망
- · OpenAI는 연결 해제 시 synced account data를 30일 내 삭제한다고 밝혔다.
- · TechCrunch는 Plaid를 통한 1만2000개 금융기관 연결을 핵심으로 짚었다.
한국 영향
- 한국 마이데이터 API와 LLM 결합 허용 범위
- 금융 메모리 삭제·감사 로그
- AI 금융조언의 면책·책임 기준
OpenAI, GPT-5.5 Codex 품질 저하 신고 조사 착수
주요 사건
Sam Altman이 GPT-5.5 Codex 성능 저하 신고를 팀이 조사 중이라는 게시물을 인용했다. 시스템 상태는 정상이나 일부 사용자가 현재 모델 품질을 이전보다 낮게 느끼는 현상을 확인하고 있다.
배경
- 2025-01-01코딩 에이전트가 IDE·터미널 업무에 본격 확산
- 2026-05-14OpenAI가 Codex 모바일·자동화 기능을 홍보
- 2026-05-15GPT-5.5 Codex 품질 저하 신고 조사를 공개 언급
주요 입장
전망
- · Karpathy는 코딩·수학처럼 검증 가능한 영역에서 최신 에이전트 모델의 진전이 가장 크다고 설명한 바 있다.
- · Sam Altman은 팀이 성능 신고를 심각하게 다룬다고 말했다.
한국 영향
- GPT-5.5 Codex 회귀 조사 결과
- 기업용 모델 버전 고정 옵션
- 국내 코드베이스 기반 벤치마크 구축
Abridge, 1억건 의료대화로 임상 AI 플랫폼 확장
주요 사건
swyx가 Latent Space의 Abridge 인터뷰를 공유했다. Abridge는 1억건 이상 의료 대화, 실시간 사전승인, 임상 인텔리전스 레이어를 내세워 단순 의무기록 자동화를 넘어 진료·보험청구·의사결정 지원으로 확장하고 있다.
배경
- 2020-01-01임상 대화 자동기록 스타트업들이 병원 도입을 시작
- 2025-06-24Abridge가 3억 달러 Series E를 발표
- 2026-05-14Abridge가 1억건 의료대화와 임상 인텔리전스 전략을 소개
주요 입장
전망
- · Abridge는 150개 이상 의료 시스템과 55개 전문과 지원을 밝혔다.
- · Abridge는 번아웃 60~70% 감소와 90% 이상 의미 있는 지속사용률을 제시했다.
한국 영향
- 국내 EMR 연동 표준
- 의료 음성 데이터 비식별화
- AI 사전승인·심사 자동화 허용 범위
LeCun, LLM 한계 지적하며 JEPA식 월드모델 재강조
주요 사건
Yann LeCun이 LLM은 수학·코딩처럼 언어가 추론의 기질인 영역에서 강하지만, 물리 세계의 계획·상식에는 한계가 있다는 주장을 다시 공유했다. 대안으로 추상 표현 공간에서 미래를 예측하는 JEPA와 월드모델을 강조했다.
배경
- 1988-01-01Moravec paradox가 인간에게 쉬운 지각·운동이 컴퓨터에 어렵다는 문제를 제기
- 2023-06-01I-JEPA가 이미지 재구성 없이 표현 예측 학습을 제안
- 2026-01-22LeCun이 AMI Labs와 LLM 대안 전략을 공개
- 2026-05-15LeCun이 LLM의 수학·코딩 강점과 현실세계 한계를 재강조
주요 입장
전망
- · LeCun은 LLM이 행동 결과를 예측하지 못한다고 비판했다.
- · MIT Technology Review 인터뷰는 JEPA가 예측 불가능한 세부를 버리고 추상 상태를 학습한다고 설명했다.
한국 영향
- AMI Labs 연구 공개 범위
- V-JEPA 계열 로봇 벤치마크
- 국내 제조 현장 데이터 활용 규제
YouTube, 성인 전체에 AI 딥페이크 얼굴 탐지 도구 확대
주요 사건
YouTube가 AI로 생성·변형된 얼굴 영상에서 본인 likeness를 찾는 도구를 모든 성인 이용자로 확대한다. 이용자는 셀피식 얼굴 스캔으로 등록한 뒤 잠재적 매칭 영상을 검토하고 삭제 요청을 할 수 있다.
배경
- 2017-01-01딥페이크 도구가 대중화되기 시작
- 2024-01-01주요 플랫폼이 AI 합성 콘텐츠 라벨·삭제 정책을 강화
- 2026-05-15YouTube가 likeness detection을 모든 성인에게 확대
주요 입장
전망
- · YouTube Help는 현재 얼굴 시각 매칭이며 음성 탐지는 2026년 확장 목표라고 설명한다.
- · The Verge는 크리에이터 요건 없이 성인 전체로 확대된 점을 핵심 변화로 봤다.
한국 영향
- 한국 계정 적용 시점
- 음성 likeness 탐지 정확도
- 오탐·악용 방지 절차
arXiv, 환각 인용 AI 논문 제출자에 1년 금지 제재 도입
주요 사건
arXiv가 부적절한 언어, 표절, 오류, 잘못된 참고문헌, 오해의 소지가 있는 AI 생성 논문을 올린 저자에게 1년 제출 금지를 부과할 수 있다고 밝혔다. 생성 방식과 무관하게 서명한 저자가 책임진다는 원칙이다.
배경
- 1991-01-01arXiv가 물리학 프리프린트 공유 플랫폼으로 출발
- 2023-01-01LLM 기반 논문 작성과 환각 인용 문제가 확산
- 2025-11-03arXiv가 AI slop 대응으로 일부 분야 정책을 강화
- 2026-05-15arXiv가 AI slop 제출자 1년 금지 방침을 보도 통해 공개
주요 입장
전망
- · The Verge는 1년 금지와 이후 peer-reviewed venue acceptance 요건을 보도했다.
- · arXiv의 이전 정책 변경은 AI 보조 리뷰 논문 홍수에 대응한 것이었다.
한국 영향
- arXiv 제재 실제 적용 사례
- 국내 학회 AI 작성 정책
- 인용 검증 도구 도입
Tesla, Robotaxi 원격조작 중 2건 충돌 사실 공개
주요 사건
Tesla가 NHTSA에 제출한 Robotaxi 충돌 설명에서 원격조작자가 개입한 뒤 2건의 사고가 났다는 사실이 드러났다. Austin 테스트에서 안전요원이 탑승했고 승객은 없었으며, 원격조작 속도는 8~9mph 수준이었다.
배경
- 2020-01-01Tesla가 완전자율주행 비전을 반복 제시
- 2025-07-01Austin Robotaxi 테스트 중 원격조작 충돌 1건 발생
- 2026-01-01건설 바리케이드 충돌 등 원격조작 사고 추가
- 2026-05-15NHTSA 자료 공개로 17건 사고 설명이 보도
주요 입장
전망
- · TechCrunch는 원격조작자가 10mph 이하에서 차량을 조종할 수 있다고 보도했다.
- · Electrek은 17건 사고 중 2건이 원격조작 개입 후 발생했다고 정리했다.
한국 영향
- NHTSA 최종 조사 방향
- Tesla 무인 안전요원 제거 일정
- 한국 자율주행 원격관제 규정
Runway, 영상 생성 넘어 월드모델로 Google 추격 선언
주요 사건
Runway가 영화·광고용 영상 생성 툴에서 관측 데이터로 세계를 학습하는 월드모델 기업으로 확장하겠다는 전략을 밝혔다. 회사는 5.3억 달러가 아니라 53억 달러 valuation의 AI 비디오 스타트업으로, Gen 4.5와 GWM 계열을 앞세운다.
배경
- 2018-01-01Runway 설립
- 2025-12-11Runway가 첫 world model GWM-1과 Gen 4.5 업데이트를 공개
- 2026-02-10Runway가 3.15억 달러 Series E, 53억 달러 valuation을 확보
- 2026-05-15Runway가 Google을 겨냥한 월드모델 전략을 설명
주요 입장
전망
- · TechCrunch는 Runway Gen 4.5가 Google·OpenAI 영상 생성 제품을 여러 벤치마크에서 앞섰다고 보도했다.
- · Runway는 GWM-1을 frame-by-frame prediction 기반 world model로 설명했다.
한국 영향
- Gen 4.5의 실제 제작 워크플로 채택률
- 한국 콘텐츠 IP 학습·활용 계약
- 월드모델의 게임엔진 대체 가능성
일본 호텔 체크인 시스템, 여권·면허증 100만건 노출
주요 사건
일본 스타트업 Reqrea가 운영하는 호텔 체크인 시스템 Tabiq가 여권, 운전면허증, 셀피 인증사진 100만건 이상을 비밀번호 없이 공개된 클라우드 스토리지에 노출했다. 보안 연구자 신고 후 버킷은 잠겼다.
배경
- 2020-01-01팬데믹 이후 비대면 호텔 체크인 도입이 확대
- 2024-01-01여행·숙박 앱에서 OCR·얼굴 인증 기반 KYC가 보편화
- 2026-05-15Tabiq의 여권·면허증·셀피 100만건 이상 노출이 보도
주요 입장
전망
- · TechCrunch는 정교한 해킹이 아니라 기본 보안실패가 원인이라고 지적했다.
- · 보안 연구자 Anurag Sen의 신고 후 Reqrea가 저장소를 잠근 것으로 보도됐다.
한국 영향
- Tabiq 영향 국가와 한국인 포함 여부
- 국내 숙박 SaaS의 공개 버킷 점검
- 여권 이미지 삭제 자동화