Cognition 260억달러 평가·Snowflake 60억달러 AWS 계약, AI 인프라 경쟁 가속
- Cognition은 10억달러 이상을 조달하고 Devin 연간화 매출 4.92억달러를 제시해 코딩 에이전트가 독립 소프트웨어 시장으로 재평가된다
- Snowflake의 5년 60억달러 AWS 계약과 SemiAnalysis의 Bedrock 분석은 AI 워크로드가 클라우드 자체 칩·모델 유통 마진으로 이동함을 보여준다
- Gemini Embedding 2·ESMFold2·LeJEPA 논문은 검색, 단백질 구조, 월드모델에서 범용 AI 연구의 벤치마크 압박을 높인다
- MakoraGenerate와 Cerebras CS4 논의는 GPU 커널 자동화와 SRAM 한계가 AI 추론 비용 경쟁의 핵심 병목임을 드러낸다
Cognition, 10억달러 조달로 260억달러 평가 — Devin ARR 4.92억달러 제시
주요 사건
swyx는 Cognition이 10억달러 이상을 조달해 260억달러 평가를 받았고, 기업 사용량과 매출 성장으로 독립 에이전트 연구소 중 최대 규모가 됐다고 평가했다. 보도 기준 연간화 매출은 약 4.92억달러, 고객에는 Mercedes-Benz·NASA·Goldman Sachs 등이 포함된다.
배경
- 2024-03-01Cognition, Devin 공개
- 2025-09-01Cognition, 4억달러 조달 후 102억달러 평가
- 2026-05-2710억달러 이상 조달·260억달러 평가 보도
주요 입장
전망
- · swyx는 Cognition을 'largest independent agent lab'로 표현하며 기업 전투검증을 핵심 자산으로 봤다
- · TechCrunch·Bloomberg 보도는 투자자가 코파일럿보다 자율 에이전트에 프리미엄을 부여한다고 해석했다
한국 영향
- Devin·Codex·Claude Code의 실제 PR 병합률
- 보안 사고와 코드 저작권 리스크
- 국내 개발자 교육 전환 속도
참고 자료
Snowflake, AWS와 5년 60억달러 계약 — Graviton·AI 용량 확보
주요 사건
Snowflake가 AWS와 5년 60억달러 규모의 클라우드·칩 사용 계약을 맺었다. CNBC는 Graviton Arm CPU와 AI용 GPU 사용 확대가 포함됐고, 평균 연 12억달러 지출에 해당한다고 보도했다.
배경
- 2018-11-01AWS Graviton 공개
- 2023-01-01Snowflake AWS 약정 25억달러로 확대
- 2026-05-27Snowflake 60억달러 AWS 계약 발표
주요 입장
전망
- · CNBC는 이번 계약을 AWS AI 모멘텀 회복 신호로 해석했다
- · Reuters 계열 보도는 Snowflake 주가가 실적·AI 계약 기대에 25~29% 급등했다고 전했다
한국 영향
- AWS Graviton/Trainium 채택률
- Snowflake AI 워크로드 매출 전환
- 국내 CSP의 Arm 서버 도입
참고 자료
Google DeepMind, Gemini Embedding 2 공개 — 텍스트·이미지·영상·음성 통합 검색 겨냥
주요 사건
Google DeepMind가 Gemini 기반 네이티브 멀티모달 임베딩 모델 Gemini Embedding 2 백서를 공유했다. 논문은 텍스트·이미지·비디오·오디오를 하나의 표현공간으로 매핑하며 MSCOCO 62.9 R@1, Vatex 68.8 NDCG@10, MTEB multilingual 69.9, MTEB Code 84.0을 제시했다.
배경
- 2023-12-01Gemini 1.0 공개
- 2025-01-01멀티모달 RAG 기업 도입 확대
- 2026-05-27Gemini Embedding 2 백서 공유
주요 입장
전망
- · 백서는 전문 모델을 넘는 zero-shot 도메인 성능을 강조했다
- · Google 문서는 128~3072 차원 출력과 8192 토큰 입력 한계를 제시했다
한국 영향
- 한국어·한국 이미지 도메인 성능
- 벡터 차원별 비용
- 개인정보 영상 검색 규제
SemiAnalysis, AWS Bedrock 마진 분석 — Claude 유통이 AWS EBIT 개선 견인
주요 사건
SemiAnalysis는 Anthropic 성장과 Bedrock 판매 구조가 AWS 마진을 끌어올렸다고 분석했다. 1Q26 AWS EBIT 마진은 전분기 대비 213bp 개선됐고, Bedrock/Anthropic 매출이 AWS AI 매출 믹스에서 빠르게 커졌다고 추정했다.
배경
- 2023-09-01Amazon, Anthropic 전략 투자 시작
- 2026-04-23Anthropic 1000억달러 AWS 실리콘 협력 보도
- 2026-05-27SemiAnalysis, Bedrock 마진 기여 분석 발행
주요 입장
전망
- · SemiAnalysis는 Bedrock이 AWS 총매출 4% 안팎이면서 매출총이익 증가분 30%를 설명한다고 추정했다
- · Futurum은 Anthropic-AWS 5GW 용량 협력을 공급 제약 시장의 구조적 전환으로 평가했다
한국 영향
- Bedrock 한국 리전 모델 지원
- Anthropic-AWS 가격 구조
- 국내 금융권 멀티클라우드 정책
참고 자료
Makora, 60초 GPU 커널 생성 제시 — DeepSeek MoE서 torch.compile 대비 1.83배
주요 사건
SemiAnalysis는 손으로 튜닝한 CUDA 커널이 자동 생성 커널에 밀리는 이유를 Makora 사례로 소개했다. MakoraGenerate는 LLM 에이전트가 CUDA/Triton 커널을 생성·컴파일·검증·벤치마크하며, DeepSeek MoE 예제에서 torch.compile 대비 1.83배 성능을 냈다고 주장한다.
배경
- 2024-01-01Triton·torch.compile 기반 AI 커널 최적화 확산
- 2025-12-10Makora, 자동 생성 커널 저장소 공개
- 2026-05-27SemiAnalysis, Makora 커널 자동화 사례 공유
주요 입장
전망
- · Makora는 DeepSeek MoE에서 런타임 18.5ms→10.2ms, 커널 런치 1043→533으로 줄었다고 제시했다
- · SemiAnalysis는 이 문제를 이론 peak와 실제 throughput 격차의 핵심으로 봤다
한국 영향
- 자동 커널 정확성 검증
- H100/B200/MI300X 범용성
- 국산 NPU 컴파일러 적용 가능성
OpenAI Foundation, AI 노동충격 대응에 2.5억달러 투입
주요 사건
Sam Altman은 OpenAI Foundation이 AI가 삶의 질과 자유를 높이도록 측정, 전환 지원, 광범위한 번영 접근에 초기 2.5억달러를 투입한다고 밝혔다. Reuters는 노동시장 영향 연구, 근로자·지역사회 지원, 경제적 이익 분배 실험에 쓰인다고 보도했다.
배경
- 2025-10-01OpenAI 구조개편으로 Foundation 지분 가치 확대
- 2026-03-01Foundation, 1년 최소 10억달러 투자 계획 공개
- 2026-05-27AI 경제전환 2.5억달러 프로그램 발표
주요 입장
전망
- · Reuters는 프로그램이 노동시장 측정과 근로자 전환 지원에 초점을 둔다고 전했다
- · OpenAI Foundation은 일반 보조금 배분뿐 아니라 직접 프로그램 운영도 예고했다
한국 영향
- AI 대체 직무 측정 방법론
- 전환지원 실험 결과
- 한국 노동부·교육부 대응
참고 자료
ESMFold2, 11억 단백질 구조 아틀라스 공개 — AlphaFold DB보다 8억개 많다
주요 사건
Yann LeCun이 공유한 ESMFold2 발표는 단일 서열 기반 단백질 구조 예측 모델과 11억개 구조 아틀라스를 공개했다. Nature는 이 아틀라스가 AlphaFold Database보다 8억개 이상 크고, 68억개 단백질 서열 정보를 포함한다고 전했다.
배경
- 2020-12-01AlphaFold2, CASP14에서 구조예측 혁신
- 2022-07-20ESMFold, 단일 서열 구조예측 논문 공개
- 2026-05-27ESMFold2와 11억 구조 아틀라스 공개
주요 입장
전망
- · Nature는 ESMFold2가 AlphaFold3보다 복합체 예측에서 낫다는 연구진 주장을 전했다
- · 서울대 Martin Steinegger는 알려진 구조와 다른 단백질에서의 성능 검증이 핵심이라고 지적했다
한국 영향
- 상업 사용 라이선스
- 한국 바이오 데이터셋 검증
- 생물보안 가이드라인
참고 자료
LeJEPA 이론 논문 공개 — 월드모델 잠재공간 식별성에 첫 보증 제시
주요 사건
Yann LeCun이 리트윗한 LeJEPA 논문은 JEPA류 월드모델이 언제 세계의 잠재변수를 선형적으로 회복하는지 증명했다. Gaussian latent world에서 LeJEPA가 식별 가능하며, 1024차원 latent와 픽셀 기반 로봇 제어 실험으로 검증했다고 주장한다.
배경
- 2022-01-01JEPA가 LeCun식 월드모델 청사진으로 부상
- 2025-11-01LeJEPA, SIGReg 기반 실용 훈련 목표 제시
- 2026-05-27LeJEPA 식별성 이론 논문 공유
주요 입장
전망
- · 논문은 Lean 4로 핵심 증명을 검증했다고 밝혔다
- · LeWorldModel 연구는 1500만 파라미터 규모에서도 단일 GPU 수시간 훈련과 빠른 planning 가능성을 제시했다
한국 영향
- 실제 3D 로봇 일반화
- Gaussian 가정 한계
- 국내 로봇 데이터셋 적용
Triomics, 암센터용 AI로 2200만달러 유치 — MSK·Yale 도입 확산
주요 사건
Triomics가 암센터 업무에 특화된 AI 플랫폼으로 2200만달러 Series B를 유치했다. Battery Ventures가 주도했고 MSK·Yale Cancer Center가 임상시험 매칭, 환자 요약, 종양 보고 자동화에 사용한다.
배경
- 2021-03-22Triomics 창업·초기 투자
- 2024-05-09Series A 1500만달러 유치
- 2026-05-27Series B 2200만달러 유치
주요 입장
전망
- · TechCrunch는 Triomics 고객 수가 1년 만에 4배, ARR이 10배 늘었다고 전했다
- · Triomics는 범용 AI 요약보다 종양학 특화 모델의 검증가능성을 차별점으로 든다
한국 영향
- 국내 EMR 연동성
- 개인정보 비식별 처리
- 보험·수가 인정 여부
참고 자료
Remote, AI 전사 도입으로 직원당 매출 50% 증가·ARR 3억달러 돌파 주장
주요 사건
글로벌 payroll 스타트업 Remote가 인력 추가 없이 직원당 매출을 50% 높이고 ARR 3억달러와 현금흐름 흑자를 달성했다고 밝혔다. CEO는 Claude 인스턴스와 사내 앱 마켓플레이스 Remote Labs, Slack 에이전트, AI 코딩을 전사적으로 쓴다고 설명했다.
배경
- 2019-01-01Remote 설립 후 글로벌 고용·급여 플랫폼 성장
- 2025-01-01사내 AI 도구·Remote Labs 확산
- 2026-05-27ARR 3억달러·직원당 매출 50% 증가 공개
주요 입장
전망
- · TechCrunch는 Remote의 최근 한 달 코드 85% 이상이 AI 작성이라는 CEO 주장을 전했다
- · Startup Fortune은 이를 AI가 운영 레버리지로 드러난 비교적 명확한 사례로 평가했다
한국 영향
- AI 작성 코드 품질
- 직원 생산성 측정 방식
- 채용 축소와 노동 규제
참고 자료
Cerebras CS4, 5nm 유지 논란 — SRAM 미세화 정체가 AI 칩 병목으로 부상
주요 사건
SemiAnalysis는 차세대 Cerebras CS4가 3nm가 아니라 5nm에 머무르는 이유로 SRAM 스케일링 정체를 지목했다. WSE-3는 TSMC N5에서 44GB SRAM과 21PB/s 대역폭을 제공하지만, N3E·N2에서도 SRAM 밀도 개선이 거의 없다는 분석이다.
배경
- 2019-01-01Cerebras WSE-1 공개
- 2024-01-01WSE-3, TSMC 5nm와 44GB SRAM 공개
- 2026-05-27CS4 5nm 유지와 SRAM 한계 논의
주요 입장
전망
- · SemiAnalysis 계열 분석은 WSE-3 SRAM이 44GB로 WSE-2 대비 10% 증가에 그쳤다고 지적했다
- · Jason's Chips는 GB200 NVL72 랙의 13.5TB HBM3E와 비교해 WSE의 44GB가 frontier 모델에는 제약이라고 봤다
한국 영향
- SRAM density 개선 로드맵
- Cerebras 상용 고객 규모
- HBM4E와 온칩 메모리 trade-off
Google 직원, 검색 내부정보로 Polymarket 120만달러 수익 혐의 기소
주요 사건
미 연방검찰은 Google 소프트웨어 엔지니어 Michele Spagnuolo가 Google Year in Search 2025 관련 비공개 내부정보로 Polymarket 베팅을 해 120만달러를 벌었다며 상품사기·전신사기·자금세탁 혐의로 기소했다.
배경
- 2025-12-04Google Year in Search 2025 공개 후 베팅 수익 발생
- 2026-04-01미군 Polymarket 베팅 사건 기소
- 2026-05-27Google 직원 Polymarket 내부정보 혐의 기소
주요 입장
전망
- · ABC News는 Polymarket이 near-zero 확률로 보던 D4vd 검색 1위 베팅이 핵심이라고 전했다
- · The Verge는 CFTC와 주정부 간 예측시장 감독권 충돌도 함께 짚었다
한국 영향
- 미국 판결의 법리
- Polymarket·Kalshi 규제
- 국내 데이터 접근 로그 감사
참고 자료
AI 인프라, Railway·수직 클라우드로 이동 — 에이전트 전용 배포 모델 부상
주요 사건
swyx는 Railway의 Agent-Native Cloud 논의를 공유하며 AI 인프라가 수직화되고 있다고 평가했다. Latent Space 요약에 따르면 Railway는 300만 사용자, 주 10만 가입, 월 20만달러 이상 코딩 에이전트 지출, production fork와 PR 없는 배포 흐름을 강조했다.
배경
- 2023-01-01AI 코딩 도구가 IDE 보조 중심으로 확산
- 2025-01-01에이전트가 장시간 작업·배포까지 수행
- 2026-05-27Railway agent-native cloud 사례 재조명
주요 입장
전망
- · swyx는 AI 인프라가 vertical하게 간다고 표현했다
- · Railway 창업자는 에이전트가 PR보다 production fork를 선호하는 흐름을 설명했다
한국 영향
- 에이전트별 IAM
- 프리뷰 환경 비용
- 국내 PaaS 대응