Gemma 4 공개, GPU 공급난 심화, 모델·에이전트·프라이버시 경쟁이 동시에 가속됐다
- Google DeepMind가 Apache 2.0 기반 Gemma 4를 공개하며 오픈모델 경쟁을 다시 흔들었다.
- SemiAnalysis는 H100 1년 계약 가격이 6개월간 약 40% 상승했고 B200 spot은 시간당 14달러까지 치솟았다고 밝혔다.
- Anthropic·모바일 에이전트 연구는 감정 표현과 프라이버시 준수 같은 비성능 축이 제품 경쟁력의 핵심이 되고 있음을 보여줬다.
- Microsoft는 음성·전사·이미지 생성 MAI 모델을 내놓으며 OpenAI 의존도를 낮추는 수직통합 전략을 강화했다.
- AI 서비스 확산과 함께 Granola 같은 협업 도구의 기본 공개 설정 문제까지 드러나면서 데이터 거버넌스 리스크가 커지고 있다.
Google DeepMind가 Apache 2.0 기반 Gemma 4를 공개하며 오픈모델 경쟁을 재점화했다
주요 사건
Google DeepMind가 Gemma 4를 공개했다. 31B Dense, 26B MoE, E4B, E2B 등 여러 크기로 나오며 이미지·영상 이해와 일부 모델의 오디오 입력, 함수 호출, 구조화 출력, 최대 256K 컨텍스트를 지원한다. Apache 2.0 라이선스로 배포돼 상업적 활용 장벽이 크게 낮아졌다.
배경
- 2017-06-01Transformer 논문 발표
- 2024-02-21Google이 Gemma 1 공개
- 2025-03-12Gemma 3 공개
- 2026-04-02Gemma 4 공개
주요 입장
전망
- · Google 자료와 외부 보도에 따르면 31B Dense는 Arena AI text leaderboard 기준 상위권 오픈모델로 포지셔닝된다.
- · 9to5Google는 31B가 오픈모델 3위, 26B MoE가 6위라고 전했다.
한국 영향
- 한국어 성능 및 파인튜닝 효율
- 온디바이스 추론 생태계 확대
- 라이선스 기반 공공조달 활용
Anthropic이 LLM 내부의 감정 개념 표현을 추적한 새 연구를 발표했다
주요 사건
Anthropic은 Claude 같은 대형언어모델 내부에 감정 개념을 나타내는 잠재 표현이 있으며 이것이 실제 응답 행동에 영향을 줄 수 있다는 연구를 공개했다. 핵심 메시지는 '모델이 감정을 느낀다'가 아니라, 감정처럼 작동하는 기능적 내부 상태가 있다는 점이다.
배경
- 2022-11-30대화형 LLM 대중화 시작
- 2024-01-01해석가능성 연구가 상용모델로 확대
- 2026-03-10Emotion is Not Just a Label 논문 제출
- 2026-04-02Anthropic이 연구 결과를 X에서 공개
주요 입장
전망
- · Anthropic은 기능적 감정이 신뢰 가능한 시스템 설계에 실제 결과를 만든다고 주장했다.
- · 관련 arXiv 논문은 감정 개념이 단순 라벨이 아니라 잠재적 처리 요인일 수 있음을 시사한다.
한국 영향
- 청소년 대상 AI 서비스 규제
- 감정적 설득 금지 기준
- 해석가능성 연구 인력 확보
SemiAnalysis는 2026년 초 GPU 렌털 시장이 다시 급등하며 H100 1년 계약가가 6개월간 40% 올랐다고 분석했다
주요 사건
SemiAnalysis는 H100 1년 렌털 계약가가 2025년 10월 GPU당 시간당 1.70달러에서 2026년 3월 2.35달러로 약 40% 상승했다고 밝혔다. AWS p6-b200 spot은 시간당 14달러까지 지불하려는 수요가 붙고, 여름에 들어올 Blackwell 물량도 상당 부분 선점됐다고 전했다.
배경
- 2023-01-01생성형 AI 인프라 투자 급증 시작
- 2025-10-01H100 1년 계약가 약 1.70달러/시간 저점
- 2026-03-31H100 1년 계약가 2.35달러/시간 수준
- 2026-04-02SemiAnalysis가 공개 인덱스와 분석 발표
주요 입장
전망
- · SemiAnalysis는 100개 이상 시장 참여자 설문과 거래 데이터를 기반으로 지수를 만들었다고 밝혔다.
- · Seeking Alpha도 H100 렌털가가 최근 6개월간 거의 40% 상승했다고 요약했다.
한국 영향
- 국내 B200/H200 공급 일정
- 국가 GPU 팜 투자
- HBM 수요 수혜 지속
OpenAI가 실리콘밸리 영향력이 큰 테크 토크쇼 TBPN을 인수했다
주요 사건
OpenAI가 실리콘밸리의 인기 비즈니스·테크 라이브쇼 TBPN을 인수했다. TBPN은 독립 브랜드로 유지되지만 OpenAI 전략 조직 산하에서 운영되며 Chris Lehane 라인으로 보고한다.
배경
- 2023-01-01AI 기업들의 워싱턴 로비 강화
- 2025-01-01TBPN이 실리콘밸리 핵심 라이브쇼로 부상
- 2026-04-02OpenAI의 TBPN 인수 보도 및 X 발표
주요 입장
전망
- · TechCrunch는 TBPN이 올해 3천만 달러 이상 매출을 낼 궤도라고 전했다.
- · Fidji Simo는 OpenAI 같은 비정형 회사에는 기존 커뮤니케이션 플레이북이 맞지 않는다고 설명했다.
한국 영향
- AI 기업의 미디어 투자
- 정책 로비와 콘텐츠 결합
- 브랜드 신뢰도 관리
Microsoft가 전사·음성·이미지 생성용 MAI 모델 3종을 발표하며 자체 멀티모달 스택을 강화했다
주요 사건
Microsoft AI가 MAI-Transcribe-1, MAI-Voice-1, MAI-Image-2를 공개했다. 회사는 MAI-Transcribe-1이 25개 언어를 다루고 Azure Fast 대비 2.5배 빠르며, Transcribe는 시간당 0.36달러, Voice는 100만 자당 22달러, Image는 텍스트 입력 100만 토큰당 5달러·이미지 출력 100만 토큰당 33달러라고 밝혔다.
배경
- 2024-03-19Mustafa Suleyman이 Microsoft AI 합류
- 2025-11-01MAI Superintelligence 팀 공식화
- 2026-03-19MAI-Image-2 선공개
- 2026-04-02MAI 모델 3종 발표
주요 입장
전망
- · Microsoft는 FLEURS 기준 상위 25개 언어 중 11개 핵심 언어에서 1위를 기록했고 나머지 14개에서 Whisper-large-v3를 앞섰다고 밝혔다.
- · TechCrunch는 이번 발표를 OpenAI와의 파트너십을 유지하면서도 자체 스택을 강화하는 신호로 해석했다.
한국 영향
- 한국어 지원 품질
- Foundry 가격 경쟁
- MS 자체모델과 OpenAI 모델의 역할 분리
Granola의 기본 링크 공개 설정이 드러나며 AI 회의노트 도구의 프라이버시 리스크가 부각됐다
주요 사건
The Verge는 AI 회의노트 앱 Granola가 '기본적으로 비공개'라고 설명하면서도 실제 기본 링크 설정은 '링크를 가진 누구나'로 되어 있어, 링크가 유출되면 메모와 일부 대화문맥을 볼 수 있다고 보도했다. 일반 요금제는 AI 학습도 기본 opt-out이 아니다.
배경
- 2024-01-01AI 회의노트 스타트업 급증
- 2025-07-25링크 공개 설정 문제가 링크드인에서 지적됨
- 2026-04-02The Verge가 기본 공개 설정 문제 재조명
주요 입장
전망
- · The Verge는 비로그인 상태에서도 노트 소유자와 생성시점, 일부 문맥을 볼 수 있음을 확인했다.
- · Granola는 엔터프라이즈 고객만 기본적으로 AI 학습에서 제외된다고 밝혔다.
한국 영향
- 기본 공유정책
- 학습 데이터 옵트아웃
- 국내 SaaS 보안 인증 연계
모바일 에이전트의 개인정보 보호 능력을 측정하는 MyPhoneBench 연구가 등장했다
주요 사건
새 논문 'Do Phone-Use Agents Respect Your Privacy?'는 MyPhoneBench라는 평가 프레임워크를 제안했다. 연구진은 5개 프런티어 모델을 10개 모바일 앱, 300개 작업에 대해 시험했고 성공률과 프라이버시 준수율이 별개 능력이라는 점을 보여줬다.
배경
- 2024-01-01스마트폰 조작형 에이전트 관심 급증
- 2026-04-01논문 arXiv 제출
- 2026-04-02AK 계정이 연구 소개
주요 입장
전망
- · 논문은 5개 모델, 10개 앱, 300개 태스크에서 단일 모델이 성공·프라이버시·저장선호 활용을 모두 지배하지 못했다고 밝혔다.
- · 가장 끈질긴 실패는 필요 없는 선택적 개인정보 항목까지 채워 넣는 데이터 최소화 실패였다.
한국 영향
- 모바일 에이전트 권한 체계
- 감사로그 표준화
- 개인정보 최소입력 정책
ServiceNow 연구는 복잡한 GUI 에이전트보다 터미널 기반 코딩 에이전트가 기업 자동화에 더 실용적일 수 있다고 주장했다
주요 사건
ServiceNow 연구진은 'Terminal Agents Suffice for Enterprise Automation' 논문에서 터미널과 파일시스템만 가진 코딩 에이전트가 다양한 기업 업무에서 MCP 기반 도구에이전트나 웹 GUI 에이전트와 맞먹거나 더 나은 성능을 낼 수 있다고 주장했다.
배경
- 2023-01-01브라우저 에이전트 붐 시작
- 2025-01-01MCP 기반 툴 생태계 확산
- 2026-03-31논문 arXiv 공개
- 2026-04-02AK가 연구 확산
주요 입장
전망
- · 논문은 저수준 터미널 에이전트가 더 복잡한 구조와 동등하거나 우수했다고 주장한다.
- · 이는 최근 코딩 에이전트 확산과 맞물려 'API가 있는 업무부터 자동화된다'는 산업 흐름을 강화한다.
한국 영향
- API 노출 범위
- 감사 가능성
- 에이전트 보안통제
Google Gemma 4 공개 직후 허깅페이스 생태계에서 로컬·오픈모델 기대감이 급상승했다
주요 사건
허깅페이스 중심 커뮤니티에서는 Gemma 4 공개 직후 모델 가중치와 실험 사례가 빠르게 퍼졌다. 특히 26B-A4B MoE의 로컬 추론 가능성과 Apache 2.0 라이선스가 주목받았다.
배경
- 2023-01-01허깅페이스가 오픈모델 배포 허브로 정착
- 2026-04-02Gemma 4가 허깅페이스에 즉시 공개
주요 입장
전망
- · 커뮤니티는 16GB급 장비에서도 준-프런티어급 로컬 추론 기대를 표시했다.
- · Gemma 4는 허깅페이스, Kaggle, Ollama에서 곧바로 받을 수 있도록 공개됐다.
한국 영향
- 한국어 파생모델 등장
- 로컬 벤치마크 결과
- 국내 GPU 메모리 조건
AI 영상 생성의 약점인 사람 움직임 품질을 겨냥한 대규모 선호 데이터셋이 공개됐다
주요 사건
datapointai 계정이 소개한 데이터셋은 AI 영상 생성 모델의 사람 움직임 품질을 비교하는 대규모 인간 선호 데이터다. 허깅페이스 기준 medium은 57,866개, large는 115,732개의 pairwise 라벨을 포함한다.
배경
- 2024-02-01텍스트-비디오 모델 경쟁 본격화
- 2026-04-02모션 선호 데이터셋이 커뮤니티에 확산
주요 입장
전망
- · 허깅페이스 데이터셋 설명 기준 large 버전은 115,732개 pairwise 선호 라벨을 포함한다.
- · 모션 품질 중심 평가는 기존 정적 이미지 지표와 다른 개발 방향을 요구한다.
한국 영향
- 한국어/한국인 동작 데이터 확장
- 영상 생성 규제
- 광고·엔터 적용 속도
Karpathy는 개인 지식베이스를 LLM이 직접 컴파일·유지하는 워크플로를 제안하며 AI 연구도구의 방향을 보여줬다
주요 사건
Andrej Karpathy는 최근 연구 주제를 대상으로 raw 문서·이미지·코드 저장소를 LLM이 위키 형태로 지속적으로 '컴파일'하고, 다시 질의응답·시각화·보고서 작성에 활용하는 개인 지식베이스 워크플로를 공개했다. 약 100개 문서, 40만 단어 규모에서도 복잡한 질의를 소화했다고 설명했다.
배경
- 2023-01-01RAG와 노트 앱 기반 AI 워크플로 확산
- 2026-03-06Karpathy autoresearch repo 공개
- 2026-04-02지식베이스 워크플로 스레드 공개
주요 입장
전망
- · Karpathy는 약 100개 문서와 약 40만 단어 수준의 위키에서도 복잡한 질의에 유용했다고 설명했다.
- · 출력 형식을 텍스트가 아니라 markdown, slide, matplotlib 이미지로 바로 생성하는 흐름이 특징이다.
한국 영향
- 문서 저장소 표준화
- 멀티모달 자료 인덱싱
- 한국어 장문 컨텍스트 품질