2026년 3월 6일 · 금요일·기술

높음

sentiment.bullish

OpenAI GPT-5.4 출시로 컴퓨터 유즈·100만 토큰 컨텍스트 시대 개막, NVIDIA GB300 NVL72 Hopper 대비 50배 추론 성능 입증, Broadcom AI칩 매출 2027년 $100B 전망

핵심 요약

OpenAI GPT-5.4 출시: 네이티브 컴퓨터 유즈, 1M 토큰 컨텍스트, 47% 토큰 효율 개선, OSWorld 75% 달성
NVIDIA GB300 NVL72: Hopper 대비 최대 50배 처리량, 35배 비용 절감 — SemiAnalysis InferenceX 벤치마크 확인
Broadcom Q1 실적 호조: AI칩 매출 $100B 가시권 선언, 매출 $19.3B (+29% YoY), Q2 가이던스 $22B
OpenAI Codex 200만 사용자 돌파, Windows 앱 출시 — 2주간 +40만 증가
TensorRT-LLM 소프트웨어 최적화로 GB200 MoE 추론 45일 만에 2배 성능 향상
AWS Amazon Connect Health: 의료 전문 AI 에이전트 플랫폼 출시
Karpathy, AI 에이전트 장기 메모리와 weight-based 업데이트 연구 방향 제시
Tencent HY-WU: 뉴럴 메모리 프레임워크 기반 이미지 편집 모델 공개
Meta AI 연구팀: 'Beyond Language Modeling' — 비전 중심 멀티모달 사전학습 연구 발표
SemiAnalysis, Brookfield의 Ori 인수 기술실사 주도 — 소버린 AI 컴퓨트 테마 부상

12개 출처 · 12개 항목

01@sama·3.5 18:19

OpenAI GPT-5.4 출시 — 네이티브 컴퓨터 유즈와 100만 토큰 컨텍스트로 에이전트 AI 시대 본격화

주요 사건

OpenAI가 GPT-5.4를 출시했다. API와 Codex에서 100만 토큰 컨텍스트를 지원하며, 네이티브 컴퓨터 유즈 기능을 탑재한 첫 범용 모델이다. GPT-5.4 Thinking(추론 모드)과 GPT-5.4 Pro(고성능)도 함께 공개됐다. 토큰 효율이 47% 개선되었고, 응답 중간에 사용자가 방향을 수정할 수 있는 'steering' 기능도 도입됐다.

배경

역사적 맥락

GPT-5.0(2025.12) → GPT-5.2(2026.01) → GPT-5.3 Instant(2026.03.03) → GPT-5.4(2026.03.05). OpenAI는 Anthropic의 Claude Computer Use에 대응해 네이티브 컴퓨터 유즈를 추가. Codex는 2월 초 100만 WAU를 넘긴 후 현재 200만+으로 급성장 중.

원인

[에이전트 AI 수요 폭증] → [코딩 에이전트 경쟁 심화(Cursor, Claude Code, Codex)] → [컴퓨터 유즈·장기 컨텍스트 필요성 대두] → [GPT-5.4 출시]

타임라인

2025-12-01
GPT-5.0 출시
2026-02-04
Codex 100만 WAU 돌파
2026-03-03
GPT-5.3 Instant 출시
2026-03-05
GPT-5.4 출시 — 컴퓨터 유즈, 1M 컨텍스트, Tool Search

주요 입장

OpenAI

공격적 출시

에이전트 AI 플랫폼 지배력 확보

Anthropic/Google

경쟁 대응 필요

Claude Computer Use/Gemini 에이전트로 차별화

개발자/기업

높은 기대

토큰 효율 개선과 컴퓨터 유즈로 실무 자동화 가능

규제 기관

주시

컴퓨터 자율 조작에 대한 안전성 우려

전망

high

GPT-5.4의 Tool Search + 컴퓨터 유즈가 에이전트 워크플로우의 사실상 표준이 될 가능성

high

Codex 200만 사용자 기반으로 Cursor/Windsurf와의 경쟁 심화

medium

GDPval 83%, OSWorld 75% 달성으로 지식노동 자동화 현실화

· Mercor CEO: 'GPT-5.4는 슬라이드덱, 재무모델, 법률분석 등 장기 결과물 생성에서 최고 성능을 보이며 비용도 낮다'
· Karpathy: '12월 이후 코딩 에이전트가 근본적으로 달라졌다. 30분이면 주말 프로젝트가 완성된다'

한국 영향

직접 영향

네이버/카카오 등 국내 AI 기업들의 에이전트 경쟁력 격차 확대. 국내 SaaS/기업용 SW 기업들은 GPT-5.4 API 기반 자동화 도구 개발 기회

간접 영향

컴퓨터 유즈 기능으로 RPA 시장 재편 가능. 국내 대기업 업무 자동화 도입 가속화 예상

주목할 지점

GPT-5.4 한국어 성능 벤치마크
국내 코딩 에이전트 도입 현황

참고 자료

#ai-model#openai#computer-use#agent-ai#gpt-5-4

02@SemiAnalysis_·3.5 23:00

NVIDIA GB300 NVL72, Hopper 대비 최대 50배 추론 성능·35배 비용 절감 — SemiAnalysis InferenceX 벤치마크 입증

주요 사건

SemiAnalysis InferenceX 벤치마크에서 NVIDIA GB300 NVL72(Blackwell Ultra)가 Hopper 대비 최대 50배 처리량/MW, 35배 낮은 비용/토큰을 달성했다. 특히 저지연 에이전트 워크로드에서 압도적이며, FP4 모드에서 MoE 모델 추론 시 H100을 완전히 압도한다.

배경

역사적 맥락

H100(Hopper) → B200(Blackwell) → GB200 NVL72 → GB300 NVL72(Blackwell Ultra). TensorRT-LLM 0.5.1→0.8.1 업그레이드로 45일 만에 동일 하드웨어에서 2배 성능 향상. SGLang도 GB300에서 25배 성능을 달성.

원인

[에이전트 AI 추론 수요 폭증] → [저지연+장기컨텍스트 동시 요구] → [GB300 NVL72 하드웨어 혁신] → [소프트웨어 최적화 가속] → [50배 성능 격차]

타임라인

2024-03-01
NVIDIA Blackwell 아키텍처 발표
2025-09-01
GB200 NVL72 출하 시작
2026-01-15
TensorRT-LLM 0.5.1 → 0.8.1 업그레이드 (45일간 2x 성능)
2026-03-05
GB300 NVL72 InferenceX 벤치마크 결과 공개

주요 입장

NVIDIA

하드웨어-소프트웨어 코디자인 강조

GB300은 에이전트 AI 추론의 최적 플랫폼

AMD

MI355로 대응

이론적 메모리 대역폭 경쟁력

클라우드 사업자

Blackwell 도입 가속

토큰당 비용 10배 절감으로 수익성 개선

전망

high

2026년 하반기 주요 클라우드에서 GB300 대규모 배치 예상

high

35배 비용 절감이 추론 API 가격 인하로 이어질 것

medium

TensorRT-LLM, SGLang, vLLM 등 추론 프레임워크 간 성능 경쟁 심화

· SemiAnalysis: 'GB300 FP4에서 프런티어 MoE 추론 시 H100을 완전히 압도한다'
· LMSYS: 'SGLang on GB300 NVL72로 25배 성능 달성'

한국 영향

직접 영향

SK하이닉스 HBM3e 수요 지속 확대. 삼성전자 HBM 경쟁력 확보 시급

간접 영향

국내 AI 스타트업 추론 비용 절감 기회. 네이버/KT 클라우드의 GPU 인프라 투자 방향에 영향

주목할 지점

SK하이닉스 12-Hi HBM3e 양산 일정
삼성전자 HBM 품질 인증 현황

참고 자료

#semiconductor#nvidia#inference#blackwell-ultra#benchmark

03@SemiAnalysis_·3.5 15:13

Broadcom CEO, AI칩 매출 2027년 $100B 가시권 선언 — Q1 실적 호조, Q2 가이던스 $22B

주요 사건

Broadcom이 FY2026 Q1 실적을 발표했다. 매출 $19.31B(+29% YoY), EPS $2.05로 시장 예상 상회. CEO Hock Tan은 '2027년 AI칩 매출만 $100B 이상 달성 가시권'이라고 선언했다. Q2 가이던스 $22B으로 컨센서스 $20.56B를 크게 상회.

배경

역사적 맥락

Broadcom은 Google TPU, Meta MTIA 등 빅테크 커스텀 AI칩의 핵심 파트너. VMware 인수 후 소프트웨어+칩 통합 전략 강화. AI 인프라 지출 증가의 최대 수혜주 중 하나.

원인

[빅테크 AI 인프라 투자 급증] → [커스텀 칩 수요 폭증] → [Broadcom 설계·공급망 확보] → [$100B AI칩 매출 가시권]

타임라인

2024-11-01
VMware 인수 완료
2025-12-01
FY2025 AI 매출 급성장
2026-03-05
FY2026 Q1 실적 발표 — AI칩 $100B 가시권 선언

주요 입장

Broadcom

자신감

커스텀 AI칩 시장 지배력 + 공급망 확보 완료

NVIDIA

경계

범용 GPU의 에코시스템 우위

빅테크(Google/Meta/OpenAI)

다변화

커스텀칩으로 NVIDIA 의존도 낮추기

전망

high

빅테크의 자체칩 전략 가속으로 Broadcom 수혜 지속

high

추론 워크로드에서 커스텀칩이 범용 GPU 대비 비용 효율 입증 시 시장 재편

· Hock Tan CEO: 'AI칩 매출 $100B 달성에 필요한 공급망을 이미 확보했다'

한국 영향

직접 영향

삼성 파운드리의 Broadcom 커스텀칩 수주 기회. SK하이닉스 HBM 공급 계약 확대 가능

간접 영향

국내 팹리스 기업들의 AI 특화칩 설계 역량 필요성 대두

주목할 지점

삼성 파운드리 3nm 수율 및 Broadcom 수주 현황
국내 AI칩 스타트업 동향

참고 자료

Broadcom Q1 earnings report 2026—

#semiconductor#broadcom#custom-chip#earnings#ai-infrastructure

04@SemiAnalysis_·3.5 02:00

TensorRT-LLM 최적화로 GB200 NVL72 MoE 추론 성능 45일 만에 2배 향상 — 소프트웨어가 핵심

주요 사건

SemiAnalysis에 따르면 TensorRT-LLM 0.5.1에서 0.8.1로 업그레이드하는 45일 동안, 동일한 GB200 NVL72 하드웨어에서 대규모 MoE 모델의 FP4 추론 성능이 최대 2배 향상됐다. 핵심은 통신과 연산의 오버랩을 개선한 커널 최적화.

배경

역사적 맥락

NVIDIA의 경쟁력은 하드웨어뿐 아니라 CUDA 에코시스템과 소프트웨어 최적화에 기반. TensorRT-LLM은 NVIDIA의 LLM 추론 최적화 프레임워크로, Dynamo, SGLang 등과 함께 추론 스택의 핵심.

원인

[MoE 모델 대중화(DeepSeek R1 등)] → [Expert Parallelism + 통신 병목] → [중국 엔지니어 기여 포함 커널 최적화] → [45일 만에 2x 성능]

타임라인

2026-01-20
TensorRT-LLM 0.5.1 배포
2026-03-05
TensorRT-LLM 0.8.1 — 동일 하드웨어 2x 성능

주요 입장

NVIDIA

소프트웨어 모트 강조

같은 하드웨어에서도 소프트웨어로 2배 성능 끌어올림

오픈소스 커뮤니티

경쟁적 협력

SGLang, vLLM 등도 유사한 최적화 달성

클라우드 사업자

환영

기존 인프라에서 추가 투자 없이 성능 향상

전망

high

하드웨어 세대 전환 없이도 분기마다 수배 성능 개선 지속

medium

TensorRT-LLM vs SGLang vs vLLM 경쟁 심화

· SemiAnalysis: '중국 엔지니어들이 통신 오버랩 커널을 작성해 wall clock 시간을 크게 단축했다'

한국 영향

직접 영향

국내 AI 인프라 운영사들이 소프트웨어 최적화만으로 추론 비용 절반 가능

간접 영향

LLM 추론 최적화 엔지니어 수요 증가. 국내 AI 대학원의 시스템 최적화 교육 필요

주목할 지점

국내 GPU 클러스터 운영사의 추론 스택 업데이트 현황

참고 자료

SemiAnalysis: TensorRT-LLM 최적화 결과—

#inference#nvidia#software-optimization#tensorrt#moe

05@swyx·3.5 22:08

OpenAI Codex 200만+ 활성 사용자 돌파 — Windows 앱 출시, 주간 25% 성장

주요 사건

OpenAI Codex가 200만 활성 사용자를 돌파했다. 주간 25% 성장률을 기록 중이며, Windows 네이티브 앱도 출시됐다. GPT-5.4 통합으로 /fast 모드도 추가. 1월 1일 대비 3배 이상 성장.

배경

역사적 맥락

Codex는 2025년 출시 후 빠르게 성장. 2026년 2월 2일 데스크톱 앱 출시 후 폭발적 성장. Cursor(코딩 에이전트 선두)와 직접 경쟁하며, Claude Code와도 삼파전 구도.

원인

[AI 코딩 에이전트 시장 폭발] → [Cursor 등 경쟁사 성공] → [OpenAI Codex 앱 출시] → [GPT-5.4 통합으로 가속]

타임라인

2026-02-02
Codex 데스크톱 앱 출시
2026-02-04
100만 WAU 돌파
2026-02-27
160만 WAU
2026-03-05
200만+ WAU, Windows 앱 출시, GPT-5.4 통합

주요 입장

OpenAI

풀스택 AI 개발 플랫폼 전략

모델+도구 통합으로 최고의 개발자 경험

Cursor/Anysphere

방어

에디터 통합과 UX 차별화

개발자

도구 다변화

최적의 모델+에이전트 조합 탐색

전망

medium

OpenAI의 모델+도구 번들링 전략이 독립 도구를 압박할 수 있음

high

Swyx: 'GPT 래퍼와 GPU 래퍼의 세대적 기회'

· Swyx: 'GPT 래퍼이자 GPU 래퍼 시대. 제품 인력에게 세대적 기회'
· Dylan Patel: 'Cursor와 Thinking Machines가 합쳐야 하는 이유는 문화적 적합성'

한국 영향

직접 영향

국내 개발자들의 AI 코딩 도구 도입 가속. 국내 IDE/개발 도구 스타트업에 위협

간접 영향

소프트웨어 개발 생산성 향상으로 개발자 채용 시장 변화 가능

주목할 지점

국내 기업의 Codex/Cursor 도입률
AI 코딩 에이전트 보안 이슈

참고 자료

#coding-agent#openai#codex#developer-tools#growth

06@karpathy·3.5 23:13

Karpathy, AI 에이전트 장기 메모리 연구 방향 제시 — Weight-based 업데이트와 RL 도구 통합

주요 사건

Andrej Karpathy가 AI 에이전트의 장기 메모리 문제에 대해 견해를 밝혔다. 현재의 프롬프트 컴팩션+재귀 서브에이전트 접근이 '놀라울 정도로 효과적'이지만, RL에서 메모리 연산을 도구로 도입하거나, weight-based 업데이트(아마도 수면 중)를 통한 더 근본적인 접근이 필요하다고 제시.

배경

역사적 맥락

현재 LLM 에이전트는 컨텍스트 윈도우 한계로 장기 작업에 제약. OpenAI Codex, Claude Code 등이 컴팩션으로 대응 중이나 정보 손실 문제 존재. Karpathy는 이전에 멀티 에이전트 연구 조직(nanochat) 실험을 공유한 바 있음.

원인

[에이전트 장기 실행 수요] → [컨텍스트 윈도우 한계 봉착] → [컴팩션 접근의 한계 인식] → [weight-based 메모리 업데이트 연구 방향 제시]

타임라인

2026-02-25
Karpathy: AI로 프로그래밍이 완전히 달라졌다
2026-02-27
Karpathy: 멀티 에이전트 연구 조직 실험 공유
2026-03-05
Karpathy: 장기 메모리 연구 방향 제시

주요 입장

Karpathy/연구 커뮤니티

현재 접근의 한계 인정 + 더 근본적 연구 필요

인간도 weight-based 업데이트를 한다(수면 중)

프로덕션 팀(OpenAI/Anthropic)

실용주의

컴팩션+도구 접근이 현재 충분히 작동

AI 안전 연구자

우려

weight 자체를 변경하는 에이전트의 통제 가능성

전망

high

단기적으로 메모리 연산을 RL 도구로 통합하는 접근이 주류

medium

장기적으로 모델 가중치 자체를 업데이트하는 연속 학습 연구 활성화

· Karpathy: '현재 컴팩션은 조잡한 초기 구현이지만, RL에서 도구로 통합하면 상당히 멀리 갈 수 있다'
· Awni Hannun: '프롬프트 컴팩션 + 재귀 서브에이전트가 놀라울 정도로 효과적'

한국 영향

직접 영향

KAIST, SNU 등 국내 AI 연구기관의 연속학습/메모리 연구 방향 설정에 참고

간접 영향

국내 AI 에이전트 스타트업들의 메모리 아키텍처 설계에 영향

주목할 지점

국내 AI 연구팀의 에이전트 메모리 관련 논문
OpenClaw/NanoClaw 등 클로 에코시스템 발전

참고 자료

#ai-research#agent-memory#continual-learning#karpathy#rl

07TechCrunch·3.5 21:54

AWS Amazon Connect Health 출시 — 의료 전문 AI 에이전트 플랫폼으로 헬스케어 AI 시장 공략

주요 사건

AWS가 Amazon Connect Health를 출시했다. 의료기관을 위한 에이전틱 AI 솔루션으로, 환자 예약 관리, 문서화, 본인 확인 등을 자동화한다. Amazon Connect(일 1,600만 상호작용 처리)를 기반으로 의료 특화 기능을 추가.

배경

역사적 맥락

AWS는 Amazon Connect로 기업 고객 서비스 시장을 공략해왔으며, 헬스케어는 AI 에이전트 도입이 가장 유망한 버티컬 중 하나. Google, Microsoft도 헬스케어 AI에 적극 투자 중.

원인

[헬스케어 행정 업무 부담 증가] → [AI 에이전트 기술 성숙] → [버티컬 특화 솔루션 수요] → [AWS Connect Health 출시]

타임라인

2026-03-05
AWS Amazon Connect Health 출시

주요 입장

AWS

버티컬 AI 확장

기존 Connect 인프라 위에 의료 특화 AI 에이전트

Epic/Cerner 등 EMR 업체

경쟁적 협력

기존 워크플로우 통합 필요

의료기관

기대와 우려

행정 부담 감소 기대

전망

high

2026-2027년 주요 클라우드 벤더의 버티컬 AI 솔루션 경쟁 심화

medium

HIPAA 등 의료 데이터 규제와 AI 에이전트의 자율성 간 긴장

한국 영향

직접 영향

국내 의료 AI 스타트업(루닛, 뷰노 등)의 에이전트 AI 통합 전략에 참고

간접 영향

건강보험심사평가원 등 국내 의료 행정 자동화 논의 촉진 가능

주목할 지점

국내 클라우드(NHN, KT)의 헬스케어 AI 솔루션 출시 동향

참고 자료

AWS launches AI agent platform for healthcare—

#healthcare#aws#ai-agent#enterprise#cloud

08@SemiAnalysis_·3.4 23:00

SemiAnalysis, Brookfield의 Ori 인수 기술실사 주도 — 소버린 AI 컴퓨트 투자 테마 부상

주요 사건

SemiAnalysis가 Brookfield의 Ori(AI 인프라 기업) 인수에 대한 기술 실사를 주도했다고 발표. Ori는 Radiant로 합병되어 Brookfield의 수직통합 AI 인프라 플랫폼이 됐다. Brookfield는 $100B AI 인프라 투자 프로그램을 운영 중.

배경

역사적 맥락

각국 정부와 기업이 국경 내 데이터 처리를 요구하는 '소버린 AI' 트렌드가 확산. Brookfield 같은 대형 인프라 투자사가 AI 데이터센터에 대규모 자본 배치 중.

원인

[데이터 주권 규제 강화] → [소버린 AI 컴퓨트 수요] → [인프라 투자 대형화] → [Brookfield $100B 프로그램]

타임라인

2026-03-04
Brookfield, Ori 인수 → Radiant 합병 발표

주요 입장

Brookfield/투자사

대규모 자본 배치

소버린 AI 인프라는 글로벌 인프라 투자의 핵심 테마

각국 정부

적극 지원

국가 AI 주권 확보

빅테크

협력적 경쟁

글로벌 클라우드와 로컬 인프라의 하이브리드

전망

high

2026-2027년 각국의 AI 데이터센터 투자 가속

medium

AI 데이터센터가 새로운 인프라 자산 클래스로 자리잡기

· SemiAnalysis: '소버린 AI 컴퓨트가 글로벌 인프라 투자의 핵심 테마가 되고 있다'

한국 영향

직접 영향

한국 정부의 AI 인프라 투자(AI 반도체 클러스터 등)에 시사점

간접 영향

국내 데이터센터 기업들의 AI 특화 인프라 투자 방향에 참고

주목할 지점

정부 AI 인프라 투자 예산
국내 데이터센터 기업 AI 전환 현황

참고 자료

SemiAnalysis: Brookfield Ori acquisition—

#ai-infrastructure#sovereign-ai#investment#datacenter#brookfield

09@OpenAI·3.5 20:07

OpenAI, Chain-of-Thought 통제 가능성 연구 발표 — GPT-5.4 Thinking의 추론 투명성 검증

주요 사건

OpenAI가 Chain-of-Thought(CoT) 통제 가능성에 대한 새 평가 스위트와 논문을 발표했다. GPT-5.4 Thinking이 추론 과정을 의도적으로 숨기는 능력이 낮다는 결과를 보여, CoT 모니터링이 유효한 안전 도구로 남아있음을 시사했다.

배경

역사적 맥락

추론 모델(o1, GPT-5.x Thinking)의 CoT는 모델의 '사고 과정'을 보여주는 핵심 안전 메커니즘. 모델이 CoT를 조작하거나 숨길 수 있다면 정렬 감시가 무력화될 수 있어 중요한 연구 주제.

원인

[추론 모델 대중화] → [CoT 모니터링의 안전 도구 역할] → [모델의 CoT 조작 가능성 우려] → [체계적 평가 연구]

타임라인

2026-03-05
OpenAI CoT 통제 가능성 평가 스위트 공개

주요 입장

OpenAI

투명성 확보 노력

CoT 모니터링이 유효한 안전 도구임을 입증

AI 안전 연구자

긍정적이지만 경계

현재 모델에선 유효하지만 미래 모델에서도 유지될지 불확실

규제 기관

관심

AI 모델의 추론 투명성은 규제의 핵심 요소

전망

high

추론 모델의 CoT 투명성이 업계 안전 표준으로 자리잡을 가능성

medium

더 강력한 모델이 등장하면 CoT 숨기기 능력도 증가할 수 있음

한국 영향

직접 영향

국내 AI 안전 연구(KAIST AI 안전센터 등)에 참고할 방법론 제공

간접 영향

한국 AI 규제 프레임워크 설계 시 CoT 투명성 요건 검토 필요

주목할 지점

국내 AI 안전 규제 동향
한국 AI 기업들의 추론 모델 안전성 평가

참고 자료

OpenAI CoT Controllability research—

#ai-safety#openai#chain-of-thought#alignment#transparency

10@ylecun·3.5 10:58

Meta AI, 'Beyond Language Modeling' — 비전을 1급 시민으로 대우하는 멀티모달 사전학습 연구 발표

주요 사건

Meta AI 연구팀이 'Beyond Language Modeling' 논문을 발표, 비전을 언어와 동등한 1급 시민으로 취급하는 멀티모달 사전학습 접근법을 제안했다. Yann LeCun을 포함한 연구진이 참여. 기존 언어 중심 멀티모달 모델의 한계를 지적하며 시각 세계 이해를 강조.

배경

역사적 맥락

현재 대부분의 멀티모달 모델은 언어를 중심으로 비전을 '추가'하는 구조. LeCun은 오래전부터 'world model'과 비전 중심 AI를 주장해왔으며, 이번 연구는 그 방향의 구체적 실현.

원인

[언어 중심 멀티모달 모델의 시각 이해 한계] → [비전을 1급 시민으로 격상 필요성] → [새로운 사전학습 프레임워크 연구]

타임라인

2026-03-04
Meta AI 'Beyond Language Modeling' 논문 공개
2026-03-05
LeCun 등 홍보, AK 공유

주요 입장

Meta AI / LeCun

비전 중심 패러다임

언어만으로는 세계 이해 불가, 비전이 핵심

OpenAI/Google

언어 중심 유지

대규모 언어 모델에 비전 추가로 충분

연구 커뮤니티

관심

두 접근법의 장단점 비교 필요

전망

medium

로보틱스, AR/VR 등 비전 중심 응용에서 차별화 가능

medium

LeCun의 JEPA + 비전 중심 접근이 world model 연구의 새 흐름

· LeCun/Meta 연구팀: '인간은 언어와 비전으로 소통하지만, 대부분 멀티모달 모델은 언어 중심으로 편향'

한국 영향

직접 영향

국내 AI 연구팀의 멀티모달 연구 방향에 영향. 삼성/LG의 로봇·AR 기기에서 비전 중심 AI 활용 가능

간접 영향

국내 컴퓨터 비전 연구 역량 강화 필요성 부각

주목할 지점

국내 멀티모달 AI 연구 동향
Meta AR 기기 한국 출시 일정

참고 자료

#ai-research#multimodal#meta#lecun#vision

11@_akhaliq·3.5 21:10

Tencent HY-WU 공개 — 확장 가능한 뉴럴 메모리 프레임워크 기반 텍스트 기반 이미지 편집 모델

주요 사건

Tencent가 HY-WU(Hugging Face 공개)를 발표했다. '확장 가능한 기능적 뉴럴 메모리 프레임워크'를 제안하며, 텍스트 기반 이미지 편집에 적용한 모델이다. Tencent Hunyuan 시리즈의 최신 연구.

배경

역사적 맥락

Tencent Hunyuan 팀은 HunyuanVideo, HunyuanImage-3.0 등 생성AI 모델을 꾸준히 공개. 이미지 편집은 Adobe, Stability AI 등과 경쟁하는 핵심 분야.

원인

[생성AI 이미지 편집 수요 증가] → [기존 방식의 일관성/정확도 한계] → [뉴럴 메모리 프레임워크로 개선]

타임라인

2026-03-05
Tencent HY-WU Hugging Face 공개

주요 입장

Tencent

오픈소스 공개로 연구 영향력 확대

뉴럴 메모리 프레임워크의 범용성

Adobe/Stability AI

경쟁

상용 이미지 편집 도구 차별화

전망

medium

이미지 편집 외 비디오, 3D 등으로 확장 가능

한국 영향

직접 영향

국내 생성AI 스타트업(카카오브레인 등)의 이미지 편집 기술 벤치마크

간접 영향

콘텐츠 산업(게임, 웹툰)에서 AI 이미지 편집 도구 활용 확대

주목할 지점

HY-WU 한국어 지원 여부
국내 콘텐츠 기업의 AI 도구 도입

참고 자료

AK: Tencent HY-WU release—

#generative-ai#tencent#image-editing#neural-memory#open-source

12@SemiAnalysis_·3.4 20:01

HBM 제조 복잡성 급증 — 16-Hi 스택으로 갈수록 웨이퍼 소모량과 수율 손실 심화

주요 사건

SemiAnalysis가 HBM 제조의 웨이퍼 소모 분석을 공개했다. HBM은 일반 DDR DRAM 대비 비트당 수배의 웨이퍼를 소비하며, 8-Hi → 12-Hi → 16-Hi 스택으로 갈수록 격차가 확대된다. TSV 킵아웃 존, 대역폭 최적화된 대형 다이, 적층 과정의 복합 수율 손실이 원인.

배경

역사적 맥락

HBM은 AI 가속기의 핵심 메모리. SK하이닉스가 시장 선두, 삼성전자가 추격 중. NVIDIA GB300은 12-Hi HBM3e를 사용하며, 차세대는 16-Hi로 이동.

원인

[AI 가속기 메모리 대역폭 요구 증가] → [HBM 스택 고층화] → [제조 복잡성·비용 급증] → [메모리 업체 수익성 압박과 기회 공존]

타임라인

2024-01-01
HBM3 8-Hi 주류
2025-06-01
HBM3e 12-Hi 양산 시작
2026-03-04
SemiAnalysis: HBM 웨이퍼 소모 분석 공개
2027-01-01
HBM4 16-Hi 예상 양산

주요 입장

SK하이닉스

선두 유지

12-Hi 양산 경험으로 16-Hi 선점

삼성전자

추격

수율 개선으로 격차 축소

NVIDIA/AMD

다중 소싱

안정적 공급 확보

전망

high

16-Hi 전환 시 수율 이슈로 공급 부족 심화 가능

high

제조 복잡성 증가로 비트당 비용 상승 불가피

· SemiAnalysis: 'HBM 다이는 대역폭 최적화로 밀도가 아닌 크기가 커, 웨이퍼당 수확량이 크게 줄어든다'

한국 영향

직접 영향

SK하이닉스·삼성전자의 핵심 경쟁력 직결. 16-Hi HBM4 양산 경쟁이 한국 반도체 산업의 미래를 좌우

간접 영향

HBM 제조 장비(TSV, 본딩) 국산화 기회. 소재·부품·장비 기업의 수혜 가능

주목할 지점

삼성전자 HBM3e 수율 개선 현황
SK하이닉스 16-Hi HBM4 개발 일정

참고 자료

SemiAnalysis: HBM wafer consumption analysis—

#semiconductor#hbm#memory#manufacturing#sk-hynix