OpenAI, Promptfoo 인수로 에이전트 보안 강화; Karpathy의 autoresearch가 AI 자율 연구 시대 열어; GPT-5.4 컴퓨터 사용 벤치마크에서 인간 초월; TSMC 파운드리 시장 독점 심화
- OpenAI가 AI 보안 스타트업 Promptfoo를 인수하여 에이전트 보안 테스팅 역량 강화
- Karpathy의 autoresearch 프로젝트: AI 에이전트가 자율적으로 700개 실험을 수행하여 LLM 학습 11% 개선
- Anthropic, Claude Code에 멀티에이전트 코드 리뷰 도구 출시
- OpenAI/Google 직원 30명+, DOD 소송에서 Anthropic 지지 성명
- GPT-5.4 출시 후 반응: 컴퓨터 사용 75%, 지식 업무 83%, 코딩은 정체
- SemiAnalysis: GB200 NVL72의 DeepSeek 추론 비용이 B200 대비 58% 절감
- TSMC Q4 2025 파운드리 매출 역대 최고, 시장 점유율 72%로 이익 94% 독점
- Grok, 세계 3위 GenAI 사이트로 등극 (DeepSeek·Claude 추월)
- Bluesky CEO Jay Graber 사임
- Google AlphaEarth 위성 임베딩 데이터셋 공개
OpenAI, AI 보안 스타트업 Promptfoo 인수 — 에이전트 보안 테스팅 강화
주요 사건
OpenAI가 2024년 설립된 AI 보안 스타트업 Promptfoo를 인수했다. Promptfoo는 LLM의 보안 취약점을 테스트하는 오픈소스 도구를 만든 회사로, Fortune 500 기업의 25% 이상이 사용 중이다. 인수 후 기술은 OpenAI의 엔터프라이즈 에이전트 플랫폼 'OpenAI Frontier'에 통합될 예정이며, 자동 레드팀 테스팅, 에이전트 워크플로우 보안 평가, 리스크/컴플라이언스 모니터링 기능을 제공한다. Promptfoo는 2,300만 달러를 조달했으며 마지막 라운드에서 8,600만 달러 기업가치를 인정받았다.
배경
- 2024-01-01Promptfoo 설립, 오픈소스 LLM 보안 테스팅 도구 출시
- 2025-07-01Promptfoo 시리즈A, 기업가치 8,600만 달러
- 2026-03-09OpenAI, Promptfoo 인수 발표
주요 입장
전망
- · swyx: AI 엔지니어링 오픈소스 프로젝트의 acqui-hire 시세가 엔지니어당 $10-100M 수준
한국 영향
- Promptfoo 오픈소스 유지 여부
- 한국형 AI 보안 규제 프레임워크 논의
Karpathy의 autoresearch: AI 에이전트가 자율적으로 700개 실험 수행, LLM 학습 11% 개선
주요 사건
Andrej Karpathy가 자신의 autoresearch 프로젝트 결과를 공개했다. AI 에이전트가 2일 동안 약 700개의 변경사항을 자율적으로 실험하여 nanochat(LLM 학습 코드)의 'Time to GPT-2' 벤치마크를 2.02시간에서 1.80시간으로 11% 개선했다. 에이전트가 발견한 주요 개선점: (1) QKnorm에 스케일러 누락 발견, (2) Value Embeddings에 정규화 미적용 오류 수정, (3) Banded attention 튜닝 부족 수정, (4) AdamW beta 값 최적화, (5) weight decay 스케줄 튜닝, (6) 네트워크 초기화 튜닝. 모든 개선이 더 큰 모델(depth=24)에도 전이됐다.
배경
- 2026-03-05nanochat, GPT-2급 학습 2시간 달성; AI 에이전트 자동 최적화 시작
- 2026-03-07autoresearch 오픈소스 공개 (GitHub)
- 2026-03-09Round 1 결과 발표: 11% 개선, 20개 유효 변경사항
주요 입장
전망
- · Karpathy: '모든 프론티어 AI 랩이 이것을 할 것. 이것이 최종 보스전'
- · Dylan Patel: 'SF에 있는 것은 팬데믹 직전 우한에 있는 것과 같다'
한국 영향
- autoresearch의 대규모 학습 환경 적용 가능성
- 한국 AI 연구 경쟁력에 미치는 영향
Anthropic, Claude Code에 멀티에이전트 코드 리뷰 도구 출시 — AI 생성 코드 품질 관리
주요 사건
Anthropic이 Claude Code에 Code Review 기능을 출시했다. 멀티에이전트 시스템으로 AI가 생성한 코드를 자동 분석하고 로직 오류를 감지하며, 엔터프라이즈 개발자가 증가하는 AI 생성 코드 볼륨을 관리할 수 있도록 돕는다. 'vibe coding' 시대에 코드 품질 유지 문제를 정면으로 해결하려는 시도.
배경
- 2025-06-01Claude Code 출시, 에이전트 코딩 시장 진입
- 2026-03-05OpenAI Codex Security 출시 (보안 에이전트)
- 2026-03-09Anthropic Code Review 출시 (품질 관리 에이전트)
주요 입장
전망
- · AI 코딩 도구 사용자 중 상당수가 생성된 코드를 충분히 검토하지 않는다는 조사 결과가 있음
한국 영향
- Claude Code Review의 한국어 코드베이스 지원 수준
- 국내 SI 업체의 AI 코드 리뷰 도입 동향
참고 자료
OpenAI·Google 직원 30명+, DOD 소송에서 Anthropic 지지 — AI 업계 연대
주요 사건
OpenAI와 Google DeepMind 직원 30명 이상이 Anthropic의 국방부(DOD) 소송을 지지하는 성명에 서명했다. DOD가 Anthropic을 'supply-chain risk'로 지정한 것에 대한 법적 소송이 진행 중이며, 경쟁사 직원들이 이례적으로 Anthropic 편에 선 것. 이는 AI 안전에 대한 업계 전반의 연대를 보여주는 동시에, 정부의 AI 기업 제재 방식에 대한 우려를 반영한다.
배경
- 2026-02-26Dario Amodei, DOD 분쟁 경위 공개
- 2026-02-28Anthropic, Pete Hegseth 발언에 대한 성명 발표
- 2026-03-09OpenAI/Google 직원 30명+ Anthropic 지지 성명
주요 입장
전망
- · Claude.ai 트래픽이 DOD 분쟁 기간 중 일 1,400만 방문으로 급증, Grok·DeepSeek 추월
한국 영향
- 미국 AI 규제의 정치화 추이
- 한국 국방 AI 전략에 대한 교훈
참고 자료
GPT-5.4 출시 후 현장 반응: 컴퓨터 사용 75%로 인간 초월, 코딩은 정체
주요 사건
OpenAI가 3월 5일 출시한 GPT-5.4의 실제 사용 반응이 쏟아지고 있다. Sam Altman은 '코딩, 지식 업무, 컴퓨터 사용에 뛰어나다'고 평가하며 특히 모델 성격 개선을 강조. 벤치마크: OSWorld-Verified(컴퓨터 사용) 75.0%(인간 72.4%), GDPval(직업 지식) 83.0%, 스프레드시트 87.3%(68.4%에서 점프). 단, SWE-Bench Pro 코딩은 57.7%로 소폭 상승에 그쳤고, Terminal-Bench는 오히려 하락(77.3%→75.1%). 가격은 입력 $2.50/M 토큰이지만 토큰 효율성이 높아 실비용 절감 주장.
배경
- 2026-02-19Gemini 3.1 Pro 출시, 벤치마크 대부분 1위
- 2026-03-05GPT-5.4 Thinking/Pro 출시
- 2026-03-07Sam Altman, GPT-5.4 실사용 반응 공유
주요 입장
전망
- · Alex Lavaee: '진짜 도약은 코딩이 아니라 컴퓨터 사용'
- · Sam Altman: 'GPT-5.4는 스프레드시트에 정말 좋다. 금융인들이 AI가 진짜라고 인정하기 시작'
한국 영향
- GPT-5.4의 한국어 벤치마크 성능
- Codex 에이전트의 한국 기업 도입 사례
SemiAnalysis: GB200 NVL72 FP4로 DeepSeek 추론 비용 58% 절감 — $0.96/M 토큰
주요 사건
SemiAnalysis가 NVIDIA GB200 NVL72에서 DeepSeek 670B MoE 모델의 추론 비용 분석을 공개했다. FP4 정밀도에서 167 tok/s/user의 인터랙티브 성능(8K 컨텍스트)에서 출력 토큰당 $0.96/M으로, B200의 $2.3/M 대비 58% 절감. 이는 disaggregated prefill-decode, wide Expert Parallelism 등 DeepSeek 시스템 최적화를 적용한 결과.
배경
- 2025-12-01NVIDIA GB200 NVL72 본격 출하
- 2026-02-27Microsoft, Azure에서 GB200 DeepSeek 추론 벤치마크 공개
- 2026-03-09SemiAnalysis, GB200 vs B200 비용 비교 분석 발표
주요 입장
전망
- · Sam Altman: Jensen에게 AWS에서 NVIDIA 용량 확대에 감사
한국 영향
- 한국 기업의 GB200 확보 물량
- HBM4 개발 경쟁
TSMC, Q4 2025 파운드리 매출 역대 최고 $47.2B — 시장 이익의 94% 독점
주요 사건
파운드리 산업이 Q4 2025에 $47.2B 분기 매출 역대 기록을 세웠다(YoY +18%). TSMC가 분기별 증분 매출의 95%, 총이익의 91%, 영업이익의 94%를 가져가며 시장 점유율 72% 달성(14분기 연속 시장 성장률 초과). TSMC의 ASP는 나머지 업계 평균의 약 3배이며 격차 확대 중. TSMC Arizona Phase 1은 2025년 $2.1B 매출에 순이익률 24%로 해외 수익성 입증. 한편 TSMC와 삼성이 8인치 용량을 2027년까지 대폭 축소하며, 중국 BCD 가격이 YoY 20% 상승. 성숙 노드 가격 회복이 2H26~1H27에 예상.
배경
- 2025-12-31파운드리 산업 Q4 2025 $47.2B 역대 최고
- 2026-01-01TSMC Arizona Phase 1 연간 실적: $2.1B, 24% 순이익률
- 2026-03-08SemiAnalysis 파운드리 산업 분석 발표
주요 입장
전망
- · SemiAnalysis: '$170B+ 산업에서 거의 모든 이익이 한 회사에 집중되며 그 집중도가 더 깊어짐'
한국 영향
- 삼성 2nm GAA 수율
- TSMC 일본/미국 팹 확장 속도
Grok, 세계 3위 GenAI 사이트로 등극 — DeepSeek·Claude 추월
주요 사건
xAI의 Grok이 웹사이트 방문자 수 기준 DeepSeek과 Claude를 추월하여 세계 3위 GenAI 사이트(ChatGPT, Gemini 다음)로 등극했다. 다만 이는 최신 데이터 기준이며, 2월 말~3월 초에는 Claude가 DOD 분쟁 효과로 일시적 1위(일 1,400만 방문)를 기록하기도 했다. Musk는 Grok Imagine 1.5 업그레이드도 예고.
배경
- 2026-02-17SimilarWeb: Grok·DeepSeek·Claude 3파전 치열
- 2026-03-03Claude, DOD 분쟁 효과로 일시 1위
- 2026-03-09Grok, 3위 재탈환 확인
주요 입장
전망
- · SimilarWeb: GenAI 경쟁이 2026년 들어 극도로 치열해졌다
한국 영향
- 한국 시장에서의 GenAI 서비스 점유율
- 네이버 HyperCLOVA X 경쟁력
SemiAnalysis: 반도체 테스트 장비 시장 — Advantest vs Teradyne 점유율 경쟁 심화
주요 사건
SemiAnalysis가 반도체 자동 테스트 장비(ATE) 시장의 Advantest와 Teradyne 경쟁을 분석했다. Advantest가 HPC·AI 가속기·HBM 비즈니스 노출도가 높아 초기 우위를 점했으나, Teradyne이 테스트 스텝과 시장 점유율 탈환을 위해 적극적으로 움직이고 있다. AI 칩 복잡성 증가로 테스트 공정의 중요성이 커지고 있음.
배경
- 2024-01-01AI 가속기 테스트 수요 급증 시작
- 2026-03-09SemiAnalysis ATE 시장 분석 발표
주요 입장
전망
- · SemiAnalysis: '테스트가 갈수록 중요해지면서 두 주요 ATE 공급업체 간 시장 점유율 분할을 주시할 가치가 있다'
한국 영향
- HBM4 테스트 요구사항 변화
- 국산 ATE 장비 개발 현황
Google AlphaEarth 위성 임베딩 데이터셋 공개 — AI 기반 지구 관측 대중화
주요 사건
Google Earth가 Google DeepMind의 AlphaEarth Foundation Model로 구동되는 위성 임베딩 데이터셋을 공개했다. 10m 해상도의 64차원 임베딩으로 위성 이미지를 수치적 '지문'으로 변환하여, 도시 분석, 건물 유형 분류, 환경 모니터링 등에 활용 가능. Earth Engine API를 통해 접근 가능하며, 2017-2024년 데이터를 포함.
배경
- 2024-01-01AlphaEarth Foundation Model 개발 시작
- 2026-03-09위성 임베딩 데이터셋 공개
주요 입장
전망
- · 리버풀 대학 연구팀: AlphaEarth 임베딩으로 건물 유형 분류, 에너지 효율 예측 등 실용적 워크플로우 가능
한국 영향
- 한반도 지역 임베딩 품질
- 한국형 위성 AI foundation model 개발 동향
Bluesky CEO Jay Graber 사임 — 소셜 미디어 탈중앙화 운동에 변곡점
주요 사건
탈중앙화 소셜 미디어 플랫폼 Bluesky의 CEO Jay Graber가 사임했다. Bluesky는 AT Protocol 기반의 X(트위터) 대안으로 성장해왔으며, Graber는 창립 초기부터 프로젝트를 이끌었다. 후임 CEO와 향후 전략 방향에 관심이 집중되고 있다.
배경
- 2021-01-01Twitter 내부 탈중앙화 프로젝트로 시작
- 2023-02-01Bluesky 독립 법인 설립, Jay Graber CEO
- 2026-03-09Jay Graber CEO 사임
주요 입장
전망
한국 영향
- 후임 CEO 인선
- Bluesky 한국어 지원 강화 여부