Infrastructure

Google Cloud Next 2026 — 구글이 TPU를 둘로 쪼갠 이유

TPU 8세대를 학습 전용(8t)과 추론 전용(8i)로 분리 발표. $750M 에이전틱 AI 펀드 조성, 구글 신규 코드의 75%가 AI 생성. 에이전틱 엔터프라이즈 시대 본격화.

2026년 4월 24일#Google #TPU #Agent #Cloud

한 줄 요약

구글이 TPU 8세대에서 학습과 추론을 물리적으로 분리했다. 이건 단순한 제품 라인업 확장이 아니라, "에이전트가 수백억 번 추론하는 시대"를 준비하는 아키텍처 전환 선언이다.

4/22~23 라스베이거스에서 열린 Google Cloud Next 2026에서 Sundar Pichai가 쏟아낸 발표를 정리한다.

TPU 8t (학습 전용) — 9,600개 TPU + 2PB 공유 메모리를 단일 슈퍼팟으로 연결. Ironwood 대비 3배 처리력.
TPU 8i (추론 전용) — 1,152개 TPU 직접 연결(Boardfly 토폴로지), 온칩 SRAM 3배 확대.
Virgo Network — 메가스케일 데이터센터 패브릭 공개.
Gemini Enterprise Agent Platform — Vertex AI의 진화. 로우코드 Agent Studio + Agent Development Kit(ADK)로 수천 개 자율 AI 에이전트를 빌드·관리·보안 통합.
$750M Agentic AI Partner Fund — 12만+ 파트너 생태계 강화.
Apple Siri × Gemini — 파트너십 티저. WWDC 2026(6/8) 공개 예정.

Sundar Pichai: "구글 신규 코드의 75%가 AI 생성입니다. 다음 단계는 팀 단위 에이전트 협업."

2025년 가을 50% → 2026년 4월 75%. 1년도 안 되어 25%p 상승했다. 구글이 자사 내부에서 달성한 이 숫자가 의미하는 건 하나다. 바이브코딩이 이미 '표준'이라는 것.

Q1 지표도 눈여겨볼 만하다.

에이전트 플랫폼 비교 시점 — Vertex AI Agent Platform vs AWS Bedrock Agents vs Azure AI Foundry. 각사가 같은 추상화(Agent Studio, ADK)를 내놓기 시작했다.
TPU 8i 가격 공개 대기 — 추론 전용 칩이 저렴하게 풀리면 onprem vs cloud 경제성이 재편된다.
'Apple Siri × Gemini'가 가져올 소비자 기대 — 기업 고객이 "왜 우리 챗봇은 Siri만큼 안 되지?"라고 물어올 날이 가까워졌다.

이 글이 도움이 됐다면 공유해주세요

다음 단계

REMO의 3분 무료 AX 진단으로 현재 수준과 우선 도입 영역을 확인하세요.