요즘AIby REMO
Infrastructure

Google Cloud Next 2026 — 구글이 TPU를 둘로 쪼갠 이유

TPU 8세대를 학습 전용(8t)과 추론 전용(8i)로 분리 발표. $750M 에이전틱 AI 펀드 조성, 구글 신규 코드의 75%가 AI 생성. 에이전틱 엔터프라이즈 시대 본격화.

2026년 4월 24일#Google #TPU #Agent #Cloud
Google Cloud Next 2026 — 구글이 TPU를 둘로 쪼갠 이유

한 줄 요약

구글이 TPU 8세대에서 학습과 추론을 물리적으로 분리했다. 이건 단순한 제품 라인업 확장이 아니라, "에이전트가 수백억 번 추론하는 시대"를 준비하는 아키텍처 전환 선언이다.

무슨 일이 있었나

4/22~23 라스베이거스에서 열린 Google Cloud Next 2026에서 Sundar Pichai가 쏟아낸 발표를 정리한다.

  • TPU 8t (학습 전용) — 9,600개 TPU + 2PB 공유 메모리를 단일 슈퍼팟으로 연결. Ironwood 대비 3배 처리력.
  • TPU 8i (추론 전용) — 1,152개 TPU 직접 연결(Boardfly 토폴로지), 온칩 SRAM 3배 확대.
  • Virgo Network — 메가스케일 데이터센터 패브릭 공개.
  • Gemini Enterprise Agent Platform — Vertex AI의 진화. 로우코드 Agent Studio + Agent Development Kit(ADK)로 수천 개 자율 AI 에이전트를 빌드·관리·보안 통합.
  • $750M Agentic AI Partner Fund — 12만+ 파트너 생태계 강화.
  • Apple Siri × Gemini — 파트너십 티저. WWDC 2026(6/8) 공개 예정.

왜 중요한가

Sundar Pichai: "구글 신규 코드의 75%가 AI 생성입니다. 다음 단계는 팀 단위 에이전트 협업."

2025년 가을 50% → 2026년 4월 75%. 1년도 안 되어 25%p 상승했다. 구글이 자사 내부에서 달성한 이 숫자가 의미하는 건 하나다. 바이브코딩이 이미 '표준'이라는 것.

Q1 지표도 눈여겨볼 만하다.

  • Gemini Enterprise 유료 MAU 40% QoQ 성장
  • 퍼스트파티 모델 API 분당 160억 토큰 처리 (전분기 100억)
  • Wiz 인수($320억) 보안 통합 발표

실무자 관점: 무엇을 준비할까

  1. 에이전트 플랫폼 비교 시점 — Vertex AI Agent Platform vs AWS Bedrock Agents vs Azure AI Foundry. 각사가 같은 추상화(Agent Studio, ADK)를 내놓기 시작했다.
  2. TPU 8i 가격 공개 대기 — 추론 전용 칩이 저렴하게 풀리면 onprem vs cloud 경제성이 재편된다.
  3. 'Apple Siri × Gemini'가 가져올 소비자 기대 — 기업 고객이 "왜 우리 챗봇은 Siri만큼 안 되지?"라고 물어올 날이 가까워졌다.

출처

이 글이 도움이 됐다면 공유해주세요
다음 단계

이걸 우리 회사에 적용한다면?

REMO의 3분 무료 AX 진단으로 현재 수준과 우선 도입 영역을 확인하세요.