**发布时间:** 2025-08-15
**厂商:** GCP
**类型:** BLOG
**原始链接:** https://cloud.google.com/blog/products/networking/multi-subnet-support-for-gke-clusters-increases-scalability
---
<!-- AI_TASK_START: AI标题翻译 -->
[新产品/新功能] GKE 发布多子网支持,提升集群可扩展性
<!-- AI_TASK_END: AI标题翻译 -->
<!-- AI_TASK_START: AI竞争分析 -->
# 产品功能分析
## 新功能/新产品概述
Google Cloud为**Google Kubernetes Engine (GKE)** 推出了多子网支持功能的预览版。此功能旨在解决GKE集群在扩展时面临的**IP地址耗尽**问题。
在过去,一个GKE集群的节点IP地址被限制在单一的**VPC子网 (VPC Subnet)** 的主IP范围内。一旦该范围内的IP地址用尽,集群便无法添加新节点,从而限制了其**自动扩缩容 (autoscaling)** 能力。
该新功能允许用户向一个已存在的GKE集群动态添加额外的子网。当创建新的**节点池 (Node Pools)** 时,GKE可以自动从这些新增的、具有可用IP空间的子网中为新节点分配IP地址。这从根本上解除了集群与单个子网的生命周期绑定,为大规模、长期运行的集群提供了网络层面的可扩展性。
- **目标用户群**:运行大规模、高弹性或长期存在GKE集群的企业,特别是那些面临VPC网络规划复杂性和IP地址空间限制的运维团队和平台工程师。
- **市场定位**:这是一项基础网络能力的增强,旨在提升GKE在可扩展性和运维灵活性方面的竞争力,解决大型企业客户在生产环境中遇到的核心痛点。
## 关键客户价值
- **提升可扩展性**
- **业务价值**:彻底消除了由单一子网IP地址耗尽导致的应用扩展瓶颈。企业可以根据业务增长无缝地扩展其集群规模,而无需进行高风险、高成本的集群迁移或重建,保障了业务的连续性和长期发展。
- **差异化优势**:此功能提供了一种非破坏性的方式来扩展集群的网络容量。与以往必须在集群创建时规划一个巨大的子网(这往往导致IP浪费或规划失误)相比,现在可以采用“按需增长”的模式,这在云原生环境中是至关重要的。
- **优化资源利用率**
- **业务价值**:实现了更精细化的IP地址管理,避免了为应对未来不确定的增长而预先分配超大IP地址块所造成的浪费。这有助于降低网络管理的复杂性,并在大型组织中减少IP地址冲突的风险。
- **实现机制**:通过将不同的节点池分布在不同的子网中,IP地址可以根据实际需求进行分配。GKE会自动在关联的子网中寻找可用的IP空间,从而确保了资源的高效利用。
- **增强灵活性**
- **业务价值**:显著降低了集群网络运维的复杂度。管理员可以根据应用需求的变化,在不中断服务的情况下调整集群的网络拓扑,这极大地提升了基础设施的敏捷性和响应速度。
- **实现机制**:核心在于能够对一个正在运行的集群执行添加子网的操作。这一能力将GKE集群的网络配置从一个静态、不可变的属性,转变为一个可以动态演进的资源。
## 关键技术洞察
- **技术独特性**:该功能的核心在于对**GKE控制平面 (GKE control plane)** 的扩展,使其能够识别并管理绑定到单个集群的多个子网。这打破了GKE集群与VPC子网之间一对一的固有映射关系。
- **工作原理**:当用户发起创建新节点池的请求时,GKE控制平面不再局限于检查默认子网的IP余量。它会自动扫描所有与该集群关联的子网,并选择一个拥有足够可用IP地址的子网来置备新的节点。这个过程对用户是透明的,简化了操作。
- **对可用性的影响**:通过动态扩展IP资源池,有效防止了因IP耗尽而导致的节点创建失败。这直接提升了依赖**集群自动扩缩容 (Cluster Autoscaler)** 的应用在流量高峰期的可靠性和可用性。
- **技术挑战与解决**:实现此功能需要确保跨多个子网的节点之间以及Pod之间的网络通信是无缝且高效的。GKE通过自动管理底层的**VPC路由 (VPC routes)** 和防火墙规则来解决这一挑战,确保无论节点分布在哪个子网,集群内部的覆盖网络(Overlay Network)都能正常工作。
## 其他信息
- **版本依赖**:该功能要求GKE集群版本不低于 **1.30.3-gke.1211000**,表明其依赖于较新版本GKE组件的底层能力。
- **工具支持**:目前在预览阶段,主要通过**CLI**和**API**进行操作。官方文档明确指出,对**Terraform**和**Google Cloud Console UI**的支持即将推出,这将进一步降低使用门槛,方便IaC(基础设施即代码)用户和习惯图形界面的用户。
<!-- AI_TASK_END: AI竞争分析 -->
<!-- AI_TASK_START: AI全文翻译 -->
# 宣布为 GKE 集群提供多子网支持,实现更强的可扩展性
网络
#
宣布为 GKE 集群提供多子网支持,实现更强的可扩展性
2025 年 8 月 15 日
##### Whitney Jenkins
Google 产品经理
##### Ivy Zhuang
Google 软件工程师
##### 试用 Gemini 2.5
我们最智能的模型现已在 Vertex AI 上提供
[立即试用](https://console.cloud.google.com/vertex-ai/studio/freeform)
我们很高兴地宣布,Google Kubernetes Engine (GKE) 集群的多子网支持 (multi-subnet support) 功能已发布预览版。这项增强功能消除了单一子网的限制,从而提高了 GKE 集群的可扩展性、优化了资源利用率并增强了灵活性。
GKE 集群的多子网支持功能允许您向现有 GKE 集群添加额外的子网,这些子网可供新的节点池使用。所有使用 GKE **1.30.3-gke.1211000** 或更高版本的集群都支持此功能。
### **优势**
- **增强可扩展性:** 集群现在可以超越单个子网主 IP 范围的限制进行扩展。
- **优化资源利用:** IP 地址可以在多个子网中更高效地分配,从而减少 IP 浪费。
- **提升灵活性:** 添加子网为管理 Pod 和服务的 IP 范围提供了更大的灵活性。您无需重新创建集群即可更新子网,从而可以轻松地在初始集群配置的基础上进行扩展。
### **用例:节点 IP 耗尽**
过去,GKE 集群创建在单个子网上,并使用其主 IP 范围。一旦主范围中的所有 IP 地址都被用尽,集群就无法再添加更多节点,因此也无法扩展或自动扩缩。
IP 耗尽错误大致如下:
```
[IP_SPACE_EXHAUSTED_WITH_DETAILS]: Instance 'gke-cluster1-default-pool-45c508b2-2jqt' creation failed: IP space of 'projects/my-project/regions/us-west1/subnetworks/my-subnet1' is exhausted.
```
为了解决这个错误,我们现在可以使用新的多子网功能向集群添加子网。新的节点池可以使用新的子网,从而使集群能够继续增长。除了现有的向默认子网 [添加额外 Pod 范围](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-pod-cidr) 的功能外,您还可以在新子网中添加 [多个次要范围](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-subnet-cluster) 。在创建节点池时,GKE 会根据子网中的 IP 可用性自动选择一个子网。
### **快速入门**
要掌控 GKE 集群的增长,请尝试按需添加子网并无忧扩展。立即选择您偏好的方式开始使用多子网支持功能吧!
- **CLI:** 有关完整的 CLI 命令和选项列表,请查阅 [相关文档](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-subnet-cluster) 。
- **API:** 要了解有关如何使用 API 的更多信息,请查阅 API [相关文档](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-subnet-cluster) 。
- Terraform 和 UI 支持即将推出!
发布于
- [网络](https://cloud.google.com/blog/products/networking)
- [容器与 Kubernetes](https://cloud.google.com/blog/products/containers-kubernetes)
- [GKE](https://cloud.google.com/blog/products/kubernetes-engine)
<!-- AI_TASK_END: AI全文翻译 -->