[新产品/新功能] GKE 发布多子网支持，提升集群可扩展性

**发布时间:** 2025-08-15 **厂商:** GCP **类型:** BLOG **原始链接:** https://cloud.google.com/blog/products/networking/multi-subnet-support-for-gke-clusters-increases-scalability ---  [新产品/新功能] GKE 发布多子网支持，提升集群可扩展性   # 产品功能分析 ## 新功能/新产品概述 Google Cloud为**Google Kubernetes Engine (GKE)** 推出了多子网支持功能的预览版。此功能旨在解决GKE集群在扩展时面临的**IP地址耗尽**问题。在过去，一个GKE集群的节点IP地址被限制在单一的**VPC子网 (VPC Subnet)** 的主IP范围内。一旦该范围内的IP地址用尽，集群便无法添加新节点，从而限制了其**自动扩缩容 (autoscaling)** 能力。该新功能允许用户向一个已存在的GKE集群动态添加额外的子网。当创建新的**节点池 (Node Pools)** 时，GKE可以自动从这些新增的、具有可用IP空间的子网中为新节点分配IP地址。这从根本上解除了集群与单个子网的生命周期绑定，为大规模、长期运行的集群提供了网络层面的可扩展性。 - **目标用户群**：运行大规模、高弹性或长期存在GKE集群的企业，特别是那些面临VPC网络规划复杂性和IP地址空间限制的运维团队和平台工程师。 - **市场定位**：这是一项基础网络能力的增强，旨在提升GKE在可扩展性和运维灵活性方面的竞争力，解决大型企业客户在生产环境中遇到的核心痛点。 ## 关键客户价值 - **提升可扩展性** - **业务价值**：彻底消除了由单一子网IP地址耗尽导致的应用扩展瓶颈。企业可以根据业务增长无缝地扩展其集群规模，而无需进行高风险、高成本的集群迁移或重建，保障了业务的连续性和长期发展。 - **差异化优势**：此功能提供了一种非破坏性的方式来扩展集群的网络容量。与以往必须在集群创建时规划一个巨大的子网（这往往导致IP浪费或规划失误）相比，现在可以采用“按需增长”的模式，这在云原生环境中是至关重要的。 - **优化资源利用率** - **业务价值**：实现了更精细化的IP地址管理，避免了为应对未来不确定的增长而预先分配超大IP地址块所造成的浪费。这有助于降低网络管理的复杂性，并在大型组织中减少IP地址冲突的风险。 - **实现机制**：通过将不同的节点池分布在不同的子网中，IP地址可以根据实际需求进行分配。GKE会自动在关联的子网中寻找可用的IP空间，从而确保了资源的高效利用。 - **增强灵活性** - **业务价值**：显著降低了集群网络运维的复杂度。管理员可以根据应用需求的变化，在不中断服务的情况下调整集群的网络拓扑，这极大地提升了基础设施的敏捷性和响应速度。 - **实现机制**：核心在于能够对一个正在运行的集群执行添加子网的操作。这一能力将GKE集群的网络配置从一个静态、不可变的属性，转变为一个可以动态演进的资源。 ## 关键技术洞察 - **技术独特性**：该功能的核心在于对**GKE控制平面 (GKE control plane)** 的扩展，使其能够识别并管理绑定到单个集群的多个子网。这打破了GKE集群与VPC子网之间一对一的固有映射关系。 - **工作原理**：当用户发起创建新节点池的请求时，GKE控制平面不再局限于检查默认子网的IP余量。它会自动扫描所有与该集群关联的子网，并选择一个拥有足够可用IP地址的子网来置备新的节点。这个过程对用户是透明的，简化了操作。 - **对可用性的影响**：通过动态扩展IP资源池，有效防止了因IP耗尽而导致的节点创建失败。这直接提升了依赖**集群自动扩缩容 (Cluster Autoscaler)** 的应用在流量高峰期的可靠性和可用性。 - **技术挑战与解决**：实现此功能需要确保跨多个子网的节点之间以及Pod之间的网络通信是无缝且高效的。GKE通过自动管理底层的**VPC路由 (VPC routes)** 和防火墙规则来解决这一挑战，确保无论节点分布在哪个子网，集群内部的覆盖网络（Overlay Network）都能正常工作。 ## 其他信息 - **版本依赖**：该功能要求GKE集群版本不低于 **1.30.3-gke.1211000**，表明其依赖于较新版本GKE组件的底层能力。 - **工具支持**：目前在预览阶段，主要通过**CLI**和**API**进行操作。官方文档明确指出，对**Terraform**和**Google Cloud Console UI**的支持即将推出，这将进一步降低使用门槛，方便IaC（基础设施即代码）用户和习惯图形界面的用户。   # 宣布为 GKE 集群提供多子网支持，实现更强的可扩展性网络 # 宣布为 GKE 集群提供多子网支持，实现更强的可扩展性 2025 年 8 月 15 日 ##### Whitney Jenkins Google 产品经理 ##### Ivy Zhuang Google 软件工程师 ##### 试用 Gemini 2.5 我们最智能的模型现已在 Vertex AI 上提供 [立即试用](https://console.cloud.google.com/vertex-ai/studio/freeform) 我们很高兴地宣布，Google Kubernetes Engine (GKE) 集群的多子网支持 (multi-subnet support) 功能已发布预览版。这项增强功能消除了单一子网的限制，从而提高了 GKE 集群的可扩展性、优化了资源利用率并增强了灵活性。 GKE 集群的多子网支持功能允许您向现有 GKE 集群添加额外的子网，这些子网可供新的节点池使用。所有使用 GKE **1.30.3-gke.1211000** 或更高版本的集群都支持此功能。 ### **优势** - **增强可扩展性：** 集群现在可以超越单个子网主 IP 范围的限制进行扩展。 - **优化资源利用：** IP 地址可以在多个子网中更高效地分配，从而减少 IP 浪费。 - **提升灵活性：** 添加子网为管理 Pod 和服务的 IP 范围提供了更大的灵活性。您无需重新创建集群即可更新子网，从而可以轻松地在初始集群配置的基础上进行扩展。 ### **用例：节点 IP 耗尽** 过去，GKE 集群创建在单个子网上，并使用其主 IP 范围。一旦主范围中的所有 IP 地址都被用尽，集群就无法再添加更多节点，因此也无法扩展或自动扩缩。 IP 耗尽错误大致如下： ``` [IP_SPACE_EXHAUSTED_WITH_DETAILS]: Instance 'gke-cluster1-default-pool-45c508b2-2jqt' creation failed: IP space of 'projects/my-project/regions/us-west1/subnetworks/my-subnet1' is exhausted. ``` 为了解决这个错误，我们现在可以使用新的多子网功能向集群添加子网。新的节点池可以使用新的子网，从而使集群能够继续增长。除了现有的向默认子网 [添加额外 Pod 范围](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-pod-cidr) 的功能外，您还可以在新子网中添加 [多个次要范围](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-subnet-cluster) 。在创建节点池时，GKE 会根据子网中的 IP 可用性自动选择一个子网。 ### **快速入门** 要掌控 GKE 集群的增长，请尝试按需添加子网并无忧扩展。立即选择您偏好的方式开始使用多子网支持功能吧！ - **CLI：** 有关完整的 CLI 命令和选项列表，请查阅 [相关文档](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-subnet-cluster) 。 - **API：** 要了解有关如何使用 API 的更多信息，请查阅 API [相关文档](https://cloud.google.com/kubernetes-engine/docs/how-to/multi-subnet-cluster) 。 - Terraform 和 UI 支持即将推出！发布于 - [网络](https://cloud.google.com/blog/products/networking) - [容器与 Kubernetes](https://cloud.google.com/blog/products/containers-kubernetes) - [GKE](https://cloud.google.com/blog/products/kubernetes-engine)