**发布时间:** 2025-11-08
**厂商:** AZURE
**类型:** TECH-BLOG
**原始链接:** https://techcommunity.microsoft.com/blog/azurenetworkingblog/cut-the-noise--cost-with-container-network-metrics-filtering-in-acns-for-aks/4468221
---
<!-- AI_TASK_START: AI标题翻译 -->
[新产品/新功能] ACNS for AKS 推出容器网络指标过滤功能,有效降低监控噪音与成本
<!-- AI_TASK_END: AI标题翻译 -->
<!-- AI_TASK_START: AI竞争分析 -->
# 产品功能分析
## 新功能/新产品概述
Azure 在其 **Azure Kubernetes Service (AKS)** 的 **Azure 容器网络服务 (ACNS)** 中推出了一项新功能:**容器网络指标过滤 (Container Network Metrics Filtering)**,目前处于公开预览阶段。该功能旨在解决大规模微服务环境中普遍存在的 **指标膨胀 (metrics bloat)** 问题,通过赋予用户精确控制网络可观测性数据的能力,从而削减不必要的监控数据。
其核心工作原理是在数据源头进行过滤。用户通过标准的 **Kubernetes 自定义资源 (Custom Resource)** `ContainerNetworkMetric` 来定义精细化的过滤规则,这些规则在 Pod 级别生效。与传统的采样或后处理方法不同,过滤操作直接在 **Cilium 代理** 层面执行,深入到内核的数据平面。这意味着只有符合条件的关键指标才会被收集并发送到监控后端,从而在数据离开主机之前就极大地减少了数据量。
该功能的目标用户是运行大型、复杂微服务架构的 AKS 用户,特别是那些因海量监控数据而面临高昂存储与摄取成本、仪表盘混乱以及运维效率低下等挑战的团队。
## 关键客户价值
- **成本优化**
- 通过在数据离开主机前进行过滤,从源头上减少了发送到 **Prometheus**、**Grafana** 等监控工具的数据量,直接并显著地降低了数据摄取和存储成本。
- **提升可观测性与效率**
- 过滤掉无关的“噪音”数据(如不重要的 Pod 流量),使监控仪表盘更加整洁,只展示高价值的信号(如延迟尖峰、错误指标)。
- 这使得团队能够更快地发现和定位关键问题,缩短了故障排查时间,提升了整体运维效率。
- **精细化与灵活控制**
- 用户可以基于命名空间或 Pod 标签来定义包含或排除规则,实现对特定关键业务服务或组件的重点监控,同时忽略非核心或开发环境的指标。
- 这种控制粒度远超传统的全局采样策略,实现了按需监控。
- **动态与无中断操作**
- 过滤规则的创建和更新是动态的,无需重启 **Cilium 代理** 或 **Prometheus** 等监控组件。
- 这一特性保证了运维操作的连续性,避免了因配置变更导致监控中断或服务抖动,实现了真正的 **零停机** 配置管理。
## 关键技术洞察
- **源头过滤架构**
- 该功能的核心技术创新在于其 **源头过滤 (Filtering at the Source)** 机制。它在 **Cilium 代理** 内部执行过滤逻辑,很可能利用了 **eBPF** 技术在内核层面直接对网络数据包进行高效分析和决策,从而在数据产生时即进行筛选。
- 这种架构与在监控后端进行数据处理或采样的传统方案形成鲜明对比。后者的数据已经离开发送端,网络传输和初步处理的成本已经产生。源头过滤在性能和成本效益上具有本质优势。
- **声明式配置管理**
- 通过 Kubernetes 原生的 **自定义资源 (Custom Resource, CR)** `ContainerNetworkMetric` 来管理过滤策略。
- 这种声明式 API 的方式与 Kubernetes 生态系统无缝集成,便于通过 GitOps 等自动化流程进行版本控制、审计和部署,极大地降低了配置管理的复杂性。
- **支持多种网络指标类型**
- 过滤能力不仅限于流量指标(flow metrics),还涵盖了 **DNS 查询**、**TCP 连接指标** 和 **丢包(错误)指标** 等多种关键网络可观测性数据。
- 这为构建全面的网络故障诊断和性能分析能力提供了强大的、经过筛选的数据基础。
<!-- AI_TASK_END: AI竞争分析 -->
<!-- AI_TASK_START: AI全文翻译 -->
# 通过 ACNS for AKS 中的容器网络指标过滤功能,降低噪音与成本
**原始链接:** [https://techcommunity.microsoft.com/blog/azurenetworkingblog/cut-the-noise--cost-with-container-network-metrics-filtering-in-acns-for-aks/4468221](https://techcommunity.microsoft.com/blog/azurenetworkingblog/cut-the-noise--cost-with-container-network-metrics-filtering-in-acns-for-aks/4468221)
**发布时间:** 2025-11-08
**厂商:** AZURE
**类型:** TECH-BLOG
---
Azure 网络博客
# 通过 ACNS for AKS 中的容器网络指标过滤功能,降低噪音与成本
2025年11月8日
我们激动地宣布,**Azure Kubernetes 服务 (AKS)** 中的 **Azure 容器网络服务 (ACNS)** 现已推出 **容器网络指标过滤 (Container Network Metrics Filtering)** 功能,并已进入 **公共预览 (Public Preview)** 阶段!这项新功能将赋予您对关键指标的掌控力,彻底改变您在 Kubernetes 集群中管理网络可观测性的方式。
***
## 指标过量为何成为难题 (以及我们的解决方案)
在当今大规模、微服务驱动的环境中,团队常常面临 **指标膨胀 (metrics bloat)** 的问题,即采集了远超实际需求的数据。这会导致:
- **高昂的存储与采集成本:** 为永远不会使用的数据付费。
- **混乱的仪表盘:** 在海量的无关 pod 重启信息中艰难寻找关键的延迟峰值。
- **运维开销增加:** 查询变慢、维护成本更高,并导致团队疲劳。
我们全新的过滤功能通过允许您使用标准的 Kubernetes 自定义资源 (Custom Resources) 在 **pod 级别** 定义 **精确的过滤器**,从而解决了这一问题。您只采集真正重要的数据,在它们进入您的监控堆栈之前就完成筛选。
***
## 关键优势:聚焦关键信号,摒弃噪音
| 优势 | 为您带来的价值 |
| :--- | :--- |
| **精细化控制** | 按命名空间或 pod 标签进行过滤。精准定位关键服务,忽略无关噪音。 |
| **成本优化** | 降低 Prometheus、Grafana 及其他工具的数据采集成本。 |
| **提升可观测性** | 仅保留相关指标,使仪表盘更清晰,故障排查更迅速。 |
| **动态且零停机** | 应用或更新过滤器无需重启 Cilium 代理或 Prometheus。 |
***
## 工作原理:从源头进行过滤
与传统的采样或后处理不同,过滤操作发生在 **Cilium 代理 (Cilium agent) 层面——即内核的数据平面 (data plane) 内部**。
您可以使用 **ContainerNetworkMetric** 自定义资源来定义过滤器,以包含或排除以下指标:
- DNS 查询
- TCP 连接指标
- 流指标
- 丢弃 (错误) 指标
这种方式在 **指标离开主机之前** 就减少了数据量,确保您的可观测性工具只接收经过筛选的高价值数据。
***
## 示例:过滤流指标以减少噪音
以下是一个 `ContainerNetworkMetric` CRD 示例,它仅筛选来自 `traffic/http` 命名空间的 **被丢弃的流**,并排除了来自 `traffic/fortio` pod 的流:
```yaml
apiVersion: acn.azure.com/v1alpha1
kind: ContainerNetworkMetric
metadata:
name: container-network-metric
spec:
filters:
- metric: flow
includeFilters:
# 仅包含来自 traffic 命名空间的 DROPPED 状态的流
verdict:
- "dropped"
from:
namespacedPod:
- "traffic/http"
excludeFilters:
# 排除来自 traffic/fortio 的流以减少噪音
from:
namespacedPod:
- "traffic/fortio"
```
### 过滤前

### 应用过滤器后

***
## 即刻开始
准备好简化您的网络可观测性了吗?
1. **启用 ACNS:** 确保您的 AKS 集群已 [启用 ACNS](<https://aka.ms/acns>) 。
2. **定义您的过滤器:** 应用包含您的包含/排除规则的 [ContainerNetworkMetric CRD](<https://aka.ms/acns/filteringhowto>) 。
3. **验证:** 通过 ConfigMap 和 Cilium 代理日志检查您的设置。
4. **见证效果:** 观察采集成本的下降和仪表盘的清晰度提升!
👉 在 [指标过滤指南](<https://aka.ms/acns/container-network-metrics-filtering>) 中了解更多信息。
**立即试用公共预览版,掌控您的容器网络指标。**
更新于 2025年11月8日
版本 1.0
<!-- AI_TASK_END: AI全文翻译 -->