快讯列表

关于 路由 的快讯列表

时间 详情
2026-02-10
15:52
Google Cloud Vertex AI使用GKE推理网关实现35%延迟降低

根据Richard Seroter的说法,GKE推理网关引入的负载感知路由和上下文感知路由,使运行在GKE上的Google Cloud Vertex AI实现了35%的延迟降低。这一改进显著提升了性能,相比标准负载均衡,提供了更快、更高效的AI推理能力。

来源