关于 路由 的快讯列表
| 时间 | 详情 |
|---|---|
|
2026-02-10 15:52 |
Google Cloud Vertex AI使用GKE推理网关实现35%延迟降低
根据Richard Seroter的说法,GKE推理网关引入的负载感知路由和上下文感知路由,使运行在GKE上的Google Cloud Vertex AI实现了35%的延迟降低。这一改进显著提升了性能,相比标准负载均衡,提供了更快、更高效的AI推理能力。 |