电信公司通过NVIDIA AI工厂塑造基于代币计量的未来
realtime news May 21, 2026 23:42
电信公司拥抱NVIDIA的代币计量AI模型,从GPU租赁转向可扩展的AI服务,契合全球代币计费趋势。
电信公司正在转向基于代币计量的AI服务模式,利用NVIDIA的AI工厂基础设施,彻底改变企业AI的交付和变现方式。通过从按小时租赁GPU的价值链上移到代币即服务(TaaS),电信公司希望抓住对可扩展、基于使用量的AI服务日益增长的需求。
NVIDIA的云合作伙伴(NCP)参考架构支持这些主权AI工厂,提供安全的本地计算能力以及构建代币计量服务所需的工具。该模型契合了科技行业的更广泛转型,即AI使用量的计费越来越多地以处理的代币数量为基准,而非通过固定费用或按小时的云使用量计费。在这一背景下,代币代表了由大型语言模型(LLMs)处理的输入或输出文本的基本单位。
为什么电信公司押注代币
基于代币计量的AI服务的经济效益非常明确。在传统的按小时租赁GPU模式下,收入与GPU租赁的小时数相关,增长受限。相比之下,TaaS允许电信公司根据处理的代币数量计费,将收入与基础设施时间脱钩,并随着实际AI需求的增长而扩展。
例如,NVIDIA估计,一个中型AI模型可以在单个GPU上每小时处理3000万个代币,如果每百万代币定价为1美元,那么每小时的收入潜力为30美元。在60%的利用率下,这相当于每年每个GPU的大约157,680美元的收入——比按3美元/小时的GPU模式下的18,400美元年收入高出8倍以上。下一代GPU如NVIDIA的B200级别可能会将代币处理量翻倍,从而进一步提高TaaS模式的收入潜力。
代币计费:全球增长趋势
代币计量的方式反映了行业向基于消费的AI计费模式的更广泛转变。像OpenAI和GitHub Copilot这样的主要参与者已经采用了基于代币的定价,成本根据实际AI使用量进行调整。中国的电信巨头最近推出了AI代币套餐,将代币视为移动数据计划,而研究表明,自2020年以来代币价格已大幅下降(高达600倍),使这种模式对企业来说越来越可行。
采用NVIDIA支持的AI工厂的电信公司可以将代币计量服务打包到API、垂直AI应用和市场中。企业则将这些服务集成到他们的工作流程中,根据消耗的代币数量支付费用,而不是基于不透明的基础设施指标。该模型满足了企业对可预测性能指标(如每秒代币数和首次代币时间(TTFT))日益增长的需求。
NVIDIA AI工厂:代币经济背后的技术
NVIDIA的AI工厂技术堆栈从经过认证的基础设施开始——包括GPU、CPU、高速网络和存储——并通过基于Kubernetes的多租户环境编排进行增强。除了基础设施,NVIDIA还提供开发者工具,如NeMo,用于微调基础模型,以及AI市场,用于商业化代币计量产品。这些工具使电信公司能够超越原始计算能力,提供高利润的AI应用。
电信公司还可以深入了解代币级别的关键绩效指标(KPI),例如使用量、性能和每个代币的成本,从而实现精确的计费和优化。通过NVIDIA在每秒代币数和每代币成本方面的进步,电信公司可以持续提高效率和利润率,实质上将他们的AI工厂转变为“代币工厂”。
电信公司的下一步是什么?
投资于NVIDIA支持的基础设施的电信公司现在必须专注于构建AI云堆栈并推出针对企业需求的代币计量服务。早期采用者如中国电信和软件合作伙伴Rafay已经证明了这一模式的可扩展性和盈利能力。
随着企业越来越多地需要基于使用量的AI服务并带有明确的SLA,电信公司凭借其主权基础设施和代币计量经济学具有独特的领导优势。通过与这一新的代币经济保持一致,他们可以从公共服务提供者转变为高价值的AI服务领导者,捕获AI市场未来收入流中日益增长的份额。
Image source: Shutterstock