中国联通发布算力网络新方案,AI时代无状态计算服务迎来调度革命
在数字经济与AI技术双轮驱动下,算力已成为像水、电一样的关键基础设施。随着大模型推理、智能体交互等无状态计算服务兴起,传统算力网络面临“资源调度与应用需求割裂”“网络协议与服务接口错位”等难题。近日,中国联通联合多家科研机构与企业发布《面向无状态计算服务的算力网络白皮书》,提出一套全新算力网络解决方案,为AI时代算力高效流动提供新路径。
当前,算力服务形态正发生深刻变革。从云计算、云存储到模型即服务(MaaS),不同业务对算力网络的需求差异显著。比如,云计算服务的算力任务生命周期可能长达数月,依赖L2/L3层网络连接;而大模型API调用这类无状态计算服务,单次任务仅需毫秒级,更需要应用层协议支撑。传统算力网络多聚焦资源层调度,用户若想使用某类AI模型服务,需自行在分配的算力资源上部署模型、维护接口,不仅增加操作难度,还难以实现全局最优调度。
针对这些痛点,中国联通提出的新型算力网络方案,核心是将无状态计算服务的“服务化范式”深度融入网络架构。方案摒弃了传统以IP地址为核心的标识方式,创新性地采用URL-PATH作为算力标识——通过类似“/ai/deepseek/v1”的层级路径,直接携带服务类型、版本等语义信息,无需依赖外部系统就能实现精准寻址。这种设计既兼容现有HTTP协议生态,又能让网络设备直接解析算力需求,为细粒度调度奠定基础。
在组网架构上,方案以传统物理网络为底层支撑,通过部署Overlay网络实现跨域算力互联。位于网络边界的算力服务网关成为关键枢纽,不仅能解析用户的HTTP请求、识别URL-PATH中的算力标识,还能动态构建适配业务需求的“网络弹性管道”。例如,对于图像识别这类对带宽要求高的服务,网关会自动匹配高带宽QoS流;而语音合成服务则优先分配低时延传输通道。这种“按需匹配”的能力,让算力服务与网络资源实现深度协同。
该方案的技术创新点集中在多个维度。在路由机制上,突破传统IP路由“只认位置不认服务”的局限,构建服务语义路由表,结合算力实例负载、网络状态等动态选择最优节点;在身份安全方面,引入分布式身份技术(DID),为每个算力服务实例生成唯一数字凭证,既解决跨域信任问题,又能实现API级别的细粒度权限管控;在算力度量上,建立涵盖计算(如FLOPS)、网络(如时延抖动)、服务(如实例存活时长)的多维度指标体系,为调度决策提供精准数据支撑。