国家超算互联网平台 QwQ-32B API 接口服务上线，免费提供 100 万 Tokens

535 0 0

GoodNav 于3月9日报道，国家超算互联网平台昨晚宣布将于本周推出阿里巴巴的开源推理模型 QwQ-32B API 接口服务，用户将获得免费100万 Tokens。

QwQ-32B 是阿里 Qwen 团队最近推出的推理模型，基于 Qwen2.5-32B 与强化学习构建而成。根据官方发布的基准测试结果，该模型在评估数学能力的 AIME24 测试集以及代码能力的 LiveCodeBench 测试中，与 DeepSeek-R1 的表现相当，优于 o1-mini 及同尺寸的 R1 蒸馏模型。

据悉，超算互联网已经完成了 QwQ-32B 的全面适配，涵盖了基于 vLLM 和 PyTorch 的推理适配，同时平台上线了 QwQ-32B 模型镜像和模型文件，用户无需进行本地下载，可一键启动 Notebook 功能在平台上开发 QwQ-32B 模型或引入专有数据进行进一步的私有化部署。

目前，除了提供 QwQ-32B 模型 API 接口服务外，超算互联网近期还引入了 DeepSeek-R1 全家桶以及最高配置的671B API 部署和 AI Web 应用服务。以下是国家超算互联网平台 QwQ-32B API 调用服务的步骤：

用户在超算互联网商城首页搜索 QwQ-32B，点击“QwQ-32B 接口服务”商品，完成购买后点击“去使用”。

进入 API 接口信息页面：点击“去使用”后将进入 API 接口信息页面。

根据需要选择访问方式，提供三种选择：通过 Postman、Apifox 等 http 工具访问；使用 Python 代码访问；或在终端页面直接访问。

目前，超算互联网已连接国内14个省的20多家超算及智算中心。平台上现有各类计算力商品超过6500款，其中 AI 模型服务接近240款，既包括 DeepSeek、Qwen 等国内开源模型，也涵盖了 Llama、Stable Diffusion、Gemma 等国外 AI 开源模型。

相关阅读：