Skip to content

快速入门

模型计费

模型及价格

模型上下文长度百万tokens输入价格百万tokens输出价格
Qwen3-235B-A22B32K0.1元0.1元
Qwen3-235B-A22B-Thinking-250732K0.1元0.1元
DeepSeek-R1-Distill-Qwen-7B32K0.1元0.1元
DeepSeek-R1-Distill-Qwen-32B32K1元4元
DeepSeek-R1-Distill-Llama-70B32K0.1元6元
QwQ-32B32K1元4元
Qwen3-30B-A3B128K1元6元
Qwen3-Embedding-8B-0.1元-
MiniMax-M2128K0.1元0.1元
DeepSeek-V3.2128K0.1元0.1元
Qwen3-30B-A3B-Instruct-2507256K0.1元0.1元

注意:

  1. 即日起至2月28日,活动期内DeepSeek-V3.2、MiniMax-M2、Qwen3-30B-A3B-Instruct-2507、Qwen3-235B-A22B、Qwen3-235B-A22B-Thinking-2507模型按照输入和输出均按0.1元/百万tokens计费。
  2. 以上参与活动模型使用过程中设定默认限流控制,如有疑问可联系平台客服。
  3. 产品价格将根据平台活动周期与市场情况动态调整,相关产品服务的定价及最终解释权归超算互联网所有。
  4. 请依据实际用量按需充值,可定期查看此页面以获知最新价格信息,以及活动优惠或联系您的专属业务顾问或平台客服开通调用API权限。
  5. 注册新用户可领取百万Tokens免费额度。系统会优先消耗赠送额度,建议您随时查看账户余额变动情况。
  6. Qwen3-Embedding-8B模型单行最大处理Token数为8,192,最大行数为 5 行。

计费逻辑

  1. Token是模型用来表示自然语言文本的最小单位,如一个词、一个数字或一个标点符号等。
  2. 模型服务用量的价格以“百万 tokens”为单位。我们将根据模型输入和输出的总 token 数进行计量计费。 注:由于不同模型采用的分词策略不同,同一段文本可能会被转化为不同数量的 token。
  3. SCNet平台大模型API服务采用按需计费的方式,根据实际调用接口产生的 tokens 数量计费,不同的模型价格不同,按照实际消耗的输入、输出总 tokens 数量,对账户中的现金余额进行扣费
  4. 调用后产生的具体消费明细,可在“费用—消费明细—推理服务费”中进行查看。
  5. 使用时发生余额不足的情况,请直接前往“控制台—费用概览”页面充值现金余额。

扣费规则

  1. 扣减费用 = token 消耗量 × 模型单价,对应的费用将直接从现金余额中进行扣减。 每次对话产生的费用可能不足0.01元,会按每次对话进行累计,当累计金额超过0.01元时进行出账,数据统计可能有5分钟延迟。
  2. 如果账户有赠送token,先消耗赠送token,赠送token使用完毕后,才会扣现金余额。