硅基流动 SiliconCloud 平台即日起正式推出 DeepSeek-R1& V3API 的批量推理(Batch Inference)功能。用户现在可以通过批量 API 向 SiliconCloud 发送请求,摆脱实时推理速率的限制,并在预期24小时内完成大规模数据处理任务。
此次更新的一大亮点是价格的大幅下调。DeepSeek-V3批量推理的价格相较实时推理直降50%。更令人惊喜的是,在3月11日至3月18日期间,DeepSeek-R1批量推理的优惠价格更是直降75%,输入价格仅为1元/百万 Tokens,输出价格为4元/百万 Tokens。
批量推理功能的推出,旨在帮助用户更高效地处理生成报告、数据清洗等大批量数据处理任务,以更低的成本享受 DeepSeek-R1& V3API 服务。此功能尤其适用于无需实时响应的数据分析、模型性能评估等场景。
值得一提的是,此前 DeepSeek-R1& V3API 已相继支持 Function Calling、JSON Mode、Prefix、FIM 等功能,并且 Pro 版 DeepSeek-R1& V3API 的 TPM(每分钟处理的 Token)上限已从1万提升至100万。