模型资源配置

  • 文档创建者:Aria.Han
  • 历史版本:9
  • 最近更新:Aria.Han 于 2026-06-01
  •  1.  简介

    本文将描述推荐在 Data Agent 中使用的主流大模型的配置项与其收费标准。

    2. 获取大模型配置项信息

    2.1 OpenAI兼容协议

    icon提示:
    • 免责申明:帆软仅提供大模型的推荐参考及对接方式,不对大模型本身的问题承担责任。

    • 由于 API Key 为隐私内容,大模型平台可能只允许在创建时可见可复制 API Key,建议创建后立即复制,以免无法使用。

    大模型
    配置项
    通义千问
    • EndPoint(即 Base URL):https://dashscope.aliyuncs.com/compatible-mode/v1

    • API Key:注册并登录 官方控制台,完成 Token 订阅并获取 API Key

    • 常用模型名称:qwen-turbo、qwen-plus、qwen-max

    DeepSeek
    • EndPoint(即 Base URL):https://api.deepseek.com/v1

    • API Key:注册并登录 DeepSeek 官方平台,进入「API keys页面>创建 API Key>命名并生成」

    • 常用模型名称:deepseek-v4-flash、deepseek-v4-pro

    智谱 GLM
    • EndPoint(即 Base URL):https://open.bigmodel.cn/api/paas/v4

    • API Key:注册并登录 智谱AI开放平台,进入「API Key>创建 API Key」

    • 常用模型名称:glm-4-flash、glm-5.1

    2.2 Azure兼容协议

    Azure 兼容协议下相关模型的 API Key 可共享同一套,创建步骤可参考:

    1)注册并登录 Azure 门户

    2)搜索 Azure OpenAI

    3)创建资源(需提交申请并审批)

    4)进入「资源页>密钥和终结点」

    5)复制 API Key

    创建详情可参考 官方文档

    大模型
    配置项

    Azure OpenAI

    GPT 系列)

    • EndPoint(即 Base URL):https://{你的资源名}.openai.azure.com

    • API Version:2025-01-01-preview

    • 常用模型名称:gpt-4o、gpt-4o-mini、gpt-4.1、o1/o3-mini

    Anthropic Claude

    (Azure 托管)

    • EndPoint(即 Base URL):https://<你的资源名>.cognitiveservices.azure.com/anthropic/v1

    • API Version:本模型下无需填写

    • 常用模型名称claude-opus-4.7claude-sonnet-4.6、claude-haiku-4.5

    Google Gemini
    • EndPoint(即 Base URL):https://<你的资源名>.cognitiveservices.azure.com/google/v1

    • API Version:本模型下无需填写

    • 常用模型名称gemini-3.1-pro、gemini-3.1-ultra

    3. 大模型API费率信息

    3.1 核心费率速览

    推荐模型

    输入价格
    (元/百万Token)

    输出价格
    (元/百万Token)

    说明

    qwen3.6-plus
    (满血版)

    2(≤256K)/8(>256K

    12(≤256K)/48(>256K

    • 支持思维链,100万Token 上下文

    • Batch 调用 5 折

    • 计费说明

    qwen3-max-preview
    (满血版)

    9(≤256K)/15(>256K

    54(≤128K)/90(>128K

    kimi-k2.6
    (满血版)

    6.527

    glm-5.1
    (满血版)

    6(≤32K)/8(>32K

    24(≤32K)/28(>32K

    MiniMax-M2.7
    (满血版)

    2.18.4

    3.2 费用计算公式

    单次调用成本 =(输入 Token 数/1000000 × 对应输入单价)+(输出 Token 数/1000000 × 对应输出单价)

    3.3 性价比参考

    假设每条用例平均总量为 20000 Token,其中:

    • 输入:18000 Token

    • 输出:2000 Token

    • 输入输出比例:9:1

    • 不考虑思维链,仅按可见输入/输出 Token 计费

    计算示例(以 qwen3.6-plus 为例):

    成本 = (18000 / 1000000 × 2)+(2000 / 1000000 × 12)= 0.036 + 0.024 = 0.06 元/条

    推荐模型
    单条用例成本(元)
    MiniMax-M2.7(满血版)≈0.055
    qwen3.6-plus(满血版)≈0.060
    glm-5.1(满血版)≈0.156
    kimi-k2.6(满血版)≈0.171
    qwen3-max-preview(满血版)≈0.270

    附件列表


    主题: 模型配置
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!