container-storage支持的模型与定价

模型目录与定价

请参阅 https://gateway.anyint.io/en/user/available-modelsarrow-up-right 以获取最新模型价格与可用性

更新:2025-11-12

提供者
模型
类型
输入 $/1M
输出 $/1M
缓存输入 $/1M

Anthropic

Claude Haiku 3

文本(旧版)

0.25

1.25

-

Anthropic

Claude Haiku 3.5

文本(最新版)

0.8

4

1

Anthropic

Claude Opus 3

文本(旧版)

15

75

18.75

Anthropic

Claude Opus 4

文本(旧版)

15

75

18.75

Anthropic

Claude Opus 4.1

文本(最新版)

15

75

18.75

Anthropic

Claude Sonnet 3.7

文本(旧版)

3

15

-

Anthropic

Claude Sonnet 4

文本(最新版)

3 ≤ 200K 代币6 > 200K 代币

15 ≤ 200K 代币22.5 > 200K 代币

3.75 ≤ 200K 代币7.5 > 200K 代币

DeepSeek

DeepSeek-R1

文本

0.07

1.68

0.56

DeepSeek

DeepSeek-V3

文本(最新版)

0.07

1.68

0.56

DeepSeek

deepseek-coder

文本

0.07

0.56

0.14

Google

Gemini 2.5 Pro

文本(最新版)

1.25 ≤ 200K 代币2.5 > 200K 代币

10 ≤ 200K 代币15 > 200K 代币

-

Google

Gemini-2.0-flash

文本

0.15

0.6

-

Google

Gemini-2.0-flash-lite

文本

0.075

0.3

-

Google

Gemini-2.5-flash

文本

2.5

10 ≤ 200K 代币15 > 200K 代币

-

Google

Gemini-2.5-flash-lite

文本

0.1

0.4

-

Google

Gemini-pro-vision

图像

50

200

-

OpenAI

gpt-3.5-turbo

旧版文本(标准)

0.5

1.5

-

OpenAI

gpt-4

旧版文本(标准)

30

60

-

OpenAI

gpt-4.1

文本(标准)

2

8

0.5

OpenAI

gpt-4.1-mini

文本(标准)

0.4

1.6

0.1

OpenAI

gpt-4.1-nano

文本(标准)

0.1

0.4

0.025

OpenAI

gpt-4o

文本(标准)

2.5

10

1.25

OpenAI

gpt-4-turbo

旧版文本(标准)

10

30

-

OpenAI

gpt-5

文本(标准)

1.25

10

0.125

OpenAI

gpt-5-mini

文本(标准)

0.25

2

0.025

OpenAI

gpt-5-nano

文本(标准)

0.05

0.4

0.005

OpenAI

o3

文本(标准,推理)

2

8

0.5

OpenAI

o4-mini

文本(标准,推理)

1.1

4.4

0.275

I. 推荐模型与使用场景

(价格以每 1M 代币的美元计 — in = 输入,out = 输出)

1)低成本 / 高吞吐量

  • gpt-5-nano($0.05 输入 / $0.4 输出):用于金丝雀/大规模任务的极低成本默认选择。

  • gpt-4.1-nano($0.1 / $0.4):更稳定、通用的“nano”级别。

  • Gemini-2.0-flash-lite($0.075 / $0.3)或 Gemini-2.5-flash-lite($0.1 / $0.4):轻量生成/理解的高性价比选择。

  • deepseek-coder($0.07 / $0.56):在代码生成/重构方面性价比高。

2)通用聊天 / 内容生成

  • gpt-4.1-mini($0.4 / $1.6):稳定、多用途的“mini”工作型模型。

  • DeepSeek-V3($0.07 / $1.68):擅长中文与中长文本,且成本友好。

  • Claude Haiku 3($0.25 / $1.25):轻量且高质量的替代方案。

3)高质量 / 复杂任务

  • gpt-4o($2.5 / $10)或 gpt-4.1($2 / $8):用于高质量长文生成与多轮对话。

  • Gemini 2.5 Pro (分级):复杂、复合工作负载的输入 $1.25–$2.5 / 输出 $10–$15。

  • Gemini-2.5-flash(输入 $2.5 / 输出 $10–$15):价格更高但性能强劲。

4)推理 / 思维链

  • o4-mini($1.1 / $4.4):以较低价格提供推理能力。

  • o3($2 / $8):更强的推理路线。

  • DeepSeek-R1($0.07 / $1.68):低成本的推理试验选择。

5)视觉 / 多模态

  • Gemini-pro-vision(输入 $50 / 输出 $200):在需要视觉理解时使用(成本高—仅按需调用)。


II. 完整价格表(美元 / 每 1M 代币)

“缓存输入”列仅在提供者支持缓存命中折扣时适用;若未标明,则该模型/路径不区分缓存定价。


注释

  • 以上价格按每百万代币计算。如见“≤200K / >200K”等分级计费,结算按调用时提供者生效的分级规则执行。

  • 默认情况下,用户端结算分别统计输入和输出代币(在适用时也按路径定义区分)。

  • 若单次请求因回退/分段路由被分配到多个提供者,费用按各段计算后合并计费。

  • 关于提供者收益分成、协议费用及用户 90% 折扣规则,请参阅定价与奖励分配模型。

最后更新于