探索 AI 模型库

汇聚全球顶尖 AI 实验室的最新大语言模型。无论是极速推理还是超长上下文,总有一款契合您的业务场景。

DeepSeek

deepseek-v3.1

DeepSeek V3.1 通过显式推理(Think)、动态搜索(Search)、高效工具调用(Tool) 这三驾马车,清晰地瞄准了下一代 AI 智能体的核心能力,清晰地勾勒出一条技术演进路线:一个更自主、更可靠、更能与外部世界交互的智能体(Agent)正在成型。

推理工具调用
上下文长度 128K
价格 (1M Tokens) 入 ¥4.00 / 出 ¥12.00
DeepSeek

deepseek-v3.2

DeepSeek 发布 V3.2 正式版,显著强化了 Agent 和推理能力,在主流测试中达到 GPT-5 水平并支持思考模式下的工具调用;同时推出的 Speciale 探索版在多项国际竞赛中取得金牌级表现。模型已全面开放使用。

推理工具调用开源权重
上下文长度 128K
价格 (1M Tokens) 入 ¥2.00 / 出 ¥3.00
DeepSeek

deepseek-v4-flash

DeepSeek-V4 系列,包含两款强大的混合专家(Mixture-of-Experts, MoE)语言模型:DeepSeek-V4-Pro(总参数量 1.6T,激活参数量 49B)和 DeepSeek-V4-Flash(总参数量 284B,激活参数量 13B),两者均支持 百万 token 的上下文长度。

推理工具调用
上下文长度 1024K
价格 (1M Tokens) 入 ¥1.00 / 出 ¥2.00
DeepSeek

deepseek-v4-pro

DeepSeek-V4-Pro 的 Agent 能力显著增强。在 Agentic Coding 评测中,V4-Pro 已达到当前开源模型最佳水平,并在其他 Agent 相关评测中同样表现优异。在数学、STEM、竞赛型代码的测评中,DeepSeek-V4-Pro 超越当前所有已公开评测的开源模型,取得了比肩世界顶级闭源模型的优异成绩。DeepSeek-V4 开创了一种全新的注意力机制,在 token 维度进行压缩,结合 DSA 稀疏注意力(DeepSeek Sparse Attention),实现了全球领先的长上下文能力,并且相比于传统方法大幅降低了对计算和显存的需求。从现在开始,1M(一百万)上下文将是 DeepSeek 所有官方服务的标配。

推理工具调用
上下文长度 1024K
价格 (1M Tokens) 入 ¥12.00 / 出 ¥24.00
字节跳动

doubao-seed-1.6-flash

Doubao-Seed-1.6-flash 推理速度极致的多模态深度思考模型,TPOT低至10ms; 同时支持文本和视觉理解,文本理解能力超过上一代lite,视觉理解比肩友商pro系列模型。支持 256k 上下文窗口,输出长度支持最大 16k tokens。

推理工具调用视觉理解
上下文长度 256K
价格 (1M Tokens) 入 ¥0.15 / 出 ¥1.50
字节跳动

doubao-seed-2.0-code

Doubao Seed 2.0 Code 面向真实编程环境优化的 Coding 模型,能稳定调用 Claude Code 等常见 IDE 中的工具。模型特别优化了前端能力,在使用常见的前端框架时能有良好表现。模型支持使用 Skills,可以配合多种自定义技能使用。

推理工具调用文件处理视觉理解
上下文长度 256K
价格 (1M Tokens) 入 ¥3.20 / 出 ¥12.00
字节跳动

doubao-seed-2.0-pro

Doubao Seed 2.0 Pro 旗舰级全能通用模型,面向 Agent 时代的复杂推理与长链路任务执行场景。强调多模态理解、长上下文推理、结构化生成与工具增强执行。复杂指令与多约束执行能力突出,可稳定应对多步复杂规划、复杂图文推理、视频内容理解与高难度分析等场景。

推理工具调用文件处理视觉理解
上下文长度 256K
价格 (1M Tokens) 入 ¥3.20 / 出 ¥16.00
字节跳动

doubao-seedance-2-0-260128

Doubao视频生成模型由字节跳动 Seed 团队研发,支持文字与图片输入,可生成运动流畅、细节丰富、风格多样且具备影视级美感的视频。支持文生视频、首帧图生视频,分辨率支持480P、720P、1080P,最大时长支持15秒。

视频价格元 / 百万 tokens
480P / 720P
含视频¥28
纯文本¥46
1080P
含视频¥31
纯文本¥51
字节跳动

doubao-seedance-2.0

Doubao视频生成模型由字节跳动 Seed 团队研发,支持文字与图片输入,可生成运动流畅、细节丰富、风格多样且具备影视级美感的视频。支持文生视频、首帧图生视频,分辨率支持480P、720P,最大时长支持15秒,支持素材上传,支持AIGC真人

视频价格元 / 百万 tokens
480P / 720P
含视频¥28
纯文本¥46
1080P
含视频¥31
纯文本¥51
字节跳动

doubao-seedream-5-0-260128

Doubao-Seedream-5.0-lite是字节跳动发布的最新图像创作模型。该模型首次搭载联网检索功能,能融合实时网络信息,提升生图时效性。同时,模型的聪明度进一步升级,能够精准解析复杂指令和视觉内容。此文生图 0.22元/张 | 图生图 0.22元/张

上下文长度 N/A
价格 (1M Tokens) 入 ¥0.00 / 出 ¥0.00
智谱

glm-5

GLM-5 是智谱新一代的旗舰基座模型,面向 Agentic Engineering 打造,能够在复杂系统工程与长程 Agent 任务中提供可靠生产力。在 Coding 与 Agent 能力上,GLM-5 取得开源 SOTA 表现,在真实编程场景的使用体感逼近 Claude Opus 4.5,擅长复杂系统工程与长程 Agent 任务,是通用 Agent 助手的理想基座。

推理工具调用开源权重
上下文长度 204.8K
价格 (1M Tokens) 入 ¥4.00 / 出 ¥18.00
智谱

glm-5.1

智谱最新旗舰模型,在长程自主执行、复杂工程优化与真实开发场景中展示出更强能力,综合能力对标Claude Opus 4.6

推理工具调用
上下文长度 200K
价格 (1M Tokens) 入 ¥8.00 / 出 ¥28.00
Moonshot

kimi-k2-thinking

Kimi K2 Thinking 是 Moonshot AI 迄今为止最先进的开源推理模型,它将 K2 系列扩展到了智能体层面,实现了长时域推理。该模型基于 Kimi K2 中引入的万亿参数混合专家 (MoE) 架构构建,每次前向传播激活 320 亿个参数,并支持 256 个 k-token 上下文窗口。该模型针对持续的逐步思考、动态工具调用以及跨越数百轮的复杂推理工作流进行了优化。它将逐步推理与工具使用交错进行,从而能够实现自主研究、编码和写作,并能持续数百次连续操作而不会出现偏差。 它在 HLE、BrowseComp、SWE-Multilingual 和 LiveCodeBench 等开源基准测试中创造了新的纪录,同时在 200-300 次工具调用中保持了稳定的多智能体行为。基于采用 MuonClip 优化的大规模 MoE 架构,它兼具强大的推理深度和高推理效率,能够胜任高要求的智能体和分析任务。

工具调用推理
上下文长度 256K
价格 (1M Tokens) 入 ¥4.00 / 出 ¥16.00
Moonshot

kimi-k2.5

Kimi K2.5 是 Kimi 迄今最智能的模型,在 Agent、代码、视觉理解及一系列通用智能任务上取得开源 SoTA 表现。同时 Kimi K2.5 也是 Kimi 迄今最全能的模型,原生的多模态架构设计,同时支持视觉与文本输入、思考与非思考模式、对话与 Agent 任务。

推理工具调用文件处理视觉理解
上下文长度 262.1K
价格 (1M Tokens) 入 ¥4.00 / 出 ¥21.00
Moonshot

kimi-k2.6

Kimi K2.6 是 Kimi 最新最智能的模型,Kimi K2.6 的通用 Agent、代码等综合能力得到全面提升,其中在博士级难度的完整版人类最后的考试(Humanity’s Last Exam)、在考察模型真实软件工程能力的 SWE-Bench Pro、评估 Agent 深度检索能力的 DeepSearchQA 等基准测试中均取得行业领先的成绩,同时支持思考与非思考模式,对话与 Agent 任务。

推理工具调用
上下文长度 256K
价格 (1M Tokens) 入 ¥6.50 / 出 ¥27.00
AI

mimo-v2.5-pro

MiMo-V2.5-Pro 是小米迄今最强大的模型。在通用智能体能力、复杂软件工程以及长程任务等维度上,它已能与全球顶尖 Agent 模型(Claude Opus 4.6、GPT-5.4 )正面较量,相较上一代 MiMo-V2-Pro 实现了全方位跃升。MiMo-V2.5-Pro 展现出的智能水平让我们重新思考人与模型的协作方式:搭配合适的运行框架,它可以稳定完成单次涉及近千轮工具调用的长程任务,在智能体场景下的指令遵循能力也明显提升——既能精准捕捉上下文中的隐性要求,又能在超长周期内保持逻辑一致。至此,MiMo-V2.5-Pro 已经可以以更高的置信度承担起真正严肃的专业工作。

推理工具调用开源权重
上下文长度 1024K
价格 (1M Tokens) 入 ¥7.00 / 出 ¥21.00
MiniMax

minimax-m2.5

Minimax M2.5专为Agent场景原生设计,编程与智能体性能(Coding & Agentic)直接对标Claude Opus 4.6,尤其在Excel高阶处理、PPT生成和深度调研等Office生产力场景达到行业领先水平(SOTA)。

推理工具调用开源权重
上下文长度 204.8K
价格 (1M Tokens) 入 ¥2.10 / 出 ¥8.40
MiniMax

minimax-m2.5-highspeed

MiniMax M2.5-highspeed 是专为追求极致效率的生产力场景打造的加速版 SOTA 模型。 它完美继承了 M2.5 的核心智能与强大的数字化工作能力——包括在 SWE-Bench Verified 斩获 80.2% 的编程实力、流畅操作 Office 全家桶的办公通用性,以及复杂环境下的跨软件协作能力。

推理工具调用
上下文长度 200K
价格 (1M Tokens) 入 ¥4.20 / 出 ¥16.80
MiniMax

minimax-m2.7

MiniMax-M2.7 是一款面向自主化、真实生产力与持续进化的下一代大语言模型。该模型深度参与自身演化进程,通过多智能体协同整合先进的智能体能力,能够在动态环境中完成复杂任务的规划、执行与优化。

推理工具调用开源权重
上下文长度 204K
价格 (1M Tokens) 入 ¥2.10 / 出 ¥8.40
MiniMax

minimax-m2.7-highspeed

MiniMax M2.7-highspeed 是专为追求极致效率的生产力场景打造的加速版 SOTA 模型。 它完美继承了 M2.7 的核心智能与强大的数字化工作能力——通过多智能体协作,主动参与自身演进,并将先进的智能体能力整合其中,使其能够在动态环境中规划、执行并改进复杂任务,能够处理诸如实时调试、根因分析、财务建模,以及跨 Word、Excel 和 PowerPoint 的完整文档生成等工作流程。

推理工具调用开源权重
上下文长度 204K
价格 (1M Tokens) 入 ¥4.20 / 出 ¥16.80
阿里巴巴

qwen3-embedding-8b

Qwen3-Embedding-8B 是 Qwen3 嵌入模型系列的最新专有模型,专为文本嵌入和排序任务设计。该模型基于 Qwen3 系列的密集基础模型,具有 80 亿参数规模,支持长达 32K 的上下文长度,可生成最高 4096 维的嵌入向量。该模型继承了基础模型卓越的多语言能力,支持超过 100 种语言,具备长文本理解和推理能力。在 MTEB 多语言排行榜上排名第一(截至 2025 年 6 月 5 日,得分 70.58),在文本检索、代码检索、文本分类、文本聚类和双语挖掘等多项任务中表现出色。模型支持用户自定义输出维度(32 到 4096)和指令感知功能,可根据特定任务、语言或场景进行优化

上下文长度 32K
价格 (1M Tokens) 入 ¥0.28 / 出 ¥0.00
阿里巴巴

qwen3.5-397b-a17b

Qwen3.5系列397B-A17B原生视觉语言模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在语言理解、逻辑推理、代码生成、智能体任务、图像理解、视频理解、图形用户界面(GUI)等多种任务中,均展现出与当前顶尖前沿模型相媲美的卓越性能。具备强大的代码生成与智能体能力,对于各类智能体场景具有良好的泛化性。

推理工具调用开源权重视觉理解
上下文长度 256K
价格 (1M Tokens) 入 ¥3.00 / 出 ¥18.00
阿里巴巴

qwen3.5-plus

Qwen3.5原生视觉语言系列Plus模型,基于混合架构设计,融合了线性注意力机制与稀疏混合专家模型,实现了更高的推理效率。在多项任务评测中,3.5系列均展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果在纯文本与多模态方面相较3系列均实现飞跃式进步。

推理工具调用文件处理视觉理解
上下文长度 1M
价格 (1M Tokens) 入 ¥4.00 / 出 ¥24.00
阿里巴巴

qwen3.6-plus

Qwen3.6原生视觉语言系列Plus模型,展现出与当前顶尖前沿模型相媲美的卓越性能,模型效果相较3.5系列显著提升。模型在Agentic coding、前端编程、Vibe coding等代码能力、多模态万物识别、OCR、物体定位等能力上显著增强。

推理工具调用
上下文长度 1024K
价格 (1M Tokens) 入 ¥8.00 / 出 ¥48.00
阿里巴巴

qwen3.7-max

Qwen3.7系列中规模最大、综合能力最强的Max模型,当前开放纯文本模型能力供体验。Qwen3.7是面向智能体时代的新一代旗舰模型,核心优势在于智能体能力的广度与深度:在编程、办公与生产力、长周期自主执行方面均能出色胜任各项任务。

推理工具调用
上下文长度 1024K
价格 (1M Tokens) 入 ¥12.00 / 出 ¥36.00
Logo
TopenRouter

下一代 AI 语义路由原语平台。 构建于 2026 年的全球智能网络。

服务与支持

企业微信企业微信
微信公众号微信公众号
电话400-666-8920(全国运营中心)
地址
上海北京贵阳成都南宁杭州盐城长沙

上海市徐汇区宜山路700号枫林科创园A5栋2楼(桂林路地铁站上盖园区)

北京市丰台区广安路9号院国投财富广场1号楼12层

贵州省贵阳市花溪区贵州理工学院3号门科技孵化园2号楼A座3-5楼

四川省成都市武侯区锦城大道666号奥克斯广场B座903B

广西自治区南宁市江南区研祥智谷E16栋1号楼

浙江省杭州市上城区东宁路677号东宁金座605室

江苏省盐城市城南新区大数据产业园学海路29号B-5

湖南省长沙市天心区万家丽南路二段1480号湖南大数据交易所B栋1202号

微信
在线
电话