对话补全 (Chat Completion)

通义千问大模型 API 核心接口,支持多轮对话、流式输出等功能。

基础示例

以下是一个简单的 cURL 调用示例:

bash
1curl -X POST https://your-api-endpoint.com/v1/chat/completions \
2 -H "Content-Type: application/json" \
3 -H "Authorization: Bearer YOUR_API_KEY" \
4 -d '{
5 "model": "dashscope/qwen-plus",
6 "messages": [
7 {"role": "system", "content": "You are a helpful assistant."},
8 {"role": "user", "content": "你好,请解释一下什么是量子力学?"}
9 ]
10 }'

流式响应

对于长文本生成,建议使用流式响应以提升用户体验。

bash
1curl -X POST https://your-api-endpoint.com/v1/chat/completions \
2 -H "Content-Type: application/json" \
3 -H "Authorization: Bearer YOUR_API_KEY" \
4 -d '{
5 "model": "dashscope/qwen-plus",
6 "messages": [{"role": "user", "content": "写一篇关于未来城市的科幻小说,字数要求3000字以上。"}],
7 "stream": true
8 }'

参数说明

参数类型必选默认值说明
modelString-模型名称,如 qwen-max, qwen-plus
messagesArray-对话消息列表,格式为 [{"role": "user", "content": "你好"}]
temperatureFloat1.0核采样参数,范围 0-2
top_pFloat1.0核采样参数
streamBooleanfalse是否流式返回
max_tokensInteger-生成的最大 token 数
presence_penaltyFloat0.0存在惩罚参数,范围 -2 到 2
frequency_penaltyFloat0.0频率惩罚参数,范围 -2 到 2
userString-用户标识,用于追踪和限流
stopString/Array-停止生成的条件,可以是字符串或字符串数组
logit_biasObject-token 概率调整,格式为 {"token_id": "bias"}
response_formatObject-响应格式,如 {"type": "json_object"}
seedInteger-随机种子,用于可复现的输出
toolsArray-可用工具列表,用于函数调用
tool_choiceString/Object-工具选择策略
logprobsBoolean-是否返回 token 的 logprobs
top_logprobsInteger-返回 top_k 个 logprobs
parallel_tool_callsBoolean-是否并行调用工具
stream_optionsObject-流式响应选项
top_kInteger-Top-K 采样参数,Qwen 特有
enable_thinkingBoolean-开启深度思考模式
thinking_budgetInteger-思考模式 token 预算,Qwen 特有
enable_searchBoolean-开启联网搜索,Qwen 特有
search_optionsObject-搜索选项配置,Qwen 特有
enable_code_interpreterBoolean-开启代码解释器,Qwen 特有
translation_optionsObject-翻译模型特殊参数