对话补全 (Chat Completion)

通义千问大模型 API 核心接口，支持多轮对话、流式输出等功能。

基础示例

以下是一个简单的 cURL 调用示例：

bash

1curl -X POST https://your-api-endpoint.com/v1/chat/completions \
2  -H "Content-Type: application/json" \
3  -H "Authorization: Bearer YOUR_API_KEY" \
4  -d '{
5    "model": "dashscope/qwen-plus",
6    "messages": [
7      {"role": "system", "content": "You are a helpful assistant."},
8      {"role": "user", "content": "你好，请解释一下什么是量子力学？"}
9    ]
10  }'

流式响应

对于长文本生成，建议使用流式响应以提升用户体验。

bash

1curl -X POST https://your-api-endpoint.com/v1/chat/completions \
2  -H "Content-Type: application/json" \
3  -H "Authorization: Bearer YOUR_API_KEY" \
4  -d '{
5    "model": "dashscope/qwen-plus",
6    "messages": [{"role": "user", "content": "写一篇关于未来城市的科幻小说，字数要求3000字以上。"}],
7    "stream": true
8  }'

参数说明

参数	类型	必选	默认值	说明
model	String	是	-	模型名称，如 qwen-max, qwen-plus
messages	Array	是	-	对话消息列表，格式为 [{"role": "user", "content": "你好"}]
temperature	Float	否	1.0	核采样参数，范围 0-2
top_p	Float	否	1.0	核采样参数
stream	Boolean	否	false	是否流式返回
max_tokens	Integer	否	-	生成的最大 token 数
presence_penalty	Float	否	0.0	存在惩罚参数，范围 -2 到 2
frequency_penalty	Float	否	0.0	频率惩罚参数，范围 -2 到 2
user	String	否	-	用户标识，用于追踪和限流
stop	String/Array	否	-	停止生成的条件，可以是字符串或字符串数组
logit_bias	Object	否	-	token 概率调整，格式为 {"token_id": "bias"}
response_format	Object	否	-	响应格式，如 {"type": "json_object"}
seed	Integer	否	-	随机种子，用于可复现的输出
tools	Array	否	-	可用工具列表，用于函数调用
tool_choice	String/Object	否	-	工具选择策略
logprobs	Boolean	否	-	是否返回 token 的 logprobs
top_logprobs	Integer	否	-	返回 top_k 个 logprobs
parallel_tool_calls	Boolean	否	-	是否并行调用工具
stream_options	Object	否	-	流式响应选项
top_k	Integer	否	-	Top-K 采样参数，Qwen 特有
enable_thinking	Boolean	否	-	开启深度思考模式
thinking_budget	Integer	否	-	思考模式 token 预算，Qwen 特有
enable_search	Boolean	否	-	开启联网搜索，Qwen 特有
search_options	Object	否	-	搜索选项配置，Qwen 特有
enable_code_interpreter	Boolean	否	-	开启代码解释器，Qwen 特有
translation_options	Object	否	-	翻译模型特殊参数