华为云首页用户手册

数智融合计算服务-发起调用请求:请求参数

数智融合计算服务-发起调用请求:请求参数

时间：2025-01-03 14:29:34

数智融合计算服务推理服务接口

请求参数

表2 请求Header参数
参数	是否必选	参数类型	描述
X-Auth-Token	否	String	参数解释：租户token。约束限制：不涉及。取值范围：不涉及。默认取值：不涉及。

表3 请求Body参数
参数	是否必选	参数类型	描述
messages	否	Array of ChatMessage objects	消息
max_tokens	否	Integer	要在聊天完成中生成的最大token数。输入token和生成token的总长度受模型的上下文长度限制。
temperature	否	Double	Temperature是用于调整随机程度的数字。介于0和2之间。较高的值（如0.8）将使输出更随机，而较低的值（如0.2）将使输出更集中和确定性。
top_p	否	Double	核心采样，用于控制AI模型根据累积概率考虑的标记范围。
stream	否	Boolean	是否支持流式返回。如果支持，则消息按行返回（交互式效果）。如果不支持，则消息一次性全部返回。
frequency_penalty	否	Double	参数解释：频率惩罚，控制文本中词汇的重复度，避免生成文本中某些词汇或短语出现过于频繁。正值会根据它们在文本中的现有频率惩罚新令牌，从而降低模型逐字重复同一行的可能性。约束限制：不涉及取值范围：[-2.0,2.0]。默认取值：不涉及。
presence_penalty	否	Double	参数解释：存在惩罚，控制文本中话题的重复度，避免在对话或文本中反复讨论相同的主题或观点。正值会根据到目前为止它们是否出现在文本中来惩罚新令牌，从而增加模型谈论新主题的可能性。约束限制：不涉及取值范围：[-2.0,2.0]。默认取值：不涉及。
n	否	Integer	要为每个输入消息生成多少个聊天完成选项。请注意，您将根据所有选项中生成的token数收取费用。将n保持为1，以最小化成本。

表4 ChatMessage
参数	是否必选	参数类型	描述
role	是	String	角色
content	是	String	消息的内容

上一篇：数智融合计算服务-发起调用请求:URI

下一篇：数智融合计算服务-发起调用请求:URI

新客秒杀 2核2G 3M L实例

68元/年

普惠上云领千元上云礼券

立即前往

企业专享 X实例 4核8G 5M

888元/年

热门域名 1元随心购

1元/年起

数智融合计算服务-发起调用请求:请求参数

意见反馈

0/200

提交成功！非常感谢您的反馈，我们会继续努力做到更好反馈提交失败！请稍后重试！

推荐文章

解决方案
相关专题