华为云用户手册

  • 请求参数 使用Token认证方式的请求Header参数见表1。 表1 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。 获取Token 接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表 请求Header参数(API Key认证)。 表2 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表3 请求Body参数 参数 是否必选 参数类型 描述 query 是 String 参数解释: query信息;支持在线输入query的embedding。 约束限制: 字符串长度限制:1~1000 取值范围: - 默认取值: - embedding_type 否 String 参数解释: embedding的两种模式 query2query 和 query2doc。 约束限制: - 取值范围:query2query 和 query2doc。 默认取值: query2doc
  • 响应参数 状态码:200 表4 响应Body参数 参数 参数类型 描述 embedding List[List[Float]] embedding的结果。 ret String 错误码。 msg String 错误信息。 cost Float 模型推理耗时。 状态码: 400 表5 响应Body参数 参数 参数类型 描述 ret String 错误码。 msg String 错误信息。 embedding List[List[Float]] embedding的结果,当错误时,是为空。 cost Float 处理时间。
  • 响应消息体 响应消息体通常以结构化格式返回,与响应消息头中Content-Type对应,传递除响应消息头之外的内容。 接口调用成功后将返回如下响应体。 { "id": "180f5745-4ee4-42a9-9869-23f829654bb7", "created": 1724915285, "choices": [ { "index": 0, "text": "故事标题:《穿越宋朝的奇妙之旅》在一个阴雨绵绵的夜晚,一个名叫李晓的年轻人正在阅读一本关于宋朝的历史书籍。突然,他感到一阵眩晕,当他再次睁开眼睛时,他发现自己身处一个完全陌生的地方。李晓发现自己穿越到了宋朝。他身处一座繁华的城市,人们穿着古代的服饰,用着他听不懂的语言交谈。他意识到自己真的穿越了。李晓在宋朝的生活充满了挑战。他必须学习如何使用新的语言,适应新的生活方式。他开始学习宋朝的礼仪,尝试理解这个时代的文化。在宋朝,李晓遇到了许多有趣的人。他遇到了一位名叫赵敏拿来的小女孩,她聪明伶俐,让李晓对她产生了深深的喜爱。他还遇到了一位名叫王安石的大儒,他的智慧和博学让李晓深感敬佩。在宋朝的生活中,李晓也遇到了许多困难。他必须适应新的食物,新的气候,甚至新的疾病。但是,他从未放弃,他始终坚信,只要他坚持下去,他就能适应这个新的世界。在宋朝的生活中,李晓也找到了新的目标。他开始学习宋朝的书法,尝试理解这个时代的艺术。他还开始学习宋朝的医学,尝试理解这个时代的科学。在宋朝的生活中,李晓也找到了新的爱情。他与赵敏拿来建立了深厚的感情,他们的conseillé情深深地打动了李晓。最后,李晓决定留在宋朝。他发现,他已经深深地爱上了这个时代,爱上了这里的人,爱上了这里的食物,爱上了这里的一切。这就是李晓在宋朝的hesion之旅,一个充满挑战和机遇的旅程。虽然他来自未来,但他已经成为了宋朝的一部分,成为了这个时代的一部分。", "ppl": 1.77809815678146e-36 } ], "usage": { "completion_tokens": 365, "prompt_tokens": 9, "total_tokens": 374 } } 当接口调用出错时,会返回错误码及错误信息说明。 token有效期为24小时,下面的报错表示token过期。 { "error_msg": "Incorrect IAM authentication information: token expires, expires_at:2023-06-29T02:16:41.581000Z", "error_code": "APIG.0301", "request_id": "469967f55e6b225xxx" } 其中,error_code表示错误码,error_msg表示错误描述信息。
  • 响应示例 { "result": [ { "RegisterMatrix": [ [ 1, 0, 0 ], [ 0, 1, 0 ], [ 0, 0, 1 ] ] }, { "Box": { "Y": 0, "Width": 100, "Angle": 0, "X": 0, "Height": 100 }, "Score": 0.9, "label": "person" } ] }
  • 响应参数 状态码: 200 表5 响应Body参数 参数 参数类型 描述 result List 物体检测的识别结果。 表6 响应Body参数 参数 参数类型 描述 RegisterMatrix List 默认为[[1, 0, 0], [0, 1, 0], [0, 0, 1]],表示图片特征矩阵。 Label String 预测类别。 Score Float 置信度。 Box Dict 检测到的目标主体信息,格式为{"x":x1,"y":y1,"width":w,"height":h,'Angle':angle}。 x:检测到的目标主体区域的左上角x坐标。 y:检测到的目标主体区域的左上角y坐标。 width:检测到的目标主体区域的宽度。 height:检测到的目标主体区域的高度。 angle: 检测到的目标主体区域的角度。 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。
  • 请求参数 使用Token认证方式的请求Header参数见表1。 表2 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表2。 表3 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表4 图片请求Body参数 参数 是否必选 参数类型 描述 images 是 String 参数解释:被检测图片的base64编码。 约束限制:建议使用PNG、JPEG、BMP、JPG、WEBP格式的图片。只支持单张图片输入,分辨率范围为1px-10000px,且长短边比例不能高于5。并且base64编码后的图片大小不超过10MB。支持RGB三通道格式的图像 取值范围: 默认取值: nms_iou_thr 是 Float 参数解释:极大值抑制阈值。 约束限制: 取值范围:范围在0.0~1.0之间。 默认取值: agnositc_nms 是 Bool 参数解释:是否进行类间nms。 约束限制: 取值范围:是填写true,不是填写false。 默认取值:
  • URI 图片推理接口:POST /v1/{project_id}/infer-api/proxy/service/{deployment_id}/ 获取URI方式请参见请求URI。 表1 推理接口路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部署ID,获取方法请参见获取模型部署ID。
  • 请求示例 { "name" : "demo-task", "input" : { "type" : "obs", "data" : [ { "bucket" : "bucket", "path" : "path/to/directory/" } ] }, "output" : { "obs" : { "bucket" : "bucket", "path" : "path/to/directory/" } }, "config" : { "start_time_begin" : 2017010100, "start_time_end" : 2017010200, "start_time_interval_hours" : 1, "forecast_lead_hours" : 1, "num_ensembles" : 2, "ensemble_noise_method" : "perlin", "ensemble_noise_perlin_scale" : 0.1, "ensemble_noise_perlin_octave" : 1, "ensemble_noise_perlin_x" : 0.2, "ensemble_noise_perlin_y" : 0.2, "draw_figures" : "true" } }
  • 请求参数 使用Token认证方式的请求Header参数见表2。 表2 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表3。 表3 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表4 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 推理作业的名称。 input 是 TaskInputDto object 输入数据的信息。 output 是 TaskOutputDto object 输出数据的信息。 config 是 TaskConfigDto object 科学计算大模型配置信息。 表5 TaskInputDto 参数 是否必选 参数类型 描述 type 是 String 存储类型,取值为obs。 data 是 Array of ObsStorageDto objects 输入数据的OBS信息。 表6 ObsStorageDto 参数 是否必选 参数类型 描述 bucket 是 String 输入数据的OBS桶名称。 path 是 String 初始场数据的存放路径。 表7 TaskOutputDto 参数 是否必选 参数类型 描述 obs 是 ObsStorageDto object 输出数据的OBS信息。 表8 TaskConfigDto 参数 是否必选 参数类型 描述 start_time_begin 是 String 起报时间区间起点(YYYYMMDDHH时间戳)。 start_time_end 是 String 起报时间区间终点(YYYYMMDDHH时间戳)。 start_time_interval_hours 否 Long 起报时间间隔小时数,默认6。取值范围:[1, 24]。 forecast_lead_hours 否 Long 预报未来小时数,默认168,取值范围:[1, 720]。 draw_figures 否 String 是否输出结果图片,取值true/false,默认true。 num_ensembles 否 Long 集合数量。在气象预报中,集合预报是指对初始场加入一定程序的扰动,使其生成一组由不同初始场预报的天气预报结果,从而提供对未来天气状态的概率信息。这种方法可以更好地表达预报的不确定性,从而提高预报的准确性和可靠性。 取值范围:[2, 10]。 ensemble_noise_method 否 String 集合预报的加噪方式。可选:{"perlin"}。 peilin噪音通过对输入数据(比如空间坐标)进行随机扰动,让模拟出的天气接近真实世界中的变化。 ensemble_noise_perlin_scale 否 Double 集合预报的Perlin加噪scale。取值范围:(0, 0.5)。 ensemble_noise_perlin_octave 否 Long 用于选择集合预报的Perlin加噪octave。Perlin噪音的octave指的是噪音的频率,在生成Perlin噪音时,可以将多个不同频率的噪音叠加在一起,以增加噪音的复杂度和细节。每个频率的噪音称为一个octave,而叠加的octave数越多,噪音的复杂度也就越高。 取值范围:[1, 10)。 ensemble_noise_perlin_x 否 Double 用于选择集合预报的Perlin加噪x经度方向的尺度。 取值范围:[0, 1)。 ensemble_noise_perlin_y 否 Double 用于选择集合预报的Perlin加噪y纬度方向的尺度。 取值范围:[0, 1)。 表9 全球中期天气要素预测模型、降水模型信息表 模型 预报层次 预报高空变量 预报表面变量 降水 时间分辨率 水平分辨率 区域范围 全球中期天气要素预测模型 13层(1000hpa, 925hpa, 850hpa, 700hpa, 600hpa, 500hpa, 400hpa, 300hpa, 250hpa, 200hpa, 150hpa, 100hpa, 50hpa) T:温度 Q:比湿 Z:重力位势 U:U风 V:V风 MLSP:海平面气压 U10:10米U风,经度方向 V10:10米V风,纬度方向 T2M:2米温度 - 1、3、6、24小时 0.25°*0.25° 全球 降水基模型 13层(1000hpa, 925hpa, 850hpa, 700hpa, 600hpa, 500hpa, 400hpa, 300hpa, 250hpa, 200hpa, 150hpa, 100hpa, 50hpa) T:温度 Q:比湿 Z:重力位势 U:U风 V:V风 MLSP:海平面气压 U10:10米U风,经度方向 V10:10米V风,纬度方向 T2M:2米温度 PRECIP6:过去6h累计降水 PRECIP24:过去24h累计降水 1、3、6、24小时 0.25°*0.25° 全球
  • 从控制台获取项目ID 登录管理控制台。 在页面右上角的用户名的下拉列表中选择“我的凭证”。 图1 我的凭证 在“我的凭证”页面,获取项目ID(project_id),以及账号名、账号ID、IAM用户名和IAM用户ID。 在调用盘古API时,获取的项目id需要与盘古服务部署区域一致,例如盘古大模型当前部署在“西南-贵阳一”区域,需要获取与贵阳一区域的对应的项目id。 图2 获取项目ID 多项目时,展开“所属区域”,从“项目ID”列获取子项目ID。
  • 调用API获取项目ID 项目ID还可通过调用查询指定条件下的项目信息API获取。 获取项目ID的接口为“GET https://{Endpoint}/v3/projects”,其中{Endpoint}为IAM的终端节点,可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。 响应示例如下,例如, 对话机器人服务 部署的区域为“cn-north-4”,响应消息体中查找“name”为“cn-north-4”,其中projects下的“id”即为项目ID。 { "projects": [ { "domain_id": "65382450e8f64ac0870cd180d14e684b", "is_domain": false, "parent_id": "65382450e8f64ac0870cd180d14e684b", "name": "project_name", "description": "", "links": { "next": null, "previous": null, "self": "https://www.example.com/v3/projects/a4a5d4098fb4474fa22cd05f897d6b99" }, "id": "a4a5d4098fb4474fa22cd05f897d6b99", "enabled": true } ], "links": { "next": null, "previous": null, "self": "https://www.example.com/v3/projects" } }
  • 响应示例 非流式 状态码: 200 OK { "id": "chat-9a75fc02e45d48db94f94ce38277beef", "object": "chat.completion", "created": 1743403365, "model": "DeepSeek-V3", "choices": [ { "index": 0, "message": { "role": "assistant", "content": "你好!有什么我可以帮助你的吗?", "tool_calls": [] }, "finish_reason": "stop" } ], "usage": { "prompt_tokens": 64, "total_tokens": 73, "completion_tokens": 9 } } 流式(stream参数为true) 状态码: 200 OK data:{"id":"chat-97313a4bc0a342558364345de0380291","object":"chat.completion.chunk","created":1743404317,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"role":"assistant"},"logprobs":null,"finish_reason":null}] data:{"id":"chat-97313a4bc0a342558364345de0380291","object":"chat.completion.chunk","created":1743404317,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":"你好"},"logprobs":null,"finish_reason":null}]} data:{"id":"chat-97313a4bc0a342558364345de0380291","object":"chat.completion.chunk","created":1743404317,"model":"DeepSeek-V3","choices":[{"index":0,"delta":{"content":",有什么我能帮您的吗?"},"logprobs":null,"finish_reason":"stop","stop_reason":null}]} data:[DONE] 流式(stream参数为true,触发 内容审核 ) 状态码: 200 OK event:moderation data:{"suggestion":"block","reply":"作为AI语言模型,我的目标是以积极、正向和安全的方式提供帮助和信息,您的问题超出了我的回答范围。"} data:[DONE]
  • 请求示例 非流式 POST https://{endpoint}/v1/{project_id}/alg-infer/3rdnlp/service/{deployment_id}/v1/chat/completions Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... Request Body: { "model":"DeepSeek-V3", "messages":[ { "role":"user", "content":"你好" }] } 流式(stream参数为true) POST https://{endpoint}/v1/{project_id}/alg-infer/3rdnlp/service/{deployment_id}/v1/chat/completions Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... Request Body: { "model":"DeepSeek-V3", "messages":[ { "role":"user", "content":"你好" }], "stream":true }
  • 响应参数 非流式 状态码: 200 表8 响应Body参数 参数 参数类型 描述 id String 用来标识每个响应的唯一字符串。形式为:"chatcmpl-{random_uuid()}" object String 固定为"chat.completion" created Integer 响应生成的时间,单位:s。 model String 请求模型ID,固定值:pangu。 choices Array of表9 ChatCompletionResponseChoice objects 生成的文本列表。 usage 表10 object 该对话请求的token用量信息。该参数可以帮助用户了解和控制模型的使用情况,避免超出Tokens限制。 prompt_logprobs Object 输入文本以及对应token的对数概率信息。 缺省值:null 表9 ChatCompletionResponseChoice 参数 参数类型 描述 message 表11 object 生成的文本内容。 index Integer 生成的文本在列表中的索引,从0开始。 finish_reason String 模型停止生成 token 的原因。 取值范围:[stop, length, content_filter, tool_calls, insufficient_system_resource] stop:模型自然停止生成,或遇到 stop 序列中列出的字符串。 length :输出长度达到了模型上下文长度限制,或达到了 max_tokens 的限制。 content_filter:输出内容因触发过滤策略而被过滤。 insufficient_system_resource:系统推理资源不足,生成被打断。 缺省值:stop logprobs Object 评估指标,表示推理输出的置信度。 缺省值:null stop_reason Union[Integer, String] 导致生成停止的token id或者字符串。如果是遇到EOS token则返回默认值。如果是因为用户请求参数参数中指定的stop参数中的字符串或者token id,则返回对应的字符串或者token id。不是openai接口标准字段,但vllm接口支持。 缺省值:None 表10 UsageInfo 参数 参数类型 描述 prompt_tokens Number 用户prompt中所包含的token数。 total_tokens Number 该次对话请求中,所有token的数量。 completion_tokens Number 推理模型所产生的答案的token数量。 表11 ChatMessage 参数 参数类型 描述 role String 生成这条消息的角色。固定为:assistant。 content String 对话的内容。 最小长度:1 最大长度:不同模型支持的token长度。 reasoning_content String 内容为在最终答案之前的推理内容(模型的思考过程)。 说明: 仅适用于 DeepSeek-R1 模型。 流式(stream参数为true) 状态码: 200 表12 流式输出的数据单元 参数 参数类型 描述 data CompletionStreamResponse object stream=true时,模型生成的消息以流式形式返回。生成的内容以增量的方式逐步发送回来,每个data字段均包含一部分生成的内容,直到所有data返回,响应结束。 表13 CompletionStreamResponse 参数 参数类型 描述 id String 该对话的唯一标识符。 created Integer 创建聊天完成时的 Unix 时间戳(以秒为单位)。流式响应的每个 chunk 的时间戳相同。 model String 生成该 completion 的模型名。 object String 对象的类型, 其值为 chat.completion.chunk。 choices ChatCompletionResponseStreamChoice 模型生成的 completion 的选择列表。 表14 ChatCompletionResponseStreamChoice 参数 参数类型 描述 index Integer 该 completion 在模型生成的 completion 的选择列表中的索引。 finish_reason String 模型停止生成 token 的原因。 取值范围:[stop, length, content_filter, tool_calls, insufficient_system_resource]。 stop:模型自然停止生成,或遇到 stop 序列中列出的字符串。 length :输出长度达到了模型上下文长度限制,或达到了 max_tokens 的限制。 content_filter:输出内容因触发过滤策略而被过滤。 insufficient_system_resource:系统推理资源不足,生成被打断。 状态码: 400 表15 响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误信息。
  • 请求参数 使用Token认证方式的请求Header参数见表3。 V1接口支持Token鉴权方式,也支持API Key鉴权方式。 表3 请求Header参数(Token认证) 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 使用API Key认证方式的请求Header参数见表 请求Header参数(API Key认证)。 表4 请求Header参数(API Key认证) 参数 是否必选 参数类型 描述 X-Apig-AppCode 是 String API Key值。 用于获取操作API的权限。API Key认证响应消息头中X-Apig-AppCode的值即为API Key。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 V2接口只支持API Key鉴权方式。 表5 V2接口请求Header参数(OpenAI格式的API Key认证) 参数 是否必选 参数类型 描述 Authorization 是 String 用户创建应用接入获取的API Key,拼接“Bearer ”后的字符串。示例:Bearer d59******9C3。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表6 请求Body参数 参数 是否必选 参数类型 描述 messages 是 Array of 表7 objects 多轮对话问答对,包含两个属性:role和content。 role表示对话的角色,取值是system或user。 如果需要模型以某个人设形象回答问题,可以将role参数设置为system。不使用人设时,可设置为user。在一次会话请求中,人设只需要设置一次。 content表示对话的内容,可以是任意文本。 messages参数可以帮助模型根据对话的上下文生成合适的回复。 model 是 String 使用的模型ID,根据所部署的模型填写,填写DeepSeek-R1或DeepSeek-V3。 stream 否 boolean 流式开关。流式输出协议为SSE(Server-Sent Events)协议。 如果开启流式,请赋值true。开启流式开关后,API会在生成文本的过程中,实时地将生成的文本发送给客户端,而不是等到生成完成后一次性将所有文本发送给客户端。 缺省值:false temperature 否 Float 用于控制生成文本的多样性和创造力。 控制采样随机性的浮点数。一般来说,temperature越低,适合完成确定性的任务。temperature越高,如0.9,适合完成创造性的任务。值为 0 意味着贪婪采样。当取值超过1,会大概率出现效果不可用问题。 temperature参数可以影响语言模型输出的质量和多样性,但也不是唯一的因素。还有其他一些参数,如top_p参数也可以用来调整语言模型的行为和偏好,但不建议同时更改这两temperature和top_p。 最小值:0,建议不要低于1e-5 最大值:1.0 缺省值:1.0 top_p 否 Float 核采样参数。作为调节采样温度的替代方案,模型会考虑前 top_p 概率的 token 的结果。0.1 就意味着只有包括在最高 10% 概率中的 token 会被考虑。 建议修改这个值或者更改 temperature,但不建议同时对两者进行修改。 取值范围:(0.0, 1.0] 缺省值:0.8 max_tokens 否 Integer 生成文本的最大输出token数量。 输入的文本加上生成的文本总量不能超过模型所能处理的最大长度。 最小值:1 最大值:8K token。 缺省值:默认部署时,token长度为最大值。 说明: token是指模型处理和生成文本的基本单位。token可以是词或者字符的片段。模型的输入和输出的文本都会被转换成token,然后根据模型的概率分布进行采样或者计算。 presence_penalty 否 Float 用于调整模型对新Token的处理方式。即如果一个Token已经在之前的文本中出现过,那么模型在生成这个Token时会受到一定的惩罚。当presence_penalty的值为正数时,模型会更倾向于生成新的、未出现过的Token,即模型会更倾向于谈论新的话题。 最小值:-2 最大值:2 缺省值:0 (表示该参数未生效)。 frequency_penalty 否 Float 用于调整模型对频繁出现的Token的处理方式。即如果一个Token在训练集中出现的频率较高,那么模型在生成这个Token时会受到一定的惩罚。当frequency_penalty的值为正数时,模型会更倾向于生成出现频率较低的Token,即模型会更倾向于使用不常见的词汇。最小值:-2,最大值:2 最小值:-2 最大值:2 缺省值:0 (表示该参数未生效)。 表7 ChatCompletionMessageParam 参数 是否必选 参数类型 描述 role 是 String 对话的角色,默认取值范围:system、user、assistant、tool、function。支持自定义。 如果需要模型以某个人设形象回答问题,可以将role参数设置为system。不使用人设时,可设置为user。 返回参数时,为固定值:assistant。 在一次会话请求中,人设只需要设置一次。 content 是 String 对话的内容,可以是任意文本,单位token。 设置多轮对话时,message中content个数不能超过20。 最小长度:1 最大长度:不同模型支持的token长度。 缺省值:None
  • URI NLP推理服务支持使用盘古推理接口(V1推理接口)调用,也支持使用业界通用的OpenAi格式接口(V2推理接口)调用。 V1接口、V2接口的鉴权方式不同,请求体和返回体略有差异。 表1 NLP服务推理接口 API分类 API访问路径(URI) V1推理接口 POST /v1/{project_id}/deployments/{deployment_id}/chat/completions V2推理接口 POST /api/v2/chat/completions 表2 V1推理接口路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参见获取项目ID。 deployment_id 是 String 模型的部署ID,获取方法请参见获取模型部署ID。
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 stream 是 Boolean 是否开启流式调用,默认开启。 true:开启 false:不开启 说明: 当前Agent只支持流式调用,需设置为true。 表3 请求Body参数 参数 是否必选 参数类型 描述 query 是 String 用户问题,作为运行Agent的输入。
  • 响应参数 流式(Header中的stream参数为true) 状态码: 200 表4 流式输出的数据单元 参数 参数类型 描述 data String stream=true时,执行Agent的消息以流式形式返回。 生成的内容以增量的方式逐步发送回来,每个data字段均包含一部分生成的内容,直到所有data返回,响应结束。 表5 流式输出的数据单元 参数 参数类型 描述 event String 数据单元类型,有以下几种类型: start,开始节点,表示开始调用模型进行会话。 message,消息节点,表示模型返回的消息。 plugin_start,插件调用请求节点,表示调用插件的请求信息。 plugin_end,插件调用响应节点,表示调用插件的响应信息。 statistic_data,执行数据节点,包含本次调用的耗时信息。 summary_response,消息总结节点,包含本次调用的全量响应信息。 done,流式调用结束节点,表示流式响应结束。 content Object 消息块内容,不同event的消息块内容不同。 createdTime long 消息块返回的时间戳,如1733817348963。 latency Object 耗时,包括以下三个元素: plugin,插件调用耗时 model,模型调用耗时 overall,总耗时 plugin Object 插件请求信息,包括以下两个元素: name,插件名 arguments,插件入参名
  • 请求示例 流式(Header中的stream参数为true) POST https://{endpoint}/v1/{project_id}/agent-run/agents/{agent_id}/conversations/{conversation_id} Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... stream: true Request Body: { "query": "查询A12会议室在9:00到10:00的状态" }
  • 响应示例 data:{"event":"start","createdTime":1735558575017} data:{"event":"message","content":"好的","createdTime":1735558576300} data:{"event":"message","content":",","createdTime":1735558576301} data:{"event":"message","content":"我将","createdTime":1735558576301} data:{"event":"message","content":"调用","createdTime":1735558576302} data:{"event":"message","content":"query","createdTime":1735558576302} data:{"event":"message","content":"_","createdTime":1735558576302} data:{"event":"message","content":"meeting","createdTime":1735558576302} data:{"event":"message","content":"_","createdTime":1735558576302} data:{"event":"message","content":"room","createdTime":1735558576303} data:{"event":"message","content":"_status","createdTime":1735558576303} data:{"event":"message","content":"工具","createdTime":1735558576303} data:{"event":"message","content":"来","createdTime":1735558576304} data:{"event":"message","content":"查询","createdTime":1735558576304} data:{"event":"message","content":"A","createdTime":1735558576304} data:{"event":"message","content":"12","createdTime":1735558576304} data:{"event":"message","content":"会议室","createdTime":1735558576305} data:{"event":"message","content":"在","createdTime":1735558576305} data:{"event":"message","content":"9","createdTime":1735558576305} data:{"event":"message","content":":00","createdTime":1735558576305} data:{"event":"message","content":"到","createdTime":1735558576306} data:{"event":"message","content":"10","createdTime":1735558576306} data:{"event":"message","content":":00","createdTime":1735558576306} data:{"event":"message","content":"的状态","createdTime":1735558576306} data:{"event":"message","content":"。","createdTime":1735558576306} data:{"event":"message","content":"请","createdTime":1735558576307} data:{"event":"message","content":"稍","createdTime":1735558576307} data:{"event":"message","content":"等","createdTime":1735558576307} data:{"event":"message","content":"。","createdTime":1735558576307} data:{"event":"message","content":" ","createdTime":1735558576307} data:{"event":"message","content":" query","createdTime":1735558576307} data:{"event":"message","content":"_","createdTime":1735558576308} data:{"event":"message","content":"meeting","createdTime":1735558576308} data:{"event":"message","content":"_","createdTime":1735558576308} data:{"event":"message","content":"room","createdTime":1735558576308} data:{"event":"message","content":"_status","createdTime":1735558576308} data:{"event":"message","content":"|","createdTime":1735558576308} data:{"event":"message","content":"{\"","createdTime":1735558576309} data:{"event":"message","content":"meeting","createdTime":1735558576309} data:{"event":"message","content":"Room","createdTime":1735558576309} data:{"event":"message","content":"\":","createdTime":1735558576309} data:{"event":"message","content":"{\"","createdTime":1735558576309} data:{"event":"message","content":"number","createdTime":1735558576310} data:{"event":"message","content":"\":","createdTime":1735558576310} data:{"event":"message","content":" 12","createdTime":1735558576310} data:{"event":"message","content":"}","createdTime":1735558576310} data:{"event":"message","content":",\"","createdTime":1735558576310} data:{"event":"message","content":"start","createdTime":1735558576310} data:{"event":"message","content":"\":\"","createdTime":1735558576311} data:{"event":"message","content":"9","createdTime":1735558576311} data:{"event":"message","content":":00","createdTime":1735558576311} data:{"event":"message","content":"\",\"","createdTime":1735558576311} data:{"event":"message","content":"end","createdTime":1735558576311} data:{"event":"message","content":"\":\"","createdTime":1735558576311} data:{"event":"message","content":"10","createdTime":1735558576311} data:{"event":"message","content":":00","createdTime":1735558576312} data:{"event":"message","content":"\"}","createdTime":1735558576312} data:{"event":"message","content":" ","createdTime":1735558576312} data:{"event":"plugin_start","type":"plugin","latency":{"overall":1.3},"plugin":{"name":"query_meeting_room_status","arguments":"{\"meetingRoom\": {\"number\": 12}, \"start\": \"9:00\", \"end\": \"10:00\"}"},"createdTime":1735558576316} data:{"event":"plugin_end","content":{"result":"空闲"},"role":"function","latency":{"overall":1.51,"plugin":0.0},"createdTime":1735558576521} data:{"event":"start","createdTime":1735558576522} data:{"event":"message","content":"A","createdTime":1735558576976} data:{"event":"message","content":"12","createdTime":1735558576977} data:{"event":"message","content":"会议室","createdTime":1735558576977} data:{"event":"message","content":"在","createdTime":1735558576977} data:{"event":"message","content":"9","createdTime":1735558576978} data:{"event":"message","content":":00","createdTime":1735558576978} data:{"event":"message","content":"到","createdTime":1735558576978} data:{"event":"message","content":"10","createdTime":1735558576978} data:{"event":"message","content":":00","createdTime":1735558576978} data:{"event":"message","content":"的时间","createdTime":1735558576978} data:{"event":"message","content":"段","createdTime":1735558576979} data:{"event":"message","content":"内","createdTime":1735558576979} data:{"event":"message","content":"是","createdTime":1735558576979} data:{"event":"message","content":"空闲","createdTime":1735558576979} data:{"event":"message","content":"的","createdTime":1735558576979} data:{"event":"message","content":"。","createdTime":1735558576980} data:{"event":"statistic_data","latency":{"overall":1.97},"createdTime":1735558576986} data:{"event":"summary_response","content":"A12会议室在9:00到10:00的时间段内是空闲的。","role":"assistant","createdTime":1735558576987} data:{"event":"done","createdTime":1735558577011}
  • 错误码 当您调用API时,如果遇到“APIGW”开头的错误码,请参见API网关错误码进行处理。遇到“APIG”开头的错误码,请参考本文档进行处理。 表1 错误码 模块 错误码 错误信息 说明 建议解决方法 模型推理 PANGU.0001 unknown error. 未知错误。 请联系服务技术支持协助解决。 PANGU.0010 parameter illegal. 请求参数错误。 请参考《API文档》输入正确的请求参数,并重新调试API。 PANGU.0011 auth failed. 认证失败。 认证鉴权失败,请参考《API文档》认证鉴权章节重新进行认证。 PANGU.0012 auth info missing. 缺少身份验证信息。 请检查调用API时是否有传入认证鉴权信息。 PANGU.0031 Inner service exception. 服务内部异常。 请联系服务技术支持协助解决。 PANGU.3305 call cal tokens failed 获取token错误。 请检查调用API时使用的token是否完整,是否存在错误。 PANGU.3254 The requested resource does not exist. 资源不存在。 请检查调用API时projectId和deploymentId是否填写正确。 PANGU.3259 NLP service status is not running or have been deleted. 推理服务状态异常。 请检查调用API时deploymentId是否正确,并检查模型的部署状态是否存在异常,如果仍无法解决请联系服务技术支持协助解决。 PANGU.3267 qps exceed the limit. QPS超出限制。 请降低请求频率。 PANGU.3278 required api parameter is not present. 请求参数丢失。 请检查调用API时请求参数是否填写完整、是否有拼写错误、取值是否正确。 PANGU.3307 domain has not added the opened API. 账号未开通该 API服务 。 请确认是否已开通该API服务。 PANGU.3308 The accessed API does not match the existing API. 访问的API与已开通的API服务不匹配。 请确认调用的API是否填写错误。 PANGU.3315 The accessed API's model instance is not public. API模型实例未公开。 请检查是否具备盘古大模型服务的使用权限,或联系服务运维人员协助解决。 PANGU.3316 create agency fail. 创建代理失败。 请联系服务运维人员协助解决。 PANGU.3317 max tokens Number Illegal. 最大token不合法 请参考《API文档》检查请求参数中输入的token数值是否不在范围内,并重新调试API。 PANGU.3318 tolal ContentLength Illegal. Content长度不合法 请参考《API文档》检查请求参数中输入的Content参数长度是否不在范围内,并重新调试API。 PANGU.3319 Private service permission error. 权限错误。 请联系服务技术支持协助解决。 PANGU.3320 The parameter [n] can only be 1 or 2 when calling non-streaming. 非流式调用推理服务传的参数只能是1或者2。 请使用正确的取值:1或者2。 PANGU.3321 The parameter [n] can only be 1 when calling streaming. 流式调用推理服务n只能取1。 请使用正确的取值:1。 IIT.0201 The input param is invalid!/The input param is invalid, please check your key! 请求参数不合法。 请检查请求参数是否填写正确。 IIT.0202 Interval Server Error! 内部错误。 请联系服务技术支持协助解决。 IIT.0203 The input param is invalid, the input data lens is less than the train data lens! 请求参数不合法,输入参数中的数据长度小于训练所用数据长度。 请确认请求body中特征名称、特征数量是否与训练数据中的特征一致。 APIG.0101 The API does not exist or has not been published in the environment. 访问的API不存在或尚未在环境中发布。 请检查API的URL是否拼写正确,例如,URL中是否缺少project_id。 HTTP请求方法(POST,GET等)是否正确。 APIG.0201 Backend timeout. 请求超时。 请检查原调用请求是否过于频繁,如果是并发过大,可以通过重试机制解决,在代码里检查返回值,碰到这个并发错误可以延时一小段时间(如2-5s)重试请求;也可以后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。 请与技术支持确认,API是否已完成部署。 APIG.0301 Incorrect IAM authentication information. IAM身份验证信息不正确: decrypt token fail:token解析失败。 token expires:token过期。 verify aksk signature fail:AK/SK认证失败。 x-auth-token not found:未找到x-auth-token参数。 token解析失败,请检查获取token的方法,请求体信息是否填写正确,token是否正确;检查获取token的环境与调用的环境是否一致。 token超时(token expires) ,请重新获取token,使用不过期的token。 请检查AK/SK是否正确(AK对应的SK错误,不匹配;AK/SK中多填了空格)。 AK/SK频繁出现鉴权出错,连续错误5次以上,被锁定5分钟(5分钟内,则一直认为其是异常的鉴权请求),5分钟后解锁重新认证。 检查账号权限,是否欠费,被冻结等。 检查调用API时,请求header参数X-Auth-Token是否拼写正确。 APIG.0308 The throttling threshold has been reached: policy user over ratelimit,limit:XX,time:1 minute. 发送请求超过了服务的默认配置限流。 通过重试机制,在代码里检查返回值,碰到并发错误可以延时一小段时间(如2-5s)重试请求。 后端检查上一个请求结果,上一个请求返回之后再发送下一个请求,避免请求过于频繁。 数据工程 MAStudio.02010005 content type [%s] not support, only [%s] support 文件内容[{0}]不支持, 只支持[{1}] 请参考报错信息中的文件内容类型,报错信息会返回支持的文件内容,请使用正确的文件内容。 MAStudio.02010027 dataset [%s] status is not online 数据集[{0}]状态不是online 请使用状态是在线状态的数据集。 MAStudio.02010028 dont have role [%s] 没有[{0}]角色 无操作权限,请根据错误提示申请对应空间内的角色操作权限。 MAStudio.02060009 Verification failed. Please check the content format is consistent with the template requirements. 校验失败,请检查文件内容格式与样例要求一致 文件内容与样例文件要求不一致,修改校验失败的文件使之与样例文件格式相同。 MAStudio.02060013 Currently, the content_type [{0}] of dataset is not supported, please purchase the relevant feature pack. 当前不支持数据集类型[{0}],请先购买相关特性包 不支持当前导入选择的数据集类型,需要订购相关的数据工程特性包。 MAStudio.02060019 import user defined file [{0}] to [{1}] failed. 导入用户自定义文件[{0}]到[{1}]失败 导入任务调用用户自定义导入数据转换格式脚本时发生错误,请检查错误信息中导入文件以及脚本文件是否正确。 MAStudio.02060021 The request for the data-management service failed, and returned [{0}]. 请求数据管理服务失败,返回[{0}] 调用数据管理接口更新数据集时发生异常,请检查数据管理微服务是否运行正常。 MAStudio.02060022 A running task cannot be started again. 运行中的任务不能再次启动 请等待数据导入任务运行结束或手动停止任务后再启动。 MAStudio.02060023 A stopping task cannot be stopped again. 停止中的任务不能再次停止 数据导入任务停止中,任务无法没重复停止。 MAStudio.02060025 The file [{0}] size exceeds the maximum limit of [{1}]. 文件[{0}]大小超过最大限制[{1}] 导入任务限制导入的TAR压缩文件大小不得超过500MB,请确认文件大小是否满足要求。 MAStudio.02060026 There is no jsonl file in the directory. 目录下没有jsonl文件 导入图片+Caption及图片+QA对类型数据集时,要求源数据中包含jsonl文件,在对当前导入数据进行校验时未匹配到jsonl文件,请确认导入数据中包含jsonl文件。 MAStudio.02071031 Job [%s] is [%s] and can not be deleted. 任务[{0}]处于处理中状态,无法删除。 运行中的数据发布任务无法被删除,等待任务运行结束后删除。 MAStudio.02010002 X-Auth-Token is invalid X-Auth-Token不合法 该token没有权限访问,使用确保该用户在IAM中配置正确权限。 MAStudio.02060018 X-Auth-Token is invalid: [{0}]. X-Auth-Token无效: [{0}] 解析或获取token失败,请检查调用接口时传入的X-Auth-Token是否有效以及X-Auth-Token与ProjectId是否匹配。 MAStudio.02012001 forbidden to do this action 无权进行该操作 该操作用户无操作权限,请获取对应IAM权限后再重试。 MAStudio.02010003 dataset [%s] not found in catalog [%s] workspace [%s] 数据集[{0}]无法在目录[{1}]下空间[{2}]中找到 该数据集在报错信息中提示的空间和catalog中不存在,请填写正确的参数。 MAStudio.02010043 user [{0}] [{1}] not found in workspace [{2}] 数据集[{0}]在空间[{1}]中没有文件,请检查 请进入该空间下检查对应的数据集在该空间下是否存在。 MAStudio.02011003 user [{0}] [{1}] not found in workspace [{2}] 在空间[{2}]中未查询到用户[{0}] [{1}] 请确认对应操作数据集的用户在该空间下具备操作权限。 MAStudio.02060032 Call mrs api failed: [{0}]. 调用 MRS API失败: [{0}] 调用MRS服务失败,请优先检查MRS集群是否运行正常,如无法解决,请联系MRS服务技术支持。 MAStudio.02060033 Mrs job is failed, job id: [{0}]. MRS作业失败, 作业id: [{0}] MRS作业失败,请根据错误信息中的作业id查看MRS manager运维界面上yarn组件中找到对应的application运行日志定位问题。 MAStudio.02071001 Read file [%s] failed 读取文件[{0}]失败 数据发布任务无法读取数据集文件,请检查当前操作用户是否具备OBS桶相关的文件读权限,确保权限配置正确。 MAStudio.02071002 Dataset [%s] is not found 找不到数据集[{0}] 数据集查找失败,请检查数据发布任务中填写的数据集信息是否填写正确。 MAStudio.02071003 Dataset [%s] status is invalid 数据集[{0}]状态不合法 该状态数据集无法被发布,确保发布任务中填写的数据集状态为上线状态。 MAStudio.02071005 Write file [%s] failed 写入文件[{0}]失败 数据发布任务无法写入数据集文件,请检查当前操作用户是否具备OBS桶相关的文件写权限,确保权限配置正确。 MAStudio.02071011 Data format is invalid, please check dataset [%s] line [%s]. 数据格式不合法,请检查数据集[{0}]第[{1}]行。 数据集的文件内容不合法,请根据错误描述中查找对应数据集文件内容格式是否正确。 MAStudio.02071017 source datasets size is up to limit [%s]GB 待发布数据大小超过上限[{0}]GB 发布任务选择的数据集超过错误信息中提示的数据大小上限,请删除数据集中的部分文件以满足发布要求。 MAStudio.02072003 Mrs job is failed, job id: [%s] Mrs作业失败,作业id:[{0}] MRS作业失败,请根据错误信息中的作业id查看MRS manager运维界面上yarn组件中找到对应的application运行日志定位问题。 父主题: 附录
  • 请求示例 POST https://{endpoint}/v1/{project_id}/agent-run/workflows/{workflow_id}/conversations/{conversation_id} Request Header: Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINODCCDTQCAQExDTALBglghkgBZQMEAgEwgguVBgkqhkiG... stream: true Request Body: { "inputs": { "query": "你好" }, "plugin_configs": [ { "plugin_id": "xxxxxxxxx", "config": { "key": "value" } } ] }
  • 响应示例 非流式(Header中的stream参数为false) 输入节点返回: { "conversation_id": "2c90493f-803d-431d-a197-57543d414317", "messages": [ { "role": "assistant", "content": "{\"inputs\": [{\"actualType\": \"string\", \"sourceType\": \"null\", \"description\": \"姓名\", \"name\": \"name\", \"type\": \"string\", \"required\": true}]}", "nodeId": "node_1745928389632", "nodeType": "Input", "nodeName": "输入" } ], "status": { "code": 3, "desc": "waiting" }, "start_time": 1734336269313, "end_time": 1734336270908 } 提问器节点返回: { "conversation_id": "f9a5540f-0c92-4f28-bd6e-f96ce04f5cc81", "messages": [ { "role": "assistant", "content": "请您提供姓名, 年龄相关的信息", "nodeId": "node_1745929628452", "nodeType": "Questioner", "nodeName": "提问器" } ], "status": { "code": 3, "desc": "waiting" }, "start_time": 1745929778250, "end_time": 1745929779951 } 结束节点返回: { "conversation_id": "2c90493f-803d-431d-a197-57543d414317", "outputs": { "responseContent": "你好!有什么我可以帮助你的吗?" }, "messages": [], "status": { "code": 1, "desc": "succeeded" }, "start_time": 1734337068533, "end_time": 1734337082545 } 流式(Header中的stream参数为true或不传) 输入节点返回: data:{"event":"workflow_started","data":{"start_time":1745929087614}} data:{"event":"message","data":{"text":"{\"inputs\": [{\"actualType\": \"string\", \"sourceType\": \"null\", \"description\": \"姓名\", \"name\": \"name\", \"type\": \"string\", \"required\": true}]}","index":0,"node_id":"node_1745928389632","node_type":"Input","node_name":"输入"}} data:{"event":"message","data":{"text":"","node_id":"node_1745928389632","node_type":"Input","node_name":"输入","is_finished":true}} data:{"event":"end"} 提问器节点返回: data:{"event":"workflow_started","data":{"start_time":1745929709955}} data:{"event":"message","data":{"text":"请您提供姓名, 年龄相关的信息","index":0,"node_id":"node_1745929628452","node_type":"Questioner","node_name":"提问器"}} data:{"event":"message","data":{"text":"","node_id":"node_1745929628452","node_type":"Questioner","node_name":"提问器","is_finished":true}} data:{"event":"end"} 结束节点返回: data:{"event":"workflow_started","data":{"start_time":1745929897770}} data:{"event":"message","data":{"text":"","index":0,"node_id":"node_end","node_type":"End","node_name":"结束"}} data:{"event":"message","data":{"text":"你好","index":1,"node_id":"node_end","node_type":"End","node_name":"结束"}} data:{"event":"message","data":{"text":"!","index":2,"node_id":"node_end","node_type":"End","node_name":"结束"}} data:{"event":"message","data":{"text":"有什么我可以帮助你的吗?","index":3,"node_id":"node_end","node_type":"End","node_name":"结束"}} data:{"event":"message","data":{"text":"","node_id":"node_end","node_type":"End","node_name":"结束","is_finished":true}} data:{"event":"workflow_finished","data":{"status":{"code":1,"desc":"succeeded"},"outputs":{"responseContent":"你好!有什么我可以帮助你的吗?"},"start_time":1745929897770,"end_time":1745929898600}} data:{"event":"end"}
  • 请求消息头 附加请求头字段,如指定的URI和HTTP方法所要求的字段。例如,定义消息体类型的请求头“Content-Type”,请求鉴权信息等。 以下公共消息头需要添加到请求中。 Content-Type:消息体的类型(格式),必选,默认取值为“application/json”。 X-Auth-Token:用户Token,可选,当使用Token方式认证时,必须填充该字段。用户Token请参考认证鉴权中的“Token认证”。 公有云API同时支持使用AK/SK认证,AK/SK认证是使用SDK对请求进行签名,签名过程会自动往请求中添加Authorization(签名认证信息)和X-Sdk-Date(请求发送的时间)请求头。AK/SK认证的详细说明请参见:AK/SK。 添加消息头后的请求如下所示: POST https://{endpoint}/v1/{project_id}/deployments/{deployment_id}/chat/completions Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINOD...
  • 请求消息体 请求消息体通常以结构化格式发出,与请求消息头中Content-Type对应,传递除请求消息头之外的内容。若请求消息体中参数支持中文,则中文字符必须为UTF-8编码。 每个接口的请求消息体内容不同,也并不是每个接口都需要有请求消息体(或者说消息体为空),GET、DELETE操作类型的接口就不需要消息体,消息体具体内容需要根据具体接口而定。 将消息体加入后的请求如下所示,详细参数解释可参考文档API章节。 POST https://{endpoint}/v1/{project_id}/deployments/{deployment_id}/chat/completions Content-Type: application/json X-Auth-Token: MIINRwYJKoZIhvcNAQcCoIINOD... { "messages": [ { "content": "介绍下长江,以及长江中典型的鱼类" } ], "temperature": 0.9, "max_tokens": 600 } 综上,您可以使用curl、Postman或直接编写代码等方式发送请求调用API。对于接口,您可以从响应消息部分看到返回参数及参数说明。
  • 请求URI 请求URI由如下部分组成: {URI-scheme} :// {Endpoint} / {resource-path} ? {query-string} 表1 请求URI 参数 说明 URI-scheme 传输请求的协议,当前所有API均采用HTTPS协议。 Endpoint 承载REST服务端点的服务器 域名 或IP。 resource-path 资源路径,即API访问路径。从具体API的URI模块获取。 query-string 查询参数,可选,查询参数前面需要带一个“?”,形式为“参数名=参数取值”。 获取请求URI的步骤详见请求URI,示例如下: https://{endpoint}/v1/{project_id}/deployments/{deployment_id}/chat/completions
  • 请求方法 HTTP请求方法,表示服务正在请求操作类型,包括: GET:请求服务器返回指定资源。 PUT:请求服务器更新指定资源。 POST:请求服务器新增资源或执行特殊操作。 DELETE:请求服务器删除指定资源,如删除对象等。 HEAD:请求服务器资源头部。 PATCH:请求服务器更新资源的部分内容。当资源不存在的时候,PATCH可能会去创建一个新的资源。 在接口的URI部分,请求方法为“POST”,例如: POST https://{endpoint}/v1/{project_id}/deployments/{deployment_id}/chat/completions
  • 请求示例 GET https://{endpotint}/v1/{project_id}/workspaces/{workspace_id}/data-management/lineages?limit=100&from_path=bucket/folder1/folder2 Requet Header: Content_Type: application/json X-Auth-Token: MIIVV... Request Params: limit: 1000 from_path: bucket/folder1/folder2
  • 响应示例 { "lineages": [ { "id": null, "from_id": null, "from_name": null, "from_catalog": null, "from_type": "OBS", "to_id": "1352299121133883392", "to_name": null, "to_catalog": "ORIGINAL", "to_type": "DATASET", "process_id": null, "process_name": null, "process_type": null, "train_job_name": null, "model_type": null, "train_type": null, "create_time": null, "from_path": "bucket/folder", "from_path_existed": null }, { "id": "1352299380551585793", "from_id": "1352299121133883392", "from_name": "时序-回归-test", "from_catalog": "ORIGINAL", "from_type": "DATASET", "to_id": "1352299379473649664", "to_name": "pub_时序回归", "to_catalog": "PUBLISH", "to_type": "DATASET", "process_id": "lt_97a2aa4cca744775aa5c7cfe3cb36121", "process_name": "pub_时序回归", "process_type": "PUBLISH", "train_job_name": null, "model_type": null, "train_type": null, "create_time": null, "from_path": null, "from_path_existed": null } ] }
  • 请求参数 表1 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 是 String 用户Token。 用于获取操作API的权限。获取Token接口响应消息头中X-Subject-Token的值即为Token。 Content-Type 是 String 发送的实体的MIME类型,参数值为“application/json”。 表2 请求Query参数 参数 是否必选 参数类型 描述 limit 是 integer 参数解释: 接口返回的血缘数量上限 约束限制: 无 取值范围: [1, 1000] 默认取值: 100 from_path 是 string 参数解释: 来源obs路径 约束限制: 最终租户桶下的OBS全路径 取值范围: 无 默认取值: 无
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全