检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ModelArts错误码。 error_msg String 具体错误信息。 请求示例 通过patch操作对服务进行更新。 PATCH https://{endpoint}/v1/{project_id}/services/{service_id} [ { "op" : "replace"
描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 GET https://{endpoint}/v2/{project_id}/pools/{pool_name}/workloads 响应示例 状态码: 400
Integer 可用节点数。 count Integer 节点数。 specification String 节点规格。 请求示例 GET https://{endpoint}/v1/{project_id}/clusters 响应示例 状态码: 200 服务部署规格列表。 { "total_count"
计费时期。 queries_limit Long 查询次数。 price Float 价格。 请求示例 给指定的工作流购买资源包 POST https://{endpoint}/v2/{project_id}/workflows{workflow_id}/service/packages
ModelArts错误码。 error_msg String 具体错误信息。 请求示例 解除指定的API对APP的授权。 DELETE https://{endpoint}/v1/{project_id}/services/{service_id}/app-auth-apis/{api_id}/app-auth-api
如下以查询训练作业状态为7,每页展示10条记录,指定到第1页,按照“job_name”排序并递增排列,查询作业名字中包含job的所有训练作业数据为例。 GET https://endpoint/v1/{project_id}/training-jobs?status=7&per_page=10&page=
如果无法访问公网,则可以配置代理,增加`--build-arg`参数指定代理地址,可访问公网。 docker build --build-arg "https_proxy=http://xxx.xxx.xxx.xxx" --build-arg "http_proxy=http://xxx.xxx
实际情况,使用generate_datasets.py脚本生成和业务数据分布接近的数据集。 公开数据集下载地址: ShareGPT: https://huggingface.co/datasets/anon8231489123/ShareGPT_Vicuna_unfiltered
描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 PUT https://{endpoint}/v1/{project_id}/app-auth/apps/{app_id}/app-secret {
String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 授权应用给指定的api POST https://{endpoint}/v1/{project_id}/services/{service_id}/app-auth-apis/{api_id}/app-auth-api
参数类型 描述 - String 状态码: 500 表8 响应Body参数 参数 参数类型 描述 - String 请求示例 GET https://{endpoint}/v1/{project_id}/workspaces?limit=2&offset=3&sort_by=na
描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 GET https://{endpoint}/v1/{project_id}/services/{service_id}/api-auths 响应示例 状态码:
oken。 如此一来,Eagle投机推理可以带来如下优势: 更小的训练成本得到小模型:相较于训练独立的LLM大模型,Eagle仅需训练一个自回归层。这使得其训练成本相较于训练一个独立的LLM模型要小得多。 为每个模型提供针对性的投机模型: Eagle的模型大小及结构,与基模型的某
step_title String 节点的Title。 status String 状态。 请求示例 查看Workflow工作流的待办事项。 GET https://{endpoint}/v2/{project_id}/workflows/todolist?workspace_id=0 响应示例
如以下查询training_job_id为5b60a667-1438-4eb5-9705-85b860e623dc的作业的所有trial的信息。 GET https://endpoint/v2/{project_id}/training-jobs/5b60a667-1438-4eb5-9705-85
String 数据集的版本名称,名称仅包含数字、字母、中划线和下划线,长度是0-32位。 请求示例 查询某个数据集的特征分析任务历史列表 GET https://{endpoint}/v2/{project_id}/processor-tasks?offset=0&limit=10&sort
实际情况,使用generate_datasets.py脚本生成和业务数据分布接近的数据集。 公开数据集下载地址: ShareGPT: https://huggingface.co/datasets/anon8231489123/ShareGPT_Vicuna_unfiltered
接口启动2种方式。详细启动服务与请求方式参考:https://docs.vllm.ai/en/latest/getting_started/quickstart.html。 以下服务启动介绍的是在线推理方式,离线推理请参见https://docs.vllm.ai/en/lates
描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 GET https://{endpoint}/v1/{project_id}/app-auth/apps 响应示例 状态码: 200 OK { "apps"
描述 error_code String ModelArts错误码。 error_msg String 具体错误信息。 请求示例 GET https://endpoint/v2/{project_id}/training-jobs/{training_job_id}/events?o