云服务器内容精选

  • 产品架构 Fabric提供高性能、高可靠、低时延、低成本的海量存储系统,与华为云的大数据服务组合使用,可大幅度降低成本,帮助企业简单快捷的管理大数据。 工作空间 工作空间是Fabric的基本单元,按团队切分工作空间,后续所有的操作都在工作空间中进行,隔离作业。 Cell 在故障处理上,Cell通过按照故障范围隔离,精准将故障限制在特定区域,避免扩散,保障系统稳定。 在安全方面,Cell实现账号隔离,保障账号独立运行和权限,防止干扰和泄露,且具备网络隔离,分隔网络区域,增强安全性,防止攻击和入侵。 EndPoint 按作业类型切分资源组,避免不同类型作业之间的相互影响,减少等待和冲突。同时合理分配资源,提高资源利用率。 数据 设计规格为99.95%可用性,满足业务连续性的要求。 图1 产品架构图
  • 产品优势 Fabric服务具有以下优势: 数智一站式开发,提供统一的开发体验 一个工作空间,提供多种工作负载,包含SQL、基于Ray的数据工程、模型推理。 基于LakeFormation统一管理结构化、半结构化、非结构化数据,数智开发全流程,一份元数据和一份权限控制。 数据+AI共享一份数据,客户无需进行数据复制。 开箱即用,资源弹性,按需使用 预置开源主流三方大模型的推理服务,客户可直接调预置推理服务API下发文本对话、文生图等任务,无需购买资源,按需付费。 全托管Ray、客户自建模型端点支持min-max自动弹性伸缩,应对客户请求波峰压力,实现资源动态分配。 开源生态 基于昇腾生态提供开源Ray的能力,并在开源Ray的能力上提供Redis高可靠。 Ray dashboard提供可视化监控、故障排查、性能调优以及管理应用运行情况。 提供Ray CAP,客户可自定义Ray镜像。
  • URI POST https://localhost.com/v1/workspaces/{workspace_id}/services/instances/{instance_id}/invocations 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:Workspace的ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 instance_id 是 String 实例的Id。获取方法,请参见获取推理实例ID。
  • 响应参数 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 401 表6 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 404 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 408 表8 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 500 表9 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 参数解释:租户token。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 表3 请求Body参数 参数 是否必选 参数类型 描述 messages 否 Array of ChatMessage objects 消息 max_tokens 否 Integer 要在聊天完成中生成的最大token数。 输入token和生成token的总长度受模型的上下文长度限制。 temperature 否 Double Temperature是用于调整随机程度的数字。介于0和2之间。较高的值(如0.8)将使输出更随机,而较低的值(如0.2)将使输出更集中和确定性。 top_p 否 Double 核心采样,用于控制AI模型根据累积概率考虑的标记范围。 stream 否 Boolean 是否支持流式返回。如果支持,则消息按行返回(交互式效果)。如果不支持,则消息一次性全部返回。 frequency_penalty 否 Double 参数解释:频率惩罚,控制文本中词汇的重复度,避免生成文本中某些词汇或短语出现过于频繁。正值会根据它们在文本中的现有频率惩罚新令牌,从而降低模型逐字重复同一行的可能性。 约束限制:不涉及 取值范围:[-2.0,2.0]。 默认取值:不涉及。 presence_penalty 否 Double 参数解释:存在惩罚,控制文本中话题的重复度,避免在对话或文本中反复讨论相同的主题或观点。正值会根据到目前为止它们是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 约束限制:不涉及 取值范围:[-2.0,2.0]。 默认取值:不涉及。 n 否 Integer 要为每个输入消息生成多少个聊天完成选项。请注意,您将根据所有选项中生成的token数收取费用。将n保持为1,以最小化成本。 表4 ChatMessage 参数 是否必选 参数类型 描述 role 是 String 角色 content 是 String 消息的内容
  • URI GET https://localhost.com/v1/workspaces/{workspace_id}/services/instances 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:Workspace的ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 表2 Query参数 参数 是否必选 参数类型 描述 id 否 String 通过service Instance id检索,32~36位的英文、数字、中划线(-)组合。 name 否 String 通过名字搜索Service Instance,支持模糊查询。 limit 否 Integer 指定每一页返回的最大条目数,取值范围[1,100],默认为10。 offset 否 Integer 偏移量,表示从此偏移量开始查询, offset大于等于0,默认为0。 endpoint_id 否 String 通过ID检索Endpoint的参数。 source_id 否 String Service ID或者Model ID。 version_id 否 String Service version ID或者Model version ID。 type 否 String Service的类型,可选值: PGSQL_SERVICE:已废弃 LLM_MODEL:大语言模型 visibility 否 String 可见性检索的参数,可选值为: PRIVATE: 私有,用户自己创建的; PUBLIC:公共,查询所有公共的,包括其他用户创建的; 默认为空,不填表示不限制,则查出当前用户下的,包括PRIVATE和PUBLIC,不包括其他用户创建的。 sort_by 否 String 根据字段排序,可选值: CREATE_TIME:创建时间。 order_by 否 String 排序方式,可选值: ASC:正序排序 DESC: 倒序排序。
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 total Integer 符合条件的service Istance总数。 service_instances Array of ServiceInstanceBriefInfo objects 符合条件的service Instance列表。 表5 ServiceInstanceBriefInfo 参数 参数类型 描述 visibility String 可见性: PRIVATE:私有 PUBLIC:公共 默认为PRIVATE source SourceRef object 来源信息,Service信息或者模型信息 id String 服务实例的ID。获取方法,请参见获取推理服务实例ID。 name String 一个Service Instance的名称,只能包含中文、字母、数字、下划线、中划线、点、空格 description Description object 描述信息 endpoint_id EndpointId object endpoint空间ID status String 运行状态: PENDING:待处理 CREATING:创建中 RUNNING:运行中 UPDATING:更新中 SUCCEEDED:成功 FAILED:失败 STOPPING:停止中 STOPPED:已停止 DELETING:删除中 DELETED:已删除 INACTIVE:待激活 TRIAL_ENDED:已结束 create_time String 创建时间 update_time String 更新时间 duration Long 运行时长 create_user User object 租户信息 type ServiceType object Service的类型,可选值: PGSQL_SERVICE:已废弃 LLM_MODEL:大语言模型 error_code String 错误码 error_msg String 错误描述 solution String 解决方案 content_moderation_switch String 参数解释:模型 内容审核 开关。 约束限制:不涉及。 取值范围: ON:开启内容审核; OFF:关闭内容审核。 默认取值:不涉及。 表6 SourceRef 参数 参数类型 描述 id String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 version_id String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 表7 Description 参数 参数类型 描述 - String 描述信息 表8 EndpointId 参数 参数类型 描述 - String endpoint空间ID 表9 User 参数 参数类型 描述 domain_name String 账户名称 user_name String 用户名称 表10 ServiceType 参数 参数类型 描述 - String Service的类型,可选值: PGSQL_SERVICE:已废弃 LLM_MODEL:大语言模型 状态码: 400 表11 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 401 表12 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 404 表13 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 408 表14 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 500 表15 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述
  • 响应参数 状态码: 202 表9 响应Body参数 参数 参数类型 描述 id InstanceId object 实例ID。获取方法,请参见获取推理实例ID。 表10 InstanceId 参数 参数类型 描述 - String 实例ID。获取方法,请参见获取推理实例ID。 状态码: 400 表11 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 401 表12 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 404 表13 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 408 表14 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 500 表15 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述
  • 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 参数解释:租户token。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 表3 请求Body参数 参数 是否必选 参数类型 描述 source 否 SourceRef object 来源信息,Service信息或者模型信息 name 否 String 一个Service Instance的名称,只能包含中文、字母、数字、下划线、中划线、点、空格 description 否 Description object 描述信息 config 否 UpdateServiceInstanceConfig object 更新Service instance时输入的配置 表4 SourceRef 参数 是否必选 参数类型 描述 id 是 String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 version_id 否 String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 表5 Description 参数 是否必选 参数类型 描述 - 否 String 描述信息 表6 UpdateServiceInstanceConfig 参数 是否必选 参数类型 描述 model_instance_config 否 UpdateModelServiceInstanceConfig object 更新模型服务实例的配置 表7 UpdateModelServiceInstanceConfig 参数 是否必选 参数类型 描述 resource 是 BaseDemand object 资源需求量配置 表8 BaseDemand 参数 是否必选 参数类型 描述 min 是 Integer 最小数 max 是 Integer 最大数,最小值为1,最大值为1000。
  • URI PUT https://localhost.com/v1/workspaces/{workspace_id}/services/instances/{instance_id} 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:Workspace的ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 instance_id 是 String 实例的Id。获取方法,请参见获取推理实例ID。
  • URI POST https://localhost.com/v1/workspaces/{workspace_id}/endpoints/{endpoint_id}/subscribe 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:工作空间ID。 约束限制:不涉及。 取值范围:获取方法,请参见获取工作空间ID。 默认取值:不涉及。 endpoint_id 是 String 端点ID。获取方法,请参见获取端点ID。
  • 响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 - AnyType OK 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表7 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表8 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。
  • 响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 agreements Array of TenantAgreement objects 租户协议列表。 表3 TenantAgreement 参数 参数类型 描述 agreement_name String 参数解释:协议名称。 约束限制:只能包含字母、数字、下划线和中划线,且长度为1-64个字符。 取值范围:不涉及。 默认取值:不涉及。 agreement_version String 参数解释:协议版本号。 约束限制:只能包含字母和数字,且长度为1-32个字符。 取值范围:不涉及。 默认取值:不涉及。 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表7 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表8 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。
  • 响应参数 状态码: 400 表1 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表2 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表3 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表4 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 503 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。
  • 响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 - AnyType OK 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表7 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表8 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表9 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。