云服务器内容精选
-
产品架构 Fabric提供高性能、高可靠、低时延、低成本的海量存储系统,与华为云的大数据服务组合使用,可大幅度降低成本,帮助企业简单快捷的管理大数据。 工作空间 工作空间是Fabric的基本单元,按团队切分工作空间,后续所有的操作都在工作空间中进行,隔离作业。 Cell 在故障处理上,Cell通过按照故障范围隔离,精准将故障限制在特定区域,避免扩散,保障系统稳定。 在安全方面,Cell实现账号隔离,保障账号独立运行和权限,防止干扰和泄露,且具备网络隔离,分隔网络区域,增强安全性,防止攻击和入侵。 EndPoint 按作业类型切分资源组,避免不同类型作业之间的相互影响,减少等待和冲突。同时合理分配资源,提高资源利用率。 数据 设计规格为99.95%可用性,满足业务连续性的要求。 图1 产品架构图
-
产品优势 Fabric服务具有以下优势: 数智一站式开发,提供统一的开发体验 一个工作空间,提供多种工作负载,包含SQL、基于Ray的数据工程、模型推理。 基于LakeFormation统一管理结构化、半结构化、非结构化数据,数智开发全流程,一份元数据和一份权限控制。 数据+AI共享一份数据,客户无需进行数据复制。 开箱即用,资源弹性,按需使用 预置开源主流三方大模型的推理服务,客户可直接调预置推理服务API下发文本对话、文生图等任务,无需购买资源,按需付费。 全托管Ray、客户自建模型端点支持min-max自动弹性伸缩,应对客户请求波峰压力,实现资源动态分配。 开源生态 基于昇腾生态提供开源Ray的能力,并在开源Ray的能力上提供Redis高可靠。 Ray dashboard提供可视化监控、故障排查、性能调优以及管理应用运行情况。 提供Ray CAP,客户可自定义Ray镜像。
-
URI POST https://localhost.com/v1/workspaces/{workspace_id}/services/instances/{instance_id}/invocations 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:Workspace的ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 instance_id 是 String 实例的Id。获取方法,请参见获取推理实例ID。
-
响应参数 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 401 表6 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 404 表7 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 408 表8 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 500 表9 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述
-
请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 参数解释:租户token。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 表3 请求Body参数 参数 是否必选 参数类型 描述 messages 否 Array of ChatMessage objects 消息 max_tokens 否 Integer 要在聊天完成中生成的最大token数。 输入token和生成token的总长度受模型的上下文长度限制。 temperature 否 Double Temperature是用于调整随机程度的数字。介于0和2之间。较高的值(如0.8)将使输出更随机,而较低的值(如0.2)将使输出更集中和确定性。 top_p 否 Double 核心采样,用于控制AI模型根据累积概率考虑的标记范围。 stream 否 Boolean 是否支持流式返回。如果支持,则消息按行返回(交互式效果)。如果不支持,则消息一次性全部返回。 frequency_penalty 否 Double 参数解释:频率惩罚,控制文本中词汇的重复度,避免生成文本中某些词汇或短语出现过于频繁。正值会根据它们在文本中的现有频率惩罚新令牌,从而降低模型逐字重复同一行的可能性。 约束限制:不涉及 取值范围:[-2.0,2.0]。 默认取值:不涉及。 presence_penalty 否 Double 参数解释:存在惩罚,控制文本中话题的重复度,避免在对话或文本中反复讨论相同的主题或观点。正值会根据到目前为止它们是否出现在文本中来惩罚新令牌,从而增加模型谈论新主题的可能性。 约束限制:不涉及 取值范围:[-2.0,2.0]。 默认取值:不涉及。 n 否 Integer 要为每个输入消息生成多少个聊天完成选项。请注意,您将根据所有选项中生成的token数收取费用。将n保持为1,以最小化成本。 表4 ChatMessage 参数 是否必选 参数类型 描述 role 是 String 角色 content 是 String 消息的内容
-
URI GET https://localhost.com/v1/workspaces/{workspace_id}/services/instances 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:Workspace的ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 表2 Query参数 参数 是否必选 参数类型 描述 id 否 String 通过service Instance id检索,32~36位的英文、数字、中划线(-)组合。 name 否 String 通过名字搜索Service Instance,支持模糊查询。 limit 否 Integer 指定每一页返回的最大条目数,取值范围[1,100],默认为10。 offset 否 Integer 偏移量,表示从此偏移量开始查询, offset大于等于0,默认为0。 endpoint_id 否 String 通过ID检索Endpoint的参数。 source_id 否 String Service ID或者Model ID。 version_id 否 String Service version ID或者Model version ID。 type 否 String Service的类型,可选值: PGSQL_SERVICE:已废弃 LLM_MODEL:大语言模型 visibility 否 String 可见性检索的参数,可选值为: PRIVATE: 私有,用户自己创建的; PUBLIC:公共,查询所有公共的,包括其他用户创建的; 默认为空,不填表示不限制,则查出当前用户下的,包括PRIVATE和PUBLIC,不包括其他用户创建的。 sort_by 否 String 根据字段排序,可选值: CREATE_TIME:创建时间。 order_by 否 String 排序方式,可选值: ASC:正序排序 DESC: 倒序排序。
-
响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 total Integer 符合条件的service Istance总数。 service_instances Array of ServiceInstanceBriefInfo objects 符合条件的service Instance列表。 表5 ServiceInstanceBriefInfo 参数 参数类型 描述 visibility String 可见性: PRIVATE:私有 PUBLIC:公共 默认为PRIVATE source SourceRef object 来源信息,Service信息或者模型信息 id String 服务实例的ID。获取方法,请参见获取推理服务实例ID。 name String 一个Service Instance的名称,只能包含中文、字母、数字、下划线、中划线、点、空格 description Description object 描述信息 endpoint_id EndpointId object endpoint空间ID status String 运行状态: PENDING:待处理 CREATING:创建中 RUNNING:运行中 UPDATING:更新中 SUCCEEDED:成功 FAILED:失败 STOPPING:停止中 STOPPED:已停止 DELETING:删除中 DELETED:已删除 INACTIVE:待激活 TRIAL_ENDED:已结束 create_time String 创建时间 update_time String 更新时间 duration Long 运行时长 create_user User object 租户信息 type ServiceType object Service的类型,可选值: PGSQL_SERVICE:已废弃 LLM_MODEL:大语言模型 error_code String 错误码 error_msg String 错误描述 solution String 解决方案 content_moderation_switch String 参数解释:模型 内容审核 开关。 约束限制:不涉及。 取值范围: ON:开启内容审核; OFF:关闭内容审核。 默认取值:不涉及。 表6 SourceRef 参数 参数类型 描述 id String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 version_id String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 表7 Description 参数 参数类型 描述 - String 描述信息 表8 EndpointId 参数 参数类型 描述 - String endpoint空间ID 表9 User 参数 参数类型 描述 domain_name String 账户名称 user_name String 用户名称 表10 ServiceType 参数 参数类型 描述 - String Service的类型,可选值: PGSQL_SERVICE:已废弃 LLM_MODEL:大语言模型 状态码: 400 表11 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 401 表12 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 404 表13 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 408 表14 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 500 表15 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述
-
响应参数 状态码: 202 表9 响应Body参数 参数 参数类型 描述 id InstanceId object 实例ID。获取方法,请参见获取推理实例ID。 表10 InstanceId 参数 参数类型 描述 - String 实例ID。获取方法,请参见获取推理实例ID。 状态码: 400 表11 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 401 表12 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 404 表13 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 408 表14 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述 状态码: 500 表15 响应Body参数 参数 参数类型 描述 error_code String 错误码 error_msg String 错误描述 solution_msg String 解决方案描述
-
请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 参数解释:租户token。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 表3 请求Body参数 参数 是否必选 参数类型 描述 source 否 SourceRef object 来源信息,Service信息或者模型信息 name 否 String 一个Service Instance的名称,只能包含中文、字母、数字、下划线、中划线、点、空格 description 否 Description object 描述信息 config 否 UpdateServiceInstanceConfig object 更新Service instance时输入的配置 表4 SourceRef 参数 是否必选 参数类型 描述 id 是 String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 version_id 否 String 一种资源ID,32~36位的英文、数字、中划线(-)组合。 表5 Description 参数 是否必选 参数类型 描述 - 否 String 描述信息 表6 UpdateServiceInstanceConfig 参数 是否必选 参数类型 描述 model_instance_config 否 UpdateModelServiceInstanceConfig object 更新模型服务实例的配置 表7 UpdateModelServiceInstanceConfig 参数 是否必选 参数类型 描述 resource 是 BaseDemand object 资源需求量配置 表8 BaseDemand 参数 是否必选 参数类型 描述 min 是 Integer 最小数 max 是 Integer 最大数,最小值为1,最大值为1000。
-
URI PUT https://localhost.com/v1/workspaces/{workspace_id}/services/instances/{instance_id} 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:Workspace的ID。 约束限制:不涉及。 取值范围:不涉及。 默认取值:不涉及。 instance_id 是 String 实例的Id。获取方法,请参见获取推理实例ID。
-
URI POST https://localhost.com/v1/workspaces/{workspace_id}/endpoints/{endpoint_id}/subscribe 表1 路径参数 参数 是否必选 参数类型 描述 workspace_id 是 String 参数解释:工作空间ID。 约束限制:不涉及。 取值范围:获取方法,请参见获取工作空间ID。 默认取值:不涉及。 endpoint_id 是 String 端点ID。获取方法,请参见获取端点ID。
-
响应参数 状态码: 200 表3 响应Body参数 参数 参数类型 描述 - AnyType OK 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表7 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表8 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。
-
响应参数 状态码: 200 表2 响应Body参数 参数 参数类型 描述 agreements Array of TenantAgreement objects 租户协议列表。 表3 TenantAgreement 参数 参数类型 描述 agreement_name String 参数解释:协议名称。 约束限制:只能包含字母、数字、下划线和中划线,且长度为1-64个字符。 取值范围:不涉及。 默认取值:不涉及。 agreement_version String 参数解释:协议版本号。 约束限制:只能包含字母和数字,且长度为1-32个字符。 取值范围:不涉及。 默认取值:不涉及。 状态码: 400 表4 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表7 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表8 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。
-
响应参数 状态码: 400 表1 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表2 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表3 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表4 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 503 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。
-
响应参数 状态码: 200 表4 响应Body参数 参数 参数类型 描述 - AnyType OK 状态码: 400 表5 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 401 表6 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 404 表7 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 408 表8 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 状态码: 500 表9 响应Body参数 参数 参数类型 描述 error_code String 参数解释:错误码。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 error_msg String 参数解释:错误描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。 solution_msg String 参数解释:解决方案描述。 约束限制:该值不可修改。 取值范围:不涉及。 默认取值:不涉及。
更多精彩内容
CDN加速
GaussDB
文字转换成语音
免费的服务器
如何创建网站
域名网站购买
私有云桌面
云主机哪个好
域名怎么备案
手机云电脑
SSL证书申请
云点播服务器
免费OCR是什么
电脑云桌面
域名备案怎么弄
语音转文字
文字图片识别
云桌面是什么
网址安全检测
网站建设搭建
国外CDN加速
SSL免费证书申请
短信批量发送
图片OCR识别
云数据库MySQL
个人域名购买
录音转文字
扫描图片识别文字
OCR图片识别
行驶证识别
虚拟电话号码
电话呼叫中心软件
怎么制作一个网站
Email注册网站
华为VNC
图像文字识别
企业网站制作
个人网站搭建
华为云计算
免费租用云托管
云桌面云服务器
ocr文字识别免费版
HTTPS证书申请
图片文字识别转换
国外域名注册商
使用免费虚拟主机
云电脑主机多少钱
鲲鹏云手机
短信验证码平台
OCR图片文字识别
SSL证书是什么
申请企业邮箱步骤
免费的企业用邮箱
云免流搭建教程
域名价格