检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
TMS管理 查询项目标签 查询资源标签 查询资源实例列表 查询资源实例数量 批量打资源标签 批量删除资源标签 父主题: API
mc2融合算子报错 Yi-34B、Qwen1.5系列、GLM4-9B模型执行lora微调策略任务时产生mc2融合算子错误。 图1 mc2融合算子错误 解决方法 修改代码文件:AscendFactory/scripts_modellink/{model_name}/3_training
mc2融合算子报错 Yi-34B、Qwen1.5系列、GLM4-9B模型执行lora微调策略任务时产生mc2融合算子错误。 图1 mc2融合算子错误 解决方法 修改代码文件:AscendFactory/scripts_modellink/{model_name}/3_training
计费样例 样例1:Fabric服务RAY资源-计费说明 RAY资源的“按需计费”模式都是秒级计费,Fabric产品价格详情中标出了每小时价格,您可以将每小时价格除以3600,即得到每秒价格。 示例,某一RAY资源按需实例,fabric.ray.dpu.d1x规格价格为0.2元/小时,购买数量为5的按需实例根据规格数量
错误码 调用接口出错后,将不会返回结果数据。调用方可根据每个接口对应的错误码来定位错误原因。当调用出错时,HTTP请求返回一个4xx或5xx的HTTP状态码。返回的消息体中是具体的错误代码及错误信息。在调用方找不到错误原因时,可以联系华为云客服,并提供错误码,以便我们尽快帮您解决问题。
Fabric使用流程 Fabric平台提供了一个serverless化的从数据到模型部署的AI全流程开发体验,针对每个环节,其使用是相对独立自由的。本章节梳理了Fabric使用流程详解,您可以选择其中一种方式完成AI开发。 表1 使用流程说明 流程 说明 详细指导 创建工作空间
大模型推理场景 大模型推理场景介绍 用公共推理服务进行推理 创建我的推理服务进行推理 通过AOM查看全量指标
计费项 Fabric服务根据RAY、推理业务场景有不同的策略进行计费。详细的计费项及说明请参考表1。每个计费项的详细价格请参考产品价格详情。 表1 计费项信息 计费项 计费说明 RAY资源 此处根据您创建的RAY资源规格和数量按照使用时间进行计费,不同的数据处理单元或AI计算单元
删除消息通知 消息通知功能用于通知用户其作业的执行情况。当不需要时,可以通过删除操作删除通知。 前提条件 已有可正常使用的华为云账号。 已有至少一个正常可用的工作空间。 需要配置FABRIC_SMN_POLICY委托,具体操作参考配置Fabric云服务委托权限。 已有至少一个消息通知。
费用账单 账单上报周期 按需计费模式的资源按照固定周期上报使用量到计费系统进行结算。按需计费模式产品根据使用量类型的不同,分为按小时、按天、按月三种周期进行结算,具体扣费规则可以参考按需产品周期结算说明。 示例:按小时结算的云服务器在8:30删除资源,但是8:00~9:00期间产
mc2融合算子报错 Yi-34B、Qwen1.5系列、GLM4-9B模型执行lora微调策略任务时产生mc2融合算子错误。 图1 mc2融合算子错误 解决方法 修改代码文件:AscendFactory/scripts_modellink/{model_name}/3_training
mc2融合算子报错 Yi-34B、Qwen1.5系列、GLM4-9B模型执行lora微调策略任务时产生mc2融合算子错误。 图1 mc2融合算子错误 解决方法 修改代码文件:AscendFactory/scripts_modellink/{model_name}/3_training
返回结果 请求发送以后,您会收到响应,包含状态码、响应消息头和消息体。 状态码 状态码是一组从1xx到5xx的数字代码,状态码表示了请求响应的状态,完整的状态码列表请参见状态码。 对于管理员创建IAM用户接口,如果调用后返回状态码为“201”,则表示请求成功。 响应消息头 对应请
权限和授权项 权限及授权项说明 策略授权参考
获取模型ID 登录Fabric工作空间管理台。 选择已创建的工作空间,单击“进入工作空间”,选择“资源与资产->模型”。 单击想要查询的模型查看模型详情。 查询ID字段的值获取模型ID。 图1 获取模型ID 父主题: 附录
设置消息通知 消息通知功能用于通知用户其作业的执行情况。 前提条件 已有可正常使用的华为云账号。 已有至少一个正常可用的工作空间。 需要配置FABRIC_SMN_POLICY委托,具体操作参考配置Fabric云服务委托权限。 操作步骤 登录Fabric工作空间管理台。 选择已创建
认证鉴权 调用接口有如下两种认证方式,您可以选择其中一种进行认证鉴权。 AK/SK认证:通过AK(Access Key ID)/SK(Secret Access Key)加密调用请求。 Token认证:通过Token认证调用请求。 AK/SK认证 AK/SK签名认证方式仅支持消息
什么是区域和可用区 通常用区域和可用区来描述数据中心的位置,您可以在特定的区域、可用区创建资源。 区域(Region)指物理的数据中心。每个区域完全独立,这样可以实现最大程度的容错能力和稳定性。资源创建成功后不能更换区域。 可用区(AZ,Availability Zone)是同一
计费模式 Fabric服务提供包年包月、按需计费两种计费模式供您灵活选择。 包年包月:一种预付费模式,即先付费再使用,按照订单的购买周期进行结算。购买周期越长,享受的折扣越大。一般适用于计算资源需求量长期稳定的成熟业务。 按需:一种后付费模式,即先使用再付费,按照ModelArt
到期与续费 客户欠费后,可以查看欠费详情。为防止相关资源被停止或者释放,需要客户及时进行充值,账号将进入欠费状态,需要在约定时间内支付欠款,详细操作请参考欠费还款。 如果没有及时的进行续费或充值,将进入宽限期。如宽限期满仍未续费或充值,将进入保留期。在保留期内资源将停止服务。保留