检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
【下线公告】华为云ModelArts MindStudio/ML Studio/ModelBox镜像下线公告 华为云ModelArts服务MindStudio,ML Studio,ModelBox镜像将在2024年6月30日00:00(北京时间)正式退市。 下线范围 下线Region:华为云全部Region
DeepSeek API和Cherry Studio快速构建个人AI智能助手 本文介绍如何使用Cherry Studio调用部署在ModelArts Studio上的DeepSeek模型,构建个人AI助手。 背景介绍 Cherry Studio是一款开源的多模型桌面客户端,支持Wi
使用华为账号登录华为云,搜索ModelArts Studio,单击“ModelArts Studio控制台”。 在ModelArts Studio控制台弹出的免责声明对话框,勾选“我已阅读并同意《ModelArts Studio免责声明》”,然后单击“确定”。 在弹出的“服务授
使用ModelArts Studio的Qwen2-7B模型框架实现对话问答 场景描述 本案例用于指导用户使用ModelArts Studio大模型即服务平台(下面简称为MaaS)的Qwen2-7B模型框架,创建并部署一个模型服务,实现对话问答。通过学习本案例,您可以快速了解如何在
MindStudio-Insight性能可视化工具使用指导 对于高阶的调优用户,可以使用可视化工具MindStudio Insight查看profiling数据详情并分析可优化点,其提供了丰富的调优分析手段,可视化呈现真实软硬件运行数据,多维度分析性能瓶颈点,支持百卡、千卡及以上
免费体验MaaS预置服务 ModelArts Studio大模型即服务平台给新用户分配了每个模型200万Tokens的免费调用额度,无需部署即可一键体验通义千问、ChatGLM、DeepSeek等预置模型服务。您也可以直接开通服务,体验和调用将优先消耗免费Token额度,免费额度用完后按实际用量计费。
在ModelArts Studio大模型即服务平台使用基础模型创建个人专属模型。 场景描述 MaaS提供了基于昇腾云算力适配的开源大模型,您可以使用这些基础模型,结合自定义的模型权重文件,创建个人专属的模型。 创建成功的模型可以在ModelArts Studio大模型即服务平台进行调优、压缩、推理等操作。
在MaaS体验模型服务 在ModelArts Studio大模型即服务平台,运行中的模型服务可以在“模型体验”页面在线体验模型服务的推理效果。 前提条件 使用预置服务:在“模型推理”页面的“预置服务”页签,已领取免费Token额度且额度未使用完毕,或者已开通付费服务。具体操作,请参见免费体验MaaS预置服务。
在调用MaaS部署的模型服务时,需要填写API Key用于接口的鉴权认证。本文介绍如何创建或删除API Key。 创建API Key 登录ModelArts Studio控制台,在顶部导航栏选择目标区域。 在左侧导航栏,单击“API Key管理”。 在“API Key管理”页面,单击“创建API Key
量预警请参见套餐包。 购买操作如下: 登录ModelArts管理控制台。 在左侧导航栏中,选择“ModelArts Studio”进入ModelArts Studio大模型即服务平台。 在ModelArts Studio首页单击“购买套餐包”,进入购买页面。 在“购买”页面,选择
Key用于接口的鉴权认证。 登录ModelArts Studio控制台,在顶部导航栏选择目标区域。 在左侧导航栏,选择“API Key管理”。 在“API Key管理”页面,单击“创建API Key”,填写描述信息后,单击“确认”会返回“您的密钥”,请复制保存密钥,单击“关闭”后将无法再次查看密钥。
在模型广场查看模型 在模型广场页面,ModelArts Studio大模型即服务平台提供了丰富的开源大模型,在模型详情页可以查看模型的详细介绍,根据这些信息选择合适的模型进行训练、推理,接入到企业解决方案中。 访问模型广场 登录ModelArts Studio控制台,在顶部导航栏选择目标区域。 在左侧导航栏,单击“模型广场”。
管理我的服务 扩缩容模型服务实例数 修改模型服务QPS 升级模型服务
实践在ModelArts Studio基于Qwen2-7B模型实现新闻自动分类。 仅“华东二”、“西南-贵阳一”和“华北-乌兰察布一”区域支持使用ModelArts Studio大模型即服务平台(MaaS)。 应用场景 ModelArts Studio大模型即服务平台(MaaS)的应用场景:
使用MaaS部署模型服务 在ModelArts Studio大模型即服务平台可以将模型部署为服务,便于在“模型体验”或其他业务环境中可以调用。 约束限制 部署模型服务时,ModelArts Studio大模型即服务平台预置了推理的最大输入输出长度。模型Qwen-14B默认是204
登录ModelArts Studio控制台,在顶部导航栏选择目标区域。 在左侧导航栏,选择“模型推理”。 在“模型推理”页面,单击“我的服务”页签。 在目标模型服务右侧,单击操作列的“更多 > 服务升级”。 在“服务升级”对话框,选择需要升级的版本,然后单击“确认”。 父主题: 管理我的服务
DeepSeek API和Cherry Studio快速构建个人AI智能助手 本文介绍如何使用Cherry Studio调用部署在ModelArts Studio上的DeepSeek模型,构建个人AI助手。 背景介绍 Cherry Studio是一款开源的多模型桌面客户端,支持Wi
使用MaaS压缩模型 在ModelArts Studio大模型即服务平台完成模型创建后,可以对模型进行压缩,获得更合适的模型。 场景描述 模型压缩是指将高比特浮点数映射到低比特量化空间,从而减少显存占用的资源,降低推理服务时延,提高推理服务吞吐量,并同时减少模型的精度损失。模型压
使用MaaS调优模型 在ModelArts Studio大模型即服务平台完成模型创建后,可以对模型进行调优,获得更合适的模型。 场景描述 从“我的模型”中选择一个模型进行调优,当模型完成调优作业后会产生一个新的模型,呈现在“我的模型”列表中。 约束限制 表1列举了支持模型调优的模
重要。 ModelArts Studio大模型即服务平台支持手动修改模型服务的实例流量限制QPS,该操作不会影响部署服务的正常运行。 约束限制 仅当模型服务处于这几个状态下才能修改QPS:运行中、异常。 修改QPS 登录ModelArts Studio控制台,在顶部导航栏选择目标区域。