检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问答机器人ID CBS控制台的“智能问题机器人”页面中,问题机器人列表中“问题机器人名称/ID”列的ID值。界面详情请参见图3。 委托站点 从下拉框中选择用户购买CBS服务的问答机器人所在Region。 委托 需要授予MetaStudio服务CBS服务的访问权限。 首次委托的站点,需要开启委托开关。详细操作如下所示:
(可选)提升问答交互次数 科大讯飞免费赠送500次/天的问答交互次数,如需提升问答交互次数,请参考本节操作,订购套餐包。 操作步骤 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。
智能机器人可以根据您的口味和需求,自动烹饪美食。 智能机器人可以通过识别您所使用的食材,提供有关这些食材的营养信息和食谱建议。 它们还能根据您想要的口味和菜谱,自动添加所需的配料和调味品。 他们还可以根据您的个人偏好和历史记录,推荐适合您的菜肴和食谱。 智慧厨房的出现不仅提高了烹饪的效率和质量,还提供了一个新的健康饮食的理念。
预置模特使用限制 MetaStudio控制台预置模特的有效使用期为3年,在2027年的年中前用户可以放心使用。具体下线时间请关注MetaStudio服务,会提前3个月在现网开放下线公告。 父主题: 使用限制
SDK概述 数字人智能交互SDK是基于数字内容生产线服务提供的能力进行封装,以简化用户的开发工作。用户直接调用智能交互Web SDK提供的接口,即可实现使用数字人智能交互业务能力的目的。 智能交互提供了如下主流平台SDK供开发者使用。 表1 客户端SDK 客户端 集成SDK 接口参考
udio资源。 根据企业用户的职能,设置不同的访问权限,以达到用户之间的权限隔离。 将MetaStudio资源委托给更专业、高效的其他华为云账号或者云服务,这些账号或者云服务可以根据权限进行代运维。 如果华为云账号已经能满足您的要求,不需要创建独立的IAM用户,您可以跳过本章节,
MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。 分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。 资产管理费用:即服务资产管理的费用。
仅支持数字人平台配置或内置ASR(语音转文本)能力的方案。不支持WebSocket接口驱动数字人方案,即文本驱动方案。 在调用create接口之前,必须要有用户点击集成WebSDK的页面的行为。 浏览器通过有上述点击的行为,才能获取采集声音的权限。否则无法采集声音,无法正常使用语音唤醒能力。
PREPROCESSING:MetaStudio直播服务启动加载形象模型的状态。 PLAY_READY:形象模型加载完成的状态。此时数字人处于静默状态,等待开始播放剧本的指令。 PROCESSING:数字人的工作状态。数字人会根据直播任务中预置的文本或音频进行直播。 PLAY_PAUSE:数字人直播
dio控制台查看已分配的资源列表,正常使用MetaStudio服务并消耗相应的资源。 前提条件 SP用户已关联当前租户,操作请参考关联租户。 SP用户已分配资源给当前租户,操作请参考分配资源。 操作步骤 租户登录华为云控制台,单击界面左上角的图标,在弹出的服务列表界面中,搜索并单击“数字内容生产线
单独上传语料包:单独录制音频文件,需要单击下方的“点击上传音频文件”,上传音频。 音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。
文本驱动 文本内容的操作说明如表1所示。 表1 操作说明 操作 说明 插入停顿 将鼠标放在需要停顿的文字右侧,单击“插入停顿”。在弹出的提示框中,选择“换气”或者停顿的时间,也支持自定义停顿时长。 连读 选中需要连读的文本内容,单击“连读”。 多音字 选中文本中的多音字,单击“多音
访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。 父主题:
访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。 父主题:
speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值
MetaStudio服务对租户资产内容的风险有一定连带责任。如果服务接收到资产内容投诉,按照国家相关部门要求,会冻结违规违规资产。情节严重的,还会冻结租户的全部资源。 被冻结的资产不能用作内容生成的素材。租户可以删除被冻结的资产或者申请解冻资产。 用户申请解冻资产 用户可以通过申诉的方式,申请解冻资产,解冻后资产会恢复至解冻前的状态。
接口参考 主入口(HwICSUiSdk) 事件通知(EventMap) 错误码(ICSError) 授权浏览器麦克风的访问权限 Web语音唤醒 父主题: Web SDK
角色名称 输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄。支持MP4、MOV格式的视频。 背景替换 选择“
录制? 大部分相机内置麦克风的录制效果也能满足我们对声音的要求。我们对声音的清晰度可以有适度的妥协,但请务必保证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。
提交工单申请开通,并提供需要使用的第三方应用名称。 单击“添加意图及话术”,新增“意图1”配置框。 需配置下述参数: 意图1:从下拉框中选择意图,这里展示的意图是服务预置的,不支持从当前界面增加新的意图名称。用户也可以在提交工单时,同步补充需要的意图列表,让服务进行预置。仅支持选