检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
IAM权限管理 创建用户并授权使用MetaStudio 子账户隔离配置
示: 营销:营销宣传风格文案 新闻:新闻播报风格文案 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用
单击“点击上传国徽面”,从本地选择身份证国徽面照片上传。 形象声音授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、jpeg、png格式的图片。 单击“上传授权书”,从本地选择pdf、jpg、jpeg或png格式的授权书上传。
00ms。 单击“确定”,创建应用,创建效果如图2所示。 可单击“修改”,修改配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。
操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。 数据上传完成后,界面提示“制作任务提交成功!”,如图2所示。
操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。 单击“提交制作”。 数
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需
产品优势 控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式
签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面 表1 界面说明 序号 区域名称 说明 1 视频素材区域 设置视频的场景,包括如下内容。视频素材的操作详情,请参考视频制作公共配置。 模板:系统预置视频模板列表。支持基于系统预置模板,一键快速制作数字人视频。 注意:只有管理员可以自定义新增模板。
操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。 图1 照片数字人制作页面 表1 界面操作说明 区域 参数 说明 01 请上传您的照片 人像照片 单击“查看
单击界面右上方的“添加凭证”,弹出“购买序列号”对话框,如图11所示。 参数配置说明,如表1所示。 图11 购买序列号 表1 参数说明 参数 说明 主体 购买出门问问声音套餐中购买套餐包的归属主体,从下拉框中选择“出门问问”。 访问配置accessKey 出门问问需要配置为资源详情界面的“用户账号”,如获取第三方声音使用凭证-步骤2所示。
自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表7 PlatformAuthorizationInfo 参数 参数类型 描述 authorize_state String 授权状态。 AUTHORIZED: 已授权 UNAUTHORIZED: 未授权 authorized_time
自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表5 PlatformAuthorizationInfo 参数 参数类型 描述 authorize_state String 授权状态。 AUTHORIZED: 已授权 UNAUTHORIZED: 未授权 authorized_time
需要在应用中,依次完成下述配置 开启讯飞闲聊功能,即开启“兜底设置”及其下的“讯飞闲聊”。 配置热词。 配置可用于闲聊的预置技能。 新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的“模拟测试”区域输入用
智能交互 智能交互支持富媒体吗? 如何自定义域名方式访问智能交互页面? 智能交互业务媒体流如何应对防火墙限制? 智能交互界面报错“MSS.20010135”如何处理? 如何实时切换智能交互的语言和声音?
服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板 选择一款名片模板,单击“开始制作”,进入名片制作页面,如图2所示。 界面左侧为名片配置内容,右侧为名片预览效果图。参数配置说明如表1所示。 图2 制作名片 表1 参数说明 区域 参数 说明 请填写数字人信息 上传头像 需提前准备一张正面清晰且
This tts access config is not exist,please check 请检查购买的第三方音色的访问配置(ak、sk)是否配置。 MSS.20051001 This text contains a word that is too long,please
服务器无法根据客户端请求的内容特性完成请求。 407 Proxy Authentication Required 请求要求代理的身份认证,与401类似,但请求者应当使用代理进行授权。 408 Request Timeout 服务器等候请求时发生超时。 客户端可以随时再次提交该请求而无需进行任何更改。 409 Conflict
五、最小化使用功能要求 我们的SDK针对扩展功能和可选的个人信息的处理提供了配置能力,您可以基于业务诉求选择开启或关闭相关功能。 1. 如何开启或关闭扩展功能 您可以通过setConfig或者create接口配置开启或关闭字幕、语音交互等扩展功能,以为您提供字幕、语音交互等服务。 2
在新闻播报、课件制作等场景模拟真人配音,提升数字内容生产效率。 算法运行机制 训练阶段: 用户上传一段真人语音音频及授权书作为输入。 音频经过人工安全审核和授权认证后,由训练人员标注用于训练的音频数据,使用深度学习算法训练生成数字人声音模型。 推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。