检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
用户与数字人进行智能交互的页面,富媒体展示效果支持使用SDK提供的默认展示方式。 下述智能交互客户端SDK的两个方法的配置字段enableCaption,默认值均为False,即用户自定义富媒体的展示效果。如果需要使用SDK提供的默认展示效果,需修改参数enableCaption的值为true。
授权书 分身形象或声音定制的授权书,如中文授权书和英文授权书所示。 父主题: 附录
图2所示。 查看生成的分身数字人形象是否满足。用户可以在“定制任务详情”界面,执行下述操作。 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。 如果训练生成的数字人形象不满足需求,单击右下方的“驳回”,进入“问题填写”界面。
分身视频直播首页面的“商品管理”页签,支持新增商品。商品会自动展示在直播间的“商品”页签中,供直播间添加使用。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身视频直播”下方的“开始创建”,进入分身数字人直播首页面。 单击“商品管理”,进入如图1所示的页面。 图1 商品管理页面 单击“新建”,进入“创建商品”页面,如图2所示。
parameter invalid. 音频采集设备不支持设置的采集约束,采集失败。 90100019 capture failed, requested device not found. 未找到请求的设备,采集失败。建议通话开始前,引导用户检查通话所需的麦克风等设备是否就绪。 90100020 capture
数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 父主题: 数字人
number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。 speechRecognized通知的流式返回跟semanticRecognized是有差异的,详细见:speechRe
数字人支持添加动作吗? 需要数字人模型训练时使用的形象采集视频包含动作编排,才可以添加动作,详见动作编排定制采集指南。 目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。 添加动作时需要注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。
如何自定义域名方式访问智能交互页面? 用户与数字人进行智能交互的URL页面,默认为IP地址形式。如果用户希望通过域名访问,目前MetaStudio服务提供了A记录的域名,但是这些A记录域名不能在浏览器直接访问,需要用户自己申请备案一个域名,并通过CNAME方式解析到如下域名上。
etaStudio控制台,根据开通引导完成服务开通。 IAM权限管理 如果华为云账号无法满足用户的使用诉求,可参考创建用户并授权使用MetaStudio,创建IAM用户,进行精细化的权限管理。 推荐浏览器 推荐使用Chrome浏览器访问MetaStudio控制台。
贴图支持动态图片吗? 不支持。目前仅支持上传PNG、JPG、JPEG和BMP格式的图片文件,不支持GIF等动态图片格式。 父主题: 视频制作
进入当前智能交互对话项目链接的用户数大于该项目配置的并发数。 解决方案是修改当前项目的并发数,以满足实际所需。详细操作如下所示: 登录MetaStudio控制台。 选择“我的创作 > 智能交互”,找到需要修改并发数的智能交互对话项目。 单击项目所在行的“编辑”,进入对话项目编辑界面。
输入分身数字人的角色名称。 示例:云笙。 训练视频 从本地上传已录制好,且符合拍摄要求的人像视频。 录制的视频要求4K,时长建议5~6分钟,分辨率≥1080P,宽高比16:9(横屏)或9:16(竖屏),建议优先使用竖屏拍摄,人物须保持竖直。支持MP4、MOV格式的视频。 背景替换
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。
部分浏览器提交H265训练视频失败如何处理? 问题描述 制作分身形象时,上传的训练视频无法播放,或提交训练任务时,提示分辨率不符合要求,如下图所示。 图1 分身形象制作 问题原因 由于Chrome等浏览器只支持硬解码H265(HEVC)视频,当您的PC硬件不支持解码H265(HEVC)视频时,Chro
购买语音包后试听一直转圈圈是为什么? 需要检查已购买的第三方声音AK/SK是否配置正确,详见购买出门问问声音套餐。如果配置有误,则无法使用。 父主题: 计费咨询
开发者论坛 开发者如果在使用MetaStudio数字内容生产线时有任何问题,可以在华为云开发者云社区的“数字内容生产线”板块提问。 父主题: 开发者论坛
每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。 请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。 请选择声音性别 选择声音的性别,示例:女生。 原始输入语言
图3 待接收资产 单击界面左上方的“返回”,回到“资源 > 已激活”页面。 选择“未激活”页签,单击已接收资产卡片中的“激活”,在弹出的“提示”对话框中,单击“确认”。 界面提示“资产已激活”,说明资产已激活成功。用户可以在“已激活”页签中查看已激活的分身模型资产。 图4 激活资产
在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行自定义读法,如图2所示。 在“原始词”列输入原始内容。 在“新建读法”列,输入拼音后,从下拉框中选择正确的读音。如有多个字,需单击“+”号图标,依次输入各文字的拼音。