检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
objects 应用信息 表6 RobotInfo 参数 参数类型 描述 robot_id String 应用ID。 name String 应用名称。 room_id String 智能交互对话房间ID。 app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。
直播剧本保存失败时,请您根据界面提示信息进行问题定位及修改,如表1所示。 表1 问题定位及修改 错误提示 处理办法 剧本名称包含非法字符 请您根据要求修改剧本名称中的敏感字符。 包含敏感词汇 可能是讲解词中包含敏感词汇,去除讲解词中的敏感词汇即可。 演示素材不存在或不可用 请您检查
在“所有项目”中设置权限,则该权限在所有区域项目中都生效。访问MetaStudio时,需要先切换至授权区域。 权限根据授权精细程度分为角色和策略。 角色:IAM最初提供的一种根据用户的工作职能定义权限的粗粒度授权机制。该机制以服务为粒度,提供有限的服务相关角色用于授权。由于各服务
MetaStudio的计费项分为分身数字人费用、3D数字人费用和资产管理费用三类。 分身数字人费用:包括分身数字人形象制作、声音制作、分身数字人视频制作、分身数字人视频直播、照片数字人视频制作和分身数字人名片制作的费用。 3D数字人费用:包括照片建模、语音驱动和视觉驱动的费用。 资产管理费用:即服务资产管理的费用。
选择“基础版声音制作”,音频格式为WAV或MP3文件。需整段录制,每句之间有2~3秒的停顿。音频时长3~10分钟,建议5分钟。 请完善声音信息 输入声音名称,示例:欢快女声。 请制作声音 使用“语料上传”的方式,直接上传一个已录制好的长音频WAV或MP3文件,无需压缩,无需携带文案txt文件。
语音同步合成WebSocket接口 前提条件 本接口目前仅支持“华北-北京四”和“华东-上海一”区域使用,且必须提交工单申请开通后才能使用。 使用本接口前,需要在MetaStudio控制台服务概览页面,开通“声音合成”的按需计费。 详细操作为:单击“声音合成”卡片中的“去开通”,
含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER和OTHER 资产类型为VOICE_MODEL时,包含MAIN、SAMPLE(样例音频文件)和OTHER 资产类型为
含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER和OTHER 资产类型为VOICE_MODEL时,包含MAIN、SAMPLE(样例音频文件)和OTHER 资产类型为
否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 name 否 String 应用名称。 app_type 否 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认
在文本输入框中,输入文本内容,以生成音频,如图1所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。 图1 文本驱动 文本内容的操作说明如表1所示。 不同声音对表1中操作的支持情况有差异。如果表1中操作项置灰,说
否 String 第三方用户ID。不允许输入中文。 表3 请求Body参数 参数 是否必选 参数类型 描述 name 是 String 应用名称。 app_type 是 Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认
是不支持websdk内置语音唤醒能力的)。预制的唤醒能力支持使用“你好云笙”、“稍等一下”、“谢谢再见”三个唤醒词,进行数字人唤醒、打断和退出。 可以通过调用create接口,设置接口参数param中config里的enableLocalWakeup参数来开启Web语音唤醒能力。
随着版权保护意识的加强,用户已经愿意以付费方式来收看影视内容, 可商家在收费之余却忽视了消费者的观看体验。 旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。 多方纷纷站出来为丫丫发声,盼望它早日归来。 八月二十四日中午十二时,日本福岛第一核电站启动核污染水排海。 海洋是全人类赖以生存的蓝色家园,
没有阴影或反光。 FAQ: 如果我没有这么多灯光设备,怎么办? 无需过于担心,只要保证人物被均匀、稳定地照亮,并且能清晰地和背景形成区分即可。注意要保证脸部和身体没有出现明显的阴影。在灯光设备有限的情况下,优先打亮被拍摄主体,之后再去对绿幕进行补光。 收音 我们会使用视频中的语音
job_id String 任务id。 app_user_id String 用户id。 voice_name String 音色名称。该名称会作为资产库中音色模型资产名称。 sex String 性别。 FEMALE: 女性 MALE: 是男性 language String 语言。 state
<insert-action>:动作标签,可在文本的指定位置插入动作。用法为:<insert-action id="动作资产ID" name="动作名称" tag="动作标识"/>。动作资产信息是通过资产库接口查询获取的。 <break>:停顿标签,可在文本的指定位置插入停顿。用法为:<break
语音性别,是男性声音还是女性声音。 FEMALE: 女性 MALE: 男性 voice_name 否 String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 phone 否 String
每页显示的条目数量。 取值范围: 1-100 默认取值: 10 room_name 否 String 按智能交互对话名称模糊查询。 model_name 否 String 按形象名称模糊查询。 start_time 否 String 最近智能交互对话任务起始时间。格式遵循:RFC 3339
含MAIN、COVER和OTHER 资产类型为PPT时,包含MAIN、COVER、PAGE和OTHER 资产类型为HUMAN_MODEL时,包含MAIN、COVER和OTHER 资产类型为VOICE_MODEL时,包含MAIN、SAMPLE(样例音频文件)和OTHER 资产类型为
取值范围: 1-100 默认取值: 10 room_name 否 String 按直播间名称模糊查询。 dh_id 否 String 按数字人形象ID查询。 model_name 否 String 按形象名称模糊查询。 live_state 否 String 当前直播间直播状态。 WAI