检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
建”,进入分身数字人直播首页面。 单击“直播任务管理”,进入如直播任务管理所示的页面。 可以看到用户创建的所有直播间的开播任务列表。如果同一个直播间,开播多次,则生成对应个数的开播任务。 可以查看任务ID、直播名称、封面、创建时间、开播时间、结束时间和当前的直播状态(直播中或直播结束)。
看界面上方的说明,按照说明操作,就可以详细了解了。 音频:从本地上传一个音频文件,支持MP4、WAV和M4A格式。当命中此规则后,使用此音频进行回复。 智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频
47010090 App Id为空 App Id为空 请携带正确的App Id信息 400 MSS.47010091 App Key为空 App Key为空 请携带正确的App Key信息 400 MSS.47010092 App Secret为空 App Secret为空 请携带正确的App
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表15
ish情景模式,才能对话成功。 情景模式名称必须为“English”,English情景模式下,不支持开启系统预置技能,仅支持开启自定义技能。一个应用可以增加多个情景模式,每个情景模式相互独立,互不干扰。 父主题: 创建智能交互数字人(科大讯飞)
不同声音对表1中操作的支持情况有差异。如果表1中操作项置灰,说明当前选择的声音不支持此操作。需要重新选择一个支持所需操作的声音模型,进行文本驱动设置。 表1 操作说明 操作 说明 插入停顿 在段落的某个位置,插入换气或者停顿时间,也支持自定义停顿时长。 多音字 选中文字,设置多音字的正确读音。 全局语速 设置全局语速,取值范围[0
参数 参数类型 描述 voice_asset_id String 语音合成特征字符串 speed Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
参数类型 描述 voice_asset_id 否 String 语音合成特征字符串 speed 否 Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
表1中的SDK对应语言的Github地址进行查看。 表1 服务端SDK 语言 Github地址 参考文档 JAVA huaweicloud-sdk-java-v3 Java SDK使用指导 Python huaweicloud-sdk-python-v3 Python SDK使用指导
参数类型 描述 voice_asset_id 否 String 语音合成特征字符串 speed 否 Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
参数 参数类型 描述 voice_asset_id String 语音合成特征字符串 speed Integer 语速。默认值100,最小值50,最大值200。 说明: 当取值为“100”时,表示一个成年人正常的语速,约为250字/分钟。 取值范围: 50-200 默认取值: 100
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表12
创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 3D数字人风格管理
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表13
SDK默认方式展示效果 富媒体展示效果(自定义方式) 用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
FullAccess”已生效。 MetaStudio自定义策略 如果系统预置的MetaStudio权限,不满足您的授权要求,可以创建自定义策略。 目前华为云云服务平台支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作
风格化ID。需要调用数字人风格管理相关接口,从系统中查得。 camera_position 否 String 人位置及相机位置。由如下4组浮点数组成的字符:人位置的X/Y/Z值,人角度的Pitch/Yaw/Roll值;相机位置的X/Y/Z值,相机角度的Pitch/Yaw/Roll值。
照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。 默认取值: 不涉及。 表10