检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
文本驱动SSML定义 MetaStudio语音驱动采用语音合成标记语言(SSML,Speech Synthesis Markup Language)来控制数字人的行为,包括动作、情绪以及TTS语音合成的多音字、停顿等。 SSML基础定义可参考语音合成标记语言版本 1.0。Meta
对应的系统权限并向用户告知征得其同意。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 四、延迟初始化要求 为了避免您的应用在未获取用户的同意前SDK提前处理用户的个人信息。我们提供了智能交互任务创建接口c
在一场网络暴力事件中,用户可能是直接施暴者、直接或间接传播者,也可能是受害者。 用户应注重规范自身“文明上网”的行为习惯, 严守言论自由的义务边界,提高对于网络暴力行为的识别能力, 及时举报相关内容,学习了解有关平台防范网络暴力的功能机制, 做好自我防护,避免网络暴力再次发生。 近日,旅美大熊猫丫丫因恶劣的健康状况,引发了网友的大量关注和担忧。
热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId
热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId
is_ifly_production Boolean 是否为正式环境 默认取值: false tail_silence_time Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 role_id String 奇妙问角色ID。 sis_region Integer
华为发布了鸿蒙操作系统,适用于各种设备,如手机、电视、手表和物联网设备。 这个系统有分布式架构,能让设备间无缝连接和协同工作。 AI在医疗领域的应用发展迅速。 比如,AI图像识别技术可以帮助医生提高疾病诊断的准确性和效率,也可以帮助医疗机构改善资源利用和服务质量。 中国继续推进5G网络建设,多个城市已经实现5G商用覆盖。
上一轮文本驱动未结束请等待 上一轮文本驱动未结束请等待 上一轮文本驱动未结束请等待 403 MSS.47015015 语音识别服务欠费不可用,请联系管理员检查 语音识别服务欠费不可用,请联系管理员检查 语音识别服务欠费不可用,请联系管理员检查 403 MSS.47015017 第三方驱动不支持此操作请通过驱动接口控制
is_ifly_production Boolean 是否为正式环境 默认取值: false tail_silence_time Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 role_id String 奇妙问角色ID。 sis_region Integer
zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 enable_question_audit 否 Boolean 提问文本审核开关 huawei_ei_cbs
zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 tail_silence_time 否 Integer 语音识别后端点静音时长默认500ms 取值范围: 0-3000 enable_question_audit 否 Boolean 提问文本审核开关 huawei_ei_cbs
视频直播 用户可以使用分身数字人,创建直播间。 操作前准备 如果系统预置的数字人形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。 推荐使用Chrome浏览器访问MetaStudio控制台。 操作限制 MetaStudio控制台预置形象的有效使用期为3年,在202
视频制作 用户可以使用MetaStudio控制台首页的“分身视频制作”功能,制作数字人视频。 操作前准备 如果系统预置形象不满足要求,请参考形象制作,提前定制符合要求的分身数字人形象。 操作限制 MetaStudio控制台预置形象的有效使用期为3年,在2027年的年中前可放心使用
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 视频制作剧本 一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。
制作名片 用户可以为分身数字人制作形象名片,且支持试听和查看数字人语音表达效果。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“分身数字人名片制作”,弹出“请选择您要使用的名片模板”对话框,如图1所示。 服务提供了名片模板,用户可以基于模板制作名片。 图1 选择名片模板
直播控制HTTP Command命令说明 分身数字人直播过程中,支持通过HTTP API的方式人工接管直播。人工接管以后,支持通过下述方式驱动数字人说话: 文本驱动方式:对应Command命令为“INSERT_PLAY_SCRIPT”,即插入表演脚本,用于互动回复。数字人不变时,
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
制作照片数字人视频 支持上传正面清晰的人像照片,生成会说话的照片数字人视频。 操作限制 照片数字人视频制作限制,如照片数字人限制所示。 操作步骤 登录MetaStudio控制台。 在“工作台”界面,单击“照片数字人”,进入照片数字人制作页面,如图1所示。 界面左侧展示配置项,右侧展示预览效果。配置操作,请参考表1。
视频制作界面说明 用户启动制作视频时,可以先了解下视频制作界面详情。 视频制作界面如图1所示。各区域详细说明,如表1所示。 用户使用数字人形象创作的视频,都会自动保存在MetaStudio控制台首页“最近项目”区域的“视频项目”页签中。用户可以根据实际情况,进行二次创作。 图1 视频制作界面
视频直播限制 分身数字人直播限制,如下所示: 直播间配置约束 直播任务退出说明 直播播放说明 直播内容审核说明 直播间配置约束 直播间配置限制,如表1所示。 表1 直播间限制 直播间配置 限制 文本驱动 每个单场景中所有段落输入文字的总量需大于200字。 每个段落的文本字符数量需