检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
视频制作限制 分身数字人视频制作限制说明,如表1所示。 表1 视频制作限制 视频制作配置 限制 视频制作剧本 一个视频制作剧本的场景数量不能超过50个。 一个视频制作剧本,仅支持使用一个数字人模型和一个音色模型。 文本驱动 每个单场景输入文字的数量不超过1万字。 所有场景输入文字的数量不超过10万字。
解除所有IP访问的限制。 在客户端防火墙配置SparkRTC端口和域名白名单。 配置SparkRTC端口的防火墙白名单,如表1所示。 表1 防火墙端口白名单 端口类型 端口 TCP端口 443、6447 UDP端口 20000-20063 配置SparkRTC域名的防火墙白名单,如表2所示。
全部启用:可以直接“全部启用”所有规则。 :设置单规则使用的场景。 :启用或关闭当前规则。 :删除规则。 单击界面右侧的“直播配置”页签,如图10所示。 直播配置说明,如表2所示。 图10 我的视频 表2 直播配置 区域 参数 说明 开播设置 选择开播方式(二选一) 请根据实际情况,选择一种开播方式,并按照界面提示进行操作。
这里设置的多音字,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。 别名 选中需要通过别名播报的文本内容 ,单击“别名”,设置为实际播报的内容。 须知: 这里设置的别名,仅对当前视频制作剧本有效,如需全局生效,可参考配置特殊词表配置。 数字英文 示例数字“1024”的读法如下所示:
五、最小化使用功能要求 我们的SDK针对扩展功能和可选的个人信息的处理提供了配置能力,您可以基于业务诉求选择开启或关闭相关功能。 1. 如何开启或关闭扩展功能 您可以通过setConfig或者create接口配置开启或关闭字幕、语音交互等扩展功能,以为您提供字幕、语音交互等服务。 2
需要在应用中,依次完成下述配置 开启讯飞闲聊功能,即开启“兜底设置”及其下的“讯飞闲聊”。 配置热词。 配置可用于闲聊的预置技能。 新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的“模拟测试”区域输入用
智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用户购买路数越多,同时进行数字人交互对话的数量则越多。 资源超过有效期后将无法使用,建议开通自动续费功能。 路数就是并发数
15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。 演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。 在光线充足的地方拍摄,避免出现脸部光照不均匀或“阴阳脸”。 父主题:
智能交互业务媒体流如何应对防火墙限制? 分身数字人智能交互业务使用SparkRTC方式收流,其信令和媒体访问方式为“IP+端口”或“域名+端口”,您的防火墙需要配置SparkRTC端口和域名的白名单,请参考直播业务媒体流如何应对防火墙限制?。 父主题: 智能交互
用各开放能力前,我们要求客户在其产品应用的隐私政策中向您告知其集成SDK处理个人信息的基本情况,并获取您的同意或取得其他合法性基础。但我们无法控制客户及其客户应用如何处理客户所控制的个人信息,也不对其行为负责。我们建议您认真阅读客户应用相关用户协议及隐私政策,在确认充分了解并同意
阅读发音 按顺序读,确保音字一致。避免漏字多字、发音错误、阅读不流畅等问题。如有这些问题,需重新录制。 内容要求 不能使用短音频复制拼接成长音频,会影响训练效果,无法通过审核。 录制提交 表3 录音内容提交规范 声音类型 音频说明 音频命名 基础版 需整段录制所有语料生成一个长音
前提条件 需要申请开通智能交互权限后,才可以使用分身数字人智能交互功能。 智能交互对硬件设备的最低配置要求,如智能交互使用限制所示。 与数字人智能交互的界面,对浏览器的要求,如智能交互使用限制所示。 父主题: 智能交互
证底噪不能太大,且不能有其他人声出现,尤其是被拍摄模特正在说话的时候。 模特形象 分身数字人不支持替换衣服,因此,您在录制时的着装会决定您的数字人穿着。 在拍摄前,我们建议参照如下条目,对您的形象进行检查。 着装要求 避免任何会和背景融为一体的衣服颜色。如绿幕背景下,不能穿绿色的衣服或者含有任何绿色图案的衣服。
创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
需要在应用中,依次完成下述配置 开启讯飞闲聊功能,即开启“兜底设置”及其下的“讯飞闲聊”。 配置热词。 配置可用于闲聊的预置技能。 新增设备人设,并在应用中启用人设。 目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的“模拟测试”区域输入用
操作流程图 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。 图3 互动问答 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。 表2 发布设置 参数 说明 激活码 智能交互项目发布成功后,自动生成激活码。
该接口用于删除资产库中的媒体资产。调用该接口删除媒体资产时,媒体资产会放入回收站中,不会彻底删除。如需彻底删除资产,需增加“mode=force”参数配置。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-assets/{asset_id}
10次/秒 10次/秒 设置TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 获取TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 删除TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 修改TTS租户级自定义读法配置 10次/秒 3次/秒 3次/秒 表3 API流控限制
视频制作 视频制作界面说明 视频制作 视频制作管理 视频制作公共配置 配置特殊词表
20010135”如何处理? 错误码“MSS.20010135” 含义为当前对话资源不足,即同时使用激活码进入当前智能交互对话项目链接的用户数大于该项目配置的并发数。 解决方案是修改当前项目的并发数,以满足实际所需。详细操作如下所示: 登录MetaStudio控制台。 选择“我的创作 > 智能