检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
query_project_id 否 String 查询租户id。 batch_name 否 String 任务批次名称。 tag 否 String 任务标签。 job_id 否 String 任务ID。 name 否 String 分身数字人模型名称 model_resolution
String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。
云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 图2 获取访问权限 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。 图3 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。 单击“发布设置”页签,参考表2配置参数。
String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。
频为标准版形象,不支持选择Flexus声音进行视频合成。 试听 单击“试听”,试听语音效果。 生成预览 单击“生成预览”,选择“当前场景”或者“所有场景”,生成预览视频,可预览视频生成后的效果。 图标 单击图标,放大展示“文本驱动”页签,提升用户操作体验。 单击“确定”,可关闭页面。
String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。
String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。
如state=FAILED,WAITING job_id 否 String 任务id。 voice_name 否 String 声音名称。 tag 否 String 任务标签。 job_type 否 String 训练类型。 BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE:
i5及以上版本。 内存 8G以上。 硬盘 128G及以上。 操作系统 Windows或Android系统。 麦克风 需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问
原子动作中文名称。 action_name_en 否 String 原子动作英文名称。 action_tag 是 String 原子动作标签。 catalog 否 String 原子动作标签。 recommended_value 否 Integer 推荐等级。 取值范围: 0-100 is_selected
name 是 String 商品名称 description 否 String 商品描述 tags 否 Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover 否 ProductCoverInfo object 商品封面信息 text_list
name 是 String 商品名称 description 否 String 商品描述 tags 否 Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover 否 ProductCoverInfo object 商品封面信息 text_list
商品ID name String 商品名称 description String 商品描述 tags Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 cover ProductCoverDetailInfo object 商品封面信息 text_list
单击右上方的“导入”,从本地导入不少于200字的txt文件。如果多个段落,可通过换行来实现,平台会自动解析输入内容。 手工输入文本示例,如下所示: 请注意,当前仅为效果演示,实际需要满足单场景不少于200字,单段落不多于2000字的要求。 段落1.1:大家好,今天欢迎来到会议室,我们今天讨论的主题是:如何更好的学习和工作。
status String 状态 sex String 性别 默认取值: UNKNOW tags Array of strings 标签。单个标签16字节,多个用逗号分隔,最多50个。 style_assets Array of StyleAssetItem objects 风格化素材资产组合。
String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。
原始录音数据,需为48kHz采样率、16bit编码和单声道。 录制风格 录制全程保持语境风格一致,避免多种情绪混杂。如直播场景时,录制风格需接近日常直播效果。 发音吐字 发音吐字清晰、准确,音量适中。如果出现喷麦或嘶嘶声音,建议当前句子重新录制。 语速节奏 语速自然、平稳,切忌过快过慢、忽快忽慢。
String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。 取值范围: 字符长度0-131072位。
视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。 示例:云笙。 联系方式 请输入有效的11位手机号码。 身份证照片 需要分别上传身份证人像面和国徽面的照片。
目前仅支持开启“播报类”的闲聊技能,即有“播报类”标识的技能。 模拟测试:在应用配置界面的“模拟测试”区域输入用户问题,进行用户问题模拟,查看对话效果。 (可选)新增English情景模式:前面的所有操作,都是main情景模式下的配置,如果对话配置时,语言选择“中文”,则main情景模式