检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
包括如下类型: 基础版:20条语料音频 进阶版:100条语料音频 高级版:1小时以上的长音频WAV文件 每成功制作1个声音,从所购预付费资源包中扣除1个。 一次性计费 分身数字人视频直播 按数字人各路直播的总时长计费。 包年/包月有效期内,自动走包年/包月套餐。
audio_addr String 音频输入地址。 session_id Integer 会话ID。
如果配置,则段落切换回调中会携带该信息。美团平台对应goodsId product_title 否 String 关联商品标题/名称。如果配置,则段落切换回调中会携带该信息。
取值范围: 字符长度0-16位 默认取值: #FFFFFF 表20 AudioInfo 参数 是否必选 参数类型 描述 audio_id 否 Integer 参数解释: 音频id。
尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 图2 获取访问权限 单击“确定”,创建应用,创建效果如图3所示。 可单击“修改”,修改配置。
尾静音时长 云端对音频进行VAD检测,发现一句话末尾的静音时长超过500ms,会结束语音识别。建议该值大于500ms。 单击“确定”,创建应用,创建效果如图2所示。 可单击“修改”,修改配置。 图2 创建应用 (可选)单击“对话配置”页签,配置对话,详细操作请参考对话配置。
权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 对未成年人的保护 您承诺在您开始使用本服务时是成年人。如您是未成年人,则需要您的父母或监护人同意您使用本服务并同意相关服务条款。
等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。
极简体验 简化拍摄制作,使用一段2分钟的视频和1分钟的音频即可复刻自己的真人形象和声音,全程手机录制无需专业相机和专业绿幕环境。 高性价比 不到千元即可完成形象、声音定制,性价比超越业界。
默认取值: false audio_source_type 否 String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 默认取值: VIDEO voice_properties 否 VoiceProperties object 声音配置信息,为Flexus
取值范围: 字符长度0-16位 默认取值: #FFFFFF 表20 AudioInfo 参数 是否必选 参数类型 描述 audio_id 否 Integer 参数解释: 音频id。
默认取值: [VIDEO_2D,LIVE_2D] audio_source_type 否 String 声音来源类型 VIDEO:视频中抽取音频 AUDIO:单独上传的音频 默认取值: VIDEO 表4 ActionBasicSampleInfo 参数 是否必选 参数类型 描述 action_name_zh
否 String 文本标题 text 否 String 文本 表6 ProductMediaInfo 参数 是否必选 参数类型 描述 asset_id 否 String 资产ID asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频
描述 title String 文本标题 text String 文本 表7 ProductMediaDetailInfo 参数 参数类型 描述 asset_id String 资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频
否 String 文本标题 text 否 String 文本 表6 ProductMediaInfo 参数 是否必选 参数类型 描述 asset_id 否 String 资产ID asset_type 否 String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频
如何实时切换智能交互的语言和声音? 智能交互对话项目支持同时添加中文和英文语言,以实现智能交互页面中英文界面的实时切换。 详细配置说明,如下所示: 登录MetaStudio控制台,单击“智能交互”。 如果是展厅场景,需要切换到“华北-北京四”区域。
请根据实际情况切换语言,目前仅支持中文和英文。 图中标识“2”处为声音切换入口。单击图标,弹出如图3所示的对话框,选择需要切换的声音。 请注意,切换后的声音必须与前面切换后的语言保持一致。如果语言选择英文,声音选择中文声音,那么界面交互时数字人会没有声音。
描述 title String 文本标题 text String 文本 表9 ProductMediaDetailInfo 参数 参数类型 描述 asset_id String 资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频
取值范围: 字符长度0-16位 默认取值: #FFFFFF 表17 AudioInfo 参数 是否必选 参数类型 描述 audio_id 否 Integer 参数解释: 音频id。
我们只需要复制这个文案添加到字幕轨道中,找到文字转语音的按钮,选择“电影解说” 这个配音,点击进行转换,然后稍作等待,大家就能听到熟悉的声音。 同样,我们再来试试语音转文字,将我们的视频拖入视频轨道,选中它,找到我们的语音转文字功能,同样转换的速度也是很快。