检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
该参数已废弃,照片数字人视频制作使用“创建照片分身数字人视频制作任务”接口。 model_asset_id String 分身数字人模型资产ID,可以从资产库中查询。 voice_config VoiceConfig object 语音配置参数。 video_config VideoConfig
单击“选择webm文件”,选择WEBM格式的视频。 等待视频格式转换完成。请注意,视频格式转换过程中,一定不能关闭如图2所示的2个窗口。 图2 工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的
发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。
界面详情如视频直播界面说明所示,对应操作说明如下所示。详细操作说明,请参考视频直播公共配置。 在左侧的素材区域,除了系统预置的视频素材外,角色还可以自定义定制数字人;背景、贴图、视频还支持从本地导入使用;商品可以自主创建;文本可自主输入文字内容。 从素材区域添加到预览窗口中的贴图、视频和数字人支持进行图层管理,如:上
and cooking methods. 42. They can also understand your needs through natural language processing technology and automatically adjust cooking parameters
发布成功后,自动跳转至与数字人智能互动页面,可以体验与数字人互动的效果。也可以复制数字人互动页面的网址,分享给其他用户使用。 获取数字人互动页面URL的方式还有:进入“我的创作 > 智能交互 > 对话项目”页面,单击智能交互对话项目右侧的“复制URL和激活码”,可以将URL和激活码分享给其他用户使用。
Boolean 参数解释: PPT是否需要自动解析。 约束限制: 部分过于复杂的PPT或压缩比过高的PPT可能无法解析。 超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status
视频素材区域,除了系统预置素材外,角色还可以自定义新增分身数字人,背景、PPT、贴图、视频和音乐还可以从本地导入使用。 从视频素材区域添加到画布区域中的PPT、贴图、视频和数字人支持进行图层管理,如:上移一层、下移一层、置顶、置底、应用到全局、删除等。还支持设置大小,拖动位置。 可以单击画布区域上方的
String 错误描述。 表8 VoiceConfig 参数 参数类型 描述 voice_asset_id String 参数解释: 音色资产ID,可以从资产库中查询。 音色ID的查询操作,详见查询预置音色ID。 约束限制: 不涉及。 取值范围: 字符长度1-256位。 默认取值: 不涉及。
资产归属分配 开启AM子账户隔离能力后,华为云账号可以在资产归属分配页面,修改所有资产的归属。 注意事项 开启AM子账户隔离能力后,各IAM子账户历史上传或制作的资产归属均已自动变更为华为云账号。 视频制作剧本、直播间、智能交互对话项目,暂不支持修改资产归属。 企业联邦虚拟用户,不支持修改资产归属。
Boolean 参数解释: PPT是否需要自动解析。 约束限制: 部分过于复杂的PPT或压缩比过高的PPT可能无法解析。 超过50页PPT仅转换50页 转换的图片无法保证完全还原,需要自行确认。 取值范围: true: 自动解析 false: 无需解析 默认取值: false ppt_analysis_status
委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,可以作为热词反馈到语音模型,以提高语音识别的准确率。这里仅开启热词功能,实际的热词配置,请参见对话配置。
数字人定制任务,会重新进行模型训练。等待模型训练完成后,用户可以二次审验,继续4的操作,直至生成符合要求的分身数字人形象。 此时,在“我的创作 > 分身形象”页面,可以看到新增的数字人形象卡片,如图3所示。也可以在MetaStudio控制台首页“最近项目”区域的“数字人”页签中查看。
修改说明 2025-01-14 本次变更如下: 新增发布3.0.2版本SDK,相比3.0.1版本,变更点如下所示: 语音唤醒能力支持设备切换实时生效。 2024-12-30 本次变更如下: 新增发布3.0.1版本SDK,相比2.2.0版本,变更点如下所示: 新增语音唤醒能力,详见Web语音唤醒。
695532670&partNumber=1&uploadId=0000018AC154BC218415213228194267&Signature=FrLhTRdhMjpAFVb%2Ff%2BcGJQgvjlw%3D", "https://{endpoint}:443/0d69
言的翻译 像咱们国内的跨境卖家,就完全可以把国内已经录制好的视频,直接上传,就可以把视频翻译为多国籍的版本,口音也可以选择。 文案可以自己撰写,写好了可以直接上传到对话框,就可以直接生成口播介绍视频了,可以点预览,就能听语音效果。 或者你可以交给AI智能脚本,在万兴播爆智能脚本中
END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String RTC鉴权token。 ctime Long 有效期。时间戳,单位:秒。 取值范围: 0-4294967295 表10
product_id 否 String 关联商品ID。如果配置,则段落切换回调中会携带该信息。美团平台对应goodsId product_title 否 String 关联商品标题/名称。如果配置,则段落切换回调中会携带该信息。美团平台对应goodsTitle 表16 LiveR
END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String RTC鉴权token。 ctime Long 有效期。时间戳,单位:秒。 取值范围: 0-4294967295 表10
END_USER: 端侧用户。从推送音频流到RTC房间,并从RTC房间接收视频流 user_id String RTC用户ID。 signature String RTC鉴权token。 ctime Long 有效期。时间戳,单位:秒。 取值范围: 0-4294967295 表8