检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务 如果训练生成的数字人形象满足需求,单击右下方的“通过”。在弹出的“确认”对话框中,单击“确认”,数字人形象生成完成。
任务ID。 表2 Query参数 参数 是否必选 参数类型 描述 auth_key 否 String 鉴权Key。通过HmacSHA256生成的鉴权key expires_time 否 Long 参数解释: 鉴权key过期时间。从1970年1月1日(UTC/GMT的午夜)开始所经过的毫秒数。
界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄后处理,有效指导用户拍摄生成一段完整可用的训练视频,用于训练生成分身数字人。 图1 定制数字人形象 上传分身数字人训练数据。 界面操作详情,如表1所示。 表1 界面操作说明 区域 参数
参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 请求示例 POST https://metastudio.cn-north-4.myhuaweicloud.com/v1/70b76xxxxxx34253880af5
响应Body参数 参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 请求示例 GET https://{endpoint}/v1/3f0924078d1b471c884a5383d4dec9fa/voice-training-man
需要有麦克风,且要保障1米以内的拾音效果。 扬声器 需要有扬声器。 触摸屏 需要有触摸屏。 带宽 4M以上。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 智能交互界面对浏览器的要求,如表2所示。 表2 浏览器适配详情 操作系统类型
X-Request-Id 否 String 请求requestId,用来标识一路请求,用于问题跟踪定位,建议使用uuId,若不携带,则后台自动生成 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。
subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。 GENERATE_FAILED:字幕文件生成失败。 job_id String 字幕文件生成任务ID。 状态码:400 表24 响应Body参数
URI(product_query_url,query参数按照Key的字典序排列)+ x-hw-mss-time) 示例: URL https://api.example.com/v1/products?live_id=111&limit=10&offset=0 Key:GCT
图2 获取项目ID 调用API获取项目ID 您还能通过调用查询指定条件下的项目信息API获取项目ID。 获取项目ID的接口为“GET https://{Endpoint}/v3/projects/”,其中{Endpoint}为IAM的终端节点可以从地区和终端节点获取。接口的认证鉴权请参见认证鉴权。
调整视频播报的音量。 图标 操作如下所示: 单击图标开启字幕。 单击“生成预览”,选择“当前场景”或“全部场景”,生成字幕内容和预览视频。 如果是“文本驱动”直接提取文本生成字幕内容。如果是“音频驱动”,会将音频转化为文本后,再生成字幕内容。 画布左侧展示字幕内容,支持修改字幕内容、调整字幕样式。
参数 参数类型 描述 error_code String 错误码。 error_msg String 错误描述。 请求示例 POST https://{endpoint}/v1/6a6a1f8354f64dd9b9a614def7b59d83/files { "file_name"
选择创建视频,可以设置每张幻灯片放映的时间等参数。 单击“创建视频”,在弹出的对话框中,选择本地存放目录,并设置视频名称。 单击“保存”,生成视频文件。 视频文件生成后,需要在视频制作界面的“视频”页签,导入使用。 请注意:视频中PPT每页播放的时间如果与对应音频的时长不匹配,需要将完整的P
在画布区域,设置角色、背景、贴图、视频等内容。 详细操作请参见视频制作素材操作详情。 画布制作完成后,再制作语音。 选择“文本驱动”的方式。在文本输入框中,输入文本内容,以生成音频,如图2所示。 文本示例:今天是9月26日,星期二,天气晴朗,欢迎大家到访。我们精心布置了现场,室内摆放了各类植物和鲜花,场地宽敞明亮,足够大家在室内共同交流和活动。
PPT转PDF的操作如下所示: 本地打开PPT文件,在左上方的导航栏中,选择“文件 > 另存为”。 选择另存的文件类型:PDF。 单击“保存”,生成PDF文件。 PDF文件生成后,可以导入视频制作界面使用。 父主题: 视频制作
视频直播间的场景布置好之后,可以通过捕捉网页画面或RTMP推流的方式向第三方直播平台传输画面。MetaStudio控制台的场景布置是免费的,生成并输出直播画面是付费的。且MetaStudio服务主要是生成数字人音视频内容,是直播内容输出源,不是直播平台。 父主题: 计费咨询
MetaStudio已经预置了各种类型的声音,可以在视频制作界面或视频直播界面查看。如果预置声音仍无法满足用户需求,可使用第三方模型“出门问问”自定义生成声音。第三方模型“出门问问”的详细说明,如下所示: 输入的语言不受限制。默认支持19种输入语言(中文、英文、粤语、德语、法语、土耳其语、菲
17+。 编译工具 建议Webpack 5 + babel 7。 浏览器 浏览器使用限制,请参见表2。 由于浏览器的安全策略限制,仅支持通过“https://域名”方式访问,否则无法正常加载运行智能交互WebSDK。 表2 浏览器适配详情 操作系统类型 浏览器类型 浏览器版本 Windows
URI(product_query_url,query参数按照Key的字典序排列)+ x-hw-mss-time) 示例: URL https://api.example.com/v1/products?live_id=111&limit=10&offset=0 Key:GCT
视频制作管理 支持在MetaStudio控制台执行如下操作: 已合成的视频,支持下载至本地、查看详情、重命名和删除等操作。 已生成的视频草稿,支持编辑、查看合成视频详情列表、重命名、删除和创建副本等操作。其中“创建副本”,可以将当前视频草稿作为模板,复制出更多一模一样的视频草稿,进行再创作。