检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
需整段录制所有语料生成一个长音频WAV或MP3格式文件,每句之间有2~3秒的停顿。WAV或MP3格式文件可直接上传MetaStudio控制台,无需压缩,无需提供语料txt文件。 推荐使用服务预置语料,也可自定义语料。系统会自动根据停顿做切割,自动识别文本内容。 音频文件命名无要求,可自定义,命名示例:Voice
5(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com
使用方式: 调用接口时,增加两个头域:x-hw-mss-time,x-hw-mss-secret x-hw-mss-time:当前时间戳。Unix时间戳的十六进制结果。1分钟内有效。 示例: 66df9308(即2024.09.10 08:30:00) x-hw-mss-secre
输入声音名称。 示例:欢快女声。 请制作声音 界面提供录音指导,需要按照指导录制1分钟的长音频WAV或MP3文件。WAV或MP3文件支持直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
所有语料录制生成一个长音频WAV或MP3文件,命名示例:Voice.wav。 音频导出 操作如下所示: 打开超级录音机软件,进入音频文件列表页面。 通过长按音频文件的方式,选中所有文件,单击分享图标,可选择隔空投送或其他第三方应用导出音频文件至PC中。 一个长音频文件无需压缩,可直接上传至MetaStudio控制台,进行声音训练。
列展示。 关键词搜索框,可输入文件名称进行精准搜索。 示例:销售指导书。 文件列表 默认展示全量文件。 查看文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,可以在弹出的界面中预览PPT的所有页面内容。 插入文件 将鼠标放在文件上方,文件右上角展示图标。单击图标,弹出如图4
String 文件下载URL,有效期为24小时。 state String 文件状态枚举: CREATING:文件上传中 CREATED:文件已上传(自动审核通过) FAILED:文件上传失败 CANCELLED:文件上传已取消 DELETING:文件删除中 DELETED:文件已删除
asset_state String 资产状态。 CREATING:资产创建中,主文件尚未上传 FAILED:主文件上传失败 UNACTIVED:主文件上传成功,资产未激活,资产不可用于其他业务(用户可更新状态) ACTIVED:主文件上传成功,资产激活,资产可用于其他业务(用户可更新状态) DEL
使用方式: 调用接口时,增加两个头域:x-hw-mss-time,x-hw-mss-secret x-hw-mss-time:当前时间戳。Unix时间戳的十六进制结果。1分钟内有效。 示例: 66df9308(即2024.09.10 08:30:00) x-hw-mss-secre
化传承的意识,形成全社会共同参与的良好氛围。 利用现代科技手段,如GIS(地理信息系统)、无人机监测等,对西湖的自然环境和文化遗产进行实时监控和分析。 通过教育和推广活动,让更多的人了解西湖的价值,培养青少年对传统文化的兴趣和保护意识。 总结 杭州西湖,以其独特的自然风光、深厚的
为了保障SDK稳定运行,改善产品的运营策略,SDK会直接收集客户应用调用SDK接口的信息并上传至服务器进行统计分析。处理的个人信息包括应用信息(浏览器User Agent)、SDK接口调用记录。上述信息不会与您个人身份关联,我们无法识别您的身份。 设备权限调用 当您使用相应功能及服务
String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否 String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
工具运行界面 视频转换过程中,工具的同级目录下面会出现一些过程文件,请勿移动或删除,待视频格式转换完成后,会自动删除。 图3 工具目录 视频格式转换完成后,WEBM视频文件的同级目录下面会生成一个同名带时间戳的MOV文件。 文件名示例如下所示: 原始频名称:test.webm 转换后的
String 字幕文件下载链接。 subtitle_file_upload_url String 字幕文件上传链接。 subtitle_file_state String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。
PPT 操作限制,如下所示: PPT文件不支持超过50页。 如果PPT的字体不支持在MetaStudio控制台展示,可能会导致视频制作时展示的PPT页面排版与实际排版不一致,建议将PPT转存为PDF文件后再导入。 操作详情请参考PPT如何转为PDF文件?。 如果PPT中有动画、动效,
Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。
使用方式: 调用接口时,增加两个头域:x-hw-mss-time,x-hw-mss-secret x-hw-mss-time:当前时间戳。Unix时间戳的十六进制结果。1分钟内有效。 示例: 66df9308(即2024.09.10 08:30:00) x-hw-mss-secre
String 字幕文件下载链接。 subtitle_file_upload_url 否 String 字幕文件上传链接。 subtitle_file_state 否 String 字幕文件生成状态。 GENERATING:字幕文件生成中。 GENERATE_SUCCEED:字幕文件生成成功。