检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 单击“提交制作”。
在“分身名片”页面,可以看到已生成的名片列表,以卡片形式排列展示。 支持对名片进行如下操作: 单击,查看分身数字人的语音表达形态。 单击“下载”,将名片下载至本地查看。下载后的文件为mp4格式。 单击,在弹出的下拉框中,可查看名片详情、重命名或删除名片。 图1 分身数字人名片 父主题: 数字人名片制作
输入声音名称。 示例:欢快女声。 请制作声音 界面提供录音指导,需要按照指导录制1分钟的长音频WAV或MP3文件。WAV或MP3文件支持直接上传,无需压缩,无需携带文案txt文件。 如果未使用服务预置文案,声音标签仅作为标签,来区分声音使用场景。 请选择声音性别 声音的性别,用于匹配声音模型的精准度。
目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。添加动作时需注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。 4 数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 5
目前仅视频制作支持数字人插入动作,如图1所示。在数字人卡片上有标识,说明当前数字人支持添加动作。添加动作时需注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。 4 数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 5
自由演讲,可以阅读华为MetaStudio提供的示例文案,也可以不看提词器自由发挥,通常自由演讲能够获得更好的拍摄效果。在演讲过程中,可以做一些自然的手部动作,但是不能做一些有明确含义的动作,比如数字手势、挥手、握拳等。同时,也不能做大幅度的手势动作,比如将手超过肩部,或将手挡住
资产管理 数字资产管理 文件管理
js'></script> 如果您直接引用华为WebRTC SDK静态JS文件,则通过以下方式访问: import { HwICSUiSdk } from './sdk/HwICSUiSdk' 除以上JS文件引入之外,还需要引入CSS样式文件,可以直接通过link标签引入或者直接在项目中import:
智能交互支持富媒体吗? 支持的富媒体格式 用户与数字人进行智能交互问答时,支持展示如下格式的富媒体: 图片:JPG、PNG、BMP、GIF、SVG。 视频:MP4。 导入富媒体操作 支持通过问答库导入富媒体,示例如表1所示。以奇妙问知识库为例,可以通过新增知识库来补充富媒体知识。
支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作: 单击商品
及修改,如表1所示。 表1 问题定位及修改 错误提示 处理办法 视频名称包含非法字符 请您根据要求修改导出文件名称中的敏感字符。 资产名称重复 请您根据要求重新修改导出文件的名称。 视频任务合成状态一直显示“待合成” 可能是由于当前视频任务正在等待队列中,请您耐心等待。 演示素材不存在或不可用
分身视频制作 视频制作剧本管理 数字人视频制作管理 分身数字人视频制作管理 数字人名片制作管理 照片数字人视频制作管理 分身数字人字幕文件生成管理
5(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github.com
照片建模 照片建模任务创建失败是什么原因? 照片建模任务出现异常问题怎么办? 风格化照片建模的照片有什么要求? 风格化照片建模生成的模型文件是什么格式? 表情驱动数据格式如何定义? 肢体驱动数据格式如何定义?
2版本,新增HwICSUiSdk.esm.js文件,使用esmodule模块化标准。当使用vite构建的项目无法顺利import HwICSUiSdk.js文件到项目中的时候,可以import HwICSUiSdk.esm.js文件集成websdk。 2025-01-14 本次变更如下:
形象授权 上传形象授权书。 操作如下所示: 单击“授权书模板”,将授权书模板下载本地。 打印授权书,由身份证本人完成签署操作。 扫描文件生成pdf文件,或拍摄文件生成jpg、png格式的图片。 单击“点击上传授权书”,从本地选择pdf、jpg或png格式的授权书上传。 授权书内容,可参考授权书。
语音合成管理 创建TTS试听任务 获取TTS试听文件 创建TTS异步任务 获取TTS异步任务 设置TTS租户级自定义读法配置 获取TTS租户级自定义读法配置 删除TTS租户级自定义读法配置 修改TTS租户级自定义读法配置 语音同步合成WebSocket接口
Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
细账单。 资产管理 资产管理 左下角展示资产存储空间的已使用量,单位:GB。 须知: 用户首次使用MetaStudio服务,会免费赠送5G的存储空间。 资源总量默认包含免费赠送的5G存储空间。 目前资产管理,在内侧免费体验中,所以存储空间可以为负数。内测体验到期后,会在Metastudio控制台进行公告提醒。
10次/秒 10次/秒 复制资产 4次/秒 3次/秒 3次/秒 文件管理 创建文件并获取上传URL 10次/秒 5次/秒 5次/秒 删除文件 10次/秒 5次/秒 5次/秒 确认文件已上传 10次/秒 5次/秒 5次/秒 创建大文件 10次/秒 5次/秒 5次/秒 视频制作剧本管理 创建视频制作剧本