检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
推荐使用无损音质格式保存音频,如WAV、MP3格式。 安卓手机的超级录音机的录音参数设置方式,如下所示: 打开超级录音机软件。 为了能正常录音和保存文件,需要先授权给软件录音和存储权限,即允许“超级录音机”访问媒体。 进入软件设置页面。 设置如下选项: 录制设置 > 录音音质:选择“高清”。 录制设置 > 录音保存格式:选择“WAV”或“MP3”。
training_input_source_url String 用户原始输入数据url。 create_type String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 tag String 任务标签。 ECOMMERCE: 电商 NEWS:
英文 默认取值: CN create_type 否 String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 phone 否 String 手机号 dhtms_job_id 否 String 形象制作任务id batch_name
英文 默认取值: CN create_type 否 String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 phone 否 String 手机号 dhtms_job_id 否 String 形象制作任务id batch_name
三月二日,神舟十五号乘组进行了二次出舱活动,在轨三个月取得多项阶段性成果。 第三十一届世界大学生运动会在成都隆重开幕,市民健康跑迎接大运会。 从中国音乐家发布的数据来看,国内有超过四千万孩子学习钢琴。 近日,中国探月航天形象太空兔正式对外公布名称, 中文名“兔星星”。 据悉,今年上半年,中国造船三大指标全面增长,
training_input_source_url String 用户原始输入数据url。 create_type String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 tag String 任务标签。 ECOMMERCE: 电商 NEWS:
支持使用查询资产列表接口,查询音色ID。需要设置如下参数: offset=0:从第一个音色开始查询,可以根据实际情况设置。 limit=60:一次可以查询的声音数据,可以根据实际情况设置。 asset_type=VOICE_MODEL:资产类型为音色模型。 asset_state=ACTIVED:资产为已激活状态。
data 是 ChatReqDataInfo object 对话请求数据信息。 表7 ChatReqDataInfo 参数 是否必选 参数类型 描述 text 是 String 文本信息。 seq 否 Integer 数据包序号。 is_last 否 Boolean 判断是否为最后一个文本。
英文 默认取值: CN create_type 否 String 任务创建方式。 PACKAGE: 使用一个zip包包含所有数据 SEGMENT: 逐句上传数据 phone 否 String 手机号 dhtms_job_id 否 String 形象制作任务id batch_name
分身形象”页面,可以看到新增的数字人形象卡片,如图3所示。也可以在MetaStudio控制台首页“最近项目”区域的“数字人”页签中查看。 图3 用户数据页面 父主题: 形象制作
S: 等待训练数据预处理 TRAINING_DATA_PREPROCESSING: 训练数据预处理中 TRAINING_DATA_PREPROCESS_FAILED: 训练数据预处理失败 TRAINING_DATA_PREPROCESS_SUCCESS: 训练数据预处理完成,等待训练资源中
从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台。 如果直播平台无法提供推流地址,可通过窗口捕获方式开播。 需要注意: 使用
package_url 参数 参数类型 描述 training_data_uploading_url String 上传的训练数据地址,用户需要将训练数据打成zip包后上传到该url。 说明: 通过该obs地址上传时需要设置content-type为application/zip
2f7693265", "name" : "会议", "description" : "会议产品", "tags" : [ "华为" ], "create_time" : "2021-09-30T10:43:17Z", "update_time" : "2021-10-30T12:30:35Z"
93265", "name" : "会议", "description" : "会议", "tags" : [ "华为" ], "create_time" : "2021-09-30T10:43:17Z", "update_time" :
app_id String 第三方应用ID。 app_type Integer 对接第三方应用厂商类型。 说明: 0:科大讯飞AIUI;1:华为云CBS;2:科大讯飞星火交互认知大模型;5:第三方驱动;6:第三方语言模型;8:奇妙问 取值范围: 0-32 app_key String
支持流式文本消息。seq为流式文本序号,从1开始计数;is_last用于判断流式文本的最后一包数据。如果不使用流式文本消息,seq设置为“1”,is_last设置为“true”。 建议每个分包数据长度大于6个字,否则可能会导致数字人说话卡顿。 详细交互流程如下所示: 用户发送文本驱动消息。
示例:4. 它不仅拥有出色的功能,还具备卓越的性能,序号4无需阅读。 音频格式 推荐使用无损音质格式保存音频文件,如WAV、MP3格式。 原始录音数据,需为48kHz采样率、16bit编码和单声道。 录制风格 录制全程保持语境风格一致,避免多种情绪混杂。如直播场景时,录制风格需接近日常直播效果。
从直播平台获取推流地址。获取方式各平台入口不一,建议咨询对应的直播平台。在MetaStudio服务这里仅需输入推流地址,即可直推平台。 推流即RTMP直推,华为云服务器直接把画面传到直播平台服务器,不需要用户一直打开控制台。 如果直播平台无法提供推流地址,可通过窗口捕获方式开播。 需要注意: 使用
CAPTURE: 直播助手,将摄像头获取视频流推送到RTC房间 ANIMATION: VDS服务,从RTC房间拉视频流生成动作数据 RENDER: 渲染服务,将动作数据渲染成数字人动画 PLAYER: 普通观看方,可选择原始视频流或者数字人动画视频流观看 INFERENCE_USER: