检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
制作页面。 界面左侧是声音制作页面,右侧为声音制作流程。声音制作录制教程,可以帮助用户快速制作声音。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 MetaStudio提供下述声音制作方式: 基础
object 华为云CBS应用配置 iflytek_aiui_config 否 IflytekAiuiConfig object 科大讯飞AIUI应用配置 iflytek_spark 否 IflytekSpark object 科大讯飞星火大模型应用配置 third_party_model_config
制作页面。 选择“第三方模型”页签的“出门问问声音制作”方式。 界面左侧是声音制作页面,右侧为声音制作流程,如图1所示。 图1 定制声音 配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“出门问问声音制作”。音频时长为0.5~18
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表7 PlatformAuthorizationInfo
LiveEventCallBackConfig object 直播事件HTTPS回调通知配置 rtc_callback_config RTCLiveEventCallBackConfig object RTC回调事件配置。兼容处理,未携带配置则默认订阅LIVE_PROGRESS stream_duration
TEMP:临时直播间,直播任务结束后自动清理直播间。 TEMPLATE:直播间模板。 默认取值: NORMAL room_state String 直播间配置状态。 ENABLE: 直播间正常可用。 DISABLE: 直播间不可用。不可用原因在error_info中说明。 BLOCKED:直播间
Config object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 UpdateCust
CustomPlatformAuthConfig object 自定义直播平台鉴权配置 callback_config 是 Array of StandardPlatformApiConfig objects 自定义直播平台回调配置。同一种类型仅保留一个配置,如果配置多个会随机保存一个。 表4 CustomPlatformAuthConfig
LiveEventCallBackConfig object 直播事件HTTPS回调通知配置 rtc_callback_config RTCLiveEventCallBackConfig object RTC回调事件配置。兼容处理,未携带配置则默认订阅LIVE_PROGRESS stream_duration
LiveEventCallBackConfig object 直播事件HTTPS回调通知配置 rtc_callback_config RTCLiveEventCallBackConfig object RTC回调事件配置。兼容处理,未携带配置则默认订阅LIVE_PROGRESS stream_duration
常用概念 数字人 数字人是一种以数字形式存在于数字空间中的虚拟人物,它具有拟人或真人的外貌、行为特点,并具备一定的智能和情感,可以进行交互和表达。数字人也可以被称之为虚拟形象、数字虚拟人、虚拟数字人等。数字人的核心技术主要包括计算机视觉、计算机图形学、动作捕捉和驱动、图像渲染和人工智能等。
设置TTS租户级自定义读法配置 GET /v1/{project_id}/ttsc/vocabulary-configs 获取TTS租户级自定义读法配置 DELETE /v1/{project_id}/ttsc/vocabulary-configs 删除TTS租户级自定义读法配置 PUT /v
声音授权签署文件。 操作步骤 登录MetaStudio控制台。 单击“声音制作”下方的“开始创建”,进入声音制作页面。 图1 定制声音 在“华为模型”页签,配置声音制作参数。 界面操作详情,如表1所示。 表1 界面操作说明 区域 说明 声音制作方式 选择“基础版声音制作”,音频格式为WAV或MP3
ig object 对话字幕配置 video_config SmartChatVideoConfig object 视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_video_type
其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以
//IAM用户名 "password": $ADMIN_PASS, //IAM用户密码,建议在配置文件或者环境变量中密文存放,使用时解密,确保安全 "domain": {
智能交互中数字人分身的动作是根据数字分身拍摄形象训练生成的,唇形和文字声音匹配,数字分身和背景融合自然,清晰度1080P。 智能交互根据客户需要,后台提供多种知识库配置,支持配置中英双语。 智能交互基于已有训练生成的数字分身形象模型和声音模型,结合知识库,可与用户进行实时对话。 用户购买路数越多,同时进行数字人交互对话的数量则越多。
ig object 对话字幕配置 video_config SmartChatVideoConfig object 视频输出配置。 voice_config_list Array of SmartChatVoiceConfig objects 语音配置参数列表。 chat_state
签,筛选展示所有的分身模型资产。 找到需要转移的资产,单击资产右下角的,从下拉框中选择“转移”,弹出“资产转移”对话框,如图2所示。 参数配置说明,如表1所示。 图2 资产转移 表1 参数说明 参数 说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。
不同资产类型主文件格式与大小约束如下 视频资产:资产类型为VIDEO,主文件格式(忽略大小写)为mp4、m4v、mkv、mov、flv、3gp、wmv、avi、webm,主文件大小不超过5G 图片资产:资产类型为IMAGE,主文件格式(忽略大小写)为jpeg、jpg、png、bmp、gif,主文件大小不超过50M