检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
手机录制音频 请根据手机类型,执行相应操作: 苹果手机操作 安卓手机 苹果手机操作 苹果手机推荐下载软件“简易录音机(Easy Voice Recorder)”进行录音,如图1所示。 图1 简易录音机 音频录制说明,如表1所示。 表1 音频录制说明 音频录制 说明 采样率 推荐使用48kHz采样率录制音频。
资源类型 MetaStudio计费中涉及的资源类型,包括商用资源类型、POC测试用需管理员分配的资源类型。 表1 商用资源类型(租户订购) 类别 资源名称 单位 计费模式 资源类型编码 备注 分身数字人 形象制作 个 一次性 hws.resource.type.metastudio
参数 参数类型 描述 X-Request-Id String 请求ID。 表4 响应Body参数 参数 参数类型 描述 hot_words_id String 热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明:
删除热词记录 功能介绍 该接口用于删除热词记录。 调用方法 请参见如何调用API。 URI DELETE /v1/{project_id}/digital-human-chat/hot-words/{hot_words_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id
第三方声音支持的语言类型 第三方声音支持的语言类型,如表1所示。 表1 语言类型 语言类型 语种 出门问问(方言) 支持7种语言:东北话、广西话、湖北话、陕西话、四川话、粤语、港台。 出门问问(预置声音) 支持19种语言:中文、英文、德语、法语、韩语、葡萄牙语、日语、西班牙语、意
修订记录 发布日期 修订记录 2024-03-30 第二次正式发布。 本次更新说明如下: 新增如下章节: 视频制作 视频制作剧本管理 视频直播 数字人名片制作 资产管理 2023-08-30 第一次正式发布。
声音更新记录 2024年12月 表1 声音更新记录 发音人名称 性别 语言 TTS版本 对话女生 女 中文 TTS V7 广告男声 男 中文 TTS V7 教育女声 女 中文 TTS V7 客服男声 男 中文 TTS V7 客服女声 女 中文 TTS V7 云景行 男 中文 TTS
修订记录 发布日期 修订记录 2024-07-09 新增PHP和Node.js语言SDK。 2023-06-30 第一次正式发布。
mos分是从音色相似度、情感表达效果和声音音质方面,进行整体效果综合评分的结果。 表1 音频文件 版本 类别 原音文件 合成音文件 版本差异 适用场景 基础版声音制作 女声 基础版媒体1.wav 基础版媒体2.wav 支持手机录制20条语料音频(5分钟),1-3天制作,快速获得类真人音色,mos分3.8。
taStudio平台API调用所需的RoleId和AppSecret。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 创建角色 访问奇妙问,输入有效手机号和验证码,或者通过密码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。 界面右侧
是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 表2 Query参数 参数 是否必选 参数类型 描述 robot_id 是 String 应用ID。 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
words-switch 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。
新增知识库 可根据实际需要,上传外部知识库和问答库给大模型学习。 前提条件 使用奇妙问前,需提交工单申请使用手机号注册账号。 操作步骤 访问奇妙问,输入有效手机号和验证码,或者通过密码方式登录。 图1 奇妙问 单击“登录”,进入奇妙问“创建角色”页面,如图2所示。 图2 创建角色
智能交互数字人热词记录管理 创建热词记录 查询热词记录列表 查询配置热词记录详情 修改热词记录 删除热词记录 修改热词功能开关 查询热词功能开关 父主题: 智能交互管理
作案例所示。 录音准备 表1 录音准备 声音类型 录制设备和软件 录音环境 录音文案 基础版 优先使用专业录音设备录制音频,推荐使用Adobe Audition软件进行录音。 如果不具备专业录音设备,可使用手机录制音频,详情请参见手机录制音频。 录音环境安静,无回音、混响、噪声,
照片数字人视频制作列表等。 默认查询最近一个月任务记录。 调用方法 请参见如何调用API。 URI GET /v1/{project_id}/digital-human-videos 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。
分身数字人Flexus版针对中小企业客户,提供1080P的实景数字人、1分钟语料声音克隆能力和120分钟1080P视频制作能力,帮助客户通过手机拍摄即可轻松制作数字人。Flexus分身数字人不仅简化制作流程,还显著降低技术门槛,且购买简单,为中小企业提供超简单、超高性价比数字人。 使用限制
演讲过程中不限制说话的内容,出现失误可直接略过或从错误位置继续说话,无需打断拍摄。 背景尽量维持静态,不能出现规律性或大幅度的背景变化。 画面保持稳定,建议使用手机支架或手机稳定器。 在光线充足的地方拍摄,避免出现脸部光照不均匀或“阴阳脸”。 父主题: Flexus分身数字人
语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用
该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG)。 资产类型是VIDEO时,通过syst