检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
问答交互次数,请参考本节操作,订购套餐包。 操作步骤 在界面上方的主菜单中,单击“我的应用”。 单击应用所在行的图标,进入当前应用的“应用配置”页面。 在左侧导航栏中,单击“服务统计”,进入“服务统计”页面,如图1所示。 通过下图可以看出,科大讯飞免费赠送500次/天的问答交互。
Command命令说明 直播控制RTSA Command命令说明 文本驱动SSML定义 系统资产标签定义 服务支持的字体 资源类型 使用Java代码生成文件内容的MD5值 预置音色ID列表 查询音色ID
在左侧导航栏中,单击“任务中心”。 选择“声音制作”,确认声音制作任务已训练完成。 在左侧导航栏中,单击“我的创作”。 选择“声音”,找到已生成的声音,单击声音卡片中的头像,即可试听声音效果。 用户还可以执行如下操作: 单击“视频制作”,基于已有声音,进行视频制作,操作请参考视频制作。
是否支持H265(HEVC)视频解码。 图2 查看浏览器配置 用ffmpeg检查视频的编码是否是H265(HEVC),输入命令:ffmpeg -i 视频文件名。 图3 检查视频是否是hevc编码 需要先安装ffmpeg,安装方法如下。 ffmpeg下载地址:https://github
、计费模式等信息,购买对应的资源。各类产品的计费说明,详见计费说明。 关联租户:仅SP用户有此入口。单击“关联租户”,进入“关联租户”信息配置界面。输入租户所在区域的项目ID和租户名称,租户名称支持自定义。单击“创建”,租户新增完成。 我的资源(租户) 租户在“我的资源”区域,可以看到资源剩余量详情,如表1所示。
PICTURE_MODELING:照片建模生成的模型 CHARACTER_CUSTOMIZATION_MODELING:捏脸生成的模型 默认取值: UPLOADED modeling_job_id String 参数解释: 建模任务ID。 约束限制: 仅由MetaStudio服务生成的模型系统自行填写 取值范围:
因素。这个改革是想减轻学生的学业压力,让他们能更全面地发展。 因为互联网技术的发展,网络教育在中国越来越受欢迎。 更多的学校和教育机构提供在线课程和远程学习平台,让学生能灵活选择时间和地点学习。 网络教育还给偏远地区和弱势群体提供了更多平等的教育机会。 STEM教育是中国教育改革的重要话题。
如表1所示。 图2 视频直播制作界面 表1 界面说明 区域 说明 ① 素材区域,包括如下内容。视频直播素材的操作详情,请参考视频直播公共配置。 模板:视频直播模板,“模板”页签仅管理员可见。 角色:数字人形象列表,可选择需要使用的数字人形象,支持自定义。 背景:背景图片列表,支持本地导入。可选择需要使用的背景图。
0版本,新增如下功能: 支持英文版智能交互。 增加热点问题开关,可以控制是否显示热点问题,详情请参考create中config参数配置或setConfig。 如果打开开关,需要智能交互任务已配置热点问题。 2024-01-30 第一次正式发布。 父主题: Web SDK
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
model_infos ModelInfo object 数字人模型信息 voice_config VoiceConfig object 语音配置参数。 说明: *此参数将被废弃,请使用voice_config_list。 concurrency Integer 参数解释: 并发路数。
照片数字人限制 照片数字人视频制作限制说明,如表1所示。 表1 照片数字人视频制作限制 照片数字人视频制作配置 限制 人像照片 制作照片数字人的人像照片拍摄要求,如下所示: 真人正面照,不支持动漫卡通形象;面部占比50%以上,侧脸俯仰角度不超过15度。 五官清晰无遮挡,目视前方。
推荐使用单声道录制音频。 苹果手机的简易录音机默认为单声道录制,无需修改。 音频格式 推荐使用无损音质格式保存音频,如WAV、MP3格式。 音频命名 所有语料录制生成一个长音频WAV或MP3文件,命名示例:Voice.wav。 音频导出 操作如下所示: 打开简易录音机软件,单击底部的“播放”菜单,进入“播放”页面。
五、最小化使用功能要求 我们的SDK针对扩展功能和可选的个人信息的处理提供了配置能力,您可以基于业务诉求选择开启或关闭相关功能。 1. 如何开启或关闭扩展功能 您可以通过setConfig或者create接口配置开启或关闭字幕、语音交互等扩展功能,以为您提供字幕、语音交互等服务。 2
Integer 响应生成时间。 choices Array of ChatChoice objects 生成的文本列表。 表7 ChatChoice 参数 是否必选 参数类型 描述 message 是 表8 objects 生成文本的内容。 index 是 Integer 生成文本在列表中的索引值,从0开始计算。
避免头部大幅度转动或者摆动,避免嘴巴被遮挡,可能造成口型异常。 视频中需保证仅出现录制者及其声音。如果出现其他人物形象或声音,将会影响口型生成效果和声音克隆效果。 避免动作幅度过大超出画面;避免相机距离人过远;建议人脸在画面中的占比超过1/5。 15秒静默状态时,需正视镜头,面带微笑,嘴巴闭合,保持静默。
MIN:分钟(视频制作) HOUR:小时 (直播) CHANNEL:路(直播/交互) GB:GB(资产管理) MILLION_WORDS:百万字 TEN_THOUSAND_WORDS:万字 TIME:次 状态码: 400 表7 响应Body参数 参数 参数类型 描述 error_code String
X-Request-Id 否 String 请求requestId,用来标识一路请求,用于问题跟踪定位,建议使用uuId,若不携带,则后台自动生成 X-Auth-Token 否 String 用户Token。使用Token鉴权方式时必选。 通过调用IAM服务获取用户Token接口获取。
其中“X-Subject-Token”就是需要获取的用户Token。有了Token之后,您就可以使用Token认证调用其他API。 建议在配置文件或者环境变量中密文存放,使用时解密,确保安全。 图1 管理员创建IAM用户响应消息头 响应消息体(可选) 该部分可选。响应消息体通常以
签,筛选展示所有的分身模型资产。 找到需要转移的资产,单击资产右下角的,从下拉框中选择“转移”,弹出“资产转移”对话框,如图2所示。 参数配置说明,如表1所示。 图2 资产转移 表1 参数说明 参数 说明 用户账号 需要接收资产的租户,其所在Region的项目ID,获取方法请参见获取项目ID。