检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
SmartImageLayerConfig 参数 是否必选 参数类型 描述 image_url 是 String 图片文件的URL。 display_duration 否 Integer 参数解释: 图片显示时长,单位s。 显示时长规则为,若携带reply_texts、reply_audios,则与
ms,会结束语音识别。建议该值大于500ms。 委托语言交互服务(SIS) 如需使用热词功能,请开启委托授权。SIS服务用于将用户口述音频转换为文本。 热词 仅开启“委托语言交互服务(SIS)”后,才会展示“热词”配置。 数字人与用户进行智能交互对话时,语音识别不准确的专业词汇,
fo 参数 类型 描述 text string 识别结果文本。 questionText string 问题文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。
智能交互:通过智能交互的方式回复用户问题,相当于提供了一个第三方语言模型去答复用户问题。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。
le_md5的值一致。 Content-Type常见取值,如下所示: image/gif:gif图片格式 image/jpeg:jpg或jpeg图片格式 image/png:png图片格式 audio/mp3:mp3音频格式 audio/wav:wav音频格式 video/mp4:mp4视频格式
2所示。 在“原始词”列输入原始内容。 在“新建读法”列,输入拼音后,从下拉框中选择正确的读音。如有多个字,需单击“+”号图标,依次输入各文字的拼音。 图2 新建词表 单击新增特殊词右侧的“确定”,新增成功。 如有更多特殊词需要配置自定义读法,可参考上述步骤依次添加完成。添加完成
SmartImageLayerConfig 参数 是否必选 参数类型 描述 image_url 是 String 图片文件的URL。 display_duration 否 Integer 参数解释: 图片显示时长,单位s。 显示时长规则为,若携带reply_texts、reply_audios,则与
分身数字人定制任务提交后,审核未通过怎么办? 如果提示信息为“自动审核不通过-人证不匹配”,可能原因如下所示: 人证校验时识别不到人脸,确保身份证照片无反光导致的内容或人像不清晰。 确保视频中的人脸清晰且与提交身份证中的人像保持一致。 视频方向可能不对,竖屏横拍的素材需要旋转,确保被拍摄对象为竖向。
SmartImageLayerConfig 参数 参数类型 描述 image_url String 图片文件的URL。 display_duration Integer 参数解释: 图片显示时长,单位s。 显示时长规则为,若携带reply_texts、reply_audios,则与播
选择“文本回复”,输入文本内容,当满足触发方式时,数字人会阅读文本内容。 素材绑定(可选) 从本地选择图片或视频上传。当直播间命中当前互动内容进行答复时,同时会在直播画面展示这里上传的图片或视频。 无需设置。 单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。
资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 asset_name
资产ID asset_type String 资产类型 IMAGE:图片 VIDEO:视频 AUDIO:音频 order Integer 参数解释: 资产次序。不设置或者0表示按照加入时间先后排序。业务上将次序最靠前的图片设置为商品封面。 取值范围: 0-300 默认取值: 0 asset_name
新闻:新闻播报风格文案 声音授权 单击“授权书模板”,下载授权书模板后打印。用户手写相关信息后,重新生成签署后的pdf文件,或者拍摄成jpg或png格式的图片后上传。 授权书内容,可参考授权书。 单击“提交制作”。 弹出“资源消耗提示”对话框。提示用户目前声音制作服务剩余数量,本次将消耗1个资源。
商品类别。设置以后,自动成为商品的标签,方便搜索商品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。
单击资产卡片区域的“取消激活”,将资产设置为“未激活”状态。未激活状态的资产在控制台不可用。 查看详情 单击资产卡片,进入资产详情界面,查看资产的全部信息,图片资产详情示例如图2所示。 编辑资产 单击资产卡片,在资产详情界面,单击“编辑”,修改资产信息。合成视频、声音模型、音乐等资产不支持编辑。 删除资产
完成审核。 图4 定制任务详情 审核通过后,任务状态变更为“算法训练中”,如图所示。 数字人定制任务审核通过后,启动算法训练,会在3个工作日内训练完成并生成数字人。 图5 数字人定制任务 等待数字人模型训练完成后,任务状态变更为“算法训练完成”,如图6所示。 图6 数字人定制任务
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
服务处理。 详细操作如下所示: 访问华为云官网。 选择“开发者 > 开发支持”,进入“开发者在线提单”界面。 单击“开发业务”区域的“数字内容生产线MetaStudio”,进入“开发者在线提单”页面。 请根据界面,输入相应的问题描述和个人联系方式等信息。 单击“提交问题”。 服务会在收到问题单后,联系您处理。
这个配音,点击进行转换,然后稍作等待,大家就能听到熟悉的声音。 同样,我们再来试试语音转文字,将我们的视频拖入视频轨道,选中它,找到我们的语音转文字功能,同样转换的速度也是很快。 我们这里是支持字幕一键同步及srt字幕的导出。 聊了这么多功能,相信大家都很关心价格问题,今天年度会员269元,折下来只需要22