检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
配置特殊词表 支持全局设置多音字或者别名,设置完成后,所有视频草稿自动生效。 操作步骤 登录MetaStudio控制台。 在左侧导航栏中,单击“我的创作”。 选择“声音”页签,单击界面右侧的“特殊词表”,进入如图1所示的界面。 图1 特殊词表 单击“新建词表”,界面新增一行特殊词,如图2所示。
品。 支持多选,支持添加新类别。 产品素材 合成商品的素材。 包括如下内容: 贴图:从本地选择图片。 视频:从本地选择视频文件。 文本:手工输入文本内容。 音频:从本地选择音频文件。 单击“创建”,界面提示“创建成功”。 在“商品管理”页面,新增一行商品。 支持对商品执行如下操作:
音频经过人工安全审核和授权认证后,由训练人员标注用于训练的音频数据,使用深度学习算法训练生成数字人声音模型。 推理阶段: 用户上传一段文本作为输入文本内容,由系统自动审核。 输入文本使用数字人声音模型推理生成数字人语音。 算法应用场景 分身数字人声音制作算法可以应用于数字人语音合成。在新闻播报、课
选择“闲聊语料”类别,在右侧界面,单击“新建”,弹出“新建知识”对话框。 请根据实际情况输入问答内容,配置示例如图6所示。其中,“答案”必须选择“纯文本”。 图6 新建知识 设置完成后,单击“确定”。一条语料新增完成。 方式二:批量导入问题类别及其语料。 用户也可以使用批量导入的方式,一次
docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图5和图6所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大模型会理解文档库文档的内容,重新组织语言来回答问题,不会完全按照问答对提供的答案去答复。 图4 知识基本信息 图5
服务支持的字体 MetaStudio制作视频添加的字幕,视频画面中的文本信息都涉及字体。目前MetaStudio服务支持的字体及语言类型如表1所示。 表1 服务支持的字体说明 字体名称 支持的语言类型 Adelle_Sans_Global Adelle_Sans_Global_Bold
说明 分段设置 选择文字分段的方式。 包含如下选项: 自动分段:自动对文档进行分段处理。单击“自动分段”,“分段预览”区域会展示自动分段后的文本效果。 手动分段:自定义分隔符和分隔长度的方式,对文档进行分段处理。 索引配置 配置索引的类型。 包含如下选项: 标准版 高配版 单击“保存”。
082f37118098b CertUtil: -hashfile 命令成功完成。 参考表1,下载SDK安装包完整性校验文件至本地。 使用文本编辑器打开完整性校验文件,查看文件中的SHA256值和2中生成的SHA256值是否一致。 如果一致,说明SDK安装包下载过程中,不存在篡改和丢包现象。
参数类型 描述 text_type 否 String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context 否 String 文本。 font_name 否 String 参数解释: 字体。当前支持的字体:
参数类型 描述 text_type 否 String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context 否 String 文本。 font_name 否 String 参数解释: 字体。当前支持的字体:
在MetaStudio控制台创建技能前,需要参考如下表格,在本地使用Excel文件,准备好技能问答对内容。 表1 智能交互问答对参考 序号 主题 所有问法 文本答案(2048) 关键词 1 自动驾驶的优势 自动驾驶的优势 自动驾驶领域有哪些优势,如何帮助客户快速构建安全合规的自动驾驶研发平台 满足
参数类型 描述 text String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
参数类型 描述 text_type String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context String 文本。 font_name String 参数解释: 字体。当前支持的字体:
thumbnail_url String 缩略图路径。 表8 ProductTextInfo 参数 参数类型 描述 title String 文本标题 text String 文本 表9 ProductMediaDetailInfo 参数 参数类型 描述 asset_id String 资产ID asset_type
thumbnail_url String 缩略图路径。 表6 ProductTextInfo 参数 参数类型 描述 title String 文本标题 text String 文本 表7 ProductMediaDetailInfo 参数 参数类型 描述 asset_id String 资产ID asset_type
参数类型 描述 text_type 否 String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context 否 String 文本。 font_name 否 String 参数解释: 字体。当前支持的字体:
参数类型 描述 text_type String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context String 文本。 font_name String 参数解释: 字体。当前支持的字体:
用户与数字人进行智能交互的页面,默认为用户需要自定义富媒体的展示效果,即用户自定义UI界面展示。 通过注册事件通知semanticRecognized获取回复文本,用户可以自行提取图片、视频标签进行自定义显示。 父主题: 智能交互
参数类型 描述 text_type 否 String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context 否 String 文本。 font_name 否 String 参数解释: 字体。当前支持的字体:
单击热词后面的问号图标,在提示框中单击“查看教程”,可以查看配置视频。 如果开启热词配置,需要同时配置下述参数: SIS服务授权:SIS服务用于将用户口述音频转换为文本,需要开启授权。 详细操作如下所示: 开启“SIS服务授权”,弹出“SIS服务授权”对话框。 单击“同意授权”,MetaStudio服务会自动在“统一身份认证服务