检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
参数类型 描述 text_type 否 String 参数解释: 文本类型。 DYNAMIC:动态文本,需要进行关键字替换。 STATIC:静态文本。 默认取值: DYNAMIC text_context 否 String 文本。 font_name 否 String 参数解释: 字体。当前支持的字体:
sis服务所在区域 取值范围: 0-32 language 否 String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN: 中文 EN: 英文 请求参数 表3 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
影响。 国际社会通过发展援助、技术转移和合作项目促进发展, 减少经济、社会和政治不稳定带来的安全风险。 国际社会通过外交和对话机制, 例如国际组织、双边对话、峰会等,加强沟通与协商,解决争端和分歧, 增强相互信任与合作。 最近,国际社会举行了一场重要的反恐安全会议, 各国就恐怖主义问题展开了广泛的讨论,
false is_support_phoneme Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time Boolean 参数解释:
false is_support_phoneme 否 Boolean 参数解释: 该声音是否支持中文多音字。 约束限制: 不涉及 取值范围: true: 支持中文多音字 false: 不支持中文多音字 默认取值: false is_support_break_time 否 Boolean
h Boolean 欢迎词功能开关。 language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 robot_id String 应用ID。 create_time String 创建时间,格式遵循:RFC
支持的格式为:MP3、WAV。 大小不超过20MB,时长不超过5分钟。 文本驱动 文本驱动方式的要求如下所示: 文本输入长度不超过2000字。 通过文本合成的音频时长不能超过5分钟。 在照片数字人制作页面,选择“文本驱动”方式驱动照片说话时,需要输入文本并选择音色,再单击“试听”预估音频时长。如果超过5分钟,会导致照片数字人制作失败。
支持如下两种模式: 纯文本模式 使用纯文本,示例:大家好,我是人工智能小A,是位虚拟主播。 标签模式 标签模式使用SSML(Speech Synthesis Markup Language)标记语言。 需要使用的标签,如下所示: <speak>:此标签为所有文本的根节点。一切需要调
参数类型 描述 text String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
多语言的计费规则? 文本转语音是以字数来计费的,多语言不是计费项,无需另外付费。 自研声音目前只有中英文,声音合成按需计费标准为:¥200.00/百万字,可以在MetaStudio服务概览页面的“声音合成”卡片中查看,如图1所示。 图1 声音合成计费项 第三方声音的计费标准,详见云商店语音合成商品页面的价格表。
pacify_words String 安抚话术。 language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 robot_id String 应用ID。 pacify_words_type Integer
hot_question String 热点问题。 language String 智能交互语言 zh_CN:简体中文(已下线,请使用CN) en_US:英语(已下线,请使用EN) CN:中文 EN:英文 robot_id String 机器人ID。 create_time String 创建时间,格式遵循:RFC
频文件。支持添加为背景视频。 商品:商品列表。需要自定义创建商品,一个商品可以同时包含贴图、视频、文本和音频内容。 文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 直播画面预览窗口,用于预览视频直播静态画面效果。 ③ 直播剧本由多个场景构成,每个场景由多个段落组成。
参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制: 不含SSML标签字符数最长10000个字符。
时需注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。 4 数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。
时需注意,动作生效需要有足够的音频时间,如果音频太短,数字人可能来不及做动作。 4 数字人说话是文本驱动还是语音驱动? 数字人视频制作、视频直播、分身数字人名片和照片数字人都支持文本驱动和语音驱动的方式说话。 5 数字人支持提供语义理解知识库吗? 不提供语义理解知识库。语义理解是知识库的能力,不是数字人的能力。
音频格式支持WAV、MP3,单段音频时长1~5分钟,建议1分钟。语料中的语言仅支持中文和英文。 视频中提取声音:直接提取训练视频中的声音,训练生成Flexus声音。 视频中的语言仅支持中文和英文。 须知:“单独上传语料包”的方式生成Flexus声音的效果会更好。 数字人名称 生成的Flexus数字人名称。
第三十一届世界大学生运动会在成都隆重开幕,市民健康跑迎接大运会。 从中国音乐家发布的数据来看,国内有超过四千万孩子学习钢琴。 近日,中国探月航天形象太空兔正式对外公布名称, 中文名“兔星星”。 据悉,今年上半年,中国造船三大指标全面增长, 造船完工量,新接订单量,手持订单量,三大指标的国际市场份额均为全球第一。 父主题:
控制台自助服务,一站式快速生成所需内容 用户申请账号并上传相关授权,拍摄训练所需音视频素材,上传进行模型训练,生成自定义形象和声音。选择背景、声音、模特等内容,基于文本或语音智能驱动,实现视频制作、视频直播、智能交互等能力。 华为云盘古数字人大模型,赋能千行百业数字化营销新模式 MetaStudio服务依
交互数字人主动播报文本信息。 解决IDE加载TS声明文件报错问题。 2024-11-13 本次变更如下: 新增发布2.1.0版本SDK,相比2.0.3版本,变更点如下所示: 支持文本问答。 startChat新增入参,参考表16,用来设置交互模式(语音问答/文本问答)。 新增接口