检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
人都能成为专业的主播。 智能互动问答:基于盘古大模型能力,和直播间观众智能互动,大幅提升直播体验和商业转化率。 基于上述先进的技术,华为云MetaStudio打造的数字人直播服务,已经广泛地应用到了千行百业,通过AI数字人辅助,让每个人都能成为专业的主播。以下是几个行业案例: 信
r/jobs/{job_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 job_id 是 String 任务id。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
smart-live-jobs 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 room_id 是 String 剧本ID。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
String 一段描述信息,会呈现在资产库中。 sex 否 String 语音性别,是男性声音还是女性声音。 FEMALE: 女性 MALE: 男性 默认取值: FEMALE voice_name 是 String 音色名称。该名称会作为资产库中音色模型资产名称。 language
以提升教学质量。通过减少对人力的依赖,使教育机构可以将更多精力投入到创新和教学内容的优化上,从而实现更高效的教育体系。 医疗健康 医学科普是近年来政策倡导的一大方向。通过医学科普,对改善已患病人群的术后身心健康等问题起着关键作用。以视频形式为患者提供诊前、诊中、诊后的医学科普服务
PROCESSING:直播任务运行中。 PLAY_PAUSE:数字人暂停说话,保持静默状态。 TAKE_OVER:真人接管中。 PLAY_END:直播任务结束。 主播端可以发送直播控制指令。 代码示例如下所示: { "message_type" : "live_control", "command"
String 一段描述信息,会呈现在资产库中。 sex 否 String 语音性别,是男性声音还是女性声音。 FEMALE: 女性 MALE: 男性 默认取值: FEMALE voice_name 是 String 音色名称。该名称会作为资产库中音色模型资产名称。 language
String 一段描述信息,会呈现在资产库中。 sex 否 String 语音性别,是男性声音还是女性声音。 FEMALE: 女性 MALE: 男性 默认取值: FEMALE voice_name 是 String 音色名称。该名称会作为资产库中音色模型资产名称。 language
表13 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制:
稿四:春江花月夜 《春江花月夜》是唐代诗人张若虚的代表作之一,以下是《春江花月夜》的原文以及解析。 原文: 春江潮水连海平,海上明月共潮生。 滟滟随波千万里,何处春江无月明! 江流宛转绕芳甸,月照花林皆似霰; 空里流霜不觉飞,汀上白沙看不见。 江天一色无纤尘,皎皎空中孤月轮。 江畔何人初见月?江月何年初照人?
参数 是否必选 参数类型 描述 job_tag 是 String 任务标签,为Flexus版声音的配置。 ECOMMERCE: 电商 NEWS: 新闻 MARKETING: 营销 sex 是 String 语音性别,是男性声音还是女性声音,为Flexus版声音的配置。 FEMALE:
backup_model_asset_ids Array of strings 参数解释: 主播轮换时备选主播数字人资产ID(仅形象资产,不包含声音)。 约束限制: 不涉及 取值范围: 当前最大支持5个备选主播。 数字人资产ID,字符长度0-64位。 默认取值: 不涉及 live_event_callback_config
什么是数字内容生产线 数字内容生产线(MetaStudio)解决方案,提供数字人视频与直播、智能交互等服务,使能千行百业场景应用。 应用场景 教育:数字人课件制作、虚拟老师教学。 政府及公共事业:数字人代言、数字人宣讲、数字人会议等。 医疗健康:智能医疗客服、虚拟医生培训等。 金
表13 TextConfig 参数 是否必选 参数类型 描述 text 是 String 参数解释: 台词脚本。支持两种模式,纯文本模式和标签模式。 纯文本模式:使用方法,如“大家好,我是人工智大家,是个虚拟主播”。 标签模式:SSML标签的详细定义请参考文本驱动SSML定义。 约束限制:
路数就是并发数,是视频直播同时执行的任务数量。需要几路并发,就买几路。如果已开通按需计费,当并发任务数超出已购买路数时,超出的路数自动走按需结算,费用从当前账户余额中扣除。 按需计费 包年/包月 分身数字人智能交互 支持购买多路,每路按时长计费。 须知: 智能交互中数字人分身的动作是根据数
对接第三方大脑,通过数字人交互的方式与用户进行问答。场景应用广泛,包括智能导购、文旅导览、智能问答、营业厅客服等。 注意: 数字人回答的内容,是由对接的第三方大模型或知识库返回的答案决定的。 资产管理 支持从本地上传模型、PPT、动画、素材、视频、场景、图片、音乐等资产。 支持转移声音和模型资产给其他租户使用。
形象授权签署文件,如授权书所示。 操作步骤 登录MetaStudio控制台。 单击“分身形象制作”下方的“开始创建”,进入分身形象制作页面。 界面左侧是定制分身数字人的数据上传界面。 界面右侧上方,展示分身数字人定制流程。下方展示训练视频拍摄指导和样例视频,包括:拍摄前准备、拍摄中操作和拍摄
请注意,分身数字人形象制作的效果与您的录制效果有较大关联,为了获取更好的数字人效果,我们建议您使用以下标准进行拍摄。 拍摄时勿启用HDR模式(部分拍摄设备有此选项)。 以下是数字人拍摄标准概览,但是我们也建议您详细阅读每一块具体内容: 拍摄规格 视频总时长5分钟,分辨率和帧率为4K/25fps或以上,格式为MP4/MOV。
描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 room_id 是 String 智能交互对话ID,获取方法请参考创建智能交互对话直播间。 表2 Query参数 参数 是否必选 参数类型 描述 robot_id 是 String 应用ID,获取方法请参考创建应用。
_id} 表1 路径参数 参数 是否必选 参数类型 描述 project_id 是 String 项目ID,获取方法请参考获取项目ID。 room_id 是 String 剧本ID。 job_id 是 String 任务ID。 请求参数 表2 请求Header参数 参数 是否必选