正在生成
详细信息:
检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
speechRecognized的流式返回是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值
示例:科技。 筛选条件 支持通过背景图片来源的维度,筛选展示下方的图片。 图片列表 默认展示全量图片。选中场景,单击图片,可以替换当前场景的背景。 第一张图为透明背景,单击透明背景后,仅智能交互预览页面会替换为透明背景。如果需要透明背景正式生效,还需要设置智能交互SDK的如下参数,任选其一设置即可。
无法保存剧本怎么办? 剧本保存失败时,请您根据界面提示信息进行问题定位及修改。 提示“剧本名称包含非法字符” 请您根据要求修改剧本名称中的敏感字符。 提示“包含敏感词汇” 可能是讲解词中包含敏感词汇,去除讲解词中的敏感词汇即可。 提示“演示素材不存在或不可用” 请您检查选择的素材是否已激活。
通过视频抽帧得到单张图片。经过安全过滤,判断是否通过安全筛选,若不通过则不进行数据生成和结果返回操作。 将视频图片输入至算法模型中,将视频图像分割为面部、手部和身体三个区域。 使用深度学习算法,识别面部区域转化为面部表情,识别手部区域转化为手部骨骼驱动数据,识别身体转化为人体骨骼驱动数据。
获取。 响应消息头中X-Subject-Token的值。 Authorization 否 String 使用AK/SK方式认证时必选,携带的鉴权信息。 X-Sdk-Date 否 String 使用AK/SK方式认证时必选,请求的发生时间。 格式为(YYYYMMDD'T'HHMMSS'Z')。
提示模板不可用怎么办? 请根据实际情况判断处理: 如果是自己创建的模板不可用,请检查模板中的资产是否正常,即资产处于激活状态时正常,如果资产取消激活或已删除会导致模板不可用。 如果是分享给我的模板不可用,可能是分享者取消了模板分享,或者模板中的资产状态不正常,即资产已取消激活或被删除。
MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。 图2 直播窗口 图3 确保直播过程不中断的窗口 父主题: FAQ
String 参数解释: 图层类型。 约束限制: 不涉及。 取值范围: HUMAN: 人物图层 IMAGE: 素材图片图层 VIDEO: 素材视频图层 TEXT: 素材文字图层 默认取值: 不涉及 asset_id 否 String 参数解释: 图层所需资产的资产id,外部资产信息无需填写。
OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件 > 设置”,弹出“设置”对话框。 在左侧导航栏中,选择“视频”,检查基础分辨率和输出分辨率的取值是否一致。 如果不一致,需要修改为相同的取值。 图1
MetaStudio控制台超过10分钟不操作,默认会退出登录,导致第三方直播平台的直播画面也中断。需要确保图3的窗口始终是打开的,直播过程中一定不能关闭,这样第三方直播平台的直播才能顺利完成。 图2 直播窗口 图3 确保直播过程不中断的窗口 父主题: 视频直播
本地打开OBS视频采集工具。 在界面下方,选择“混音器”。 图1 OBS工具 单击“桌面音频”区域的图标,在弹出的下拉框中,选择“属性”,弹出桌面音频属性设置对话框,如图2所示。 需要确认这里的“设备”与Windows系统的声音输出设备是否一致。如果不一致,会导致OBS无法成功捕获声音
OBS视频采集工具的基础分辨率和输出分辨率的值需要保持一致。 检查方法如下所示: 本地打开OBS视频采集工具。 在界面上方的导航栏中,选择“文件 > 设置”,弹出“设置”对话框。 在左侧导航栏中,选择“视频”,检查基础分辨率和输出分辨率的取值是否一致。 如果不一致,需要修改为相同的取值。 图1
String 参数解释: 图层类型。 约束限制: 不涉及。 取值范围: HUMAN: 人物图层 IMAGE: 素材图片图层 VIDEO: 素材视频图层 TEXT: 素材文字图层 默认取值: 不涉及 asset_id String 参数解释: 图层所需资产的资产id,外部资产信息无需填写。
String 参数解释: 图层类型。 约束限制: 不涉及。 取值范围: HUMAN: 人物图层 IMAGE: 素材图片图层 VIDEO: 素材视频图层 TEXT: 素材文字图层 默认取值: 不涉及 asset_id String 参数解释: 图层所需资产的资产id,外部资产信息无需填写。
text string 识别结果文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。 speechRecognized通知的流式返回跟seman
定数字或英文的读法。 <sub></sub>标签用于设置当前标记文字的别名,即替代读法。 <prosody></prosody>标签用于控制局部语速。 <word></word>标签用于设置选中文字为连读模式。 MetaStudio包含多种TTS音色,每种音色支持的SSML标签能
视频素材总大小小于1GB。 同时叠加的视频总数量为3,包含互动时配置的视频。 音频格式 音频支持的格式为:MP3、M4A、WAV。 音频要求如下所示: 仅提取单声道音频。 音频素材总大小小于500MB。 图片格式 图片支持的格式为:PNG、JPG、JPEG。 图片要求如下所示: 分辨率最大支持1080P。
String 参数解释: 图层类型。 约束限制: 不涉及。 取值范围: HUMAN: 人物图层 IMAGE: 素材图片图层 VIDEO: 素材视频图层 TEXT: 素材文字图层 默认取值: 不涉及 asset_id 否 String 参数解释: 图层所需资产的资产id,外部资产信息无需填写。
String 参数解释: 图层类型。 约束限制: 不涉及。 取值范围: HUMAN: 人物图层 IMAGE: 素材图片图层 VIDEO: 素材视频图层 TEXT: 素材文字图层 默认取值: 不涉及 asset_id 否 String 参数解释: 图层所需资产的资产id,外部资产信息无需填写。
功能介绍 该接口用于在资产库中添加上传新的媒体资产。可上传的资产类型包括:分身数字人模型、背景图片、素材图片、素材视频、PPT等。 资产类型是IMAGE时,通过system_properties来区分背景图片(BACKGROUND_IMG)、素材图片(MATERIAL_IMG)。 资