检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
是覆盖式返回。后一条通知中的text字段值包含前一条通知的内容。例如:第一条通知的text值为“你吃”,第二条新识别了“饭了么”,则第二条text值为“你吃饭了么”。 semanticRecognized的流式返回是分段式返回。后一条通知中的text字段值与前一条通知的内容是上下
cn-north-4.myhuaweicloud.com/v3.0/OS-USER/users 图1 URI示意图 为方便查看,在每个具体API的URI部分,只给出resource-path部分,并将请求方法写在一起。这是因为URI-scheme都是HTTPS,而Endpoint在同一
单击“保存”,一条互动规则新增完成。 用户可以根据实际情况,为当前互动库增加更多的互动规则,或者增加更多的互动库。 支持对互动规则执行下述操作: 单击互动规则右侧的“编辑”,在弹出的“互动编辑”对话框中修改互动规则。 单击互动规则右侧的“复制”,复制当前互动规则,生成一条新的互动规则。
其次是一条视频的制作周期。 我问过了一些广告团队,他们说正常的一条视频制作周期,最快也得7天。 工作流程可能包括了“脚本制作、模特邀约、道具采购、灯光调试、绿幕布景、排场拍摄、后期剪辑、沟通确认……” 时间作为企业成本之一,另外一个直接的就是费用成本。 按照制作周期里的每个工作流
取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条弹幕规则重复触发的间隔时间,每条规则的触发时间互不影响。 默认值:120。 用户入场触发间隔时间 取值范围[-1,120],单位:秒。 取值含义如下所示: -1:只触发1次。 0:一直触发。 其他数值:同一条达到互动条件的
调整段落在场景中的位置。 :新增1个空白段落。 图3 开播界面 音频驱动 单击“上传音频”,从本地上传已录制好的音频,如图4所示。 每个音频不能超过100M,支持WAV、M4A和MP3格式,每个场景的音频总时长不能低于1分钟。 开播后会直接播放音频,声音是音频原有声音。用户也可以设置主播和助播的声音,用
string 识别结果文本。 resultId number 识别流式响应时返回的各包顺序序号。 isLast boolean 是否是最后一条识别结果。 chatId string 对话ID,每轮问答的ID值唯一。 speechRecognized通知的流式返回跟semantic
”对话框。 请根据实际情况输入问答内容,配置示例如图6所示。其中,“答案”必须选择“纯文本”。 图6 新建知识 设置完成后,单击“确定”。一条语料新增完成。 方式二:批量导入问题类别及其语料。 用户也可以使用批量导入的方式,一次性添加完成问题类别及其所有问答对。操作方式如下所示:
数字人直播首页面。 单击“互动管理”,进入如图3所示的页面。 图3 互动管理页面 在左侧“互动库”区域,单击下方的“新增互动库”,上方新增一条横线,如图4所示。 输入互动库的名称。 图4 互动库 选中左侧的互动库,单击界面右侧的“新建”,弹出“新建互动”对话框,如图5所示。 可以
上传文件。 支持上传TXT,PDF,PPTX,DOCX,XLSX,XLM,MD,HTML,CSV,TSV格式的文件,支持同时上传多个文件,每个文件不能超过20M。 单击“下一步”,进入“文档清洗”页面,如图5所示。 参数配置说明,如表1所示。 图5 文档清洗 表1 参数说明 参数
docx格式说明:可以没有标题和分级标题, 如需添加标题和分级标题,请使用word标准格式,如图5和图6所示。 txt格式说明:文档内容当前仅支持纯文本,一行对应一条知识。 星火大模型会理解文档库文档的内容,重新组织语言来回答问题,不会完全按照问答对提供的答案去答复。 图4 知识基本信息 图5 标题 图6
请求参数“is_stream”取值为“false”时,响应Body体中的参数说明,如表6所示。 表6 非流式响应Body体参数说明 参数 参数类型 描述 id String 每个响应的唯一标识。 created Integer 响应生成时间。 choices Array of ChatChoice objects 生成的文本列表。
obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成100个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~99.wav;文本文件命名规则:0.txt~99.txt。
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
描述 X-Request-Id String 请求ID。 表5 响应Body参数 参数 参数类型 描述 offset Integer 与第一条数据的偏移量 取值范围: 0-2147483647 默认取值: 0 limit Integer 页面大小 取值范围: 1-1000 默认取值:
文本:文本模板列表,可选择一个文本模板,在视频直播画面上添加文本。 ② 直播画面预览窗口,用于预览视频直播静态画面效果。 ③ 直播剧本由多个场景构成,每个场景由多个段落组成。 支持新增、复制场景,并为每个场景设置对应的数字人形象、背景、声音等内容。 支持新增、复制段落,或使用txt格式文本导入剧本,平台自动解析输入内容。
个obs上传地址,用于上传语音文件。 支持2种方式上传语音文件: 语音文件和文本文件打包成zip上传:语音文件已经切分成20个wav文件,每个语音文件对应一个txt文本文件,所有文件打包成zip文件。语音文件命名规则:0.wav~19.wav;文本文件命名规则:0.txt~19.txt。
计费模式,以满足不同场景下的用户需求。 按需计费模式:包含按需和按需预付费套餐包两种计费方式。 按需计费:一种后付费模式,即先使用再付费。每个计费周期分别统计各资源的实际使用量,并根据使用量*单价的方式计算出费用,然后从账户余额中扣除对应金额。 按需预付费套餐包:您也可以通过按需
表情驱动数据格式如何定义? MetaStudio表情驱动的表情基数据总共52个系数,每个系数的取值范围在0~1之间,表情基系数的顺序性定义如下: 序号 表情名称 0 mouthPucker 1 mouthPressLeft 2 mouthPressRight 3 mouthRollUpper