-
数字内容生产线 MetaStudio - 数字内容生产线 MetaStudio
使用窗口捕获方式开播 00:51 6.使用窗口捕获方式开播 视频直播 直播高级配置策略 02:07 7.直播高级配置策略 视频直播(英文) 视频直播全流程 01:46 视频直播英文界面全流程演示 视频制作 视频制作全流程 02:27 视频制作全流程演示 智能交互(科大讯飞) 智能交互全流程 03:17
-
创建角色 - 数字内容生产线 MetaStudio
输入有效手机号和验证码,或者通过密码方式登录。 图1 数字人工作台 单击“登录”,进入数字人工作台“创建角色”页面,如图2所示。 界面右侧有“创建角色”入口,下方的“角色中心”区域展示系统预置的角色,可以直接克隆使用。 图2 创建角色 单击“创建角色”,进入“创建角色”页面,如图3所示。 参数配置说明,如表1所示。
-
SDK概述 - 数字内容生产线 MetaStudio
的快速操作。 在线生成SDK代码 API Explorer能根据需要动态生成SDK代码功能,降低您使用SDK的难度,推荐使用。 您可以在API Explorer中,具体API页面的“代码示例”页签查看对应编程语言类型的SDK代码,如图1 获取SDK代码示例所示。 图1 获取SDK代码示例
-
概览 - 数字内容生产线 MetaStudio
避免穿着与绿幕颜色相近的服饰,避免衣服上带绿色图案。 不佩戴可能反光的金属耳饰、手链和手表。 体态动作 面带微笑。头部自然摆动,动作自然,避免幅度过大。做完动作后,手部需返回至初始位置。未说话时,请保持嘴巴闭合状态。 录制台本 - 提前准备中文或英文台本,并建议使用提词器,以确保阅读流畅
-
关联租户 - 数字内容生产线 MetaStudio
成为SP用户时,提供的项目ID所在Region保持一致。 租户名称:输入自定义租户名称,方便SP用户识别租户身份即可。 图2 关联租户 单击“创建”,租户创建完成,如图3所示。 图3 租户列表 如需取消关联,可单击右侧的“取消关联”,在弹出的“取消关联租户提示”对话框中,单击“确定”。
-
修改热词记录 - 数字内容生产线 MetaStudio
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 sis_hot_words 是 UpdateSisHotWords object sis类型热词 表4 UpdateSisHotWords
-
创建热词记录 - 数字内容生产线 MetaStudio
表3 请求Body参数 参数 是否必选 参数类型 描述 hot_words_type 是 String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 robot_id 是 String 应用ID。 sis_hot_words 是 CreateSisHotWords
-
创建技能 - 数字内容生产线 MetaStudio
如6所示。为方便识别和记忆,两边的技能名称可以设置成一样的。 技能标识:需要与MetaStudio服务新能技能的“技能标识”一致,如6所示。 图8 创建技能 输入完成后,单击“创建”。 界面提示“创建成功”,并自动跳转至“意图”页面,如图9所示。 图9 意图页面 单击“批量操作
-
SDK隐私声明 - 数字内容生产线 MetaStudio
授权所进行的个人信息处理活动的效力。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 对未成年人的保护 您承诺在您开始使用本服务时是成年人。如您是未成年人,则需要您的父母或监护人同意您使用本服务并同意相关服务条款。
-
创建基础版语音训练任务 - 数字内容生产线 MetaStudio
wav~19.wav;文本文件命名规则:0.txt~19.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
-
创建进阶版语音训练任务 - 数字内容生产线 MetaStudio
wav~99.wav;文本文件命名规则:0.txt~99.txt。 语音文件和文本文件逐句上传:每次上传一句语料的语音文件和文本文件,再调用“确认在线录音结果”接口确认语音和文本内容是否一致。确认成功后再上传和确认下一句。 文件上传后,调用“提交语音训练任务”接口,启动审核和训练。 调用方法
-
查询语音训练任务列表 - 数字内容生产线 MetaStudio
create_since 否 String 过滤创建时间>=输入时间的记录。 state 否 String 任务状态,默认所有状态。 可多个状态查询,使用英文逗号分隔。 如state=FAILED,WAITING job_id 否 String 任务id。 voice_name 否 String
-
查询配置热词记录详情 - 数字内容生产线 MetaStudio
热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId
-
产品优势 - 数字内容生产线 MetaStudio
数字人升级迭代快,提升产品竞争力 口型精准:口型匹配度>95%,多语种无缝切换,泛化能力强。 表情自然:通过AI眼神矫正,矫正前后眼部ID一致,避免眼神不聚焦。 图像真实:智能重打光,背景融合更真实。 多种复杂场景建模:支持人物走动、侧身等训练,肢体动作更自然。 多语言泛化:一次母语训练,多语种支持;支持20+语种,覆盖主流语言。
-
查询热词记录列表 - 数字内容生产线 MetaStudio
热词记录ID。 robot_id String 应用ID。 hot_words_type String 热词类型。 说明: SIS:使用的语音识别服务为SIS时选此类型 vocabulary_id String 热词ID(sis中配置)。 sis_project_id String SIS服务所在区域projectId
-
营销宣传风格文案(100句) - 数字内容生产线 MetaStudio
智能机器人还可以与智能烤箱、智能冰箱等,实现更加智能化的烹饪模式。 智能机器人可以根据您的口味和需求,自动烹饪美食。 智能机器人可以通过识别您所使用的食材,提供有关这些食材的营养信息和食谱建议。 它们还能根据您想要的口味和菜谱,自动添加所需的配料和调味品。 他们还可以根据您的个
-
真人声音录制 - 数字内容生产线 MetaStudio
割,自动进行文本识别。 方式二:使用预置语料按句录制 每个音频文件时长约10秒,不能超过15秒,否则会导致声音模型训练失败。 使用预置语料,创建声音制作任务的时候,必须选对声音标签。并将所有音频文件压缩成一个zip文件,示例如图1所示。系统会自动匹配预置文本。 图1 音频压缩文件示例
-
提交语音训练任务 - 数字内容生产线 MetaStudio
String 音色名称。该名称会作为资产库中音色模型资产名称。 language 否 String 训练语言,当前仅支持中文。 CN: 中文 EN: 英文 phone 否 String 手机号 app_user_id 否 String 第三方用户id 响应参数 状态码: 400 表4 响应Body参数
-
SDK合规使用指南 - 数字内容生产线 MetaStudio
应的系统权限并向用户告知征得其同意。 权限 权限描述 使用目的 获取麦克风权限 获取浏览器的麦克风设备权限 开始语音交互时,用于进行语音识别文字,获取交互答案 四、延迟初始化要求 为了避免您的应用在未获取用户的同意前SDK提前处理用户的个人信息。我们提供了智能交互任务创建接口cr
-
查询语音训练任务详情 - 数字内容生产线 MetaStudio
状态码: 200 表3 响应Body参数 参数 参数类型 描述 job_type String 训练类型。 LLM_MAJOR: 大模型中英文版 LLM_MINOR: 大模型中小语种版 BASIC: 基础版(20句话) MIDDLE: 进阶版(100句话) ADVANCE: 高级版