检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
需要在训练开始前,修改llm_train/AscendFactory/yi/3_training.sh文件,并添加--tokenizer-not-use-fast参数。修改后如图1所示。
convert_mg2hf_at_last 1 Megatron格式权重转换为HuggFace格式权重,如不 num_train_epochs 5 表示训练轮次,根据实际需要修改。一个Epoch是将所有训练样本训练一次的过程。 train-iters 10 非必填。
training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。
training_job_id 是 String 训练作业ID。获取方法请参见查询训练作业列表。 请求参数 表2 请求Body参数 参数 是否必选 参数类型 描述 tags 是 Array of TmsTag objects TMS标签列表。
'recordDomain' => '', //存放录音文件的域名(仅语音回呼场景携带) 'recordFileDownloadUrl' => '', //录音文件下载地址(仅语音回呼场景携带) 'ttsPlayTimes' => 0
资源和成本规划 该解决方案主要部署如下资源,不同产品的花费仅供参考,具体请参考华为云官网价格,实际以收费账单为准: 表1 资源和成本规划(按需计费) 华云服务 配置示例 每月预估花费 语音交互服务 区域:华北-北京四 计费模式:按需计费 涉及服务:录音文件识别 录音文件识别:2.5
预训练数据处理 训练前需要对数据集进行预处理,转化为.bin和.idx格式文件,以满足训练要求。
训练的权重转换说明 以llama2-13b举例,使用训练作业运行0_pl_pretrain_13b.sh脚本。脚本同样还会检查是否已经完成权重转换的过程。 如果已完成权重转换,则直接执行预训练任务。
语音验证码代码样例 Node.js Java Python PHP C# 父主题: 线下开发
node_count Integer 训练作业选择的资源副本数。 pool_id String 训练作业选择的资源池ID。 flavor_detail FlavorDetail object 训练作业、算法的规格信息(该字段只有公共资源池存在)。
MODEL_NAME llama2-13b 输入选择训练的模型名称。 RUN_TYPE pretrain 表示训练类型。可选择值:[pretrain, sft, lora]。
语音通话如何查看已申请的号码? 在号码订购页面申请号码后,若已下发号码资源,可在号码管理页面查看所申请的号码。 父主题: 号码相关
语音通话控制台访问异常如何处理? 异常现象: 进入控制台一直在转圈圈,不显示。 无法申请语音通话服务(“立即申请”按钮灰色,无法点击)。 添加应用,点击“确定”无反应。 处理建议: 请检查本地网络,确保能正常访问公网。 请参考浏览器兼容性,选择合适的浏览器。
Java 公共要求 代码样例 父主题: 语音通知代码样例
Step1 修改训练超参配置 SFT微调脚本qwen.sh,存放在xxx-Ascend/llm_train/AscendSpeed/scripts/qwen目录下。训练前,可以根据实际需要修改超参配置。
预训练超参配置 本章节介绍预训练前的超参配置,可以根据实际需要修改。 预训练脚本baichuan2.sh,存放在“6.3.904-Ascend/llm_train/AscendSpeed/scripts/baichuan2”目录下。训练前,可以根据实际需要修改超参配置。
流式一句话 功能介绍 流式一句话模式的语音长度限制为一分钟,适合于对话聊天等识别场景。 该接口支持用户将一整段语音分段,以流式输入,最后得到识别结果。实时语音识别引擎在获得分段的输入语音的同时,就可以同步地对这段数据进行特征提取和解码工作,而不用等到所有数据都获得后再开始工作。
result_bucket_name String 是 OBS桶名称,全局唯一,用于存放语音识别结果。取值范围:3~63个字符,支持小写字母、数字、中划线(-)、英文句号(.)。 登录华为云解决方案实践,选择“语音识别解决方案”,单击“一键部署”,跳转至解决方案创建堆栈界面。
启动SD1.5 Finetune训练服务 使用ma-user用户执行如下命令运行训练脚本。 sh diffusers_finetune_train.sh 启动SDXL Finetune训练服务 使用ma-user用户执行如下命令运行训练脚本。
语音交互服务是否支持私有化部署 目前语音交互服务暂不支持私有化部署。 父主题: 部署类