检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
在使用通用实体抽取工作流开发应用之前,您需要提前准备用于模型训练的数据,上传至OBS服务中。 设计实体标签 首先需要确定好文本实体的标签,即希望抽取出文本的一种结果。例如“时间”、“地点”、“人物”等。 数据集要求 文件格式要求为txt或者csv,且编码格式为“UTF-8”格式,文件大小不能超过8MB。 txt文件编码保存为“UTF-8”格式:
确认信息后,单击“开始训练”。 图1 模型训练 模型训练一般需要运行一段时间,等模型训练完成后,“应用开发>模型训练”页面下方显示训练详情。 查看训练详情 模型训练完成后,可在“开发应用>模型训练”页面查看“训练详情”。 图2 训练详情 父主题: HiLens安全帽检测技能
在“我的应用”页签下,选择已创建的应用,单击操作列的“查看”。 默认进入“应用总览”页签。 您可以在“应用总览”页查看应用开发、更新应用版本;也可以切换页签,查看应用资产(数据集)、应用监控。 图1 应用总览 查看应用开发配置 在“应用总览”页签,在开发版本列表选择工作流版本,单击“操作”列的“查看”,进入应用开发页
保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 训练分类器的数据集要求将图片放在一个目录里,并压缩成zip文件,文件大小不应大于10M。 进入应用开发页面 登录“ModelArts Pro>文字识别套件”控制台。
G、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 进入应用开发页面 登录“ModelArts Pro>文字识别套件”控制台。 默认进入“应用开发>工作台”页面。 在“我的应用”页签下,选择应用并单击“操作”列的“查看”。 进入“应用资产”页面。
文件放置方式请按照“单品文件夹/单品图”或者“父文件夹/单品文件夹/单品图”的组织方式。 为了保证智能标注效果,建议每个SKU,即每种类别商品的图片大于20张。一次上传文件大小不能超过10M。 后续会把SKU图片保存至OBS,需要提前创建用于存储数据的OBS桶及文件夹,且数据存储的OBS桶与ModelArts
侧会显示预测结果。 查看历史版本 在“应用监控”页面,您可以查看当前应用所部署的不同版本信息,包括“更新时间”、“更新状态”、“对应应用版本”、“分流(%)”、“计算节点规格”和“计算节点个数”。 图2 历史版本 查看调用指南 在“应用监控”页面,您可以查看调用应用API的信息。
图3 在线测试 查看历史版本 在“应用监控”页面,您可以查看当前应用所部署的不同版本信息,包括“更新时间”、“更新状态”、“对应应用版本”、“分流(%)”、“计算节点规格”和“计算节点个数”。 图4 历史版本 查看调用指南 在“应用监控”页面,您可以查看调用应用API的信息。
参数范围[30,100]。 确认信息后,单击“训练”。 模型训练一般需要运行一段时间,等模型训练完成后,“模型训练”页面下方显示查看训练详情。 查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“交并比变化情况”和“损失变化”。 图1 模型训练 模型如何提升效果
“车辆场景”:可选“城市场景”和“工地场景”。 单击“训练”。 模型训练一般需要运行一段时间,等模型训练完成后,“开发应用>模型训练”页面下方显示查看训练详情。 查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“损失变化”。 图2 模型训练 模型如何提升效果
括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。 多模板工作流 保证图片质量:不能有损坏的图片;目前支持的格式包括JPG、JPEG、PNG、BMP。 图片最大边不大于4096px,最小边不小于100px,且大小不超过4M。
“训练轮次”指模型训练中遍历数据集的次数。 确认信息后,单击“开始训练”。 模型训练一般需要运行一段时间,等模型训练完成后,“模型训练”页面下方显示训练详情。 查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“误差变化”。 图2 训练详情 模型如何提升效果
“语种”指文本数据的语言种类。 确认信息后,单击“开始训练”。 模型训练一般需要运行一段时间,等模型训练完成后,“模型训练”页面下方显示训练详情。 查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“误差变化”。 图2 训练详情 模型如何提升效果
盖参照字段。 参照字段是文字内容、位置固定不变的文本框区域。 参照字段为单行文本框,不可以框选竖版文字或跨行框选。 框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片的四周。 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。
过程、设置当前版本、删除数据集版本。 查看数据集演进过程 在数据集“版本管理”页面,您可以查看数据集的基本信息,并在左侧查看版本及其发布时间。 图2 查看数据集版本 设置当前版本 在“版本管理”页面中,选择对应的数据集版本,在数据集版本基本信息区域,单击“设置为当前版本”。设置完
训练速度及模型优化效果。 确认信息后,单击“开始训练”。 模型训练一般需要运行一段时间,等模型训练完成后,“模型训练”页面下方显示训练详情。 查看训练详情 模型训练完成后,可在“模型训练”页面查看“训练详情”,包括“准确率变化情况”和“误差变化”。 图2 训练详情 模型如何提升效果
盖参照字段。 参照字段是文字内容、位置固定不变的文本框区域。 参照字段为单行文本框,不可以框选竖版文字或跨行框选。 框选参照字段个数须建议大于4个,越多越好,并尽量分散在图片的四周。 参考字段尽量沿着文字边缘框选,精确框住对应文本行为佳。 核对右侧“框选参照字段”中的参照字段是否与框选的参照字段一致。
<filename>bike_1_1593531469339.png</filename> <source> <database>Unknown</database> </source> <size> <width>554</width>
通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图2 开发版本列表 父主题: 自然语言处理套件
通过详细评估中的错误识别示例,有针对性地扩充训练数据。 后续操作 更新版本后,您可以在“应用详情”页的开发版本列表查看当前应用各个版本的“版本名称”、“进展”、“模型精准率”、“模型召回率”、“F1值”、“更新时间”和可执行的“操作”。 图2 开发版本列表 父主题: 视觉套件