AI开发平台MODELARTS-OBS目录导入数据规范说明:文本分类
文本分类
文本分类支持导入“txt”和“csv”两种文件类型,文本的编码格式支持“UTF-8”和“GBK”。
文本分类的标注对象和标注文件有2种存放模式。
- ModelArts text classfication combine 1.0:文本和标注合并,文本分类的标注对象和标注内容在一个文本文件内,标注对象与标注内容之间,多个标注内容之间可分别指定分隔符。
- ModelArts text classfication 1.0:文本和标注分离,文本分类的标注对象和标注文件均为文本文件,并且以行数进行对应,如标注文件中的第一行表示的是标注对象文件中的第一行的标注。
例如,标注对象“COMMENTS_20180919_114745.txt”的内容如下所示。
手感很好,反应速度很快,不知道以后怎样 三个月前买了一个用的非常好果断把旧手机替换下来尤其在待机方面性能好 没充一会电源怎么也会发热呢音量健不好用回弹不好 算是给自己的父亲节礼物吧物流很快下单不到24小时就到货了耳机更赞有些低音炮的感觉入耳很紧不会掉棒棒哒
标注文件“COMMENTS_20180919_114745_result.txt”的内容。
positive negative negative positive
此数据格式要求将标注对象和标注文件存储在同一目录,并且一一对应,如标注对象文件名为“COMMENTS_20180919_114745.txt”,那么标注文件名为“COMMENTS _20180919_114745_result.txt”。
数据文件存储示例:
├─dataset-import-example │ COMMENTS_20180919_114732.txt │ COMMENTS _20180919_114732_result.txt │ COMMENTS _20180919_114745.txt │ COMMENTS _20180919_114745_result.txt │ COMMENTS _20180919_114945.txt │ COMMENTS _20180919_114945_result.txt
- ModelArts推理部署_OBS导入_模型包规范-华为云
- ModelArts是什么_AI开发平台_ModelArts功能
- ModelArts数据管理_数据管理功能简介_数据集管理
- MySQLdump导入数据库_MySQL建立数据库_MySQL数据库导出
- ModelArts推理部署_模型_AI应用来源-华为云
- GaussDB数据库授权_GaussDB授权说明_高斯数据库授权-华为云
- GaussDB如何建主键_数据库索引设计规范_高斯数据库如何建主键-华为云
- ModelArts推理部署_纳管Atlas 500_边缘服务-华为云
- 文件存储与块存储的区别_免费的文件存储_分布式文件存储系统
- 华为云ModelArts_ModelArts开发_AI全流程开发