搜索_华为云

示例场景说明 - 数据治理中心 DataArts Studio

Studio服务的数据集成CDM组件、数据开发DLF组件和数据仓库服务（DWS）对电影评分原始数据进行分析，输出评分最高和最活跃Top10电影。您可以学习到数据集成模块的数据迁移和数据开发模块的脚本开发、作业开发、作业调度等功能，以及DWS SQL基本语法。本入门示例涉及DataArts

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 初级版：基于DWS的电影评分数据集成与开发流程
示例场景说明 - 数据治理中心 DataArts Studio

脱敏后）进行分析，输出用户和商品的各种数据特征，可为营销决策、广告推荐、信用评级、品牌监控、用户行为预测提供高质量的信息。在此期间，您可以学习到数据开发模块脚本编辑、作业编辑、作业调度等功能，以及DLI的SQL基本语法。本入门示例涉及DataArts Studio服务的管理中心和数据开发模块，DataArts

帮助中心 > 数据治理中心 DataArts Studio > 快速入门 > 免费版：基于DLI的电商BI报表数据开发流程
开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业在本章节您可以学习到数据开发模块资源管理、作业编辑等功能。场景说明用户在使用DLI服务时，大部分时间会使用SQL对数据进行分析处理，有时候处理的逻辑特别复杂，无法通过SQL处理，那么可以通过Spark作业进行分析处理。本章节通过一个例子演示如何

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据开发 > 使用教程
目的端为OBS - 数据治理中心 DataArts Studio

fieldSeparator 否 String 列分割符号，当“toJobConfig.outputFormat”（文件格式）为“CSV_FILE”时此参数有效，默认值为：“,”。 toJobConfig.lineSeparator 否 String 行分割符号，当“toJobConfig.o

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
源端为HBase/CloudTable - 数据治理中心 DataArts Studio

columnFamilies 否 String 抽取数据所属的列族。 fromJobConfig.columns 否 String 需要抽取的列，列号之间使用“&”分割，列族与列之间用“:”分隔，例如：“cf1:c1&cf2:c2”。 fromJobConfig.isSplit 否 Boolean 选择是否拆分Rowkey，例如“true”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
源端为对象存储 - 数据治理中心 DataArts Studio

columnList 否 String 需要抽取的列号，列号之间使用“&”分割，并由小到大排序，例如：“1&3&5”。 fromJobConfig.regexSeparator 否 Boolean 是否使用正则表达式分割字段，当文件格式为“CSV_FILE”时此参数有效。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
目的端为DDS - 数据治理中心 DataArts Studio

MongoDB/DDS的集合名称。 toJobConfig.columnList 否 String 需要抽取的字段列表，字段名之间使用“&”分割，例如：“id&gid&name”。 toJobConfig.isBatchMigration 否 Boolean 是否为整库迁移。父主题：

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
目的端为HDFS - 数据治理中心 DataArts Studio

lineSeparator 否 String 行分割符号，当“toJobConfig.outputFormat”（文件格式）为“CSV_FILE”时此参数有效，默认值为：“\r\n”。 toJobConfig.fieldSeparator 否 String 列分割符号，当“toJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
源端为HDFS - 数据治理中心 DataArts Studio

当选择“BINARY_FILE”时，目的端也必须为文件系统。 fromJobConfig.columnList 否 String 需要抽取的列号，列号之间使用“&”分割，并由小到大排序，例如：“1&3&5”。 fromJobConfig.lineSeparator 否 String 文件中的换行符，默认自

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
目的端为DLI - 数据治理中心 DataArts Studio

是 String 写入数据的表名。 toJobConfig.columnList 否 String 需要加载的字段列表，字段名之间使用“&”分割，例如：“id&gid&name”。 toJobConfig.shouldClearTable 否 Boolean 导入前是否清空资源队列的数据。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
源端为FTP/SFTP - 数据治理中心 DataArts Studio

regexSeparator 否 Boolean 是否使用正则表达式分割字段，当文件格式为“CSV_FILE”时此参数有效。 fromJobConfig.regex 否 String 正则表达式，当选择使用正则表达式分割字段时，此参数有效。 fromJobConfig.firstRowAsHeader

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
源端为关系数据库 - 数据治理中心 DataArts Studio

columnList 否 String 需要抽取的字段列表，字段名之间使用“&”分割，例如：“id&gid&name”。 fromJobConfig.partitionColumn 否 String 抽取分区字段，依据此字段将作业分割为多个任务并发执行，例如：“id”。 fromJobConfig

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

String 需要抽取数据的列，列号之间使用“&”分割，列族与列之间用“:”分隔，例如：“cf1:c1&cf2:c2”。 toJobConfig.rowKeyColumn 是 String 作为rowkey的列，列号之间使用“&”分割，列族与列之间用“:”分隔，例如：“cf1:c1&cf2:c2”。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 目的端作业参数说明
源端为Redis - 数据治理中心 DataArts Studio

系表的一行数据对应Redis的Value。 fromJobConfig.keySeparator 是 String key分隔符，一般用来分割关系表和主键。 fromJobConfig.valueStoreType 是 String 关系表行数据在Redis中的存储方式分为“string”和“hash”两种存储方式。

帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置Redis目的端参数 - 数据治理中心 DataArts Studio

写入前是否将相同的键删除。否高级属性键分隔符用来分隔关系数据库的表和列名。 _ 值分隔符以STRING方式存储，列之间的分隔符。存储类型为列表时字串分割成数组的字符。 ; key值有效期设置统一的生存时间。单位：秒。 3600 父主题：配置作业目的端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业目的端参数
源端为Hive - 数据治理中心 DataArts Studio

待抽取数据的表名，例如“cdm”。 fromJobConfig.columnList 否 String 需要抽取的列号，列号之间使用“&”分割，并由小到大排序，例如：“1&3&5”。父主题：源端作业参数说明

 帮助中心 > 数据治理中心 DataArts Studio > API参考 > 数据集成API > 附：公共数据结构 > 源端作业参数说明
配置Redis源端参数 - 数据治理中心 DataArts Studio

STRING 高级属性键分隔符用来分隔关系数据库的表和列名。 _ 值分隔符以STRING方式存储，列之间的分隔符。存储类型为列表时字串分割成数组的字符。 ; 字段相同 “值存储类型”选择“HASH”时，显示该参数，是否允许哈希键内有相同的字段。否父主题：配置作业源端参数

 帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 数据集成（离线作业） > 配置作业源端参数
访问DataArts Studio实例控制台 - 数据治理中心 DataArts Studio

Studio新版控制台首页已经上线，您可以通过单击页面上方banner中的“立即体验”进入。新版控制台首页，从功能组件入口升级为集任务处理、资源监控和场景学习于一体的一站式数据工作台，全面为您提升生产效率。图2 旧版控制台首页图3 新版控制台首页

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作
访问DataArts Studio实例控制台 - 数据治理中心 DataArts Studio

Studio新版控制台首页已经上线，您可以通过单击页面上方banner中的“立即体验”进入。新版控制台首页，从功能组件入口升级为集任务处理、资源监控和场景学习于一体的一站式数据工作台，全面为您提升生产效率。图2 旧版控制台首页图3 新版控制台首页父主题：购买并配置DataArts Studio

帮助中心 > 数据治理中心 DataArts Studio > 用户指南 > 购买并配置DataArts Studio
（可选）购买规格增量包 - 数据治理中心 DataArts Studio

Studio实例卡片上通过“更多 > 配额使用量”查看使用量。当您的数据模型数量接近或达到该规格时，建议购买数据模型数量增量包，以避免新建数据模型受限。背景信息不同版本的DataArts Studio实例的规格请参见版本规格说明。您可以在DataArts Studio实例卡片上，通过“更多

 帮助中心 > 数据治理中心 DataArts Studio > 准备工作 > 购买DataArts Studio实例

总条数： 107

点击加载更多

您搜索到想要的结果了吗？

是的没搜到

意见反馈

/200

提交反馈取消

示例场景说明 - 数据治理中心 DataArts Studio

示例场景说明 - 数据治理中心 DataArts Studio

开发一个DLI Spark作业 - 数据治理中心 DataArts Studio

目的端为OBS - 数据治理中心 DataArts Studio

源端为HBase/CloudTable - 数据治理中心 DataArts Studio

源端为对象存储 - 数据治理中心 DataArts Studio

目的端为DDS - 数据治理中心 DataArts Studio

目的端为HDFS - 数据治理中心 DataArts Studio

源端为HDFS - 数据治理中心 DataArts Studio

目的端为DLI - 数据治理中心 DataArts Studio

源端为FTP/SFTP - 数据治理中心 DataArts Studio

源端为关系数据库 - 数据治理中心 DataArts Studio

目的端为HBase/CloudTable - 数据治理中心 DataArts Studio

源端为Redis - 数据治理中心 DataArts Studio

配置Redis目的端参数 - 数据治理中心 DataArts Studio

源端为Hive - 数据治理中心 DataArts Studio

配置Redis源端参数 - 数据治理中心 DataArts Studio

访问DataArts Studio实例控制台 - 数据治理中心 DataArts Studio

访问DataArts Studio实例控制台 - 数据治理中心 DataArts Studio

（可选）购买规格增量包 - 数据治理中心 DataArts Studio

意见反馈

7*24

备案

专业服务

退订

建议反馈

售前咨询热线