检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
),系统默认展示其通过角色(包含空间权限集、权限集和角色)或权限申请和审批流程所获取的权限。在权限结果中,支持筛选不同的数据源类型,并通过集群名称、库名、schema、表名或列名检索。 图2 查看用户权限 父主题: 数据安全运营
不同区域的资源价格可能有差异,请参见华为云服务价格详情。 如何选择可用区? DataArts Studio实例中的数据集成CDM集群所在可用区。DataArts Studio实例通过数据集成CDM集群与其他服务实现网络互通。 第一次购买DataArts Studio实例或增量包时,可用区无要求。再次购买DataArts
际贸易促进等方面。 在这之前,H公司采用其自建的大数据集群,并安排专人维护,每年固定购买电信联通双线专用带宽,在机房、电力、专网、服务器、运维方面进行高额投入,但其在面对客户不断变化的业务诉求时,因为人员投入不足,大数据集群能力不匹配,而无法聚焦业务创新,使得存量100T的数据只有4%的利用率。
TEXT格式:将整条消息内容作为文本直接同步。 消费组ID:由用户指定,标识当前实时处理集成作业的消费组。 当迁移作业消费DMS Kafka集群某一Topic的消息后,在Kafka集群的“消费组管理”可以看到此处配置的消费组ID、在“消息查询”可以查到消费属性group.id。因为Kafka把消费消息
连接动态变化配置项,每种连接略有区别,建议在界面进行调试。 agent_id 否 String CDM集群ID,获取方法请参见查询集群列表。 agent_name 否 String 代理集群名称,获取方法请参见查询集群列表。 env_type 否 Integer 0:开发模式 1:生产模式,默认为0。
均应保持一致,详细操作请参见创建DataArts Studio数据连接。 创建数据连接时,通过不同的集群来进行开发与生产环境的隔离,如图2所示。 图2 创建数据连接时选择不同集群 配置DLI环境隔离。 配置企业模式环境隔离,包含DLI队列配置和DB配置。 对于Serverless服务(例如DLI),DataArts
Y 编辑数据标准 Y Y N N 数据集成 权限点 管理员 开发者 运维者 访客 新建集群 Y Y N N 删除集群 Y Y N N 操作集群 Y Y Y N 查询集群 Y Y Y Y 编辑集群 Y Y N N 操作连接 Y Y Y N 查询连接 N N N N 操作作业 Y Y
选择已创建的日志组名称,进入该日志组页面。 单击“创建日志流”,在弹出框内,输入日志流名称。 单击“确定”,创建完成。 配置云服务访问日志转储 登录数据服务专享版页面,选择集群,选择日志转储,选择LTS云服务日志。 图2 LTS转储 查看访问日志 当您配置了访问日志,可以查看访问日志的详细信息。 通过“云日志服务
连接动态变化配置项,每种连接略有区别,建议在界面进行调试。 agent_id 否 String CDM集群ID,获取方法请参见查询集群列表。 agent_name 否 String 代理集群名称,获取方法请参见查询集群列表。 env_type 否 Integer 0:开发模式 1:生产模式,默认为0。
维管理,如查看运行状态,对任务进行终止、重跑等操作。 只有支持委托提交作业的MRS集群,才支持对账作业周期调度。 支持委托方式提交作业的MRS集群有: MRS的非安全集群。 MRS的安全集群,集群版本大于 2.1.0,并且安装了MRS 2.1.0.1以上的补丁。 表3 配置周期调度参数
参数类型 描述 project_id 是 String 项目ID,获取方法请参见项目ID和账号ID。 cluster_id 是 String 集群ID。 job_name 是 String 作业名称。 请求参数 表2 请求Header参数 参数 是否必选 参数类型 描述 X-Auth-Token
连接动态变化配置项,每种连接略有区别,建议在界面进行调试。 agent_id 否 String CDM集群ID,获取方法请参见查询集群列表。 agent_name 否 String 代理集群名称,获取方法请参见查询集群列表。 env_type 否 Integer 0:开发模式 1:生产模式,默认为0。
服务,支持自建和云上的文件系统,以及关系数据库,数据仓库,NoSQL,大数据云服务,对象存储等数据源。 数据集成 支持的数据源 创建CDM集群 创建CDM与数据源之间的连接 新建表/文件迁移作业 数据目录(元数据采集) 为了在DataArts Studio对迁移到云上的原始数据层
运行程序参数 否 为本次执行的作业配置相关优化参数(例如线程、内存、CPU核数等),用于优化资源使用效率,提升作业的执行性能。 说明: 若集群为MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此参数。 MRS Hive SQL作业的运行程序参数,请参见《MapRedu
数据开发 数据开发可以创建多少个作业,作业中的节点数是否有限制? DataArts Studio支持自定义的Python脚本吗? 作业关联的CDM集群删除后,如何快速修复? 作业的计划时间和开始时间相差大,是什么原因? 相互依赖的几个作业,调度过程中某个作业执行失败,是否会影响后续作业?这时该如何处理?
API连接时支持为Spark SQL作业独立配置需要的资源(例如线程、内存、CPU核数并指定MRS资源队列等)。代理连接时不支持配置。 若集群为MRS 1.8.7版本或MRS 2.0.1之后版本,需要配置此参数。 MRS SparkSQL作业的运行程序参数,请参见《MapRedu
DataArts无法直接与非全托管服务进行连接,需要提供DataArts Studio与非全托管服务通信的代理。CDM集群可以提供通信代理服务,请选择一个CDM集群,如果没有可用的CDM集群,请先通过数据集成增量包进行创建。 数据集成配置 测试地址 是 测试连通性地址,返回200则视为连接认证成功。
ALTER,INDEX,LOCK,READ,WRITE cluster_id 否 String 集群ID,获取方法请参见查询单个数据连接信息。 cluster_name 否 String 集群名称。 datasource_type 否 String 数据源类型 HIVE数据源 DWS数据源
放的API,这样即可不受每天最多访问1000次的规格限制。 专享版默认发布到数据服务专享版集群上,发布成功后API调用者可以通过内网调用该API。值得一提的是,只有将API发布到专享版集群上,才不存在每天最多可以访问1000次的限制,可自由调用API。 您也可以选择“更多”,将API发布到APIG专享版或ROMA
MRS_MANAGED managed_cluster_id 否 String 纳管角色所在集群id(仅纳管类权限集需要)。 managed_cluster_name 否 String 纳管角色所在集群名称(仅纳管类权限集需要)。 managed_role_name 否 String 纳管角色名称(仅纳管类权限集需要)。