检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
最佳实践 配置Edge插件JVM参数
表1 评估策略参数说明 参数 子参数 说明 购买区域 - 选择在华为云购买资源的区域。推荐您选择靠近目标用户的区域,可以减少网络时延,提高访问速度。 推荐策略 匹配源端规格 根据源端规格推荐最合适的华为云对应资源规格。 如果是通过手动添加或内网发现获取的源端主机,则将X实例,通用
均用量为2,即月均用量=资源个数, 资源总用量=月均用量 x 账单月数 x 720。 月均用量的概念形成主要是为了方便购买方式转换时的价格计算,因为当购买方式变化时,不能直接从单价比较,需要将单价和使用时长进行规范化转换,才能形成合理的比较。 折算价格 源端的折算价格为:账单所示支付价格(折扣后)
而避免了数据丢失或不一致的风险。 校验方式说明 全量校验:全量对比所有数据,适用于需要对比历史数据的场景。 日级增量校验:依靠元数据中的创建或更新时间,获取数据变化(增量)分区,再进行校验。支持单日或连续多日增量数据的统计,是最常用的校验方式。 小时级增量校验:依靠元数据中的创建
默认创建名称为“Doris-4位随机数(字母和数字)”,也可以自定义名称。 Doris凭证 选择在Edge添加的源端Doris凭证。凭证的添加方式请参考添加资源凭证,类型选择“大数据-Doris”。 数据库地址 填写连接到源端Doris集群部署的服务器IP地址。 数据库端口 填写连接
口。 勾选需要迁移的桶,单击操作列的“修改”,调整桶的迁移方式,迁移方式说明参见表2。勾选并调整完成后,单击“确认”。 所选的资源必须都来源于基础配置所选的源端平台。 最多添加 100 个桶。 表2 迁移方式说明 迁移方式 说明 全量迁移 迁移源端桶/文件夹内的全部数据。 列表迁移
MgC自定义策略 如果系统预置的MgC权限,不满足您的授权要求,可以创建自定义策略。 目前华为云支持以下两种方式创建自定义策略: 可视化视图创建自定义策略:无需了解策略语法,按可视化视图导航栏选择云服务、操作、资源、条件等策略内容,可自动生成策略。 JSON视图创建自定义策略:可
”,也可以自定义名称。 迁移工具 选择在源端环境中部署的迁移工具Edge。 Doris凭证 选择在Edge添加的Doris凭证。凭证的添加方式请参考添加资源凭证,类型选择“大数据-Doris”。 数据库地址 填写连接到Doris集群部署的服务器IP地址。 数据库端口 填写连接到D
执行校验。需要注意任务配置中的表组,选择步骤步骤16.创建的表组。 任务类型请选择大数据组件中的“Hive”。 统计方式按实际需求选择,各统计方式说明请参见校验方式说明。 当源端与目的端的统计任务都执行完成后(实例状态为“已完成”),在校验结果页面可以查看并导出任务的执行结果,方法请参考查看并导出校验结果。
数为必填参数。 配置完成后,单击“确认”按钮,采集任务创建完成。在任务列表中可以查看任务的数据源采集状态。 数据源采集成功后,可以通过如下方式获取采集结果: 单击任务操作列的“下载json”,将采集结果保存为json文件,用于将采集结果导入MgC进行应用关联分析,详情请参考导入工具采集结果。
查看元数据 您可以通过创建采集任务、手动添加、导入模板等方式获取元数据库表清单。 通过采集任务获取元数据 创建采集任务的方法请参考创建并运行元数据同步任务。当元数据同步任务的实例状态为“已完成”且采集结果有数值时,在库表清单页签可以查看采集到的元数据列表。 手动添加数据表 登录迁移中心管理控制台。
任务名称 用户自定义。 云厂商 选择源端云厂商。 说明: 当前源端云厂商仅支持AWS和阿里云。 区域 选择源端资源所在区域。 调研方式 “AK/SK”方式,需要选择“凭证”、“对比时间段”和“对比产品”,如未提前添加凭证,请单击“新建凭证”,填写相应参数,校验并保存凭证。 说明:
行校验。需要注意任务配置中的表组,选择步骤步骤16.创建的表组。 任务类型请选择大数据组件中的“Doris”。 统计方式按实际需求选择,各统计方式说明请参见校验方式说明。 当任务执行完成后(实例状态为“已完成”),在校验结果页面可以查看并导出任务的执行结果,方法请参考查看并导出校验结果。
UNT,请根据实际情况选择。 - 迁移方式 选择迁移方式。 全量迁移:迁移源端文件存储服务地址+路径内的全部数据。 列表迁移:通过列表文件过滤迁移,只迁移列表文件中的对象。 - 列表路径 迁移方式选择列表迁移时,填写列表文件所在路径。迁移方式选择全量迁移时,无需填写。 列表文件需要满足如下要求:
16.创建的表组;执行机连接选择步骤20.创建的MRS执行机连接。 任务类型请选择大数据组件中的“Hive”。 统计方式按实际需求选择,各统计方式说明请参见校验方式说明。 当任务执行完成后(实例状态为“已完成”),在校验结果页面可以查看并导出任务的执行结果,方法请参考查看并导出校验结果。
MgC:部署在云上,主要包含六个业务功能(问卷&TCO对比、在线采集、应用关联分析、在线评估、资源分组、迁移编排),通过基于服务开发服务,基于服务运维服务的方式进行设计。 Edge:部署在客户的网络中,用来保存凭证等敏感资源和操作租户本地部署的资源。可以接收MgC的命令和上报命令执行结果。 图1 MgC逻辑架构图
行校验。需要注意任务配置中的表组,选择步骤步骤16.创建的表组。 任务类型请选择大数据组件中的“HBase”。 统计方式按实际需求选择,各统计方式说明请参见校验方式说明。 当任务执行完成后(实例状态为“已完成”),在校验结果页面可以查看并导出任务的执行结果,方法请参考查看并导出校验结果。
“-Infinity”(表示无限小)。这些值并不是有效的数字,因此在进行数值转换或计算时,可能会引发异常。 在校验过程中,Hive和Spark对这些无法表示的数值有默认的处理方式: 当数值为 Infinity 或 -Infinity 时,会被默认处理并显示为 -1。 当数值为 NaN(Not a Number,非数字)时,会被默认处理并显示为
填写登录用户名对应的密码。 username 否 auth参数值为“2”或“3”时,填写Kafka登录用户名。 auth 是 Kafka认证方式。 0表示无认证 1表示PLAINTEXT认证 2表示SASL_PLAINTEXT认证 3表示SASL_SSL认证 endpoint 是 填写Kafka连接地址。例如:127
SV文件,本节介绍将CSV文件的编码格式修改UTF-8编码的方法。 方法一(适用于Windows操作系统) 选择csv文件,鼠标右键,打开方式选择“记事本”。 在记事本窗口左上角选择“文件 > 另存为”,在弹出的“另存为”窗口中,找到编码下拉菜单,选择“UTF-8”,然后保存即可。