检测到您已登录华为云国际站账号,为了您更好的体验,建议您访问国际站服务网站 https://www.huaweicloud.com/intl/zh-cn
不再显示此消息
基于Serverless版事件流实现Kafka实例之间的数据同步 本文介绍如何应用事件网格EventGrid的Serverless版事件流功能实现分布式消息服务Kafka版实例间的数据同步。 当前事件网格服务仅支持华北-北京四、华北-乌兰察布一、华东-上海一、华东-上海二、华南-广州、亚太-新加坡、拉美-墨西哥城二。
则会导致CPU过高。 减少磁盘读写:避免使用不必要的upsert命令,避免查询不必要的数据。 优化数据分布:对数据进行分片,同时分散热点数据,均衡地使用实例资源。如何进行数据分片,请参见设置数据分片。 减少锁冲突:避免对同一个Key过于频繁地操作。 减少锁等待:避免前台创建索引。
Insight支持接入GaussDB(DWS)数据源、GaussDB数据源、MySQL数据源、PostgreSQL数据源、Doris数据源、ClickHouse数据源、API数据源、DLI数据源、Hive数据源。本文为您介绍如何接入数据源。 支持的数据源类型 表1 支持的数据源类型 数据源 数据源类型 与数据库的连通方式
运行MRS作业时如何读取OBS加密数据 MRS 1.9.x支持使用OBS文件系统中加密后的数据来运行作业,同时支持将加密后的作业运行结果存储在OBS文件系统中。目前仅支持通过OBS协议访问数据。 OBS支持使用KMS密钥的加解密方式对数据进行加解密,所有的加解密操作都在OBS完成,同时密钥管理在DEW服务。
数据保护技术 通过数据保护手段,保障租户数据可靠性。 表1 数据保护手段 数据保护手段 简要说明 传输加密(HTTPS) 外部接口支持HTTPS传输协议,保障数据传输的安全性。 服务端加密 涉及个人数据处理,包括:姓名、手机号码、邮箱等。这些数据在企业工作台内加密存储,避免个人数据的泄露。
计费说明 购买实例存储空间后,文档数据库服务将同比例赠送OBS备份存储空间,用于存储备份数据。当备份数据超出赠送的免额空间时,将按需进行收费。例如,您购买的实例存储空间为100GB时,会得到赠送的100GB的OBS免费备份存储空间。当备份数据没有超出100GB,将免费存储在OBS上;当
RDS数据库中数据被损坏的可能原因有哪些 数据被篡改 有很多安全措施保证只有经过认证的用户才能操作数据库表数据,只能通过指定的数据库服务端口来访问数据库表。 主备数据库在同步过程中有传输包校验功能,所以不会出现数据被篡改。RDS for MySQL使用InnoDB引擎,不容易出现数据损坏。
通过LDAP协议同步数据 LDAP(Lightweight Directory Access Protocol)即轻量目录访问协议。它是一种树状结构的组织数据,可以简单理解成一个存储用户和组织信息的树形结构数据库。单点登录是LDAP的主要使用场景之一,即用户只在公司计算机上登录一次后,便可以自动在公司内部网上登录。
CDM集群与目标数据源可以正常通信。 如果目标数据源为云下的数据库,则需要通过公网或者专线打通网络。通过公网互通时,需确保CDM集群已绑定EIP、CDM云上安全组出方向放通云下数据源所在的主机、数据源所在的主机可以访问公网且防火墙规则已开放连接端口。 如果目标数据源为云上服务(如
9,500.00 云备份 云服务器备份存储库 | 1000GB; 1 1,992.00 数据复制服务 实时同步 | 出云 | GaussDB(for MySQL) | Kafka | 极小; 1 3,840.00 数据复制服务 实时同步 | 出云 | GaussDB(for MySQL)
目标数据库评估(可选) 跳过目标数据库评估: UGO采集数据,但不评估目标数据库,在查看数据库评估结果中目标数据库分析页签将仅显示目标数据库选择。建议在已确定要迁移的目标数据库时选择。 不跳过目标数据库评估: 生成目标数据库的总结和评估报告。从源数据库采集数据后,目标数据库的评估和分析需要一些时间。
刷新数据集样例数据 功能介绍 管理员在数据集详情页面样例数据分页下刷新样例数据。 URI URI格式 GET /softcomai/datalake/v1.0/datasets/{id}/simpledatas/refresh 参数说明 无。 请求 请求样例 GET https://aissowulanalpha
创建和管理数据库 写入/更新和删除命令的规范请参见写入/更新命令和删除命令。 操作步骤 创建info数据库。 use info 输入“db”当结果显示为如下信息,则表示当前已在这个数据库中。 info 为数据库插入一条数据。 db.user.insert({"name": "joe"})
数据安全配置数据搬迁 当前暂不支持数据安全数据的导入导出,需要您手动同步各项配置数据和任务。 数据安全的配置数据,需要您按照旧空间的相关配置,手动在新空间进行重新配置。 父主题: DataArts Studio配置数据搬迁实践
数据拆分 “数据拆分”组件将传入该节点的数据按照指定的表达式进行拆分,并将拆分的结果通过节点变量传递给后续节点。通常“数据拆分”组件后续会连接“数据筛选”组件以配合使用。 “数据拆分”为异步处理组件,如果一个任务中存在“数据拆分”节点,最终开放的API将返回传入“数据拆分”节点时的数据。
数据保护技术 需求管理通过多种数据保护手段和特性,保障数据安全可靠。 表1 需求管理的数据保护手段和特性 数据保护手段 简要说明 详细介绍 传输加密(HTTPS) 为保证数据传输的安全性,需求管理使用HTTPS传输数据。 构造请求 个人数据保护 通过控制个人数据访问权限以及记录操
数据集备份 功能介绍 为防止数据服务异常后用户数据丢失,数据服务通过该接口定期向数据集下发数据备份的命令,数据集受到备份的命令后以租户粒度将各租户下的数据备份。 URI URI格式 GET /softcomai/datalake/v1.0/datacatalog/backup/start
配置SFS Turbo数据淘汰策略 SFS Turbo HPC型文件系统绑定OBS后端之后,建议配置缓存数据淘汰功能。SFS Turbo会自动释放设定时间内没有访问过的文件数据内容,仅保留文件元数据,数据内容释放后不占用SFS Turbo文件系统上的存储空间,再次访问该文件时,将重新从OBS中加载文件数据内容。
分布式版:分布式形态能够支撑较大的数据量,且提供横向扩展的能力,可以通过扩容的方式提高实例的数据容量和并发能力。 集中式版:适用于数据量较小,且长期来看数据不会大幅度增长,但是对数据的可靠性,以及业务的可用性有一定诉求的场景。 部署形态 1主2备 分布式版 独立部署:将数据库组件部署在不同节点上。适用于可靠
jsonl 训练NLP大模型所需数据量 使用数据工程构建盘古NLP大模型数据集进行模型训练时,所需数据量见表2。 表2 构建NLP大模型所需数据量 模型规格 训练类型 推荐数据量 最小数据量(数据条数) 单场景推荐训练数据量 单条数据Token长度限制 N1 微调 - 1000条/每场景