华为云用户手册

  • 处理步骤 检查OpenVpn网络适配器。 按Win+R键,输入devmgmt.msc,按回车,打开“设备管理器”。 选择“网络适配器”,找到“TAP-Windows Adapter V9 for OpenVPN Connect”和“OpenVPN Data Channel Offload”。如图 设备管理器所示。 图1 设备管理器 右键单击“属性”,查看设备状态是否运转正常。如图 查看设备状态所示。 图2 查看设备状态 如果运转不正常,需要卸载OpenVPN Connect,重新安装。 检查"agent_ovpnconnect"服务是否正常运行。 在开始菜单栏中输入“任务管理器”,单击打开。 单击“服务”,找到“agent_ovpnconnect”服务。 如果该服务状态为“已停止”,右键单击“开始”。如图 任务管理器所示。 图3 任务管理器 使用客户端重新连接。 按Win+R,输入cmd,打开命令窗口。 [/topic/body/section/ol/li/styler {""}) 执行以下命令,验证连通性。 (styler] [/topic/body/section/ol/li/p/ph/styler {""}) ping XX.XX.XX.XX (styler] XX.XX.XX.XX为想要连接的E CS 私网IP,请根据实际替换。 回显如下信息,表示网络已通。 64 bytes from XX.XX.XX.XX: icmp_seq=1 ttl=63 time=1.27 ms 64 bytes from XX.XX.XX.XX: icmp_seq=2 ttl=63 time=1.36 ms 64 bytes from XX.XX.XX.XX: icmp_seq=3 ttl=63 time=1.40 ms 64 bytes from XX.XX.XX.XX: icmp_seq=4 ttl=63 time=1.29 ms 64 bytes from XX.XX.XX.XX: icmp_seq=5 ttl=63 time=1.35 ms 64 bytes from XX.XX.XX.XX: icmp_seq=6 ttl=63 time=1.52 ms
  • 处理步骤 确认客户端设备和ECS的访问控制策略是否禁止ping探测。 如果禁止,请修改策略放通ping探测。Windows操作系统还需要修改防火墙的入站规则,允许ICMPv4-In。 确认ECS安全组的出方向和入方向规则都放通ICMP。 确认本端网段包含需要访问的ECS的私网IP地址。 在VPN网关的“服务端”页签中修改本端网段。 断开客户端连接,重新接入。 查看客户端设备是否可以接收到VPN网关推送的路由。 Windows:使用route print命令。 Linux:使用ip route show all命令。 确认用户管理中已经配置用户所属用户组和访问策略。 访问策略的目的网段中需要包含被访问的ECS的私网IP地址。 服务端配置的本端网段和客户端地址池需要符合以下规则。 本端网段为192.168.1.XX。 客户端地址池为172.16.0.0。 在客户端系统上查看本端网段对应的路由是否生成。 如果生成对应的路由,客户端分配到的IP为172.16.0.5。 回显信息如下: IPv4 路由表 =========================================================================== 活动路由: 网络目标 网络掩码 网关 接口 跃点数 192.168.1.XX 255.255.255.0 172.16.0.0 172.16.0.5 281 192.168.2.XX 255.255.255.0 172.16.0.0 172.16.0.5 281 192.168.3.XX 255.255.255.0 172.16.0.0 172.16.0.5 281 =========================================================================== 如果未生成对应的路由,请断开客户端连接,重新接入。 如果上述操作仍然无法解决客户端登录问题,请提交工单联系华为工程师。
  • 处理步骤 在Windows系统,以记事本或Notepad++打开“client_config.conf”文件。 注释“disable-dco”。 按Ctrl+F定位“disable-dco”参数的所在位置。 在参数所在行前输入#注释该行信息。 ..... ..... # disable-dco ..... ..... 保存conf配置文件。 将conf配置文件用Xftp文件传输工具上传到Linux系统。本示例中上传至“/opt/”目录下。 在Linux系统,执行以下命令,进入客户端配置文件所在目录。 cd /opt/ 执行以下命令,启动OpenVPN客户端并连接VPN网关。 openvpn --config /opt/openvpn_config_user-01.conf 回显如下粗体信息,表示OpenVPN连接建立成功。 2025-02-27 19:22:41 Note: Kernel support for ovpn-dco missing, disabling data channel offload. 2025-02-27 19:22:41 OpenVPN 2.6.12 x86_64-pc-linux-gnu [SSL (OpenSSL)] [LZO] [LZ4] [EPOLL] [PKCS11] [MH/PKTINFO] [AEAD] [DCO] 2025-02-27 19:22:41 library versions: OpenSSL 3.3.1 4 Jun 2024, LZO 2.10 ...... ...... ...... 2025-02-27 19:22:42 Initialization Sequence Completed ...... ...... [/topic/body/section/ol/li/styler {""}) 执行以下命令,验证连通性。 (styler] [/topic/body/section/ol/li/p/ph/styler {""}) ping XX.XX.XX.XX (styler] XX.XX.XX.XX为想要连接的ECS私网IP,请根据实际替换。 回显如下信息,表示网络已通。 64 bytes from XX.XX.XX.XX: icmp_seq=1 ttl=63 time=1.27 ms 64 bytes from XX.XX.XX.XX: icmp_seq=2 ttl=63 time=1.36 ms 64 bytes from XX.XX.XX.XX: icmp_seq=3 ttl=63 time=1.40 ms 64 bytes from XX.XX.XX.XX: icmp_seq=4 ttl=63 time=1.29 ms 64 bytes from XX.XX.XX.XX: icmp_seq=5 ttl=63 time=1.35 ms 64 bytes from XX.XX.XX.XX: icmp_seq=6 ttl=63 time=1.52 ms
  • 场景描述 由于业务发展,企业A需要将数据中心和VPC的数据进行互通。此时企业A可以通过VPN服务创建数据中心和VPC的连接,实现云上和云下数据互通。 如果用户数据中心仅有一个对端网关,且对端网关只能配置一个IP地址,推荐VPN网关使用双活模式,组网如图 双活模式所示。 双活模式下,如果连接1链路故障,流量自动切换至连接2进行传输,企业业务不受影响。 图1 双活模式 如果用户数据中心存在两个对端网关,或一个对端网关可以配置两个IP地址,推荐VPN网关使用主备模式,组网如图 主备模式所示。 主备模式下,连接1和连接2互为主备,主链路为连接1,备链路为连接2。默认情况下流量仅通过主链路进行传输,如果主链路故障,流量自动切换至备链路进行传输,企业业务不受影响;主链路恢复正常后,VPN回切至主链路进行数据交互。 图2 主备模式
  • 操作流程 通过VPN实现数据中心和VPC互通的操作流程如图3所示。 图3 操作流程 表2 操作流程说明 序号 步骤 说明 1 步骤一:创建VPN网关 VPN网关需要绑定两个EIP作为出口公网IP。 如果您已经购买EIP,则此处可以直接绑定使用。 2 步骤二:创建对端网关 添加数据中心的VPN设备为对端网关。 3 步骤三:创建VPN连接 VPN网关的主EIP、主EIP2和对端网关组建两条VPN连接。 连接2的连接模式、预共享密钥、IKE/IPsec策略需要和连接1的配置保持一致。 4 步骤四:配置对端网关设备 对端网关配置的本端隧道接口地址/对端隧道接口地址需要和华为云VPN连接配置互为镜像配置。 对端网关配置的连接模式、预共享密钥、IKE/IPsec策略需要和华为云VPN连接配置保持一致。 5 步骤五:验证网络互通情况 登录ECS,执行ping命令,验证网络互通情况。
  • 数据规划 表1 规划数据 类别 规划项 规划值 VPC 待互通子网 192.168.0.0/16 VPN网关 互联子网 用于VPN网关和VPC通信,请确保选择的互联子网存在4个及以上可分配的IP地址。 192.168.2.0/24 HA模式 双活 EIP地址 EIP地址在购买EIP时由系统自动生成,VPN网关默认使用2个EIP。本示例假设EIP地址生成如下: 主EIP:11.xx.xx.11 主EIP2:11.xx.xx.12 VPN连接 “连接1配置”中的Tunnel接口地址 用于VPN网关和对端网关建立IPsec隧道,配置时两边需要互为镜像。 本端隧道接口地址:169.254.70.1/30 对端隧道接口地址:169.254.70.2/30 “连接2配置”中的Tunnel接口地址 本端隧道接口地址:169.254.71.1/30 对端隧道接口地址:169.254.71.2/30 数据中心 待互通子网 172.16.0.0/16 对端网关 网关IP地址 网关IP地址由运营商统一分配。本示例假设网关IP地址如下: 22.xx.xx.22
  • 配置对端设备 配置对端设备详细请参见《 虚拟专用网络 管理员指南》,该指南可以帮助您配置本地的VPN设备,实现您本地网络与华为云VPC子网的互联互通。 详细配置示例可参见: 示例:HUAWEI USG6600配置 示例:Fortinet飞塔防火墙VPN配置 示例:深信服防火墙配置 示例:使用TheGreenBow IPsec VPN Client配置云上云下互通 示例:使用Openswan配置云上云下互通 示例:使用strongSwan配置云上云下互通 父主题: 通过站点入云VPN经典版实现数据中心和VPC互通
  • 简单的IPsec VPN内网对连拓扑说明 如图1所示,假设您在云中已经申请了VPC,并申请了2个子网(192.168.1.0/24,192.168.2.0/24),您在自己的数据中心Router下也有2个子网(192.168.3.0/24,192.168.4.0/24)。您可以通过VPN使VPC内的子网与数据中心的子网互相通信。 图1 IPsec VPN 支持点到点VPN(Site-to-Site VPN),可实现VPC子网和用户数据中心局域网互访。在建立IPsec VPN前,请确认拟开通VPN的用户数据中心满足以下3个条件: 用户数据中心有支持标准IPsec协议的设备。 上述设备可以分配独立的公网IP(NAT IP也支持)。 VPC子网和用户数据中心子网不冲突,用户数据中心子网到上述设备可达。 满足以上条件后,配置IPsec VPN时,需要保证两端IKE策略以及IPsec策略配置一致,两端子网互为镜像。 配置完成后,需要通过私网数据流触发VPN协商。
  • 数据规划 表1 规划数据 类别 规划项 规划值 VPC 待互通子网 192.168.0.0/16 VPN网关 互联子网 用于VPN网关和VPC通信,请确保选择的互联子网存在3个及以上可分配的IP地址。 192.168.2.0/24 最大连接数 10 EIP地址 EIP地址在购买EIP时由系统自动生成。 本示例假设EIP地址生成如下:11.xx.xx.11 服务端 本端网段 192.168.1.0/24 服务端证书 cert-server(使用 云证书管理服务 托管的服务端证书名称) SSL参数 协议:TCP 端口:443 加密算法:AES-128-GCM 认证算法:SHA256 是否压缩:否 客户端 客户端网段 172.16.0.0/16 客户端认证类型 默认选择“口令认证(本地)”。 用户组 名称:Testgroup_01 用户 名称:Test_01 密码:请根据实际配置 所属用户组:Testgroup_01 访问策略 名称:Policy_01 目的网段:192.168.1.0/24 用户组:Testgroup_01
  • 操作流程 通过VPN实现客户端远程接入VPC的操作流程如图 操作流程所示。 图1 操作流程 表2 操作流程说明 序号 步骤 说明 1 步骤一:创建VPN网关 VPN网关需要绑定EIP作为出口公网IP。 如果您已经购买EIP,则此处可以直接绑定使用。 2 步骤二:配置服务端 指定客户端需要访问的网段(本端网段)和客户端访问时使用的网段(客户端网段)。 选择服务端证书和客户端认证类型,用于建立VPN连接时的身份认证。 客户端认证类型支持“证书认证”和“口令认证(本地)”两种方式。 配置VPN连接的SSL参数(协议、端口、认证算法、加密算法等)。 3 步骤三:配置客户端 从管理控制台下载客户端配置,对配置文件进行修改后导入对应的VPN客户端软件。 4 步骤四:验证连通性 打开客户端设备的命令行窗口,执行ping命令,验证连通性。
  • ModelArts Studio(MaaS)调优数据集异常日志说明 调优任务创建后,状态显示为“运行失败”,报错“ModelArts.6001:Unknown error, please contact the operation and maintenance personnel or check the log to locate the specific problem.”,您可以参照下表对日志进行定位。 表1 数据集格式异常 控制台选择格式(预期格式) 实际格式 关键日志 MOSS Alpaca KeyError: 'chat' ShareGPT KeyError: 'chat' Alpaca MOSS KeyError: 'instruction' Alpaca增量预训练 KeyError: 'instruction' ShareGPT KeyError: 'instruction' ShareGPT MOSS KeyError: 'conversations' Alpaca KeyError: 'conversations' Alpaca增量预训练格式 普通的Alpaca KeyError: 'text' MOSS KeyError: 'text' ShareGPT KeyError: 'text' 表2 csv/xlsx数据集格式异常 训练类型 实际格式 关键日志 调优 增量预训练(csv/xlsx) ValueError: The columns must be arranged like [conversation_id,human,assistant]. ValueError: The columns of lora must be arranged like ["conversation_id", "human", "assistant"]. ValueError: The columns of sft must be arranged like ["conversation_id", "human", "assistant"]. 增量预训练 调优(csv/xlsx) ValueError: The columns of pretrain must be arranged like ["conversation_id", "text"]. 对于csv、xlsx文件,平台会根据训练类型的不同,将其转为Alpaca格式或MOSS格式,选择预期的数据类型无效。 父主题: ModelArts Studio(MaaS)
  • Atlas 800训练服务器的网卡配置问题 机头网卡配置是什么? 有以下两类网卡: 四个2*100GE网卡,为RoCE网卡,插在NPU板。 一个4*25GE/10GE,为Hi1822网卡,插在主板上的。 ifconfig能看到的网卡信息吗 能看到主板上的网卡信息,即VPC分配的私有IP。如果要看RoCE网卡的命令需要执行“hccn_tools”命令查看,参考Atlas 800 训练服务器 1.0.11 HCCN Tool接口参考中的指导。 NPU上的网卡在哪里可以看到, 会健康检查吗? 8*NPU的网卡为机头上配置的四个2*100GE网卡。华为云有网卡健康状态监控机制。
  • Linux操作系统 获取登录密码 鉴权方式为SSH密钥对:使用创建时选择的密钥。如果您的私钥文件丢失了,建议您开启 数据加密 服务,重新设置密钥对。参考链接:重置密钥对 鉴权方式为密码:使用创建时设置的密码。如果您忘记了密码,可以进行密码重置。参考链接:重置裸金属服务器密码 确保裸金属服务器绑定弹性公网IP(远程登录方式不需要) SSH密钥方式、用户名和密码方式登录裸金属服务器时,需要绑定弹性公网IP。 参考链接:绑定弹性公网IP至服务器
  • 密钥所有者和接受者权限说明 密钥所有者可以对密钥执行任何操作,接受者仅可以执行部分操作,接受者支持的操作说明如表 密钥接受者支持的操作列表所示。 表1 密钥接受者支持的操作列表 角色 支持的操作 操作说明 接受者 kms:cmk:get 通过控制台或API进行访问 kms:cmk:createDataKey 仅能通过API访问 kms:cmk:createDataKeyWithoutPlaintext 仅能通过API访问 kms:cmk:encryptDataKey 仅能通过API访问 kms:cmk:decryptDataKey 仅能通过API访问 kms:cmk:encryptData 通过控制台或API进行访问 kms:cmk:decryptData 通过控制台或API进行访问 kms:cmk:sign 仅能通过API访问 kms:cmk:verify 仅能通过API访问 kms:cmk:generateMac 仅能通过API访问 kms:cmk:verifyMac 仅能通过API访问 kms:cmk:getPublicKey 通过控制台或API进行访问 kms:cmk:getRotation 通过控制台或API进行访问 kms:cmk:getTags 通过控制台或API进行访问
  • 应用场景 本方案旨在通过华为云Flexus云服务器X实例高效部署和运行Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型。bge-m3模型是一种先进的文本嵌入模型,能够将文本转换为高维向量,从而实现高效的文本相似度计算、分类等任务。bge-reranker-v2-m3是一个轻量级的重排序模型,具有强大的多语言能力,易于部署,推理速度快。借助于Flexus云服务器的强大性能和弹性扩展能力,用户可以轻松地在云端部署此模型,并根据实际需求灵活调整资源。 文本相似度计算:适用于搜索引擎、推荐系统等领域,帮助提升搜索结果的相关性和推荐准确性。 文本分类与聚类:广泛应用于内容管理、舆情分析等场景,支持自动化的信息分类与主题发现。 自然语言处理任务:如情感分析、意图识别等,助力企业更好地理解和利用非结构化数据。 搜索引擎优化:在大型搜索引擎中,重排序模型可以帮助优化搜索结果,确保用户看到的信息是最相关和最有价值的。 问答系统:在问答系统中,重排序模型可以帮助确定哪些答案是最准确和最相关的,从而提高问题解决的质量。
    AI
  • 方案架构 该解决方案帮助您在华为云Flexus云服务器X实例(弹性云服务器 ECS)上快速部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型。 图1 方案架构图 该解决方案将会部署如下资源: 创建一个弹性公网IP EIP,用于提供访问公网和被公网访问能力。 创建一台Flexus云服务器X实例(弹性云服务器 ECS),用于部署Embedding(bge-m3)及Reranker(bge-reranker-v2-m3)模型。 创建一个安全组,通过配置安全组规则,为云服务器提供安全防护。
    AI
  • 操作步骤 登录华为云解决方案实践,选择“快速部署Embedding及Rerank模型”,支持区域下拉选择部署的区域(以贵阳一为例),单击“一键部署”,跳转至解决方案创建资源栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数界面中,参考“表1 参数填写说明”完成全部自定义参数填写,部分参数会自动默认填充参数值。如需修改请在参数配置页面删除文本框内的默认值后填写新的参数值,所有参数填写完成后方可单击“下一步”。 图3 配置参数 表1 参数填写说明 参数名称 类型 是否可选 参数解释 默认值 vpc_name string 必填 虚拟私有云名称,该模板使用新建VPC,不允许重名。取值范围:1-54个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。 deploying-embedding-and-reranker-models-demo security_group_name string 必填 安全组名称,该模板新建安全组,安全组规则请参考部署指南进行配置。取值范围:1-64个字符,支持数字、字母、中文、_(下划线)、-(中划线)、.(点)。 deploying-embedding-and-reranker-models-demo ecs_name string 必填 云服务器实例名称,不支持重名。取值范围:1-64个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。 deploying-embedding-and-reranker-models-demo ecs_flavor string 必填 云服务器实例规格,支持弹性云服务器 ECS(含GPU服务器)及华为云Flexus 云服务器X实例。Flexus 云服务器X实例规格ID命名规则为x1e.?u.?g,例如4vCPUs4GiB规格ID为x1.4u.4g,具体华为云Flexus 云服务器X实例规格请参考控制台。弹性云服务器 ECS规格请参考部署指南配置。弹性云服务器规格清单。 x1e.16u.16g ecs_password string 必填 云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。管理员账户默认root。 空 system_disk_size number 必填 云服务器系统盘大小,磁盘类型默认为通用型SSD,单位:GB,取值范围为40-1,024,不支持缩盘。 40 charging_mode string 必填 云服务器计费模式,默认自动扣费,可选值为:postPaid(按需计费)、prePaid(包年包月)。 postPaid charging_unit string 必填 云服务器订购周期类型,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:month(月),year(年)。 month charging_period number 必填 云服务器订购周期,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:charging_unit=month(周期类型为月)时,取值为1-9;charging_unit=year(周期类型为年)时,取值为1-3。 1 (可选,如果使用华为主账号或admin用户组下的 IAM 子账户可不选委托)在资源设置界面中,在权限委托下拉框中选择“rf_admin_trust”委托,单击“下一步”。 图4 资源栈设置 在配置确认界面中,单击“创建执行计划”。 图5 配置确认 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。 图6 创建执行计划 单击“部署”,并且在弹出的执行计划确认框中单击“执行”。 图7 执行计划 图8 执行计划确认 (可选)如果计费模式选择“包年包月”,在余额不充足的情况下(所需总费用请参考表2)请及时登录费用中心,手动完成待支付订单的费用支付。 待“事件”中出现“Apply required resource success”,堆栈部署成功,表示顺利完成资源的下发和部署。堆栈部署成功后,部署Embedding/Reranker模型脚本开始执行,耐心等待10分钟左右(受网络波动影响)。 图9 部署完成 单击“资源”查看已创建好的资源,如下图所示,单击“蓝色资源名称”跳转至弹性云服务器详情页面,复制获取弹性云服务器绑定的弹性公网IP。 图10 弹性云服务器详情页 图11 获取弹性公网IP
    AI
  • 安全组规则修改(可选) 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。 在使用本方案之前需要部署Dify开发平台,如果您没有部署请参考快速搭建Dify-LLM应用开发平台部署。 浏览器输入http://[弹性公网IP],访问您已部署的Dify开发平台。首次登录需注册管理员账号,依次填写邮箱、账号、密码。 图1 Dify开发平台 依次输入上一步骤中的“邮箱”、“密码”登录Dify平台。 图2 登录Dify平台 单击右侧“用户名称”下拉并单击“设置”。 图3 设置 单击左侧“模型供应商”,在Ollama下单击“添加模型”。 图4 添加模型 模型类型选择“Text Embedding”,模型名称填写“bge-m3”,基础URL填写快速部署步骤10中获取的公网IP地址,端口号11434,单击右下角“保存”。 图5 添加Ollama 单击左侧“模型供应商”,在Xorbits Inference下,单击“添加模型”。 图6 添加xorbits Inference 模型类型选择 Rerank,模型名称与模型UID均填写“bge-reranker-v2-m3”服务器URL填写快速部署步骤10中获取的公网IP地址,端口号9997,单击右下角“保存”。 图7 调试与预览
  • 名词解释 Flexus云服务器X实例:Flexus云服务器X实例是新一代面向中小企业和开发者打造的柔性算力云服务器。Flexus云服务器X实例功能接近ECS, 同时还具备独有特点,例如Flexus云服务器X实例具有更灵活的vCPU内存配比、支持热变配不中断业务变更规格、支持性能模式等。 弹性云服务器 ECS:是一种云上可随时自助获取、可弹性伸缩的计算服务,可帮助您打造安全、可靠、灵活、高效的应用环境。 虚拟私有云 VPC:是用户在华为云上申请的隔离的、私密的虚拟网络环境。用户可以基于VPC构建独立的云上网络空间,配合弹性公网IP、云连接、云专线等服务实现与Internet、云内私网、跨云私网互通,帮您打造可靠、稳定、高效的专属云上网络。 弹性公网IP EIP:提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务。可以与弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡、NAT网关等资源灵活地绑定及解绑,提供访问公网和被公网访问能力。
    AI
  • GPU版 登录弹性云服务器 ECS控制台,如下图所示获取3.2快速部署步骤3中的部署的弹性云服务器的弹性公网 IP地址和私有 IP地址。 图5 获取公网IP 浏览器输入http://[弹性公网IP],访问Dify的开发平台。首次登录需注册管理员账号,依次填写邮箱、账号、密码。 图6 Dify开发平台 依次输入上一步骤中的“邮箱”、“密码”登录Dify平台。 图7 登录Dify平台 单击右侧“用户名称”下拉并单击“设置”。 图8 设置 单击左侧“模型供应商”,在Ollama下单击“添加模型”。 图9 添加模型 模型名称填写3.2快速部署中部署的模型,如“deepseek-r1:7b”,基础URL填写步骤1中获取的私网IP地址,端口号11434,单击右下角“保存”并关闭“设置”。 图10 添加Ollama 选择“创建空白应用”,单击“聊天助手”并填写“应用名称&图标”,单击右下角“创建”。 图11 创建空白应用 图12 创建应用 单击左侧“编排”,在右下角“和机器人聊天”中输入内容即可调试预览。 图13 调试与预览 拓展应用请参考: 华为云ModelArts Studio,助力快速搭建专属大模型 探索Dify:开启AI应用开发的新篇章
    AI
  • CPU版 登录Flexus云服务器X实例控制台,选择部署DeepSeek的服务器,单击远程登录。 图1 选择远程登录 选择使用CloudShell登录,在连接配置页面输入云服务器的密码,单击“连接”(部分区域不支持CloudShell,请使用VNC登录)。 图2 选择CloudShell登录 图3 配置连接信息 在命令行输入“ollama run deepseek-r1:$distilled_model”distilled_model支持1.5b、7b、8b,请对照3.2快速部署步骤3中参数“distilled_model”的值填写(如:DeepSeek-R1-Distill-Qwen-1.5B 此处填写1.5b)执行命令即可测试预览。 图4 效果测试 在交互模式下,可以测试 DeepSeek-R1 的多种功能,例如: 智能客服:输入客户常见问题,如“如何安装软件?”。 内容创作:输入“为一款智能手表撰写广告文案”。 编程辅助:输入“用 Python 实现快速排序”。 教育辅助:输入“解释牛顿第二定律”。
    AI
  • 安全组规则修改(可选) 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
    AI
  • 操作步骤 登录华为云解决方案实践,选择“快速搭建DeepSeek推理系统”,支持区域下拉选择部署的区域(以北京四CPU版为例),单击“一键部署(CPU版)”,跳转至解决方案创建资源栈界面。 图1 解决方案实施库 在选择模板界面中,单击“下一步”。 图2 选择模板 在配置参数界面中,参考“表1 参数填写说明”完成自定义参数填写,部分参数会自动默认填充参数值。如需修改请在参数配置页面删除文本框内的默认值后填写新的参数值,所有参数填写完成后方可单击“下一步”。 图3 配置参数 表1 参数填写说明 参数名称 类型 是否可选 参数解释 默认值 vpc_name string 必填 虚拟私有云名称,该模板使用新建VPC,不允许重名。取值范围:1-54个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。 building-a-deepseek-Inference-system-demo security_group_name string 必填 安全组名称,该模板新建安全组,请参考安全组规则修改进行配置。取值范围:1-64个字符,支持字母、数字、中文、下划线(_)、中划线(-)、英文句号(.)。 building-a-deepseek-Inference-system-demo ecs_name string 必填 云服务器实例名称,不支持重名。取值范围:1-64个字符,支持中文、英文字母、数字、_(下划线)、-(中划线)、.(点)。 building-a-deepseek-Inference-system-demo distilled_model string 必填 DeepSeek-R1-Distill模型。支持Qwen-1.5B、Qwen-7B、Llama-8B,默认Qwen-1.5B。GPU版支持部署Qwen-14B、Qwen-32B。 DeepSeek-R1-Distill-Qwen-1.5B ecs_gpu_mapping string 必填 (GPU版部署参数,涉及华北-北京四、华南-广州区域)弹性云服务器 ECS规格与GPU显卡大小的映射关系。A-1对应显存1*16、B-1对应显存1*24G、B-2对应显存2*24G、B-4对应显存4*24G、B-6对应显存6*24G,推荐显存大小16GB及以上(Qwen-32B推荐显存大小24G及以上)。当参数{ecs_flavor}有值时,此参数不生效。默认A-1。 A-1 ecs_flavor string 必填 云服务器实例规格,CPU版部署1.5b推荐使用x1.4u.4g、7b和8b推荐使用x1.16u.16g,默认:x1.4u.4g;GPU版部署推荐显存大小16GB及以上(Qwen-32B推荐显存大小24G及以上)。规格信息具体请参考官网弹性云服务器规格清单。 x1.4u.4g ecs_password string 必填 云服务器密码,长度为8-26位,密码至少必须包含大写字母、小写字母、数字和特殊字符(!@$%^-_=+[{}]:,./?)中的三种。管理员账户默认root。 空 system_disk_size number 必填 云服务器系统盘大小,磁盘类型默认为通用型SSD,单位:GB,取值范围为40-1,024,不支持缩盘。 40 charging_mode string 必填 云服务器计费模式,默认自动扣费,可选值为:postPaid(按需计费)、prePaid(包年包月)。 postPaid charging_unit string 必填 云服务器订购周期类型,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:month(月),year(年)。 month ccharging_period number 必填 云服务器订购周期,仅当charging_mode为prePaid(包年/包月)生效,此时该参数为必填参数。取值范围:charging_unit=month(周期类型为月)时,取值为1-9;charging_unit=year(周期类型为年)时,取值为1-3。 1 (可选,如果使用华为主账号或admin用户组下的IAM子账户可不选委托)在资源设置界面中,在权限委托下拉框中选择“rf_admin_trust”委托,单击“下一步”。 图4 资源栈设置 在配置确认界面中,单击“创建执行计划”。 图5 配置确认 在弹出的创建执行计划框中,自定义填写执行计划名称,单击“确定”。 图6 创建执行计划 单击“部署”,并且在弹出的执行计划确认框中单击“执行”。 图7 执行计划 图8 执行计划确认 (可选)如果计费模式选择“包年包月”,在余额不充足的情况下(所需总费用请参考表2)请及时登录费用中心,手动完成待支付订单的费用支付。 待“事件”中出现“Apply required resource success”,堆栈部署成功,表示顺利完成资源的下发和部署。堆栈部署成功后,搭建DeepSeek脚本开始执行,耐心等待5-10分钟左右(受网络波动影响)。 图9 部署完成
    AI
  • 创建rf_admin_trust委托(可选) 进入华为云官网,打开控制台管理界面,鼠标移动至个人账号处,打开“ 统一身份认证 ”菜单。 图1 控制台管理界面 图2 统一身份认证菜单 进入“委托”菜单,搜索“rf_admin_trust”委托。 图3 委托列表 如果委托存在,则不用执行接下来的创建委托的步骤 如果委托不存在时执行接下来的步骤创建委托 单击步骤2界面中的“创建委托”按钮,在委托名称中输入“rf_admin_trust”,委托类型选择“云服务”,选择“ RFS ”,单击“下一步”。 图4 创建委托 在搜索框中输入“Tenant Administrator”权限,并勾选搜索结果,单击“下一步”。 图5 选择策略 选择“所有资源”,并单击“下一步”完成配置。 图6 设置授权范围 “委托”列表中出现“rf_admin_trust”委托则创建成功。 图7 委托列表
  • 资源和成本规划 该解决方案主要部署如下资源,以下费用仅供参考,具体请参考华为云官网价格详情,实际收费以账单为准。 表1 资源和成本规划(按需计费)CPU版 华为云服务 资源名称 配置示例 数量 每月预估花费 虚拟私有云 VPC building-a-deepseek-Inference-system-demo VPC网段:172.16.0.0/16 区域:华北-北京四 1 0.00元 子网 Subnet building-a-deepseek-Inference-system-demo-subnet 子网网段:172.16.1.0/24 区域:华北-北京四 1 0.00元 安全组 SecurityGroup building-a-deepseek-Inference-system-demo 允许ping:0.0.0.0/0 开放端口22允许Cloud Shell 登录:121.36.59.153/32 区域:华北-北京四 1 0.00元 Flexus云服务器X实例 building-a-deepseek-Inference-system-demo 按需计费:0.38/小时 区域:华北-北京四 规格:Flexus云服务器X实例 | 性能模式(关闭)| x1.4u.4g | 4核 | 4GB 镜像:Ubuntu 22.04 server 64bit 系统盘:通用型SSD | 40GB 1 271.30元 弹性公网IP EIP building-a-deepseek-Inference-system-demo-eip 按需计费:0.80元/GB 区域:华北-北京四 线路:动态BGP 公网带宽:按流量计费 带宽大小:300Mbit/s 1 0.80元/GB 合计 - 271.30元 + 弹性公网IP EIP费用 表2 资源和成本规划(包年包月)CPU版 华为云服务 资源名称 配置示例 数量 每月预估花费 虚拟私有云 VPC building-a-deepseek-Inference-system-demo VPC网段:172.16.0.0/16 区域:华北-北京四 1 0.00元 子网 Subnet building-a-deepseek-Inference-system-demo-subnet 子网网段:172.16.1.0/24 区域:华北-北京四 1 0.00元 安全组 SecurityGroup building-a-deepseek-Inference-system-demo 允许ping:0.0.0.0/0 开放端口22允许Cloud Shell 登录:121.36.59.153/32 区域:华北-北京四 1 0.00元 Flexus云服务器X实例 building-a-deepseek-Inference-system-demo 包年包月 区域:华北-北京四 规格:Flexus云服务器X实例 | 性能模式(关闭)| x1.4u.4g | 4核 | 4GB 镜像:Ubuntu 22.04 server 64bit 系统盘:通用型SSD | 40GB 1 190.00元 弹性公网IP EIP building-a-deepseek-Inference-system-demo-eip 按需计费:0.80元/GB 区域:华北-北京四 线路:动态BGP 公网带宽:按流量计费 带宽大小:300Mbit/s 1 0.80元/GB 合计 - 190.00元 + 弹性公网IP EIP费用 表3 资源和成本规划(按需计费)GPU版 华为云服务 资源名称 配置示例 数量 每月预估花费 虚拟私有云 VPC building-a-deepseek-Inference-system-demo VPC网段:172.16.0.0/16 区域:华东-上海一 1 0.00元 子网 Subnet building-a-deepseek-Inference-system-demo-subnet 子网网段:172.16.1.0/24 区域:华东-上海一 1 0.00元 安全组 SecurityGroup building-a-deepseek-Inference-system-demo 允许ping:0.0.0.0/0 开放端口22允许Cloud Shell 登录:121.36.59.153/32 区域:华东-上海一 1 0.00元 弹性云服务器 ECS building-a-deepseek-Inference-system-demo 按需计费:6.37/小时 区域:华东-上海一 规格:GPU加速型g6 | g6.xlarge.4 | 16核 | 32GB | NVIDIA T4 | 16GB 镜像:Ubuntu 22.04 server 64bit 系统盘:通用型SSD | 40GB 1 4585.54元 弹性公网IP EIP building-a-deepseek-Inference-system-demo-eip 按需计费:0.80元/GB 区域:华东-上海一 线路:动态BGP 公网带宽:按流量计费 带宽大小:300Mbit/s 1 0.80元/GB 合计 - 4585.54元 + 弹性公网IP EIP费用 表4 资源和成本规划(包年包月)GPU版 华为云服务 资源名称 配置示例 数量 每月预估花费 虚拟私有云 VPC building-a-deepseek-Inference-system-demo VPC网段:172.16.0.0/16 区域:华东-上海一 1 0.00元 子网 Subnet building-a-deepseek-Inference-system-demo-subnet 子网网段:172.16.1.0/24 区域:华东-上海一 1 0.00元 安全组 SecurityGroup building-a-deepseek-Inference-system-demo 允许ping:0.0.0.0/0 开放端口22允许Cloud Shell 登录:121.36.59.153/32 区域:华东-上海一 1 0.00元 弹性云服务器 ECS building-a-deepseek-Inference-system-demo 包年包月 区域:华东-上海一 规格:GPU加速型g6 | g6.xlarge.4 | 16核 | 32GB | NVIDIA T4 | 16GB 镜像:Ubuntu 22.04 server 64bit 系统盘:通用型SSD | 40GB 1 3064.40元 弹性公网IP EIP building-a-deepseek-Inference-system-demo-eip 按需计费:0.80元/GB 区域:华东-上海一 线路:动态BGP 公网带宽:按流量计费 带宽大小:300Mbit/s 1 0.80元/GB 合计 - 3064.40元 + 弹性公网IP EIP费用
    AI
  • 方案架构 该解决方案帮助您在华为云Flexus云服务器X实例(弹性云服务器 ECS)上快速搭建DeepSeek-R1蒸馏版模型。 图1 方案架构图 该解决方案将会部署如下资源: 创建一个弹性公网IP EIP,用于提供访问公网和被公网访问能力。 创建一台Flexus云服务器X实例(弹性云服务器 ECS),用于搭建DeepSeek-R1蒸馏版模型。 创建一个安全组,通过配置安全组规则,为云服务器提供安全防护。
    AI
  • 应用场景 随着互联网信息量的爆炸式增长,企业和个人面临着海量数据管理和高效检索的需求。传统的搜索引擎虽然能够满足基本的搜索需求,但在面对复杂多样的数据类型和个性化需求时,往往显得力不从心。因此,DeepSeek应运而生,DeepSeek(深度求索)作为一款国产AI大模型,凭借其高性能、低成本和多模态融合能力,在人工智能领域崛起,并在多个行业中展现出广泛的应用潜力。 该解决方案帮助您在华为云Flexus云服务器X实例(弹性云服务器 ECS)上快速搭建DeepSeek-R1轻量级推理系统。DeepSeek-R1是一个高性能的AI推理模型,专注于数学、代码和自然语言推理任务,通过Ollama在云服务器中部署DeepSeek-R1蒸馏版轻量模型,快速打造您的私人AI助手,主要适用如下场景: 自然语言处理(NLP):能够理解和生成自然语言文本,适用于对话、翻译、摘要等任务。 文本生成:能够生成连贯、逻辑清晰的文本,适用于内容创作、故事编写等。 问答系统:能够回答用户提出的问题,适用于客服、知识库查询等场景。 情感分析:能够分析文本中的情感倾向,适用于市场调研、舆情监控等。 文本分类:能够对文本进行分类,适用于垃圾邮件过滤、新闻分类等。 信息抽取:能够从文本中提取关键信息,适用于数据挖掘、知识图谱构建等。
    AI
  • 名词解释 Flexus云服务器X实例:Flexus云服务器X实例是新一代面向中小企业和开发者打造的柔性算力云服务器。Flexus云服务器X实例功能接近ECS, 同时还具备独有特点,例如Flexus云服务器X实例具有更灵活的vCPU内存配比、支持热变配不中断业务变更规格、支持性能模式等。 弹性云服务器 ECS:是一种云上可随时自助获取、可弹性伸缩的计算服务,可帮助您打造安全、可靠、灵活、高效的应用环境。 虚拟私有云 VPC:是用户在华为云上申请的隔离的、私密的虚拟网络环境。用户可以基于VPC构建独立的云上网络空间,配合弹性公网IP、云连接、云专线等服务实现与Internet、云内私网、跨云私网互通,帮您打造可靠、稳定、高效的专属云上网络。 弹性公网IP EIP:提供独立的公网IP资源,包括公网IP地址与公网出口带宽服务。可以与弹性云服务器、裸金属服务器、虚拟IP、弹性负载均衡、NAT网关等资源灵活地绑定及解绑,提供访问公网和被公网访问能力。
    AI
  • 使用步骤 登录Flexus云服务器X实例控制台,选择部署本方案创建的服务器,单击远程登录。 图1 选择远程登录 选择使用CloudShell登录,在连接配置页面输入云服务器的密码,单击“连接”(部分区域不支持CloudShell,请使用VNC登录)。 图2 选择CloudShell登录 图3 配置连接信息 在部署成功的登录Flexus云服务器X实例上执行以下命令查询有哪些模型文件可供分发。 curl http://127.0.0.1/api/fetch/models | jq 图4 查询可用模型文件 执行命令创建模型文件同步任务。 curl -XPOST http://127.0.0.1/api/task?modelName=${模型名称} 图5 创建任务 查看任务状态。 curl http://127.0.0.1/api/task | jq 图6 任务状态 待任务状态为“FINISHED”即代表模型权重文件同步成功。 图7 任务完成 登录OBS控制台,查看该解决方案创建的OBS桶,可以看到模型权重文件已同步成功。 图8 同步成功
    AI
  • 安全组规则修改(可选) 安全组实际是网络流量访问策略,包括网络流量入方向规则和出方向规则,通过这些规则为安全组内具有相同保护需求并且相互信任的云服务器、云容器、云数据库等实例提供安全保护。 如果您的实例关联的安全组策略无法满足使用需求,比如需要添加、修改、删除某个TCP端口,请参考以下内容进行修改。 添加安全组规则:根据业务使用需求需要开放某个TCP端口,请参考添加安全组规则添加入方向规则,打开指定的TCP端口。 修改安全组规则:安全组规则设置不当会造成严重的安全隐患。您可以参考修改安全组规则,来修改安全组中不合理的规则,保证云服务器等实例的网络安全。 删除安全组规则:当安全组规则入方向、出方向源地址/目的地址有变化时,或者不需要开放某个端口时,您可以参考删除安全组规则进行安全组规则删除。
    AI
共100000条
提示

您即将访问非华为云网站,请注意账号财产安全