华为云计算 云知识 网络爬虫如何工作?
网络爬虫如何工作?

一、获取网页

构造一个请求并发送给服务器;接收到响应(页面源代码)并将其解析出来。

二、提取信息

网页的结构有一定的规则,采用正则表达式提取;使用Requests库,我们可以高效快速地从中提取网页信息。

三、保存数据

将提取到的数据保存到某处以便后续使用;保存形式有多种多样,可以保存到文本或者 数据库

上一篇:Node.js文档手册学习与基本介绍 下一篇:创建节点池CreateNodePool

虚拟私有云 VPC

虚拟私有云(Virtual Private Cloud)是用户在华为云上申请的隔离的、私密的虚拟网络环境。用户可以自由配置VPC内的IP地址段、子网、安全组等子服务,也可以申请弹性带宽和弹性IP搭建业务系统