PHP爬虫实例-4K壁纸爬取测试

所需积分  5 9957
PHP爬虫实例-4K壁纸爬取测试

PHP爬虫实例,4K壁纸爬取测试。本实例的目标网站是一个叫《彼岸网》的壁纸网站,使用技术是 QueryList(php爬虫库)。

只要爬取.clearfix li>a>img元素里面的src属性和alt属性即可获得图片url和图片标题,实现代码如下

// 采集规则
$rules = [  
    // 表示 获取类型为.clearfix li a img 元素的 alt属性值  
    "title"=>[".clearfix li a img","alt"],  
    // 表示 获取类型为.clearfix li a img 元素的 src属性值  
    "link"=>[".clearfix li a img","src"],   
];

执行

// $url 要爬取的页面网站
$url = "https://pic.netbian.com/index_2.html";
// 'UTF-8','GB2312':设置编码格式 ,执行获取数据
$data = (new QueryList)->Query($url,$rules,'','UTF-8','GB2312')->data;
// $data 是一个数组,爬虫获得的数据如下
[  
    {  "title": "澶澶 灏濂 缁杈瀛 姹借溅4kㄦ极澹绾",  "link": "/uploads/allimg/220702/224637-16567731978388.jpg"  },  
    {  "title": "浠濂充 搴 缇濂 椴 辩e缇4k缇濂冲绾",  "link": "/uploads/allimg/220702/222610-1656771970e92c.jpg"  },  
    {  "title": "杩ㄧ濂 缃 妤 娓扮濂4k澹绾",  "link": "/uploads/allimg/220702/222125-1656771685f559.jpg"  },
]

可以根据网址实现遍历爬取整个网站壁纸

第二页https://pic.netbian.com/index_2.html

第三页https://pic.netbian.com/index_3.html

依次类推

我们只需 动态变更网站$url即可,爬网第一张后,$start + 1 开始爬取第二页,依次爬取,直到完成所有

$start = $start + 1;
$url = "https://pic.netbian.com/4k/index_".$start.".html";


展开
TAG标签:

强大的Laravel管理后台UI框架源码-Nazox

Nazox是一个Laravel7实现的管理后台模板,前端样式使用Bootstrap4 CSS库,身份验证和多语言支持。Nazox Laravel管理后台模板是基于一个简单的和模块化的设计,使它很容易定制一些可重用的组件。它有大量的可重用的和

PayPal支付接口PHP版实例

PayPal支付接口PHP版实例,php版本paypal支付接口开发源码。使用compurse连接paypal,可以自调节运费及其他服务费。

ThinkPHP5电脑与手机支付扩展库

ThinkPHP5电脑与手机支付扩展库,在默认配置情况下,将文件夹拷贝到根目录即可。其中extend目录为支付扩展目录, application\extra\alipay.php为配置文件需要在配置文件application\ex

PHP用户注册邮箱验证激活帐号实例

本实例演示如何使用PHP+Mysql完成注册帐号、发送激活邮件、验证激活帐号、处理URL链接过期的功能。网站注册会员时,注册完成后,系统会自动向用户的邮箱发送一封邮件,这封邮件的内容就是一个URL链接,用户需要点击打开这个链接才能激活之前在

PHP爬虫实例-4K壁纸爬取测试

PHP爬虫实例,4K壁纸爬取测试。本实例的目标网站是一个叫《彼岸网》的壁纸网站,使用技术是 QueryList(php爬虫库)。只要爬取.clearfix li>a>img元素里面的src属性和alt属性即可获得图片u

Thinkphp5-支付宝alipay/电脑与手机支付扩展库

Thinkphp5-支付宝alipay电脑与手机支付扩展库,代码非常清晰明了,拿来即用。使用说明在默认配置情况下,将文件夹拷贝到根目录即可, 其中extend目录为支付扩展目录, application\extra\alipay.

ThinkPHP在线更新解决方案/PHP在线更新方案实例代码

ThinkPHP在线更新解决方案实例代码,基本实现了网站应用程序的在线更新功能。大家可以参考其中的实现思路,再略加完善,整合到自己的系统中,就能实现系统的在线更新功能。其中ThinkPHP版本为5.0,代码中的更新接口地址需要更具自己的实际

Dropzone.js实现文件拖拽上传实例

Dropzone.js是一个开源的JavaScript库,提供 AJAX 异步文件上传功能,支持拖拽文件、支持最大文件大小、支持设置文件类型、支持预览上传结果,不依赖jQuery库。本实例实现了基本的拖拽上传功能,供大家参考。实例相关教程:

Thinkphp6.0整合PayPal支付实例

Thinkphp6.0整合PayPal支付实例,需要执行 composer install 命令安装Thinkphp框架。具体功能可以查看已经整合好的代码。

基于H5的easyUpload.js多文件批量上传实例

一款简单易用、可配置的H5/Web上传插件。支持多文件上传,批量上传,混合上传,以及多实例上传。特性文件类型可配置文件数量可配置文件大小可配置上传前文件可预览展示上传实时进度条批量上传支持不同类型文件混合上传支持自由配置 base64 或

基于Focusky.js的高逼格故宫介绍网页PPT展示效果

基于Focusky.js的高逼格故宫介绍网页PPT展示效果,Focusky.js是一款能制作网页格式的类似PPT模仿动画的JS插件,本例通过制作一款故宫介绍网页实现PPT播放效果,学习Focusky.js,有兴趣的可以下载下来共同学习一下。

评论(0)条

您还没有登录,请 登录 后发表评论!

提示:请勿发布广告垃圾评论,否则封号处理!!

    编辑推荐

    Python海报生成器源码
    PHP+Mysql+jQuery找回密码实例