PHP爬虫实例-4K壁纸爬取测试

所需积分  5 10172
PHP爬虫实例-4K壁纸爬取测试

PHP爬虫实例,4K壁纸爬取测试。本实例的目标网站是一个叫《彼岸网》的壁纸网站,使用技术是 QueryList(php爬虫库)。

只要爬取.clearfix li>a>img元素里面的src属性和alt属性即可获得图片url和图片标题,实现代码如下

// 采集规则
$rules = [  
    // 表示 获取类型为.clearfix li a img 元素的 alt属性值  
    "title"=>[".clearfix li a img","alt"],  
    // 表示 获取类型为.clearfix li a img 元素的 src属性值  
    "link"=>[".clearfix li a img","src"],   
];

执行

// $url 要爬取的页面网站
$url = "https://pic.netbian.com/index_2.html";
// 'UTF-8','GB2312':设置编码格式 ,执行获取数据
$data = (new QueryList)->Query($url,$rules,'','UTF-8','GB2312')->data;
// $data 是一个数组,爬虫获得的数据如下
[  
    {  "title": "澶澶 灏濂 缁杈瀛 姹借溅4kㄦ极澹绾",  "link": "/uploads/allimg/220702/224637-16567731978388.jpg"  },  
    {  "title": "浠濂充 搴 缇濂 椴 辩e缇4k缇濂冲绾",  "link": "/uploads/allimg/220702/222610-1656771970e92c.jpg"  },  
    {  "title": "杩ㄧ濂 缃 妤 娓扮濂4k澹绾",  "link": "/uploads/allimg/220702/222125-1656771685f559.jpg"  },
]

可以根据网址实现遍历爬取整个网站壁纸

第二页https://pic.netbian.com/index_2.html

第三页https://pic.netbian.com/index_3.html

依次类推

我们只需 动态变更网站$url即可,爬网第一张后,$start + 1 开始爬取第二页,依次爬取,直到完成所有

$start = $start + 1;
$url = "https://pic.netbian.com/4k/index_".$start.".html";


展开
TAG标签:

ThinkPHP5微信支付扩展库

ThinkPHP5微信支付扩展库使用说明在默认配置情况下,将文件夹**拷贝到根目录**即可, 其中 extend 目录为扩展目录需要在配置文件 /extend/wxpay/lib/WxPayConfig.php 中填写必要的参数如有退款操作

PHP隐藏文件真实下载地址源码/支持超大文件断点续传

非常简单完整全开源的一款关于隐藏文件真实下载地址的PHP程序源码。1、你服务器上有什么文件供别人下载的,但是又不想显示出路径,那么此源码将是你的不二之选2、你服务器上的文件,需要授权后,才能下载,那么,此源码将是你的不二之选3、你想让你的网

Thinkphp5-支付宝alipay/电脑与手机支付扩展库

Thinkphp5-支付宝alipay电脑与手机支付扩展库,代码非常清晰明了,拿来即用。使用说明在默认配置情况下,将文件夹拷贝到根目录即可, 其中extend目录为支付扩展目录, application\extra\alipay.

PHP点餐系统/基于Vue开发的前后端分离点餐系统实例

PHP点餐系统,基于Vue开发的前后端分离点餐系统实例;本站已亲测,功能全面,可实现在线点餐。需要注意的是默认系统是部署在“phpecXfv”文件夹中的,如果需要部署在根目录,则注释掉根目录 index.php 文件的5-9行。并修改 /f

Artplayer视频JSON解析播放器源码

Artplayer视频JSON解析播放器源码支持弹幕json数据模式,支持两种返回模式:网页播放模式、json数据模式,json数据模式支持限制ip每分钟访问次数+UA限制+key密钥,也可理解为防盗链 ,本播放器带弹幕库。运行环境:推荐使

jQuery年终奖抽奖系统代码

公司年终奖抽奖系统,基于jQuery,兼容Chrome,火狐等现代浏览器,其他浏览器未做兼容性测试

基于jQuery的分页组件-jqPaginator分页组件

jqPaginator是一款基于jQuery的简洁、高度自定义的jQuery分页组件,适用于多种应用场景。用法很简单,首先引入jQuery和jqPaginator,之后就可以初始化分页了$('#id').jqPaginato

Python批量爬取快手主页视频代码

这是一段Python批量爬取快手主页视频的代码示例,输入作者id就可批量爬取视频,有兴趣的可以研究研究。自动保存到D:/video/文件夹需要导入requests库(懂python的应该都知道吧)指令(win+r,cmd)pip 

PHP+Mysql+jQuery找回密码实例

找回功能不是真的能把忘记的密码找回,因为我们的密码是加密保存的,一般开发者会在验证用户信息后通过程序生成一个新密码或者生成一个特定的链接并发送邮件到用户邮箱,用户从邮箱链接到网站的重置密码模块重新设置新密码。

php-qrcode 在线生成二维码

基于phpqrcode+js实现的在线生成二维码工具(canvas版)。新增小程序版本,wxapp-qrcode文件夹,目前功能只有简版的生成二维码,代码下载后可在本地的微信开发者工具中导入查看。

Thinkphp6.0整合PayPal支付实例

Thinkphp6.0整合PayPal支付实例,需要执行 composer install 命令安装Thinkphp框架。具体功能可以查看已经整合好的代码。

强大的Laravel管理后台UI框架源码-Nazox

Nazox是一个Laravel7实现的管理后台模板,前端样式使用Bootstrap4 CSS库,身份验证和多语言支持。Nazox Laravel管理后台模板是基于一个简单的和模块化的设计,使它很容易定制一些可重用的组件。它有大量的可重用的和

Element UI表单设计及代码生成器

Element UI表单设计及代码生成器,可将生成的代码直接运行在基于Element的vue项目中;也可导出JSON表单,使用配套的解析器将JSON解析成真实的表单。仓库地址:https://gitee.com/mrhj/form-gene

评论(0)条

您还没有登录,请 登录 后发表评论!

提示:请勿发布广告垃圾评论,否则封号处理!!

    编辑推荐

    ThinkPHP5微信支付扩展库