PHP爬虫实例-4K壁纸爬取测试

所需积分  5 10790
PHP爬虫实例-4K壁纸爬取测试

PHP爬虫实例,4K壁纸爬取测试。本实例的目标网站是一个叫《彼岸网》的壁纸网站,使用技术是 QueryList(php爬虫库)。

只要爬取.clearfix li>a>img元素里面的src属性和alt属性即可获得图片url和图片标题,实现代码如下

// 采集规则
$rules = [  
    // 表示 获取类型为.clearfix li a img 元素的 alt属性值  
    "title"=>[".clearfix li a img","alt"],  
    // 表示 获取类型为.clearfix li a img 元素的 src属性值  
    "link"=>[".clearfix li a img","src"],   
];

执行

// $url 要爬取的页面网站
$url = "https://pic.netbian.com/index_2.html";
// 'UTF-8','GB2312':设置编码格式 ,执行获取数据
$data = (new QueryList)->Query($url,$rules,'','UTF-8','GB2312')->data;
// $data 是一个数组,爬虫获得的数据如下
[  
    {  "title": "澶澶 灏濂 缁杈瀛 姹借溅4kㄦ极澹绾",  "link": "/uploads/allimg/220702/224637-16567731978388.jpg"  },  
    {  "title": "浠濂充 搴 缇濂 椴 辩e缇4k缇濂冲绾",  "link": "/uploads/allimg/220702/222610-1656771970e92c.jpg"  },  
    {  "title": "杩ㄧ濂 缃 妤 娓扮濂4k澹绾",  "link": "/uploads/allimg/220702/222125-1656771685f559.jpg"  },
]

可以根据网址实现遍历爬取整个网站壁纸

第二页https://pic.netbian.com/index_2.html

第三页https://pic.netbian.com/index_3.html

依次类推

我们只需 动态变更网站$url即可,爬网第一张后,$start + 1 开始爬取第二页,依次爬取,直到完成所有

$start = $start + 1;
$url = "https://pic.netbian.com/4k/index_".$start.".html";


展开
TAG标签:

抖音快手无水印解析APi代码实例

网友自己写的,目前支持抖音和快手,数据都是从原服务器取来的,没有从html结果抓,应该算是比较稳定一点, 其他平台的函数大家照猫画虎试试。一共五个函数1、analyzing 平台解析2、douyin 抖音视频处理3、kuaishou 快手视

Artplayer视频JSON解析播放器源码

Artplayer视频JSON解析播放器源码支持弹幕json数据模式,支持两种返回模式:网页播放模式、json数据模式,json数据模式支持限制ip每分钟访问次数+UA限制+key密钥,也可理解为防盗链 ,本播放器带弹幕库。运行环境:推荐使

基于Focusky.js的高逼格故宫介绍网页PPT展示效果

基于Focusky.js的高逼格故宫介绍网页PPT展示效果,Focusky.js是一款能制作网页格式的类似PPT模仿动画的JS插件,本例通过制作一款故宫介绍网页实现PPT播放效果,学习Focusky.js,有兴趣的可以下载下来共同学习一下。

强大的Laravel管理后台UI框架源码-Nazox

Nazox是一个Laravel7实现的管理后台模板,前端样式使用Bootstrap4 CSS库,身份验证和多语言支持。Nazox Laravel管理后台模板是基于一个简单的和模块化的设计,使它很容易定制一些可重用的组件。它有大量的可重用的和

PHP微信扫码关注公众号并授权登录源码

PHP微信扫码登录看起来简单,但做起来有点麻烦,开发起来就会浪费很多的时间。PHP判断是否首次关注公众号,扫码关注公众号获取微信用户头像、openid和省市等信息源码。使用方法:1、把 wx 目录放到网站根目录2、登录https://mp.

Thinkphp5-支付宝alipay/电脑与手机支付扩展库

Thinkphp5-支付宝alipay电脑与手机支付扩展库,代码非常清晰明了,拿来即用。使用说明在默认配置情况下,将文件夹拷贝到根目录即可, 其中extend目录为支付扩展目录, application\extra\alipay.

PHP隐藏文件真实下载地址源码/支持超大文件断点续传

非常简单完整全开源的一款关于隐藏文件真实下载地址的PHP程序源码。1、你服务器上有什么文件供别人下载的,但是又不想显示出路径,那么此源码将是你的不二之选2、你服务器上的文件,需要授权后,才能下载,那么,此源码将是你的不二之选3、你想让你的网

jQuery年终奖抽奖系统代码

公司年终奖抽奖系统,基于jQuery,兼容Chrome,火狐等现代浏览器,其他浏览器未做兼容性测试

基于H5的easyUpload.js多文件批量上传实例

一款简单易用、可配置的H5/Web上传插件。支持多文件上传,批量上传,混合上传,以及多实例上传。特性文件类型可配置文件数量可配置文件大小可配置上传前文件可预览展示上传实时进度条批量上传支持不同类型文件混合上传支持自由配置 base64 或

Element UI表单设计及代码生成器

Element UI表单设计及代码生成器,可将生成的代码直接运行在基于Element的vue项目中;也可导出JSON表单,使用配套的解析器将JSON解析成真实的表单。仓库地址:https://gitee.com/mrhj/form-gene

基于Vue.js的表格分页组件-BootPage

基于Vue.js的表格分页组件-BootPage,一款支持静态数据和服务器数据的表格分页组件,支持调整每页显示行数和页码显示个数,样式基于bootstrap。注:在使用ES6及vue-loader的vue项目中才能使用本组件,请求本地jso

评论(0)条

您还没有登录,请 登录 后发表评论!

提示:请勿发布广告垃圾评论,否则封号处理!!

    编辑推荐

    Python海报生成器源码