PHP爬虫实例-4K壁纸爬取测试

所需积分  5 7761
PHP爬虫实例-4K壁纸爬取测试

PHP爬虫实例,4K壁纸爬取测试。本实例的目标网站是一个叫《彼岸网》的壁纸网站,使用技术是 QueryList(php爬虫库)。

只要爬取.clearfix li>a>img元素里面的src属性和alt属性即可获得图片url和图片标题,实现代码如下

  1. // 采集规则
  2. $rules = [  
  3.     // 表示 获取类型为.clearfix li a img 元素的 alt属性值  
  4.     "title"=>[".clearfix li a img","alt"],  
  5.     // 表示 获取类型为.clearfix li a img 元素的 src属性值  
  6.     "link"=>[".clearfix li a img","src"],   
  7. ];

执行

  1. // $url 要爬取的页面网站
  2. $url = "https://pic.netbian.com/index_2.html";
  3. // 'UTF-8','GB2312':设置编码格式 ,执行获取数据
  4. $data = (new QueryList)->Query($url,$rules,'','UTF-8','GB2312')->data;
  5. // $data 是一个数组,爬虫获得的数据如下
  6. [  
  7.     {  "title": "澶澶 灏濂 缁杈瀛 姹借溅4kㄦ极澹绾",  "link": "/uploads/allimg/220702/224637-16567731978388.jpg"  },  
  8.     {  "title": "浠濂充 搴 缇濂 椴 辩e缇4k缇濂冲绾",  "link": "/uploads/allimg/220702/222610-1656771970e92c.jpg"  },  
  9.     {  "title": "杩ㄧ濂 缃 妤 娓扮濂4k澹绾",  "link": "/uploads/allimg/220702/222125-1656771685f559.jpg"  },
  10. ]

可以根据网址实现遍历爬取整个网站壁纸

第二页https://pic.netbian.com/index_2.html

第三页https://pic.netbian.com/index_3.html

依次类推

我们只需 动态变更网站$url即可,爬网第一张后,$start + 1 开始爬取第二页,依次爬取,直到完成所有

  1. $start = $start + 1;
  2. $url = "https://pic.netbian.com/4k/index_".$start.".html";


展开
TAG标签:

PHP记录和读取JSON格式日志文件实例代码

有时需要记录用户或者后端的某个操作事件的运行情况,可以使用后端语言如PHP将操作结果记录到日志文件中,方便测试和查找问题。尤其是这些在后端运行的而前端不能直接看到运行结果的,那么就可以用日志文件记录下来,如果你经常跟一些接口开发如支付宝接口

ThinkPHP5电脑与手机支付扩展库

ThinkPHP5电脑与手机支付扩展库,在默认配置情况下,将文件夹拷贝到根目录即可。其中extend目录为支付扩展目录, application\extra\alipay.php为配置文件需要在配置文件application\ex

Element UI表单设计及代码生成器

Element UI表单设计及代码生成器,可将生成的代码直接运行在基于Element的vue项目中;也可导出JSON表单,使用配套的解析器将JSON解析成真实的表单。仓库地址:https://gitee.com/mrhj/form-gene

Python海报生成器源码

海报编辑器最左侧是组件列表。可以在最左侧选择组件,比如文本、二维码、图片等添加到最中间的画布区域,通过右侧的属性调节面板调节添加组件的样式。快速:三步完成海报开发工作:启动服务 > 编辑海报 > 生成代码简单:组件丰富、支持拖拽

仿美图秀秀html5版canvas自由拼图实例

基于canvas自由拼图实例,可以自由拖动,仿美图秀秀自由拼图,并可以对插入图片旋转,拖拽,缩放。当然,如果用户对插入的图片不满意,可以用另一张图片替换选中的图片,或者删除选中图片。

PHP点餐系统/基于Vue开发的前后端分离点餐系统实例

PHP点餐系统,基于Vue开发的前后端分离点餐系统实例;本站已亲测,功能全面,可实现在线点餐。需要注意的是默认系统是部署在“phpecXfv”文件夹中的,如果需要部署在根目录,则注释掉根目录 index.php 文件的5-9行。并修改 /f

Artplayer视频JSON解析播放器源码

Artplayer视频JSON解析播放器源码支持弹幕json数据模式,支持两种返回模式:网页播放模式、json数据模式,json数据模式支持限制ip每分钟访问次数+UA限制+key密钥,也可理解为防盗链 ,本播放器带弹幕库。运行环境:推荐使

基于ThinkPHP5.0的微信小程序登录流程封装

基于ThinkPHP5.0的微信小程序composer包。安装方法:composer require xxh/think-wxminihelper你只需要两部就可以实现微信的登录验证,验证成功后会自动返回一个3rd_se

基于Focusky.js的高逼格故宫介绍网页PPT展示效果

基于Focusky.js的高逼格故宫介绍网页PPT展示效果,Focusky.js是一款能制作网页格式的类似PPT模仿动画的JS插件,本例通过制作一款故宫介绍网页实现PPT播放效果,学习Focusky.js,有兴趣的可以下载下来共同学习一下。

Thinkphp5-支付宝alipay/电脑与手机支付扩展库

Thinkphp5-支付宝alipay电脑与手机支付扩展库,代码非常清晰明了,拿来即用。使用说明在默认配置情况下,将文件夹拷贝到根目录即可, 其中extend目录为支付扩展目录, application\extra\alipay.

Thinkphp6.0整合PayPal支付实例

Thinkphp6.0整合PayPal支付实例,需要执行 composer install 命令安装Thinkphp框架。具体功能可以查看已经整合好的代码。

ThinkPHP5微信支付扩展库

ThinkPHP5微信支付扩展库使用说明在默认配置情况下,将文件夹**拷贝到根目录**即可, 其中 extend 目录为扩展目录需要在配置文件 /extend/wxpay/lib/WxPayConfig.php 中填写必要的参数如有退款操作

基于vue开发的转盘抽奖实例源码/支持奖项动态配置

基于vue开发的转盘抽奖实例源码,支持奖项动态配置。提供了简单的旋转逻辑和奖项位置的动态计算,样式布局使用的是绝对单位,使用者根据自身情况调整,这里默认采用的是八个奖项的转盘背景,使用者如果需要改变奖项数量,请更换转盘背景图片。食用方法:进

评论(0)条

您还没有登录,请 登录 后发表评论!

提示:请勿发布广告垃圾评论,否则封号处理!!

    编辑推荐