Puppeteer入门
1.背景需求
刚好公司的app,定制包比较多,当初经常出现app里二维码页面图片丢失或者有些白屏,打出来的包比较多又不好人工验证,所以可以使用Puppeteer。跳转到二维码页面截图,识别二维码,是否与预设的地址一样。还有每次有新客户的时候,就有友盟,微信,极光7,8个key需要申请,也可以使用puppeteer来完成。缺点就是维护成本比较高,需要经常更新。
2.Puppeteer介绍
Puppeteer
是一个Nodejs
的库,可以用来做爬虫,加上百度文字识别,用于识别验证码,可以过一些简单表单提交,验证码比如一些字母加数字的比较好识别,一些不好识别图片就没办法了。也可以监听网络请求,比如监听到某些请求,然后去抓取里面的数据。应用场景还是蛮多的。
3.Puppeteer入门
1.安装
1 | npm i puppeteer |
安装时报错:Chromium revision is not downloaded
手动下载的办法
1)先下载https://download-chromium.appspot.com/
2)下载后解压到项目路径
3)配置路径
1 | const browser = await puppeteer.launch({ |
2.目录结构:
3.简单的例子
1 | //一个截取百度图片的小例子 |
4.介绍几个比较实用的
1.第一个当然是截屏(可以截取想要的位置,比如想识别一张验证码,需要先截取验证码的图片,再去识别)。
1 | const puppeteer = require('puppeteer'); |
2.iframe标签里面的内容(登陆qq邮箱的简单例子)
1 | const puppeteer = require('puppeteer'); |
3.鼠标事件(比如有些网站验证比较简单,输入账号密码之后,只需要拖动滑块便可完成验证)
1 | await page.mouse.move(0, 0); |
4.监听事件
1 | page.on('response', response => { |
以上这些感觉是比较常用的东西。