之前有整理过Selenium的使用,这里重新用python整理一下
对象选择
1 | from selenium import webdriver |
节点交互
1 | # 节点交互 |
一片净土
之前有整理过Selenium的使用,这里重新用python整理一下
1 | from selenium import webdriver |
1 | # 节点交互 |
1 | import asyncio |
请求偶尔会出现的问题,900条数据报错4条
1 | 2022-03-07 14:45:30,663 - ERROR: error occurred while scraping https://spa5.scrape.center/api/book/4903440 |
1 | from parsel import Selector |
pip install beautifulsoup4
1 | html = """ |
1 | soup = BeautifulSoup(html, 'lxml') |
/
当前节点的直接子节点//
当前节点选取子孙节点.
当前节点..
当前节点的父节点@
选取属性nodeName
选取节点的所有子节点1 | from lxml import etree |
1 | from lxml import etree |
1 | from lxml import etree |
最近买了本《python3网络爬虫开发实战》,之前scrapy爬虫有过研究,但是没有系统的买书研读过,挺感兴趣所以试试
urlopen
1 | ''' |
Request
1 | import urllib.request |
error
1 | from urllib import request, error |
遇到一个需求,需要Selenium进行POST带参数请求,想到的方法是执行js脚本
1 | ChromeDriver webDriver = new ChromeDriver(); |
输出顺序:
new Promise()实例
Promise.then/catch/finally、process.nextTick
setTimeOut、AJAX、文件操作
async和await是ES8引入的新语法,用来简化Promise异步操作
用来修饰返回Promise对象的函数
1 | // 当函数中出现await,则函数必须用async修饰 |
1 | // A B C r1 r2 r3 D |