常见的反爬机制及处理方式
1、从囻政数据网站中提取最新行政区划代码链接
最新的在上面命名格式: 2019年X月中华人民共和国县以上行政区划代码
# 先获取假链接的响应,然后根據响应获取真链接
start: 0 # 每次加载电影的起始索引值
json文件在以下地址:
基准URL地址+查询参数
二级页面地址(postId在变,在一级页面中可拿到)
/中的电影详情数據 用抓包工具捉取 使用ajax加载页面的请求 鼠标往下下滚轮拖动页面,会加载更多的电影信息,这个局部刷新是当前页面发起的ajax请求, 用抓包工具捉取页面刷新的ajax的get请求,捉取滚轮在最底部时候发起的请求 这个get请求是本次发起的请求的url ajax的get请求携带参数 获取响应内容不再是页面数据,是json字符串,是通过异步请求获取的电影