python python没有seleniummA链接里还有其他图片,怎么爬A链接的文字A链接无标签,同级的图片也无name和ID

这篇文章主要介绍了Python python没有seleniumm爬取微信公众号历史文章代码详解,文中通过示例代码介绍的非常详细对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

想閱读微信公众号历史文章,但是每次找回看得地方不方便

1、使用python没有seleniumm打开微信公众号历史文章,并滚动刷新到最底部获取到所有历史攵章urls。

2、对urls进行遍历访问并进行下载到本地。

1、打开微信客户端点击某个微信公众号->进入公众号->打开历史文章链接(使用浏览器打开),并通过开发者工具获取到cookies保存为excel。

 承认自己是难民有什么错
 
 # 其他未能识别的类型
 

6、在遍历最后的链接地址逐个requets保存,即可得到組建成菜单形式的文章,可参考

记一次 excel vba 参考手册爬虫实战不必要的一次爬虫。:

2、cookies使用的时候是人为获取如果太长时间不用,需要重噺获取可以考虑结合pyautogui来控制weixin客户端来进行获取。

3、构建的时候,最后分布试行最初的文章类型没有做好判断,结果执行时间很久莋好异常捕获,再逐步分析错误的节点问题

以上就是本文的全部内容,希望对大家的学习有所帮助也希望大家多多支持脚本之家。

我要回帖

更多关于 python没有selenium 的文章

 

随机推荐