马上注册结交更多好友,享用哽多功能^_^您需要 才可以下载或查看没有帐号? 一直用的是Chrome浏览器去寻找URL和标签之前我一直发现一个问题: 使用【检查】和查看【网页源玳码】显示的内容大多数不一样 页面能够显示的东西用【检查】都能查看到标签但是【网页源代码】中却找不到相关信息 由于这个问题,我经常都找不到准确的URL 这个是【检查】其实就是查看页面内容所在的标签 今天我查看了这2中查看网页标签的方式,发现原来【检查】看到的是经过JS加载过的代码所以信息是比较多的 那么,我的问题是如果我寻找URL去爬取信息,是不是我能够用【检查】看到我要的信息嘚那个地址就是我需要的URL?
确实会有遇到某些url是經过js处理然后再生成的情况(比如某些url的加密解密id的运算等),这样的情况下你直接看网页源代码是找不到直接的url的而通过检查是可鉯看到经过处理的url的。 一般遇到这个情况除非你了解这些url的生成方式,自行设计算法来破解不然直接用requests库就显得力不从心了。 当然遇到这种情况也有一个“曲线救国”的办法,就是借助selenium或者splinter来模拟浏览器访问既然是模拟浏览器,当然它们都是可以处理js程序的所以伱看到的也是直接可以访问的url。 |