如何提取网页中的文字文字

如何从禁止拷贝、右键功能的网页中提取文字或图片素材_百度文库
两大类热门资源免费畅读
续费一年阅读会员,立省24元!
如何从禁止拷贝、右键功能的网页中提取文字或图片素材
上传于||暂无简介
阅读已结束,如果下载本文需要使用0下载券
想免费下载更多文档?
下载文档到电脑,查找使用更方便
还剩7页未读,继续阅读
你可能喜欢JS远程获取网页源代码实例
字体:[ ] 类型:转载 时间:
获取网页源代码的方法有很多,本文为大家介绍下使用JS是如何做到的,感兴趣的朋友可以学习下哦
代码如下: &!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN"& &html& &head& &meta http-equiv="Content-type" content="text/ charset=utf-8"& &title&远程网页源代码读取&/title& &style type="text/css"& /* 页面字体样式 */ body, td, input, textarea { font-family:A font-size:12 } &/style& &script type="text/javascript"& //用于创建XMLHttpRequest对象 function createXmlHttp() { //根据window.XMLHttpRequest对象是否存在使用不同的创建方式 if (window.XMLHttpRequest) { xmlHttp = new XMLHttpRequest(); //FireFox、Opera等浏览器支持的创建方式 } else { xmlHttp = new ActiveXObject("Microsoft.XMLHTTP");//IE浏览器支持的创建方式 } } //直接通过XMLHttpRequest对象获取远程网页源代码 function getSource() { var url = document.getElementById("url"). //获取目标地址信息 //地址为空时提示用户输入 if (url == "") { alert("请输入网页地址。");
} document.getElementById("source").value = "正在加载……"; //提示正在加载 createXmlHttp(); //创建XMLHttpRequest对象 xmlHttp.onreadystatechange = writeS //设置回调函数 xmlHttp.open("GET", url, true); xmlHttp.send(null); } //将远程网页源代码写入页面文字区域 function writeSource() { if (xmlHttp.readyState == 4) { document.getElementById("source").value = xmlHttp.responseT } } &/script& &/head& &body& &h1&远程网页源代码读取&/h1& &div& 地址:&input type="text" id="url"& &input type="button" onclick="getSource()" value="获取源码"& &/div& &textarea rows="10" cols="80" id="source"&&/textarea& &/body& &/html&
大家感兴趣的内容
12345678910
最近更新的内容
常用在线小工具当前访客身份:游客 [
当前位置:
你好,想跟你请教个问题:我想采集一个有几个亿商品的网站,它有很多套模版不知道怎么抓,能提供点思路吗
共有2个答案
<span class="a_vote_num" id="a_vote_num_
很多套模板是多少?
目前来看手写规则还是比较靠谱的方法,至于适配多少模板看你的写法了。
我读研的时候也有同学研究过自动抽取的技术,比如这篇 但是需要不少技术基础,不建议在工程项目中直接使用。
<span class="a_vote_num" id="a_vote_num_
你是说taobao么 呵呵
更多开发者职位上
有什么技术问题吗?
majinli...的其它问题
类似的话题java如何获取一个网页中指定的内容-Java/Web开发-java-电脑编程网java如何获取一个网页中指定的内容-Java/Web开发作者:budetcbc001 和相关&&请问如何快速的 获取一个网址中的 适合一定条件的内容?我代码:String urlstr = &/n?cmd=1&class=civilnews&pn=1&from=tab&;try {url=new URL(urlstr);} catch (MalformedURLException e1) {// TODO Auto-generated catch blocke1.printStackTrace();}InputStreamRBufferedReader in =try {reader = new InputStreamReader(url.openStream());in = new BufferedReader(reader);} catch (Exception e) {// TODO Auto-generated catch blocke.printStackTrace();}String temps=&&;String regEx=&[\u4e00-\u9fa5]+&;Pattern pile(regEx);Matcher m=try {while((temps+=in.readLine())!=null){//System.out.println(temps);
}} catch (IOException e) {// TODO Auto-generated catch blocke.printStackTrace();}m=p.matcher(temps);m.find();System.out.println(m.groupCount());for(int i=1;i&m.groupCount();i++){System.out.println(m.group(i));} ------回答---------------其他回答(3分)---------你不已经这样做了吗,你只要找合适的就可以了,去找这个吧,------其他回答(3分)---------正则,这个东西是我的弱项!呵呵!------其他回答(3分)---------想获取啥啊,偶给你相关资料:|||||||java如何获取一个网页中指定的内容-Java/Web开发来源网络,如有侵权请告知,即处理!编程Tags:                &                    

我要回帖

更多关于 如何提取网页上的文字 的文章

 

随机推荐