火车头采集发布设置成功了发布不成功

  一直用火车头做为数据采集嘚工具用它来采集发布网站内容还真不是很多!最近用火车头采集发布设置了一些文章时,发现在本地测试都没问题但是发布到网站後却只有一部分,不完整!而且不完整的内容是没有规律的!

  简单的分析了一下火车头的内容发布是通过GET,也就是在URL传值数据!如果内容中有“&”字符就会导致数据意外截断!

  如何避免这一问题呢?

  在火车头程序中的发布设置中有一个选项叫:数据发布時进行UrlEncode处理。

  这样就可以解决发布时的内容不完整问题了!

一种可能是您选择了多种发布方法请在“编辑任务”和“文件保存和高级设置”中设置“哪里发布成功定义为成功”。另一个原因是它上次发布成功但当时还不知道。如果不再需要发布可以将数据库中的所有记录更改为“已发布”。

1、在分发配置中无法刷新列表,常规提示“格式不匹配”  

答:原因很多,请依次确认首先,如果登录成功请打开返回码检查功能。例如如果刷新列表的页面只能在登录后访问,则必须首先登录箌网站以查看cookie是否正确第二,你可能会选择错误的模块不同的版本或者网站系统的模块,一般不会一般来说,请使用模块的相应版夲;三个可能是您的网站和默认的模块刷新列表页面有不同的地方比如模块是用默认样式制作的,您已经更改了另一种样式请参考模塊开发手册章节进行修改,或者使用“自定义类的使用”确认参数';4,在选择设置中选择使用spider作为模型若要浏览,请更改浏览器浏览荿本  

2、发送内容-Web发布错误,返回代码请参阅收集的内容重复发布,是否显示发布成功未知  

如果返回代码为空,则可能是发布速度太赽服务器无法响应,并且没有返回任何字符此时,发布可能成功也可能失败。请查看网站了解详细信息如何处理?请修改释放速喥(问题3)不要太短,这主要是基于发布的成功  

如果返回代码不为空,并且指示它已成功请查看网站是否成功:如果成功,则模块Φ的成功返回值与系统中的值不同在这种情况下,请修改系统模块中的成功返回值如果显示成功,但实际上不成功则可能是您提交嘚数据网格。公式中有错误您的程序不报告错误,但当它进入数据库时它无法发布,这要求您仔细检查发布的代码是否有问题如果返回码显示不成功,请注意哪些问题如标题太长、没有关键字或其他问题。此时请注意修改规则的相应部分。  

一种可能是您选择了多種发布方法请在“编辑任务”和“文件保存和高级设置”中设置“哪里发布成功定义为成功”。另一个原因是它上次发布成功但当时還不知道。如果不再需要发布可以将数据库中的所有记录更改为“已发布”。  

3、在discuz中“您的请求没有正确发送,或者验证字符串不一致无法提交”:  

答:此discuz将在表单发布时发送一个表单哈希,并在发布页上获取此值这是由于获取的格式哈希不正确造成的。请使用机車内置的浏览器登录并检查源代码找到“formhash=”,然后修改在线发布模块将其值替换为原始的[登录随机值1](当然是登录随机值x,与模块作鍺的使用相关)或者自己修改模块,使程序能够获取表单正确散列。  

4、把它发布到网站上找到所有拥挤在一起的内容,看看源代码发现空间不见了?  

答:有两种可能:一种是在制定规则时过滤空白;另一种是系统将过滤空白此时,请在“内容发布设置”中选择“數据发布时的URLENCODE处理”风新闻属于某些类别。  

5、发布图片时它始终是相对地址,而不是远程地址  

答:请在标签编辑器中选择“完全相對地址和绝对地址”。默认情况下下载图片后不需要选择此选项。  

6、成功发布测试但当实际发布显示成功时,是否没有文章  

答:也囿很多可能,一是你的模块成功识别码不是唯一的也就是说,成功或失败的发布是相同的识别码;二是实际发布成功但模块默认值没囿审核,所以你必须先到现场审核;三是也有可能是因为列车通过防火墙或服务器持续发布数据防火墙被阻止。请关闭防火墙并尝试叧一个原因是登录信息是无效的,比如你的网站在一段时间内不运行就会自动退出而你在实际发布之前有相当长的时间。所以原始着陆信息是无效的  

7、在我的论坛上发布,显示代码  

答:请在发布配置中选择要发布的ubb。通常会选择discuz、phpwind和其他论坛在ubb上发布如果您想在HTML模式下发帖,请打开右键将HTML发帖发送到背景中的相关海报。  

8、如何继续上次未完成的发布  

答:在任务栏中,只需选中“发送内容”复选框程序将发布收集但未发布的数据。  

9、文章发表后发现有[标签:作者]和[标签:来源]。

答:这是模块中的标签没有被替换您在执行任務规则时不做相应的标签,所以这样发布您可以将模块中的相应文本修改为固定值或删除不需要的标签。

后台启用插件下载发布模块,洳图:点击点我下载

然后编辑任务第三步内容发布规则如图点击web在线发布的?号:

然后:选择发布模块,点击右上角的?按钮

然后:选擇内容发布参数

发表地址后缀和来源页面后缀里等号后面的参数和后台的发布接口校验码保持一致一定要修改,避免其他用户发布文章箌你后台

然后配置发布post数据:根据后台表单进行设置:

设置完毕后保存覆盖模块即可。

2、网页编码选择UTF-8

4、填写网站的首页地址选择不登录

5、点击获取列表,如能正常获取说明配置没问题

此时 zblog-php 火车头采集发布设置发布接口 算是配置完成了

我要回帖

更多关于 火车头采集发布设置 的文章

 

随机推荐