94采集器5.2.4 采集规则和以前版本的规则其实是差不多,但是旧版本的规则是无法在94caiji 5.2.4版本使用的,至于在编写和设置方面,差别是不大的。这里我们详细的写一下。
- [2022最新 图文版]94采集器5.2.4 采集规则和采集任务教程 94caiji
- [2022最新 图文版]94采集器5.2.4 采集配置和采集教程 94caiji
- [2022最新 图文版]94采集器5.2.4 安装方法和采集教程 94caiji
注意:如果需要示例规则或者是可以用的规则,可以在页面底部查看。
规则环境
宝塔面板+Python+94采集器5.2.4
规则添加
导入可以使用的最新规则,粘贴规则代码进去
测试规则
粘贴采集链接进去,测试一下规则是否正常,按照下图顺序操作
任务添加
任务采集方面有很多重要的需要设置,设置的时候要考虑你的服务器性能和网站本身的需求。这里我详细的写一下,然后大家主要看图片设置,因为我是VPS测试的,所以一些参数设置的比较小,仅供参考。
任务ID:空白,后期生成会自动补数据
规则ID:选择采集规则
任务名称:随便写
间隔时间:这里的单位是秒,数据太小,会导致采集源站屏蔽,一般600-1800秒
添加类型:有四个选项,一般默认选“添加” 正常采集
默认、书号、书号列表、列表:这个选择是根据你规则来选择和配置的,这里我们的规则是按照列表来采集的,所以图片中我们只配置了列表,具体设置可以参考自己规则配置。
封面更新:否
简介更新:否
标识修复:是
字数修复:1000
采集间隔:0.1-10
重试次数:5-60
重试间隔:1-30
最低章节数:2 章节数低于2章节的不采集
最高章节数:10000 章节数高于10000章节的不采集
UserAgent:直接选择,因为在配置系统参数的时候已经加入了
对比方式:最后章节名称 按需选择
小说线程数/章节线程数:根据服务器配置写,我是1H1G的测试vps 所以写1-2
代理信息设置:如果用代理 这里设置
过滤信息设置:如果有不想采集的小说名称,写这里
原创文章,作者:Tony,如若转载,请注明出处:https://www.xxside.com/5012.html
思德心语,壹群:799239814