胖鼠采集(Fat Rat Collect) 是一款能够帮助你网站自动化的工具.自动采集,自动发布,省心省力,由作者Fatrat独立开发的一款开源WordPress采集插件。
初始化学习的例子有: 微信采集 简书采集 御龙在天新闻采集 寻仙新闻采集 心理咨询师新闻采集 虎扑新闻采集 直播8新闻采集,
并支持爬取任意网站列表详情页面 如(今日头条, 腾讯新闻, 简书, 知乎 …)
注: 胖鼠采集 坚持以开源学习,和大家使用最方便为宗旨!
- 胖鼠采集是完全内嵌到wordpress插件里面,不需要脱离Wordpress,
- 不会安装其他任何第三方软件. 功能强大。相比其他插件. 胖鼠很有优势.
- 胖鼠是使用 Html,Jquery语法 爬取和剔除数据. 比其他采集器, 更灵活,
- 胖鼠软件的设计思想分三大块. ①爬虫模块, ②配置模块, ③数据模块
- ①爬虫模块主要使用配置模块的各种特色配置来爬取数据.
- ②配置模块为爬虫模块提供支持.
- ③数据模块支撑胖鼠各种特色发布功能!
安装插件
- 在wordpress插件搜索 胖鼠采集 安装即可
- 前往WP官网下载:https://wordpress.org/plugins/fat-rat-collect/
- Github 开源地址:https://github.com/fbtopcn/fatratcollect
插件作用
- 自动任务: 可以自动采集文章, 也可以自动发布文章.
- 手动执行: 自动时间没到? 咱们手动来.
- 文章过滤: 再用不用担心爬取重复啦.
- 站群: 定时发布,维护站群好帮手.
- 导入数据: 一键导入,站群导入.
- 导入数据: 爬回来的数据预览, 单数据发布.
- DEBUG模式: 帮你调试配置规则.
- 分页爬取: 爬取目标站历史文章.
- 手动配置采集规则采集任何网站 : 只要你只会一点点Html JQery即可写规则。如果你会一点点Html Jquery。自己搞应该没一点毛病。
- 例:你可以用爬虫盯着 某新闻网站的 热门新闻列表页 当出现热点事件,他们第一时间更新文章。我们自动定时爬虫就抓到了。
功能演示
- 胖鼠采集部分功能图片给大家看一下
- 上来就有几个默认的配置。大家自动导入直接用。
- 规则配置非常简单。作者秉承开源精神。想给大家做一款开源好用的采集工具。
原创文章,作者:Tony,如若转载,请注明出处:https://www.xxside.com/1869.html
思德心语,壹群:799239814