最新PHP新闻小偷采集站开源版本源码分享,集成六个广告位,不限制域名,站群引流神器,24小时全自动更新,解放您的双手,获取搜狐网站最新更新,网站配置好后,不再需要人工维护,每天都会有大量包含相关长尾关键词的新闻热点文章发布,所发布的文章被搜索引擎收录后,会带来可观的流量,采用高性能文本缓存,无需数据库,文章第一次访问时,程序连接搜狐抓取文章数据,生成文本缓存文件,无需数据库,再次访问时,程序仅读取本地缓存文件,如同访问静态页面,极速访问。10万篇文章仅占用600MB左右硬盘空间。
只需要输入目标站地址就能全自动采集,高智能的采集程序,支持98%的单级域名站点
规则制作十分简单,菜鸟也能制作采集规则,采集不求人(内置1条采集规)
通杀所有单域名站点
ftp上传需使用二进制上传方式,方法请百度
data文件夹需要读写权限,一般空间不用设置,vps的话,win系统给users用户读写权限,linux给766或777权限
首次使用程序请到后台进行相关设置,否则出现错位、空白等现象
默认后台:http://网站地址/@admin/index.php默认账号:admin默认密码:admin
程序使用环境php5.2-php5.5,强烈推荐使用php5.4
功能简介:
后台配置采集节点,输入目标站地址即可全自动智能转换自动全站采集
支持https、支持POST获取、支持搜索、支持cookie、支持代理、支持解密防盗链、支持解密防采集
全自动分析内外链接自动转换、图片地址、css、js,自动分析CSS内的图片使得页面风格不丢失
广告标签,方便在规则里直接替换广告代码
支持自定义标签,标签可自定义内容、自由截取、内容正则截取。可以放在模板里,也可以在规则里替换
支持自定义模板,可使用标签diy个性模板,真正做到内容上移花接木
调试模式,可观察采集性能,便于发现和解决各种错误
多条采集规则一键切换,支持导入导出
内置强大替换和过滤功能,标签过滤、站内外过滤、字符串替换、等等
IP屏蔽功能,屏蔽想要屏蔽IP地址让它无法访问
蜘蛛访问记录
高级功能:
url过滤功能,可过滤屏蔽不采集指定链接
伪原创,近义词替换有利于seo
伪静态,url伪静态化,有利于seo
自动缓存自动更新,可设置缓存时间达到自动更新,css缓存
简繁体互转
代理IP、伪造IP、随机IP、伪造user-agent、伪造referer来路、自定义cookie,以便应对防采集措施
url地址加密转换,个性化url,让你的url地址与众不同
关键词内链功能