功能介绍: 1、支持文章内容分页采集; 2、支持论坛采集 3、支持UTF-8转换到GB2312,可采集内容字符格式为UTF-8的目标; 4、支持把文章内容保存到本地; 5、支持站点+栏目管理方式,使采集管理一目了然; 6、支持链接替换、分页链接替换,破解某些使用JS/后台程序设置的防采功能; 7、支持采集器设置无限过滤功能; 8、支持图片采集保存到本地,自动替换文件名避免重复; 9、支持FLASH文件采集保存到本地,自动替换文件名避免重复; 10、支持限制PHP FOPEN、FSOCKET函数功能的虚拟主机; 11、支持采集结果人工筛选,并提供“空标题、空内容”的快速过滤删除; 12、支持Flash专业站采集,专门采集flash小游戏,可完美采集缩略图、游戏简介; 13、支持全站配置规则导入、导出; 14、支持栏目配置规则导入、导出,提供规则复制功能简化设置; 15、提供导库规则导入、导出; 16、支持自定义采集间隔时间,避免被误认为DDOS攻击而拒绝响应,可采集设置了防DDOS攻击的网站; 17、支持自定义入库间隔时间,躲避虚拟主机并发数限制; 18、支持自定义内容写入,用户可设置任意内容(如自己的链接、广告代码),写入到所采集内容的:最前面、最后面,或者随机写入;导库时自动带上需要写入的内容,无需修改您WEB系统的模版。 19、支持采集内容替换功能,用户可设置替换规则随意替换; 20、支持html标签过滤,允许采集到的内容仅保留必要的html标签甚至无任何html标签的纯文本; 21、支持多种CMS导库 程序包内含PHPCMS V2/V3、DedeCms(织梦) V2/V3、PHP168 CMS、mephpcms、Mambo CMS、Joomla CMS系统导库规则及操作指南说明; 22、支持PHPWIND、Discuz论坛导库,程序包内含2大论坛导库规则及操作指南说明; 23、附带数据库优化工具,减少频繁采集数据碎片过多降低数据库性能。 以下特殊功能仅“小蜜蜂采集器”拥有: 1、支持采集过程断点续采功能,不受浏览器意外关闭影响,重新启动后不会重复采集; 2、支持自动对比过滤功能,对已采集的链接系统不会进行重复采集和入库; 以上两条功能可大幅度减少采集时间,降低系统负载。 3、支持系统每日自动创建图片保存目录,方便管理; 4、支持采集/导库间隔时间设置,避免被目标站识别为流量攻击而拒绝响应; 5、支持自定义内容写入,达到简单防采功能; 6、支持html标签过滤,近乎完美的显示您想要的采集效果; 7、完美的内容入库解决方案,不受目标程序语言、数据库类别限制。 以上众多强劲功能给您免费使用,即刻安装使用体验信息采集的轻松、高效。 v1.619更新: 本次功能升级针对文章采集模块,增加诸多强劲功能。 1、文章采集:增加采集内容替换功能,用户可设置替换规则随意替换; 2、文章采集:目标链接地址定义支持多规则,降低因目标站使用多种链接标志防采导致采集链接不完整几率; 3、文章采集:增加列表页URL地址步长值设置,可采集非简单加1增长的URL地址; 4、文章采集:内容规则定义增加多规则支持,灵活运用可采集某些通过设置多套显示模版来防采的目标; 5、文章采集:增加html标签过滤设置,允许采集到的内容仅保留必要的html标签甚至无任何html标签的纯文本,降低过滤难度; 6、文章采集:内容分页规则定义增加替换功能,可获取某些通过JS或后台程序变换真实地址的内容分页链接; 7、文章采集:增加内容写入功能,用户可设置任意内容(如自己的链接、广告代码),写入到所采集内容的:最前面、最后面,或者随机写入;导库时自动带上需要写入的内容,无需修改您WEB系统的模版。 8、内容导库规则模版:增加PHPCMS v3.0 数据库直导规则; 9、修正部分显示模版的设置。 下载地址:http://www.jhdown.com/soft/3/59/html/2006033014007.html