图腾数据采集器 Powered By www.luckytt.cn ★①软件说明★ 本采集软件,作者制作初衷是为了采集图片使用的,但是后来经过改良,加入了很多新的元素和规则,融合了很多优秀的采集器优点, 现在不单单可以采集图片,还可以把图片本地化+图片水印、可以采集文章+在文章随机加入自定义的搜索关键词,起到对网站SEO作用。 本采集器把采集内容生成CSV文件(多个可合并),然后使用附带的在线入库程式,导入你的网站。 支持phpwind5.X 、DZ5.X、DVBBS PHP版、phpcms、php168、dedecms、verycms、帝国cms、SupeSite5.X ……,目前主流的网站系统入库。 ★②基本功能介绍★ 1、使用站点+任务方式组织节点,方便采集及管理。 2、每个站点可以定义一个规则,也可以从其他规则中复制派生出来,还可以自己独立修改自己的规则。 3、站点规则可以自由复制,粘贴,导入,导出,方便与大家共享自己的采集资源 4、参数设置,可以设置标题前辍、设置搜索关键词,将会随机插入文章中,使得采集同时对网站起SEO作用,加速你的站被收录! 5、可以使用排他和替换等过滤你不想要的内容,或者使用软件自带的自动过滤广告模块,来过滤JS、Frame等广告。 6、可以使用系统内置的13个HTML排除标签,方便排除无用html代码 7、支持内容分页采集 8、支持二种网址添加方式,支持采集区域内网址 9、支持图片本地化并加图片水印 10、支持gbk,utf-8,big5网站的数据发布到任何gbk,utf-8,big5的编码转换 11、支持自动生成采集时间和文章点击率,记录来源地址 12、文章在发布前可以预览,编辑至满足要求后再发布 13、多线程无刷新采集,进度条显示等等... ★③简单使用说明★ 1、首先添加你的采集项目,如果是同个站点不同栏目采集,可以使用复制来派生出新的项目。 2、选择你的采集项目 3、点击开始采集按钮 4、直到采集完毕后,将在软件右边列表中列出所有符合规则的采集目标 5、选择一个或多个采集目标。并生成CSV文件 6、CSV文件内定尺寸为2MB,也可以通过参数设置那修改,来满足各人的需要 7、生成的CSV文件保存在软件的CSV文件夹里,如果生成多个CSV,可以用合并功能,合并为一个再执行导入网站 8、连接 http(s)://你的网站/mycjq.php ,执行导入你的网站 ★④规则添加/修改方法★ 1、区域表示法则:用{DATA}表示有效内容 2、替换表示法则:原始字段|目标字段 (注意:如果原始字段中还包含变量的请参考区域表示法,用{DATA}表示变量部分) 3、规则基本法则:一行表示一个规则。 4、采集方式:单页批量采集和分页批量采集 ⑴ 单页批量采集:把采集目标列表地址填写好,一行一个地址 ⑵ 分页批量采集:把采集目标列表地址填写好,然后用 {page} 表示分页变量 下载地址: http://www.luckytt.cn/download/ttspider.rar