软件下载

下载网站:http://www.cnblogs.com/wangzsky

极速动车组采集器系统需求

极速动车组采集器可以运行于Windows 2000或以上操作系统,CPU 的速度为 "奔腾133 MHz" 或以上,128 MB 内存容量或以上。

极速动车组采集器的安装

极速动车组采集器是绿色软件。如果您电脑上安装了微软的.NET FrameWork 2.0框架或更高版本,安装时直接解压缩到您电脑的任何地方即可完成采集器的安装--安装过程不操作注册表和系统文件,不产生任何垃圾文件!如果您安装后程序无法启动,那可能是您电脑没有安装.NET FrameWork 2.0,请下载微软的.NET FrameWork 2.0框架或更高版本并安装。附2.0下载地址:

.net framework 2.0下载地址:   http://download.microsoft.com/download/5/6/7/567758a3-759e-473e-bf8f-52154438565a/dotnetfx.exe   

解压完成后,双击目录内的WangzSoft.WebSpider5.exe文件启动主程序开始采集之旅。

极速动车组采集器特点

极速动车组采集器是一款通用型的采集器,可以满足大部分数据抓取的需要.它有如下功能特性:

   1.多任务,多线程,多数据库支持,多解析引擎
  2.多页采集
  3.分页采集
  4.循环采集
  5.网站登陆采集
  6.使用代理服务器采集数据
  7.下载图片
  8.列表缩略图及标签采集...
  9.flash文件下载
10.任意格式文件下载功能
11.使用自定义规则获取网址
12.POST方式采集列表网址或标签
13.使用正则采集内容
14.使用前后字符串方式采集内容
15.html标签排除
16.采集记录筛选
17.任务运行日志
18.自定义随机下载文件保存下载文件
19.导出采集数据为txt,mdb,sql格式
20.下载支持导出到迅雷,FlashGet
21.本地任务数据编辑再发布
23.扩展插件

极速动车组采集器使用实例几规则说明

本帮助主要介绍各种引擎使用方式,方便采集

1.新建工程

在运行左边的空白出右键选择添加工程,输入工程名称后保存 如图:

2.新建任务

在工程下右键选择新建任务

输入任务名称,添加采集网址,支持批量地址和直接网址

添加规则

点击右下角保存后即可,然后点击一键开始,立刻可以采集你要的内容,在运行界面或主页面你可以点击停止

运行完成后,右小角会有提示和播放完成声音,如果不想看到提示信息,可以在系统设置里面取消掉

在右边的树选择当前任务,点击结果菜单下面查看结果立刻可以查看到你的采集结果

查看结果后可以在结果里面选择导出到你要的文件

以上一个采集流程就完成了。

3.解析规则说明

1.字符规则,通配符*,对称符 |              例如    标题*标题2|标题结束

2.CPath规则    支持XPath 支持空格,逗号多选择器    例如    div[@class="test"] ul li[5] span

3.NQuery规则    支持JQuery语法选择器    例如:    .test li span    [5]

4.正则规则    支持正则表达式    例如:(?<=(^]+>))[^>]+   

4.帮助中心完善中,有问题请发邮件或网站留言