信息采集的难点是什么? 数据比较复杂, 形式多样; 下载后的难点又是什么? 数据管理. 网络信息采集大师(NetGet)的主要功能, 就是解决这两个问题. 一般数据采集是有针对性的, 通常是针对某个或者某些网站, 采集某些类别的数据. 比如采集几个网站的人才招聘信息, 产品信息, 供求信息, 公司库信息等等. 对这些网站的数据结构进行简单分析后, 设置相应的采集规则, 就可以把想要的数据统统下载到本地.


现有功能简介:
1. 本软件可采集任何类型的网站信息. 包括htm, html, ASP, JSP, PHP等. 采集速度快, 信息一致准确.
2. 网站登录。对于需要登录后才能采集的信息, 提供了简便的登录设置, 登录后轻松采集. 自动保存Cookie.
3. 支持脚本类型的网站. 专门提供了脚本类型的任务, 实行机器人自动点击采集.
4. 多任务多线程, 将采集效率最大化.
5. 数据保存格式丰富. 可把采集的数据,快速保存为Txt,Excel和多种数据库格式.
6. 采集过程中信息自动保存. 对于采集的信息, 可设定一定的时间周期, 自动保存数据. 即使机器突然断电或其他异常情况, 也能有效的保存数据.
7. 信息再加工. 对采集的信息, 可进行二次批量再加工, 使之更加符合您的实际要求.
8. 可下载二进制文件, 比如图片, 软件, mp3等.
9. 实时监测和发布(任务调度). 指定某些任务自动运行, 把采集的数据自动去掉重复之后导入数据库(可指定组合唯一项). 可循环往复运行.
10.支持多种数据库. 包括Sqlserver, Access, Mysql, DB2, Sybase等. 可自定义数据库接口(和数据库原有表对接), 或自动创建表和字段(字段长度自适应).
11.把采集的数据,直接发布到网站数据库.此功能适用于租赁的数据库, 不能直接连接, 网络提供商只提供了一个发布页面的情况.
12.可设置采集一定数据量后, 自动保存到数据库, 保存后清空历史数据. 此功能可在占用系统资源很少的情况下, 连续不间断地采集十万级和百万级数据.
13.无人值守采集. 可设置自行采集, 自动保存到数据库, 所有任务完成后自动关机, 真正做到无人值守, 提高效率, 节省能源.