网络矿工采集软件
网络矿工采集软件(Soukeyminer,以下简称网络矿工)是一款集互联网数据采集、数据编辑、数据存储、数据发布、数据监控为一体的专业数据采集软件,其不仅可通过内置的配置工具将采集变得简单,而且还可轻松应对复杂结构网站数据的采集。网络矿工采集极其专业,功能丰富,操作简单,同时辅以完善的服务体系助您无忧采集。
概况
特点
- 多线程 多任务 多实例运行机制
可以同时执行多个采集任务,每个任务可多个实例多线程运行;
- N层导航 跨层采集 多页采集
通过N层导航技术,支持跨层、多页采集功能,对复杂的网站结构进行海量采集;
- 强大的采集数据编辑能力
数据采集能力超强,同时提供了强大的数据加工操作,完美实现高质量数据的输出;
- 真正的无人值守运行模式
后台服务运行模式使您的其他工作不受干扰,真正的无人值守;
- 可视化采集
所见即所得,点点鼠标即可完成采集的配置,简单便捷,易于上手;
- 轻松应对数据发布
提供发布模版工具,可制作复杂的网站发布规则及数据库发布规则,发布数据easy;
- 网络雷达 / 数据监测
自动监控您想要的数据,犹如在网络中设置了一双眼睛,帮您监控数据的变化;
- 自由灵活的计划任务
定时运行最小间隔可达到5分钟,可按照周、日灵活制定采集计划;
- 智能采集 / 配置助手 / 嗅探器
智能提取标题、正文、时间等信息;配置助手、嗅探器辅助您完成复杂规则配置;
- =OCR识别 / 图片水印
可实现英文、数字图片到文本的识别;可对下载图片自动增加水印;
- 文件下载 / 支持多数据库
支持任意文件下载,支持MSSqlserver、Access、Mysql等数据库;
- 插件扩展
支持插件,可通过插件扩展属于自有的采集功能;
使用手册
使用教程
网络矿工使用教程
视频讲解
视频讲解
用户手册
用户手册
FAQ
网络矿工FAQ
主要功能
- 数据采集:以数据采集为核心提供了导航、多页、代理采集、跨层采集、文件下载、编码解码、参数配置等功能,确保在数据采集时可应对各种复杂的采集配置需求;
- 强大的采集能力:支持各种编码、压缩采集,可实现U码转换、HTML代码转换,支持cookie登录采集、自定义HTTP Header,支持代理轮询、采集延时等多种设置,支持各种排重,具备断点续采能力;
- 可视化及智能:全面支持可视化配置,从导航、翻页及数据采集规则,都支持可视化的配置;
- 数据加工:提供了各种字符串的加工方式,可边采集边进行数据加工,同时也提供了专用的数据加工工具,可进行数据表合并、创建列、数据格式化等多种方式,最终可获取到高质量的数据信息;提供OCR识别能力,图片水印功能及伪原创功能;
- 数据发布:数据可发布到数据库(Access、mssqlserver、MySql),也可直接发布数据到网站,同时还提供了直接入库的模式,适应采集海量数据;
- 发布模板:提供发布模板,助您实现一键发布操作;
- 多种辅助工具:数据加工发布工具、日志工具、HTTP嗅探器、编解码助手、正则分析器、配置助手,全面辅助您完成配置工作;
- 插件支持:支持.net插件,用户可基于接口扩展自己个性化的功能,网络矿工提供了cookie获取、数据加工及数据发布的接口操作;
- 数据监控:提供文字匹配及数字匹配规则,满足数据监控的大部分需求,并可对监控数据进行预警、快照保存等操作;
- 其他:支持灵活的定时采集策略、静默运行等多种附加功能,不仅可以方便用户的采集工作,也从数据采集实用角度大大丰富的软件的功能应用;
相关条目
采集
参考来源
网络矿工官方站点
请先 登录后发表评论 ~