网页数据抓取采集软件 WebHarvy 6.4.0.191 英文版

2021年12月21日22:33:39评论158阅读模式
所属分类:网络工具 最后更新:2021年12月21日 22:39

今天的软件分享是 Windows 平台的 ,该软件是5ilr绿软最新搜集整理的一款网页数据抓取采集程序,该应用可以提取网页里的文本及图像,输入网址即可打开,默认使用内部浏览器,允许扩展分析,可以自动获取相似链接的列表,比如采集网址、电话、地址、邮箱、价格表等信息,该应用界面直观操作简单。

WebHarvy是一款网页数据获取应用,通过本应用您可以直接在网页上选择需求选择的资源,也可以直接将整个网页存储为HTML的格式,从而提取网页里面的所有文本以及图标内容,当您复制一个URL地址的时候,应用默认使用内部浏览器组件打开,可以显示完整的网页,随后您可以开始配合数据抓取的规则。SysNucleus WebHarvy允许扩展分析可以自动获取相似链接的列表,复制一个地址就能搜索多个网页内容,无需编写任何脚本或代码来抓取数据。您将使用WebHarvy的内置浏览器查看网页,您可以选择要单击的数据,WebHarvy自动识别网页中发生的数据方式。因此如果您需求从网页上刮取项目列表(名称,地址,电子邮件,价格等),则无需执行任何其他选项。

如果数据重复WebHarvy会自动删除它,您可以以多种格式存储从网页中提取的数据。WebHarvy Web Scraper的当前版本允许您将抓取的数据导出为Excel,XML,CSV,JSON或TSV文件,您也可以将抓取的数据导出到SQL数据库。通常网页在多个页面上显示产品列表等数据,WebHarvy可以自动抓取并从多个页面提取数据。只需指出“链接到下一页”,WebHarvy Web Scraper就会自动从所有页面中抓取数据。

小编制录制了一个简单的基础操作供大家参考:

截图预览

网页数据抓取采集软件 WebHarvy 6.4.0.191 英文版

小编测试发现可以截取文库文本,但格式是错乱的。

网页数据抓取采集软件 WebHarvy 6.4.0.191 英文版

功能特色

  • 支持智能识别方式;
  • 支持导出捕获的数据;
  • 支持从多个页面提取;
  • 直观化的操作界面;
  • 支持基于关键字的提取;
  • 支持提取分类;
  • 支持使用正则表达式提取;

更新内容

webharvy.com

下载地址

网页数据抓取采集软件 WebHarvy 6.4.0.191 英文安装版

历史版本

为防恶意采集部分内容需回复下载,造成不便还请见谅!

免责声明:根据《计算机软件保护条例》第十七条规定“为了学习和研究软件内含的设计思想和原理,通过安装、显示、传输或者存储软件等方式使用软件的,可以不经软件著作权人许可,不向其支付报酬。”本站所有内容资源均来源于网络,仅供用户交流学习与研究使用,版权归属原版权方所有,版权争议与本站无关,用户本人下载后不能用作商业或非法用途,需在24个小时之内从您的电脑中彻底删除上述内容,否则后果均由用户承担责任;如果您访问和下载此文件,表示您同意本声明,否则一切后果请您自行承担。如果您喜欢该程序请支持正版软件,购买注册获得更好的服务。 本站为个人博客非盈利性站点,并不贩卖软件,不存在任何商业目的及用途。
  • 本文原创发表于5ilr绿软!

  • 除非特殊声明,本站文章均为原创,转载请务必保留本文链接!

    https://www.5ilr.com/webharvy.html

匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: