全新推出-易采网站数据采集服务

为什么要推出网站数据采集服务?

我们在多年来做产品支持的过程中,不断有客户建议我们提供网站数据采集服务服务,为客户免除购买软件、配置采集任务等等需要比较多时间和技术的事情,依靠我们在网站数据采集方面积累的技术和经验,为客户提供快捷、精准、低廉的网站数据采集服务。

我们的优势:

依托我们在网站数据采集软件方面积累的深厚技术和经验,采用自动化采集和人工辅助采集相结合的方式,我们可以快速采集到您所需要的复杂数据,并以您要求的各种方式(文本、CSV、EXCEL、数据库等等)提供给您。我们合理的价格和诚信为首的服务必然是您的不二之选。

服务流程:

1.您把您的采集要求发送给我们(sales@digeststar.com)。
2.我们根据您的采集要求,计算要采集的数据量,评估采集难度,把我们的采集结果样板和报价反馈给您。
3.协商一致后,我们开始为您进行采集。根据采集的难易,所需时间从1天到几天不等。
4.我们把采集结果截图(部分或全部)发送给您,您确认后付款。
5.我们收到款后把采集结果按照您预先要求的格式发送给您,完成交易。


易采网站数据采集系统




免费下载试用
易采网站数据采集系统 是一款功能全面、准确、稳定、易用的网络信息采集软件。它可以轻松将你想要的网页内容(包括文字、图片、文件、HTML源码等)抓取下来。采集到的数据可以直接导出到EXCEL、也可以按照你定义的模板保存成任何格式的文件(如保存成网页文件、TXT文件等)。也可以在采集的同时,实时保存到数据库、发送到网站服务器、保存到文件。

软件特色:

1. 图形化的采集任务定义界面 你只需在软件内嵌的浏览器内用鼠标点选你要采集的网页内容即可配置采集任务,无需像其它同类软件一样面对复杂的网页源码去寻找采集规则。可以说是所见即所得的采集任务配置界面。

2. 创新的内容定位方式,定位更准确、稳定 同类软件基本上都是根据网页源码中的前导标记和结束标记进行内容定位,这样一来,用户就不得不自己去面对网页制作人员才需要面对的HTML代码,付出更多额外的学习时间才能掌握软件的使用。同时,只要网页内容稍有变更(简单的如改变一下文字的颜色)定位标记即极有可能失效,导致采集失败。我们经过艰难的技术攻关,实现了全新的定位方式:结构定位和相对标志定位。大家都知道,一个网站的风格基本上是固定的,其同类网页内容的编排布局基本相同。这就是结构定位可行之处。当然基本相同不等于100%相同,不过,我们攻克了技术难关,消除了这些障碍。我们的定位方式的优势在于:1.用户只需用鼠标点击就可以配置采集任务,实现所见即所得的采集任务配置界面;2.网页内容的变化(如文字增减、变更,文字颜色、字体的变化等)不会影响采集的准确性。

3. 支持任务嵌套,可采集无限级的页面内容 只需在当前任务的页面中选择指向你要采集的下级页面的链接,即可建立嵌套任务,采集下级页面的内容,且嵌套级数不限。这种便利都得益于我们全新的内容定位方式和图形化的采集任务配置界面。

4. 可同时采集任何内容 除了最基本的文字、图片、文件外,还可以采集针对具体HTML标签的源码、属性值等。

5. 强大的信息自动再加工能力 你可以在配置任务的时候,指定对采集到的内容进行任何的替换、筛选。

6. 可对采集到的内容进行自动排序

7. 支持采集结果保存到EXCEL和任意格式的文件 支持自定义文件模板。

8. 支持实时保存到数据库 支持ACCESS、SQLSERVER、MYSQL数据库(后续版本还将支持更多类型的数据库)。

9. 支持实时上传到网站服务器 支持POST和GET方式,可自定义上传参数,模拟人工提交

10. 支持实时保存到任意格式的文件 支持自定义模板,支持按记录保存和将多个记录保存到单个文件,支持大纲、明细式的保存(所有记录的某些内容保存到一个大纲文件中,然后每条记录又单独保存到一个文件。

11. 支持多种灵活的任务调度方式,实现无人值守采集

12. 支持多任务,支持任务导入和导出



网页文字抓取器




免费下载试用
网页文字抓取器 是个小巧的网页文字抓取工具,可以让你轻松抓取和复制那些禁止选择和拷贝的网页上的文字。对于页面上的内容被大面积的广告盖住看不到的网页,网页文字抓取器抓取下来再看也是个不错的解决办法。

软件特色:

1. 小巧易用 只需移动鼠标到要抓取的文本上即可抓取,无需选择目标文本。

2. 突破限制 可抓取任何网页上的文本,即使网页右键菜单被禁用、鼠标选择操作被禁止,也可成功抓取。

3. 内容过滤 可过滤网页作者加入到页面中的透明文字、垃圾文件、干扰文字。