iDatica – бесплатный парсинг данных
插件介绍
Idatica-带有现成模板的网站的免费解析器,您可以收集价格,特征,联系人,评论等。
idatica-一个免费的网站解析器,以自动模式收集站点的所有数据,并保存到文件。在Idatica的解析器的帮助下,您可以收集竞争对手,与Lyidogenation的联系人,评论有关商品,链接到图片等等。
可能性:
•使用准备好数据收集模板;
•用分页解析目录 - 自动过渡到下一页;
•解析商品卡和单个URL;
•在页面上解析某个区域;
•自定义 - 表列的类型;
•预先检查收集的数据及其数量;
•与XPath和CSS样式合作的能力;
•调整过渡到页面的速度;
•在CSV中设置所需分离器的能力;
•查看该过程的日志。
解析器限制:
解析器不会收集URL地址(带有标签<a> </a>的链接)。
阅读有关解析器功能的更多信息:
模板 - 带有准备的解析设置的文件。您可以下载完成的设置并从所需站点快速启动数据收集,而无需初步调整。您可以将设置保存为模板。
解析具有分页的目录 - 能够独立切换到目录中的下一页,您只需要在第一页上运行解析即可。
解析商品和单个URL卡 - 使用此选项,您可以跟踪所需的商品列表。
表列的可调类型 - 该程序允许您添加所需的列数并删除不必要的列。
收集到的数据及其数量的预审查是一种工具,可让您快速评估解析设置的正确性。单击相应的按钮时,该程序将显示您在所在页面上找到的数据及其编号。
使用XPATH和CSS的功能 - 您可以使用XPATH和CSS查询语言将其附加到页面上的数据。如果您不熟悉XPATH的功能,请在信息部分中查找我们的培训文章,几分钟后,您将学习基础知识,甚至可以在复杂的网站上配置数据收集。
过渡到页面的可调速度 - 此选项使您可以设置解析到新页面后开始的时间,这避免了由于频繁的吸引力而阻止站点的阻止,并给时间加载新页面。
在CSV中设置所需分离器的能力是一个方便的选项,可让您选择所需的符号作为分离器。
查看日志 - 显示每个步骤的信息字段,哪个页面是当前解析的,收集的元素的数量等。
注意力!遵循有关自动数据收集的目标站点的策略。