请将题目填写完整
上一单元
单元(共单元)
下一单元

第十五课(06):数据抓取如何停止?

3分钟




【课程目标】





目录:

  • 知识点1--获取结构化数据-定义(课程时长:4分钟)
  • 小任务1--方式1_整表获取“直观表格”(课程时长:5分钟)
  • 小任务2--方式2_DIY数据获取规则(课程时长:5分钟)
  • 小任务3--方式3_“非表单数据”获取(课程时长:8分钟)
  • 知识点2--结构化数据原理(课程时长:5分钟)
  • 知识点3--数据抓取如何停止?(课程时长:3分钟)




二、学习内容:


  • 课程简介:知识点3--数据抓取如何停止?(课程时长:3分钟)
  • 学习目标:掌握 ★★★
  • 难易程度:一般 ★★★
  • 讲义下载:文末进群-获取“讲义PPT”




2.1 视频教程





2.2 文档教程


1. 操作多页数据,如何确保获取完整数据?

若需获取多页数据,在开始运行流程时,需要将网页保留在所需抓取数据的首页,这样才能获取到完整的数据。



2. 组件是如何知道停止抓取的呢?

通过设置对应的终止条件:当以下几个条件满足任意一个的时候,则结束本次自动翻页抓取功能。

  • 达到设定的结构化数据抓取条数上限;
  • 翻页按钮状态被disable; 获取处于禁止鼠标点击状态;
  • 翻页元素消失。




END:

论坛相关讨论

    需要帮助或反馈问题?去云扩论坛参与讨论