下列哪项不是爬虫抓取策略?A.page rank策略B.OPIC策略C.大站优先策略D.重度优先策略
下列哪项不是爬虫抓取策略?
A.page rank策略
B.OPIC策略
C.大站优先策略
D.重度优先策略
参考答案和解析
D
相关考题:
以下关于网络爬虫的说法,不正确的是()。 A、网络爬虫还可以对网页建立索引B、有些网络爬虫能够从网站抓取内容聚合起来C、有些网络爬虫甚至能发动DDos攻击、发送垃圾邮件等D、隐藏在表单后的信息无法被网络爬虫发现
关于各种网络爬虫,以下说法不正确的是()。 A、通用网络爬虫通常采用并行工作方式,但需要较长时间才能刷新一次页面。B、通用网络爬虫适用于为搜索引擎搜索广泛的主题,有较强的应用价值。C、聚焦爬虫根据一定的网页分析算法过滤与主题无关的链接,保留有用的链接并将其放入等待抓取的URL队列。D、增量式爬虫在需要的时候爬行新产生或发生更新的页面,并重新下载所有页面
()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。 A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫
网页抓取策略中,( )从起始网页开始选取其中一个URL 进入该网页,分析完该网页中的URL 后再选择其中一个URL 再进入,如此深入地抓取下去,直到处理完一条路线之后再处理下一条路线。A.深度优先搜索策略B.广度优先搜索策略C.最佳优先搜索策略D.复合优先搜索策略
使用了百度分享的网页可以更快地被百度爬虫发现,从而帮助网站的内容更快地被百度抓取。请问百度分享能使网页被快速抓取的原因是什么?()A、百度分享吸引爬虫抓取链接到百度数据库中,再由爬虫提交收录B、真实分享行为可以将链接直接存储到百度数据库中,并加速爬虫提交收录C、爬虫直接将分享的链接提交收录D、百度分享只能加速爬虫从数据库提交收录,不能影响链接的存储
单选题选择性地爬行预先定义好的与主题相关的页面,是()。A通用网络爬虫B聚焦网络爬虫C增量式网络爬虫D反向网络爬虫