按照()爬取的网页内容根据目录层次深浅来爬行页面,处于较浅目录层次的页面首先被爬行,当同一层次中的页面爬行完毕后,爬虫再深入下一层继续爬行。 A、深度优先策略B、广度优先策略C、PageRank优先策略D、随机爬行策略

按照()爬取的网页内容根据目录层次深浅来爬行页面,处于较浅目录层次的页面首先被爬行,当同一层次中的页面爬行完毕后,爬虫再深入下一层继续爬行。

A、深度优先策略

B、广度优先策略

C、PageRank优先策略

D、随机爬行策略


相关考题:

等组成了婴儿爬行能力发展的三个阶段A.后退爬、手足爬行、手膝爬行B.抵足爬行、手膝爬行、手足爬行C.后退爬行、腹部贴地爬行、手足爬行D.后退爬行、抵足爬行、腹部贴地爬行

以下对于爬行策略的说法,不正确的是()。 A、深度优先策略比较适合垂直搜索或站内搜索,但爬行页面内容层次较深的站点时会造成资源的巨大浪费。B、广度优先策略能够有效控制页面的爬行深度,避免遇到一个无穷深层分支时无法结束爬行的问题C、通用网络爬虫常用的爬行策略有:深度优先策略、广度优先策略D、深度优先策略不足之处在于需较长时间才能爬行到目录层次较深的页面。

如果要采集指定的数据,则需要使用到(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。 A、增量式网络爬虫B、聚焦网络爬虫C、DeepWeb爬虫D、全网爬虫

聚焦爬虫爬行策略实现的关键是评价()的重要性,不同的方法计算出的重要性不同,由此导致链接的访问顺序也不同。 A、页面内容B、页面内容和链接C、链接D、表单信息

()只会在需要的时候爬行新产生或发生更新的页面,并不重新下载没有发生变化的页面,可有效减少数据下载量,及时更新已爬行的网页,减小时间和空间上的耗费,但是增加了爬行算法的复杂度和实现难度。 A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫

()是指对已下载网页采取增量式更新和只爬行新产生的或者已经发生变化网页的爬虫,它能够在一定程度上保证所爬行的页面是尽可能新的页面。 A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫

如果要采集指定的数据,则需要使用到(),因为它只需要爬行与主题相关的页面,极大地节省了硬件和网络资源,保存的页面也由于数量少而更新快。 A、聚焦网络爬虫B、聚焦网络爬虫C、通用网络爬虫D、深层网络爬虫

(),又称主题网络爬虫,是指选择性地爬行那些与预先定义好的主题相关页面的网络爬虫。 A、聚焦网络爬虫B、增量式网络爬虫C、通用网络爬虫D、深层网络爬虫

下列划分婴儿爬行能力发展三阶段的正确说法是()A.抵足爬行、腹部贴地爬行、手足爬行B.抵足爬行、向后退爬、手膝爬行C.抵足爬行、向后退爬、手足爬行D.抵足爬行、手膝爬行、手足爬行