做一个网络爬虫程序: 从一个网址,如http://hao.360.cn开始,得到网页的内容,找到其中的链接,并进一步下载(注:可以将已下载的链接保存入一个Hashtable中,其key为链接的网址,下载前其值为false,下载后其值为true)。 (要注意绝对引用与相对引用的问题,为了简化,可以只考虑绝对引用的链接)。 评分标准: 能获取网页内容(3分); 能解析出网页的内容中的网址(3分); 能放入一个hashtable中进一步下载(3分); 总体情况(1分)。

做一个网络爬虫程序: 从一个网址,如http://hao.360.cn开始,得到网页的内容,找到其中的链接,并进一步下载(注:可以将已下载的链接保存入一个Hashtable中,其key为链接的网址,下载前其值为false,下载后其值为true)。 (要注意绝对引用与相对引用的问题,为了简化,可以只考虑绝对引用的链接)。 评分标准: 能获取网页内容(3分); 能解析出网页的内容中的网址(3分); 能放入一个hashtable中进一步下载(3分); 总体情况(1分)。


参考答案和解析
发起请求;获取响应内容;解析内容;保存数据

相关考题:

(1)文件下载。点击网页上的"文件下载"超链接,将下载列表中的"文件下载八"下载到NETKT文件夹下,文件名不变。(2)保存网页。在网页搜索栏填写"汤姆叔叔的小屋"并单击"搜索"进行搜索,将搜索结果网页保存到NETKT文件夹下,文件名为MyPage,保存类型选择"文本文件(*.txt)".(3)保存图片。将网页上的"图片6"保存到NETKT文件夹下,文件名不变。

将网上素材下载到本地机器上的方法是:图片、网页一些比较小的文件可以直接通过浏览器下载,比较大的文件或整个网站可以用()下载。 A.下载软件B.网站条目C.下载链接D.另存为”文件

当我们要在网页中制作"超级链接"时,应注意( )。A.必须使用非成对标记来完成链接工作B.在标记中,可以使用绝对网址或相对网址表示链接目标C.绝对网址"通常用来链接当前前网站中的其它网页D."相对网址"主要用来链接其他网站的网页

在网页中单击下载链接无法进行,有什么别的办法进行下载吗?

为什么有些网页的链接点开要下载个PHP文件?下载后链接还是打不开?

以下操作:①检查内容;②检查链接;③预览网页;④检查下载时间。属于网站发布前准备工作的是()。 A.①②B.①②③C.①②④D.①②③④

在用BT下载时,能否下载到素材,关键要看是否有()。A、网址B、种子C、关键帧D、超链接

关于下载网页信息的说法不正确的是()A、使用“选定”/“复制”/“粘贴”,可将其保存在一个新文件中B、在网页中的图片,点击鼠标右键,弹出菜单,选择“图片另存为”可将图片保存到本地的计算机当中C、使用文件菜单中的“另存为”命令,可保存到当前的网页D、在超级链接上右击,不可以下载其链接的页面内容

相对网址的链接是从当前文字段或图像处链接到其他网站中的网页。

关于HTML文件中的超级链接,()说法是错误的。A、可以链接到一个特定的网址B、可以链接到一个e-mailC、可以链接到一个文件D、不能链接到当前网页中的一个特定位置

下列关于网页信息保存的说法中不正确的是()。A、“复制”-“粘帖”,可将选定的内容保存在一个新文件中B、在超链接上右击,不可以下载其链接的页面内容C、使用文件菜单中的“另存为”命令,可保存当前的网页D、在网页中的图片上点击鼠标右键,选择“图片另存为”,可以将图片保存到计算机中

在Dreamweaver中,()是指不需要文字或图片超链接,网页就会自动链接到另一个网页。这种功能通常被用于广告页制作以及在网页开场动画结束后,在设定时间内自动链接到某一网页上。A、自动换页B、锚点链接C、下载D、邮件链接

关于下载网页信息的说法不正确的是()A、执行"选定_复制_粘贴"命令,可将其保存在一个新文件中B、右击网页中的图片,在弹出的快捷菜单中选择"图片另存为…"命令可将图片保存到本地的计算机中C、使用"文件"菜单中的"另存为…"命令,可保存当前浏览的网页D、右击超链接,不可以下载其链接的页面内容

绝对网址的链接是从当前的文字段或者图像处链接到同一网站的其他网页。

当我们下载一个大小约为1.2GB的高清电影时,以下哪种下载方式能更快更好?()A、左键点击链接直接下载左键点击链接直接下载B、在链接上点击右键,选择“目标另存为”C、在链接上点击右键,选择“使用迅雷下载”D、在链接上点击右键,选择“打开”

关于HTML文件中的超链接,下列说法错误的是()。A、可以链接到一个特定的网址B、可以链接到某个E-mailC、可以链接到一个文件D、不能链接到当前网页中的一个特定位置

合理组织网站链接结构的根本目的在于()。A、链接最少,使浏览者不会迷路B、最少的链接使得浏览最有效率C、链接最少,保证网站内的目录结构不乱D、考虑到网络情况,尽量少用链接就可以减少浏览器下载网页的负担

当我们要在网页中制作’超级链接’时,应注意()A、必须使用非成对标记来完成链接工作B、在标记中,可以使用绝对网址或相对网址表示链接目标C、绝对网址’通常用来链接当前前网站中的其它网页D、’相对网址’主要用来链接其他网站的网页

某同学在网上找到一个非常好的学习资料(xuexi.rar),并且网页上提供了一个下载链接。那么以下选项中,不可能正确下载这个学习资料的操作是()。A、直接按鼠标左键选中下载链接后按Ctrl+C复制,再按Ctrl+V粘贴B、按鼠标左键点击下载链接,弹出另存为窗口,选择存放路径后点击“保存”按钮C、在下载链接上按鼠标右键,选择“目标另存为”D、安装网际快车,然后在下载链接上按鼠标右键,选择“使用快车下载”

将网上素材下载到本地机器上的方法是:图片、网页一些比较小的文件可以直接通过浏览器下载,比较大的文件或整个网站可以用()下载。A、下载软件B、网站条目C、下载链接D、另存为”文件

以下操作:①检查内容;②检查链接;③预览网页;④检查下载时间。属于网站发布前准备工作的是()。A、①②B、①②③C、①②④D、①②③④

单选题以下操作:①检查内容;②检查链接;③预览网页;④检查下载时间。属于网站发布前准备工作的是()。A①②B①②③C①②④D①②③④

单选题在Acrobat5.0C中,可以直接转换PDF文件中链接的网页。下列哪种方式可以将链接的网页转换为新的PDF文件?()A用鼠标单击网络链接B按住Command(Macintosh)/Ctrl(Windows)键,然后单击网络链接C按住Shift键,然后单击网络链接D执行“查看网络链接”命令,选择要下载的网络链接地址,然后单击“下载”命令

单选题在Dreamweaver中,()是指不需要文字或图片超链接,网页就会自动链接到另一个网页。这种功能通常被用于广告页制作以及在网页开场动画结束后,在设定时间内自动链接到某一网页上。A自动换页B锚点链接C下载D邮件链接

单选题关于HTML文件中的超级链接,()说法是错误的。A可以链接到一个特定的网址B可以链接到一个e-mailC可以链接到一个文件D不能链接到当前网页中的一个特定位置

单选题关于下载网页信息的说法不正确的是()A执行选定_复制_粘贴命令,可将其保存在一个新文件中B右击网页中的图片,在弹出的快捷菜单中选择图片另存为…命令可将图片保存到本地的计算机中C使用文件菜单中的另存为…命令,可保存当前浏览的网页D右击超链接,不可以下载其链接的页面内容

单选题关于HTML文件中的超链接,下列说法错误的是()。A可以链接到一个特定的网址B可以链接到某个E-mailC可以链接到一个文件D不能链接到当前网页中的一个特定位置

单选题当我们下载一个大小约为1.2GB的高清电影时,以下哪种下载方式能更快更好?()A左键点击链接直接下载左键点击链接直接下载B在链接上点击右键,选择“目标另存为”C在链接上点击右键,选择“使用迅雷下载”D在链接上点击右键,选择“打开”