【中国大学MOOC】java程序设计-week8-多线程爬虫

2024-03-10 18:58

本文主要是介绍【中国大学MOOC】java程序设计-week8-多线程爬虫,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.题目

下面的程序可以下载多个网页文件(download方法已写好),请将它改成多线程进行下载(评分占7分),如果可能, 显示计算全部下载完成程序所用的时间(提示:new Date().getTime()可以得到当前时间的毫秒数,评分占3分)。另外,请注意一下,

系统中http:传到平台后,它自动改成了https:,所以请改回http:。 另外,有一些链接访问不了,所以要注意加try…catch。

import java.net.URL;
import java.io.*;class Downloader 
{public static void main(String[] args)throws Exception{final URL[] urls = {new URL("https://www.pku.edu.cn"),new URL("https://www.baidu.com"),new URL("https://www.sina.com.cn"),new URL("https://www.dstang.com")};final String[] files = {"pku.htm", "baidu.htm","sina.htm", "study.htm",};for(int idx=0; idx<urls.length; idx++){try{System.out.println( urls[idx] );download( urls[idx], files[idx]);}catch(Exception ex){ex.printStackTrace();}}}static void download( URL url, String file)throws IOException{try(InputStream input = url.openStream();OutputStream output = new FileOutputStream(file)){byte[] data = new byte[1024];int length;while((length=input.read(data))!=-1){output.write(data,0,length);}}}
}

2.题解

import java.net.URL;
import java.io.*;
import java.util.Date;public class homework8
{public static void main(String[] args)throws Exception{final URL[] urls = {new URL("https://www.pku.edu.cn"),new URL("https://www.baidu.com"),new URL("https://www.sina.com.cn"),new URL("https://www.dstang.com")};final String[] files = {"pku.htm","baidu.htm","sina.htm","study.htm",};// 新建线程Thread t0 = new MyThread(urls[0], files[0]);Thread t1 = new MyThread(urls[1], files[1]);Thread t2 = new MyThread(urls[2], files[2]);Thread t3 = new MyThread(urls[3], files[3]);// 运行线程t0.start();t1.start();t2.start();t3.start();}
}
/*
新建线程类,继承Thread*/
class MyThread extends Thread {URL url;String file;public MyThread(URL url, String file){super();this.url = url;this.file = file;}public void run() {long time1 = new Date().getTime();  // 计算开始时的时间time1java.io.InputStream input = null;java.io.OutputStream output = null;try{try{input = url.openStream();output = new FileOutputStream(file);byte[] data = new byte[1024];int length;while((length=input.read(data))!=-1){output.write(data,0,length);}}catch(IOException e1){e1.printStackTrace();}}catch(Exception ex) {ex.printStackTrace();}finally{long time2 = new Date().getTime();  // 计算结束后的时间time2System.out.println("本次下载耗时" + (time2-time1) + "ms");  // 计算下载耗时time2-time1}}
}

这篇关于【中国大学MOOC】java程序设计-week8-多线程爬虫的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/795203

相关文章

springboot健康检查监控全过程

《springboot健康检查监控全过程》文章介绍了SpringBoot如何使用Actuator和Micrometer进行健康检查和监控,通过配置和自定义健康指示器,开发者可以实时监控应用组件的状态,... 目录1. 引言重要性2. 配置Spring Boot ActuatorSpring Boot Act

使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)

《使用Java解析JSON数据并提取特定字段的实现步骤(以提取mailNo为例)》在现代软件开发中,处理JSON数据是一项非常常见的任务,无论是从API接口获取数据,还是将数据存储为JSON格式,解析... 目录1. 背景介绍1.1 jsON简介1.2 实际案例2. 准备工作2.1 环境搭建2.1.1 添加

Java实现任务管理器性能网络监控数据的方法详解

《Java实现任务管理器性能网络监控数据的方法详解》在现代操作系统中,任务管理器是一个非常重要的工具,用于监控和管理计算机的运行状态,包括CPU使用率、内存占用等,对于开发者和系统管理员来说,了解这些... 目录引言一、背景知识二、准备工作1. Maven依赖2. Gradle依赖三、代码实现四、代码详解五

java如何分布式锁实现和选型

《java如何分布式锁实现和选型》文章介绍了分布式锁的重要性以及在分布式系统中常见的问题和需求,它详细阐述了如何使用分布式锁来确保数据的一致性和系统的高可用性,文章还提供了基于数据库、Redis和Zo... 目录引言:分布式锁的重要性与分布式系统中的常见问题和需求分布式锁的重要性分布式系统中常见的问题和需求

SpringBoot基于MyBatis-Plus实现Lambda Query查询的示例代码

《SpringBoot基于MyBatis-Plus实现LambdaQuery查询的示例代码》MyBatis-Plus是MyBatis的增强工具,简化了数据库操作,并提高了开发效率,它提供了多种查询方... 目录引言基础环境配置依赖配置(Maven)application.yml 配置表结构设计demo_st

在Ubuntu上部署SpringBoot应用的操作步骤

《在Ubuntu上部署SpringBoot应用的操作步骤》随着云计算和容器化技术的普及,Linux服务器已成为部署Web应用程序的主流平台之一,Java作为一种跨平台的编程语言,具有广泛的应用场景,本... 目录一、部署准备二、安装 Java 环境1. 安装 JDK2. 验证 Java 安装三、安装 mys

Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单

《Springboot的ThreadPoolTaskScheduler线程池轻松搞定15分钟不操作自动取消订单》:本文主要介绍Springboot的ThreadPoolTaskScheduler线... 目录ThreadPoolTaskScheduler线程池实现15分钟不操作自动取消订单概要1,创建订单后

JAVA中整型数组、字符串数组、整型数和字符串 的创建与转换的方法

《JAVA中整型数组、字符串数组、整型数和字符串的创建与转换的方法》本文介绍了Java中字符串、字符数组和整型数组的创建方法,以及它们之间的转换方法,还详细讲解了字符串中的一些常用方法,如index... 目录一、字符串、字符数组和整型数组的创建1、字符串的创建方法1.1 通过引用字符数组来创建字符串1.2

SpringCloud集成AlloyDB的示例代码

《SpringCloud集成AlloyDB的示例代码》AlloyDB是GoogleCloud提供的一种高度可扩展、强性能的关系型数据库服务,它兼容PostgreSQL,并提供了更快的查询性能... 目录1.AlloyDBjavascript是什么?AlloyDB 的工作原理2.搭建测试环境3.代码工程1.

Java调用Python代码的几种方法小结

《Java调用Python代码的几种方法小结》Python语言有丰富的系统管理、数据处理、统计类软件包,因此从java应用中调用Python代码的需求很常见、实用,本文介绍几种方法从java调用Pyt... 目录引言Java core使用ProcessBuilder使用Java脚本引擎总结引言python