http断点续传与文件下载原理解析

本文主要是介绍http断点续传与文件下载原理解析，希望对大家解决编程问题提供一定的参考价值，需要的开发者们随着小编来一起学习吧！

一、断点续传的原理

其实断点续传的原理很简单，就是在http的请求上和一般的下载有所不同而已。

打个比方，浏览器请求服务器上的一个文时，所发出的请求如下：

假设服务器域名为www.jizhuomi.com/android，文件名为down.zip。

 ? 
 get /down.zip http/ 1.1 
 accept: image/gif, image/x-xbitmap, image/jpeg, image/pjpeg, application/vnd.ms- 
 excel, application/msword, application/vnd.ms-powerpoint, */* 
 accept-language: zh-cn 
 accept-encoding: gzip, deflate 
 user-agent: mozilla/ 4.0  (compatible; msie  5.01 ; windows nt  5.0 ) 
 connection: keep-alive 

服务器收到请求后，按要求寻找请求的文件，提取文件的信息，然后返回给浏览器，返回信息如下：

 ? 
 content-length= 106786028 
 accept-ranges=bytes 
 date=mon,  30  apr  2001  12 : 56 : 11  gmt 
 etag=w/ "02ca57e173c11:95b" 
 content-type=application/octet-stream 
 server=microsoft-iis/ 5.0 
 last-modified=mon,  30  apr  2001  12 : 56 : 11  gmt 

所谓断点续传，也就是要从文件已经下载的地方开始继续下载。所以在客户端浏览器传给web服务器的时候要多加一条信息--从哪里开始。

下面是用自己编的一个“浏览器”来传递请求信息给web服务器，要求从2000070字节开始。

 ? 
 get /down.zip http/ 1.0 
 user-agent: netfox 
 range: bytes= 2000070 - 
 accept: text/html, image/gif, image/jpeg, *; q=. 2 , */*; q=. 2 

仔细看一下就会发现多了一行 range: bytes=2000070-

这一行的意思就是告诉服务器down.zip这个文件从2000070字节开始传，前面的字节不用传了。

服务器收到这个请求以后，返回的信息如下：

 ? 
 206 
 content-length= 106786028 
 content-range=bytes  2000070 - 106786027 / 106786028 
 date=mon,  30  apr  2001  12 : 55 : 20  gmt 
 etag=w/ "02ca57e173c11:95b" 
 content-type=application/octet-stream 
 server=microsoft-iis/ 5.0 
 last-modified=mon,  30  apr  2001  12 : 55 : 20  gmt 

和前面服务器返回的信息比较一下，就会发现增加了一行：

content-range=bytes 2000070-106786027/106786028

返回的代码也改为206了，而不再是200了。

知道了以上原理，就可以进行断点续传的编程了。

二.文件下载和在浏览器显示

文件下载原理主要控制来自于服务器端响应，浏览器或者httpClient自行读取IO流

 ? 
 Accept-Ranges:bytes  #接受类型 
 Access-Control-Allow-Origin:* #允许任何主机均可跨域访问，ajax同样可以 
 Access-Control-Max-Age: 2592000 
 Cache-Control: public , max-age= 31536000 
 Connection:keep-alive 
 Content-Disposition:attachment; filename= "c501b_01_h264_sd_960_540.mp4" 
 Content-Length: 14470485 
 Content-Transfer-Encoding:binary #传输类型，字节类型 
 Content-Type:video/mp4  #响应类型 
 Date:Sun,  25  Jan  2015  00 : 17 : 14  GM  #文件日期--注意，对于浏览器读取缓存而不重新请求服务器十分有用,用来检测静态文件有没有被修改 
 ETag: "lraEcGPNv-73F2tLNOKhuA8a6pFa"  # 

下面是一个简单的好PHP下载实例

 ? 
 <?php 
 $file_name= "哈哈.jpg" ; //需要下载的文件 
 $file_name=iconv( "utf-8" , "gb2312" , "$file_name" ); 
 $fp=fopen($file_name, "r+" ); //下载文件必须先要将文件打开，写入内存 
 if (!file_exists($file_name)){ //判断文件是否存在 
      echo  "文件不存在" ; 
      exit(); 
 } 
 $file_size=filesize( "a.jpg" ); //判断文件大小 
 //返回的文件 
 Header( "Content-type: application/octet-stream" ); 
 //按照字节格式返回 
 Header( "Accept-Ranges: bytes" ); 
 //返回文件大小 
 Header( "Accept-Length: " .$file_size); 
 //弹出客户端对话框，对应的文件名 
 Header( "Content-Disposition: attachment; filename=" .$file_name); 
 //防止服务器瞬时压力增大，分段读取 
 $buffer= 1024 ; 
 while (!feof($fp)){ 
      $file_data=fread($fp,$buffer); 
      echo $file_data; 
 } 
 //关闭文件 
 fclose($fp); 
 ?> 

三.关于在浏览器中显示文件内容

浏览器默认会显示一些 text/*,image/*,PDF类型的文件，但默认会变成自动下载，这是我们需要修改响应头为

 ? 
 Content-Disposition:inline; filename= "c501b_01_h264_sd_960_540.mp4" 

这篇关于http断点续传与文件下载原理解析的文章就介绍到这儿，希望我们推荐的文章对编程师们有所帮助！

http断点续传与文件下载原理解析

相关文章

PostgreSQL的扩展dict_int应用案例解析

深度解析Java DTO(最新推荐)

从原理到实战深入理解Java 断言assert

深度解析Java项目中包和包之间的联系

Java中的雪花算法Snowflake解析与实践技巧

使用Python实现可恢复式多线程下载器

MySQL中的表连接原理分析

使用Python绘制3D堆叠条形图全解析

深度解析Python装饰器常见用法与进阶技巧

解析C++11 static_assert及与Boost库的关联从入门到精通