1.企业CDN缓存系统varnish

2023-11-26 11:32
文章标签 系统 企业 缓存 cdn varnish

本文主要是介绍1.企业CDN缓存系统varnish,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!

1.什么是CDN缓存系统

(1)CDN的概念

CDN:content distribute network(内容分发网络)或者content delivery network(内容交付网络)。很显然,CDN的任务是将内容从源站传递给用户。

  • 联网的设计理念是:网络是中立的,是无控制的,任何人都无决定权;网络与应用无关的,它的任务就是将数据更好更快的进行端对端的传输。

  • 常说的互联网由两层组成
    一层是以TCP/IP为代表的网络层(狭义的互联网internet),另一层是以www为代表的应用层。
    以TCP/IP为核心的狭义的互联网,实际上是广义互联网的下层基础。其本质就是通过各种网络设备,实现各个计算机之间的互联互通,实现各种信息数据的低成本传输。
    举个简单例子来区分而这之间的差异:internet就是铁路轨道和各种信号灯,而www则是运行在internet上的众多火车中的一种。

(2).CDN的产生背景

分析一下互联网的网络层和应用层之间的磨合问题。在互联网这个大的铁路网上,有4个地方容易出现拥堵。而 CDN的产生背景正是为了缓解互联网传输的这些问题。

“第一公里”:指的是数据传输到用户的通道的第一个出口,其速度受限于网站服务器接入互联网链路的带宽。这个带宽直接影响到网站的访问速度和并发访问量。当用户请求的数据量超过网站的出口带宽时,就会形成拥塞。用户越多,拥塞越严重。

“最后一公里”:指的是数据传输到用户的通道的最后一段链路,即用户的接入带宽。互联网发展初期,用户主要通过拨号上网的方式,带宽很低,只能传输带宽占用小的文字等信息。2001年开始,电信运营商开始大力发展ADSL等宽带接入方式,随着带宽的提升和接入手段的不断丰富(光纤、3G、4G、wifi),最后一公里瓶颈问题已经基本解决。

“对等互联关口”:不同的运营商之间,只提供了比较少的互联互通的接口。如果一个网站服务器部署在A运营商的IDC机房里,而用户用的却是B运营商的网络,此时,服务器数据就需要从A运营商网络传输到B运营商网络。不同网络之间的互联互通,对任何一个运营商网络的流量的占比都很小,收敛比很高,所以,这个互联关口很容易成为互联网传输的拥塞点。
长途骨干传输:长距离传输过程中,数据需要经过网站的IDC网络、骨干网、用户城域网、用户接入网等,一定会产生延时。这个延时,是互联网本身无法解决的问题。另外,长途骨干网络的流量非常大,很容易产生拥塞。

(3)CDN的工作原理
  • 无cdn时,用户通过浏览器访问网站的过程
    1、用户在浏览器输入URL
    2、浏览器向本地DNS请求域名解析
    3、如果本地DNS缓存有该域名的解析结果,则直接将解析结果返回给浏览器
    4、如果本地DNS缓存中无该域名的解析结果,则以递归方式向整个DNS系统请求域名解析,在获得应答后将解析结果返回给浏览器
    5、浏览器获得解析结果,提取出IP信息,使用IP向服务器请求数据
    6、服务器返回数据给浏览器

  • 有cdn时,用户通过浏览器访问网站的过程
    1、用户在浏览器中输入URL
    2、浏览器向本地DNS请求域名解析,DNS会将域名解析权转交给CNAME指向的CDN专用的DNS服务器
    3、CDN专用的DNS服务器将CDN的全局负载均衡设备的IP返回给浏览器
    4、浏览器向CDN全局负载均衡设备发起URL请求
    5、CDN全局负载均衡设备根据请求的URL和用户的IP地址,将用户请求转发到用户所在区域的区域负载均衡设备
    6、区域负载均衡设备,根据用户IP、请求URL、缓存服务器的负载情况等,返回一台合适的服务器IP给用户
    7、用户向缓存服务器发起请求
    8、缓存服务器响应用户请求,如果用户请求的内容缓存服务器上不存在,则缓存服务器要向上一级缓存服务器请求内容,直到追溯到网站的源服务器

2.什么是varnish?

Varnish 是一款高性能的开源HTTP加速器(挪威最大的在线报纸 Verdens Gang 使用3台Varnish代替了原来的12台Squid,性能比以前更好)

1.varnish加速器与Squid加速器的对比

Squid加速器(代理缓存服务器)是将从服务器要回来的资源放在自己的硬盘里,客户读取的速率很慢,代理的效率低

varnish加速器(代理缓存服务器)是将从服务器要回来的资源放在自己的内存里,客户读取的速率很快,代理的效率高

2.varnish代理服务器的工作方式

varnish代理服务器的工作方式有两种

  • (1)仅仅作为一个代理服务器:帮客户端去问服务端要数据,要回来的数据直接给客户端自己不缓存一份,这种情况是客户的隐私信息、热点信息、更新比较快的数据,不缓存,只代理。

  • (2)既代理又缓存:帮客户端去问服务端要数据,要回来的数据先给自己缓存一份,然后再发给客户端,这种情况是用于更新比较慢的数据,此时varnish既代理又缓存。

3.为什么使用varnish加速缓存代理服务器?
比如:我们国家使用微信的用户非常多,微信的服务商腾讯总部在深圳
当每个地区的用户使用微信访问腾讯服务器的资源的时候,访问量太大
对于深圳的服务器来说,会造成很大的访问压力,甚至会造成服务器瘫痪
对于每个地区的用户来数,如果都去访问腾讯的总部服务器,会造成网络拥塞,使得客户的访问很缓慢,不利于用户的使用
现在腾讯总部给每个地区都放varnish代理服务器,每个地区的微信使用用户想访问深圳资源的时候
都会间接去问自己地区的varnish代理服务器要资源
如果varnish代理服务器上面没有资源,此时varnish代理服务器就会去向深圳的服务器要资源,将要回来的资源视情况而定给自己缓存一份,然后再给客户端发一份。这种情况下,varnish代理服务器的数量远远少于微信用户的数量,即使所有的varnish代理服务器同时向深圳总部的服务器要资源的时候,也不会给深圳的服务器造成很大的压力,对微信使用的客户端和深圳总部的服务端都有好处
假如代理服务器缓存了一些更新慢的数据,当客户端再次要这个数据的时候,代理服务器会直接返回给客户端,不需要再去问深圳的服务器要资源,那么这就是把varnish服务器叫做加速器的原因,加快了客户端和服务端之间的访问速率
注意:以上我是仅仅使用微信举个例子,其实所有的互联网企业使用加速器的原理是一样的
4.varnish加速器的工作流程

Varnish与一般服务器软件类似,分为master(management)进程和child(worker ,主要做cache的工作)进程。

  • master进程读入命令,进行一些初始化,然后fork并监控child进程。
  • child进程分配若干线程进行工作,主要包括一些管理线程和很多woker线程。
针对文件缓存部分,master读入存储配置,调用合适的存储类型,然后创建/读入相应大小的缓存大文件。接着,master初始化管理该存储空间的结构体。这些变量都是全局变量,在fork以后会被child进程所继承(包括文件描述符)。在child进程主线程初始化过程中,将前面打开的存储大文件整个mmap到内存中(如果超出系统的虚拟内存,mmap失败,进程会减少原来的配置mmap大小,然后继续mmap)
此时创建并初始化空闲存储结构体,挂到存储管理结构体,以待分配。接着,真正的工作开始,Varnish的某个负责接受新HTTP连接的线程开始等待用户,如果有新的HTTP连接过来,它总负责接收,
然后叫醒某个等待中的线程,并把具体的处理过程交给它。Worker线程读入HTTP请求的URI,查找已有的object,如果命中则直接返回并回复用户。如果没有命中,则需要将所请求的内容,从后端服务器中取过来,存到缓存中,然后再回复。

分配缓存的过程如下:

varnish根据所读到object的大小,创建相应大小的缓存文件。
为了读写方便,程序会把每个object的大小变为最接近其大小的内存页面倍数。然后从现有的空闲存储结构体中查找,找到最合适的大小的空闲存储块,分配给它。如果空闲块没有用完,就把多余的内存另外组成一个空闲存储块,挂到管理结构体上。如果缓存已满,就根据LRU机制,把最旧的object释放掉。
释放缓存的过程是这样的:有一个超时线程,检测缓存中所有object的生存期。
如果超初设定的TTL(Time To Live)没有被访问,就删除之,并且释放相应的结构体及存储内存。(释放时会检查该存储内存块前面或后面的空闲内存块。如果前面或后面的空闲内存和该释放内存是连续的,就将它们合并成更大一块内存。)整个文件缓存的管理,没有考虑文件与内存的关系,实际上是将所有的object都考虑是在内存中如果系统内存不足,系统会自动将其换到swap空间,而不需要varnish程序去控制。

这篇关于1.企业CDN缓存系统varnish的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!



http://www.chinasem.cn/article/425614

相关文章

在C#中获取端口号与系统信息的高效实践

《在C#中获取端口号与系统信息的高效实践》在现代软件开发中,尤其是系统管理、运维、监控和性能优化等场景中,了解计算机硬件和网络的状态至关重要,C#作为一种广泛应用的编程语言,提供了丰富的API来帮助开... 目录引言1. 获取端口号信息1.1 获取活动的 TCP 和 UDP 连接说明:应用场景:2. 获取硬

JAVA系统中Spring Boot应用程序的配置文件application.yml使用详解

《JAVA系统中SpringBoot应用程序的配置文件application.yml使用详解》:本文主要介绍JAVA系统中SpringBoot应用程序的配置文件application.yml的... 目录文件路径文件内容解释1. Server 配置2. Spring 配置3. Logging 配置4. Ma

2.1/5.1和7.1声道系统有什么区别? 音频声道的专业知识科普

《2.1/5.1和7.1声道系统有什么区别?音频声道的专业知识科普》当设置环绕声系统时,会遇到2.1、5.1、7.1、7.1.2、9.1等数字,当一遍又一遍地看到它们时,可能想知道它们是什... 想要把智能电视自带的音响升级成专业级的家庭影院系统吗?那么你将面临一个重要的选择——使用 2.1、5.1 还是

高效管理你的Linux系统: Debian操作系统常用命令指南

《高效管理你的Linux系统:Debian操作系统常用命令指南》在Debian操作系统中,了解和掌握常用命令对于提高工作效率和系统管理至关重要,本文将详细介绍Debian的常用命令,帮助读者更好地使... Debian是一个流行的linux发行版,它以其稳定性、强大的软件包管理和丰富的社区资源而闻名。在使用

Redis缓存问题与缓存更新机制详解

《Redis缓存问题与缓存更新机制详解》本文主要介绍了缓存问题及其解决方案,包括缓存穿透、缓存击穿、缓存雪崩等问题的成因以及相应的预防和解决方法,同时,还详细探讨了缓存更新机制,包括不同情况下的缓存更... 目录一、缓存问题1.1 缓存穿透1.1.1 问题来源1.1.2 解决方案1.2 缓存击穿1.2.1

Ubuntu系统怎么安装Warp? 新一代AI 终端神器安装使用方法

《Ubuntu系统怎么安装Warp?新一代AI终端神器安装使用方法》Warp是一款使用Rust开发的现代化AI终端工具,该怎么再Ubuntu系统中安装使用呢?下面我们就来看看详细教程... Warp Terminal 是一款使用 Rust 开发的现代化「AI 终端」工具。最初它只支持 MACOS,但在 20

windows系统下shutdown重启关机命令超详细教程

《windows系统下shutdown重启关机命令超详细教程》shutdown命令是一个强大的工具,允许你通过命令行快速完成关机、重启或注销操作,本文将为你详细解析shutdown命令的使用方法,并提... 目录一、shutdown 命令简介二、shutdown 命令的基本用法三、远程关机与重启四、实际应用

Debian如何查看系统版本? 7种轻松查看Debian版本信息的实用方法

《Debian如何查看系统版本?7种轻松查看Debian版本信息的实用方法》Debian是一个广泛使用的Linux发行版,用户有时需要查看其版本信息以进行系统管理、故障排除或兼容性检查,在Debia... 作为最受欢迎的 linux 发行版之一,Debian 的版本信息在日常使用和系统维护中起着至关重要的作

Redis与缓存解读

《Redis与缓存解读》文章介绍了Redis作为缓存层的优势和缺点,并分析了六种缓存更新策略,包括超时剔除、先删缓存再更新数据库、旁路缓存、先更新数据库再删缓存、先更新数据库再更新缓存、读写穿透和异步... 目录缓存缓存优缺点缓存更新策略超时剔除先删缓存再更新数据库旁路缓存(先更新数据库,再删缓存)先更新数

el-select下拉选择缓存的实现

《el-select下拉选择缓存的实现》本文主要介绍了在使用el-select实现下拉选择缓存时遇到的问题及解决方案,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的... 目录项目场景:问题描述解决方案:项目场景:从左侧列表中选取字段填入右侧下拉多选框,用户可以对右侧