转载

发表于 2015年10月25日
浏览 (676)
评论 (0)

浏览器HTTP缓存原理分析

以前项目中遇到了很多浏览器缓存相关的问题，也在网上查过资料，搞过服务器的配置，来确保客户端加载服务器资源的速度和资源有效性。最近仔细看了下http协议中和缓存相关的一些属性，总结一下。

浏览器缓存原理

文字版描述

①浏览器第一次访问服务器资源 /index.html

在浏览器中没有缓存文件，直接向服务器发送请求。

服务器返回 200 OK，实体中返回 index.html文件内容，并设置一个缓存过期时间，一个文件修改时间，一个根据index.html内容计算出来的实体标记Entity Tag，简称Etag。

浏览器将/index.html路径的请求缓存到本地。

②浏览器第二次访问服务器资源 /index.html

由于本地已经有了此路径下的缓存文件，所以这一次就不直接向服务器发送请求了。

首先， 进行缓存过期判断 。浏览器根据①中设置缓存过期时间判断缓存文件是否过期。

情景一：若没有过期，则不向服务器发送请求，直接使用缓存中的结果，此时我们在浏览器控制台中可以看到 200 OK(from cache) ，此时的情况就是完全使用缓存，浏览器和服务器没有任何交互的。

情景二：若已过期，则向服务器发送请求，此时请求中会带上①中设置的文件修改时间，和Etag

然后， 进行资源更新判断 。服务器根据浏览器传过来的文件修改时间，判断自浏览器上一次请求之后，文件是不是没有被修改过；根据Etag，判断文件内容自上一次请求之后，有没有发生变化

情形一：若两种判断的结论都是文件没有被修改过，则服务器就不给浏览器发index.html的内容了，直接告诉它，文件没有被修改过，你用你那边的缓存吧—— 304 Not Modified，此时浏览器就会从本地缓存中获取index.html的内容。此时的情况叫协议缓存，浏览器和服务器之间有一次请求交互。

情形二：若修改时间和文件内容判断有任意一个没有通过，则服务器会受理此次请求，之后的操作同①

我的文字表达能力可能有限，为了尽量把这个流程描述清楚一点，下面

一图以蔽之

浏览器HTTP缓存原理分析

浏览器HTTP缓存原理分析

缓存相关首部字段

request缓存相关首部字段

浏览器HTTP缓存原理分析

① cache-control 用来做 缓存过期判断

常用指令：

no-cache 不直接使用缓存，始终向服务器发起请求

max-age 缓存过期时间，是一个时间数值，比如3600秒，设置为0的时候效果等同于no-cache

s-maxage 给缓存代理用的指令，对直接返回资源的server无效，当s-maxage生效时，会忽略max-age的值

only-if-cached 若有缓存，则只使用缓存，若缓存文件出问题了，请求也会出问题

② Pragma 用来做 缓存过期判断

它可以取值no-cache

这是一个http1.0遗留的字段，当它和cache-control同时存在的时候，会被cache-control覆盖

③ if-match / if-none-match 用来做 资源更新判断

这个指令会把缓存中的Etag传给服务器，服务器用它来和服务器端的资源Etag进行对比，若不一致则证明资源被修改了，需要响应请求为 200 OK

④ if-modified-since 用来做 资源更新判断

这个指令会把文件的上一次缓存中的文件的更新时间传给服务器，服务器判断文件在这个时间点后是否被修改，如果被修改过则需要响应请求为200 OK

response缓存相关首部字段

浏览器HTTP缓存原理分析

① cache-control 用来 设置缓存过期时间

常用指令：

no-cache 让客户端不直接使用缓存，始终向服务器发起请求，不设置默认是这个，上边截图中的请求就是省略了，所以客户端不会直接使用缓存。

max-age 缓存过期时间，是一个时间数值，比如3600秒，设置为0的时候效果等同于no-cache

s-maxage 给缓存代理用的指令，对直接返回资源的server无效，当s-maxage生效时，会忽略max-age的值

private/public 默认是private，只在一个浏览器中缓存，设置为public时缓存可被多个用户共享

② Etag 用来 设置根据资源内容生成的实体标签

这个值有强tag和弱tag，区别是计算方式不同，只有强tag才会在资源被更新的时候立即发生变化，请求首部中的if-match/if-none-match字段就会传回这个值给服务端

③ age

这个字段用来告诉客户端，这个response是在多久前被创建的，单位为秒，缓存服务器返回资源的时候必须创建此字段

实体首部缓存相关字段

response的head里边可能还包括实体首部，实体首部是紧跟在response首部后边的。

①last-modified-time ——用来 设置资源最后修改时间

②Exprire —— 设置 文件过期时间

这个字段的作用和cache-control相同，不同的是它直接指定一个缓存过期时间点，容易受客户端时间的影响。

这也是一个遗留的字段，和cache-control同时存在的时候会被后者覆盖

缓存配置的一些注意事项

① 只有get请求会被缓存，post请求不会

② Etag 在资源分布在多台机器上时，对于同一个资源，不同服务器生成的Etag可能不相同，此时就会导致304协议缓存失效，客户端还是直接从server取资源。可以自己修改服务器端etag的生成方式，根据资源内容生成同样的etag。

③ 系统上线，更新资源时，可以在资源uri后边附上资源修改时间、svn版本号、文件md5 等信息，这样可以避免用户下载到缓存的旧的文件

④ 观察chrome的表现发现，通过链接或者地址栏访问，会先判断缓存是否过期，再判断缓资源是否更新；F5刷新，会跳过缓存过期判断，直接请求服务器，判断资源是否更新。

目前只能回忆起这些了，以后遇到了再补充吧~

正文到此结束

所属分类：编程技术

本文标签： src SVN 总结协议 Chrome 服务器 HTML文件 HTML 时间 UI http 配置 entity
版权声明： 本文为互联网转载文章，出处已在文章中说明(部分除外)。如果侵权，请联系本站长删除，谢谢。
本文海报： 生成海报一生成海报二

热门推荐

openfire数据库安装指南

浏览(14,994) 评论(0)
Caffe 深度学习框架上手教程

浏览(11,259) 评论(0)
ReactiveCocoa入门教程：第一部分

浏览(12,060) 评论(0)
开源HIDS-OSSEC使用实例:监测CC攻击

浏览(11,963) 评论(0)
Decorators in ES7

浏览(16,582) 评论(4)
用Electron（Atom编辑器的兄弟项目）开发桌面应用

浏览(29,551) 评论(0)
Windows下JetBrains CLion中文输出乱码的解决方法

浏览(12,997) 评论(1)
同步-@synchronized, NSLock, pthread, OSSpinLock性能比较

浏览(11,912) 评论(0)
【开班了】JAVA培训班正式招生

浏览(8,055) 评论(12)
Seaweedfs之Volume读请求重定向

浏览(26,209) 评论(3)

相关文章

阿里云首购8折

Loading...

其他链接

关于本站

本站定位：个人技术类博客

本站作用：写博客、记日志、闲聊扯淡鼓捣技术。

问题交流

[HBLOG]公众号

HBLOG

HBLOG