文章内容:
1.HTTP协议概述
2.URL知识概述
3.HTTP消息结构详解
1.HTTP协议概述
定义:
- 超文本传送协议 (HTTP-Hypertext transfer protocol) 是分布式的超媒体系统应用之间的通信协议;是万维网(WWW)交换信息的基础。它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器;
- HTTP工作在TCP/IP协议体系中的TCP协议上;
- 现在WWW中使用的是HTTP/1.1,它是由RFCs(Requests for comments)在1990年6月制定。
特点:
简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。
灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。
无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传。
HTTP传输步骤/过程:
- 建立TCP连接
- Web浏览器向Web服务器发送请求命令
- Web浏览器发送请求头信息
- Web服务器应答
- Web服务器发送应答头信息
- Web服务器向浏览器发送数据
- Web服务器关闭TCP连接/或者保持连接
2.URL概述
URL定义:
统一资源定位符(URL,英语 Uniform / Universal Resource Locator 的缩写)是用于完整地描述Internet上网页和其他资源的地址的一种标识方法。
URL格式:
基本格式如下
schema://host[:port#]/path/.../[?query-string][#anchor]
schema 协议(例如:http, https, ftp)
host 服务器的IP地址或者域名
port# 服务器的端口(如果是走协议默认端口,可省略)
path 访问资源的路径
query-string 参数,发送给http服务器的数据
anchor- 锚(跳转到网页的指定锚点位置)
一个URL 的例子:
http://www.website.com/test/test.aspx?name=sv&x=true#stuff
一个URL的请求过程:
- 当你在浏览器输入URL http://www.website.com 的时候,浏览器发送一个Request去获取 http://www. website.com的html. 服务器把Response发送回给浏览器.
- 浏览器分析Response中的 HTML,发现其中引用了很多其他文件,比如图片,CSS文件,JS文件。
- 浏览器会自动再次发送Request去获取图片,CSS文件,或者JS文件。
- 当所有的文件都下载成功后, 网页就被显示出来了。
3.HTTP 消息结构
HTTP消息分为HTTP 请求消息(HTTP Request)和HTT响应(HTTP Response)消息。
HTTP 请求消息(HTTP Request),由三部分组成:
第1部分叫Request line
第2部分叫Request header
第3部分是body(header和body之间有个空行)。
如下图所示:
HTTP请求消息示意图
HTTP请求消息示意图详细说明如下:
- METHOD :表示请求方法,比如POST、GET和PUT等;
- path-to-resoure :表示请求的资源。
- Http/version-number :表示HTTP协议的版本号,如HTTP/1.1
- Request消息常用方法 :Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE,对应着对资源的查、改、增和删 4个操作。一般GET用于获取/查询资源信息,POST一般用于更新资源信息;这应该是GET和POST的本质区别;
Request消息之GET/POST示例:
GET实例:
GET /test/?id=11101&name=Professional HTTP/1.1 Host: www.test.com User-Agent: Mozilla/5.0 (Windows; U;) Firefox/1.0.1 Connection: Keep-Alive
POST 实例:
POST / HTTP/1.1 Host: www.test.com User-Agent: Mozilla/5.0 (Windows; U) Firefox/1.0.1 Content-Type: application/x-www-form-urlencoded Content-Length: 40 Connection: Keep-Alive (…… 此处空一行 ……) name=Professional&id=11101
更多关于HTTP请求消息的知识要点:
- GET提交,请求的数据会附在URL之后(就是据放置在HTTP协议头中),以“?”分割URL
输数据,多个参数用“&”连接;例如:
login.action?name=tom&password=securiy - POST提交:把提交的数据放置在是HTTP包的正文中。上文示例中name=Professional&id=11101就是实际的传输数据;
- 数据长度:HTTP协议没有对传输的数据和URL长度进行限制, 但特定浏览器和服务器对URL长度有限制, 因此对于GET提交时,传输数据就会受到URL长度的限制; 由于POST操作不是通过URL传值,理论上数据长度不受限;
- 安全性:POST的安全性要比GET的安全性高,通过GET提交数据,用户名和密码将明文出现在URL上,容易被他人看到,URL信息也可能会被记录到历史纪录中;
HTTP 响应消息(HTTP Response),由三部分组成:
第1部分叫Response line
第2部分叫Response header
第3部分是body(header和body之间有个空行)。
HTTP 响应消息示意图
HTTP响应消息示意图详细说明如下:
- HTTP/version-number:HTTP协议的版本号;
- status-code :状态码
1XX 提示信息 - 表示请求已被成功接收,继续处理
2XX 成功 - 表示请求已被成功接收,理解,接受
3XX 重定向 - 要完成请求必须进行更进一步的处理
4XX 客户端错误 - 请求有语法错误或请求无法实现
5XX 服务器端错误 - 服务器未能实现合法的请求 - message:状态消息
- 请求行最常用的状态码:
200 (OK): 找到了该资源,并且一切正常。
304 (NOT MODIFIED): 该资源在上次请求之后没有任何修改。这通常用于浏览器的缓存机制。
401 (UNAUTHORIZED): 客户端无权访问该资源。这通常会使得浏览器要求用户输入用户名和密码,以登录到服务器。
403 (FORBIDDEN): 客户端未能获得授权。这通常是在401之后输入了不正确的用户名或密码。
404 (NOT FOUND): 在指定的位置不存在所申请的资源。
TO DO Next:
HTTP请求头(HTTP Request Header)
HTTP响应头(HTTP Request Header)
HTTP编码与解码(HTTP Encode/Decode)