转载

HTTP协议教程

文章内容:

1.HTTP协议概述

2.URL知识概述

3.HTTP消息结构详解

1.HTTP协议概述

定义:

  • 超文本传送协议 (HTTP-Hypertext transfer protocol) 是分布式的超媒体系统应用之间的通信协议;是万维网(WWW)交换信息的基础。它允许将超文本标记语言(HTML)文档从Web服务器传送到客户端的浏览器;
  • HTTP工作在TCP/IP协议体系中的TCP协议上;
  • 现在WWW中使用的是HTTP/1.1,它是由RFCs(Requests for comments)在1990年6月制定。

特点:

简单快速:客户向服务器请求服务时,只需传送请求方法和路径。请求方法常用的有GET、HEAD、POST。每种方法规定了客户与服务器联系的类型不同。由于HTTP协议简单,使得HTTP服务器的程序规模小,因而通信速度很快。

灵活:HTTP允许传输任意类型的数据对象。正在传输的类型由Content-Type加以标记。

无状态:HTTP协议是无状态协议。无状态是指协议对于事务处理没有记忆能力。缺少状态意味着如果后续处理需要前面的信息,则它必须重传。

HTTP传输步骤/过程:

  • 建立TCP连接
  • Web浏览器向Web服务器发送请求命令
  • Web浏览器发送请求头信息
  • Web服务器应答
  • Web服务器发送应答头信息
  • Web服务器向浏览器发送数据
  • Web服务器关闭TCP连接/或者保持连接

2.URL概述

URL定义:

统一资源定位符(URL,英语 Uniform / Universal Resource Locator 的缩写)是用于完整地描述Internet上网页和其他资源的地址的一种标识方法。

URL格式:

基本格式如下

schema://host[:port#]/path/.../[?query-string][#anchor]

schema 协议(例如:http, https, ftp)

host 服务器的IP地址或者域名

port# 服务器的端口(如果是走协议默认端口,可省略)

path 访问资源的路径

query-string 参数,发送给http服务器的数据

anchor- 锚(跳转到网页的指定锚点位置)

一个URL 的例子:

http://www.website.com/test/test.aspx?name=sv&x=true#stuff

一个URL的请求过程:

  • 当你在浏览器输入URL http://www.website.com 的时候,浏览器发送一个Request去获取 http://www. website.com的html. 服务器把Response发送回给浏览器.
  • 浏览器分析Response中的 HTML,发现其中引用了很多其他文件,比如图片,CSS文件,JS文件。
  • 浏览器会自动再次发送Request去获取图片,CSS文件,或者JS文件。
  • 当所有的文件都下载成功后, 网页就被显示出来了。

3.HTTP 消息结构

HTTP消息分为HTTP 请求消息(HTTP Request)和HTT响应(HTTP Response)消息。

HTTP 请求消息(HTTP Request),由三部分组成:

第1部分叫Request line

第2部分叫Request header

第3部分是body(header和body之间有个空行)。

如下图所示:

HTTP协议教程 HTTP请求消息示意图

HTTP请求消息示意图详细说明如下:

  • METHOD :表示请求方法,比如POST、GET和PUT等;
  • path-to-resoure :表示请求的资源。
  • Http/version-number  :表示HTTP协议的版本号,如HTTP/1.1
  • Request消息常用方法 :Http定义了与服务器交互的不同方法,最基本的方法有4种,分别是GET,POST,PUT,DELETE,对应着对资源的查、改、增和删 4个操作。一般GET用于获取/查询资源信息,POST一般用于更新资源信息;这应该是GET和POST的本质区别;

Request消息之GET/POST示例:

GET实例:

GET /test/?id=11101&name=Professional HTTP/1.1  Host: www.test.com  User-Agent: Mozilla/5.0 (Windows; U;) Firefox/1.0.1  Connection: Keep-Alive

POST 实例:

POST / HTTP/1.1  Host: www.test.com   User-Agent: Mozilla/5.0 (Windows; U) Firefox/1.0.1  Content-Type: application/x-www-form-urlencoded  Content-Length: 40  Connection: Keep-Alive  (…… 此处空一行 ……)  name=Professional&id=11101

更多关于HTTP请求消息的知识要点:

  • GET提交,请求的数据会附在URL之后(就是据放置在HTTP协议头中),以“?”分割URL
    输数据,多个参数用“&”连接;例如:
    login.action?name=tom&password=securiy
  • POST提交:把提交的数据放置在是HTTP包的正文中。上文示例中name=Professional&id=11101就是实际的传输数据;
  • 数据长度:HTTP协议没有对传输的数据和URL长度进行限制, 但特定浏览器和服务器对URL长度有限制, 因此对于GET提交时,传输数据就会受到URL长度的限制; 由于POST操作不是通过URL传值,理论上数据长度不受限;
  • 安全性:POST的安全性要比GET的安全性高,通过GET提交数据,用户名和密码将明文出现在URL上,容易被他人看到,URL信息也可能会被记录到历史纪录中;

HTTP 响应消息(HTTP Response),由三部分组成:

第1部分叫Response line

第2部分叫Response header

第3部分是body(header和body之间有个空行)。

HTTP协议教程

HTTP 响应消息示意图

HTTP响应消息示意图详细说明如下:

  • HTTP/version-number:HTTP协议的版本号;
  • status-code :状态码
    1XX 提示信息 - 表示请求已被成功接收,继续处理
    2XX 成功 - 表示请求已被成功接收,理解,接受
    3XX 重定向 - 要完成请求必须进行更进一步的处理
    4XX 客户端错误 - 请求有语法错误或请求无法实现
    5XX 服务器端错误 - 服务器未能实现合法的请求
  • message:状态消息
  • 请求行最常用的状态码:
    200 (OK): 找到了该资源,并且一切正常。
    304 (NOT MODIFIED): 该资源在上次请求之后没有任何修改。这通常用于浏览器的缓存机制。
    401 (UNAUTHORIZED): 客户端无权访问该资源。这通常会使得浏览器要求用户输入用户名和密码,以登录到服务器。
    403 (FORBIDDEN): 客户端未能获得授权。这通常是在401之后输入了不正确的用户名或密码。
    404 (NOT FOUND): 在指定的位置不存在所申请的资源。

TO DO Next:

HTTP请求头(HTTP Request Header)

HTTP响应头(HTTP Request Header)

HTTP编码与解码(HTTP Encode/Decode)

正文到此结束
Loading...