当浏览器向 Web服务器发出请求时,它向服务器传递了一个数据块,也就是请求信息, HTTP请求信息由 3部分组成:
l 请求行(包括:请求方式 /URI地址 协议/版本)
l 请求头 (Request Header)/
l 请求正文
下面是一个 HTTP请求的例子:
GET /sample.jsp HTTP/1.1
Accept:image/gif.image/jpeg,*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible;MSIE5.01;Window NT5.0)
Accept-Encoding:gzip,deflate
username=jinqiao&password=1234
( 1)请求头
请求的第一行是“方法 / URL /议 版本”: GET /sample.jsp HTTP/1.1
以上代码中“ GET”代表请求方法,“ /sample.jsp”表示 URI,“ HTTP/1.1代表协议和协议的版本。
根据 HTTP标准, HTTP请求可以使用多种请求方法。例如: HTTP1.1目前支持 7种请求方法: GET、 POST、 HEAD、 OPTIONS、 PUT、 DELETE和 TARCE。
GET 请求获取由 Request-URI 所标识的资源。
POST 在 Request-URI 所标识的资源后附加新的数据。
HEAD 请求获取由 Request-URI 所标识的资源的响应消息报头。
OPTIONS 请求查询服务器的性能,或查询与资源相关的选项和需求。
PUT 请求服务器存储一个资源,并用 Request-URI 作为其标识。
DELETE 请求服务器删除由 Request-URI 所标识的资源。
TRACE 请求服务器回送收到的请求信息,主要用语测试或诊断。
在 Internet应用中,最常用的方法是 GET和 POST。
URI完整地指定了要访问的网络资源,通常只要给出相对于服务器的根目录的相对目录即可,因此总是以“ /”开头,最后,协议版本声明了通信过程中使用 HTTP的版本。
( 2)请求头 (Request Header)
请求头包含许多有关的客户端环境和请求正文的有用信息。例如,请求头可以声明浏览器所用的语言,请求正文的长度等。
Accept:image/gif.image/jpeg.*/*
Accept-Language:zh-cn
Connection:Keep-Alive
Host:localhost
User-Agent:Mozila/4.0(compatible:MSIE5.01:Windows NT5.0)
Accept-Encoding:gzip,deflate.
( 3)请求正文
请求头和请求正文之间是一个空行,这个行非常重要,它表示请求头已经结束,接下来的是请求正文。请求正文中可以包含客户提交的查询字符串信息:
username=jinqiao&password=1234
在以上的例子的 HTTP请求中,请求的正文只有一行内容。当然,在实际应用中, HTTP请求正文可以包含更多的内容。
HTTP请求方法我这里只讨论 GET方法与 POST方法
l GET方法
GET方法是默认的 HTTP请求方法,我们日常用 GET方法来提交表单数据,然而用 GET方法提交的表单数据只经过了简单的编码,同时它将作为 URL的一部分向 Web服务器发送,因此,如果使用 GET方法来提交表单数据就存在着安全隐患上。例如
Http://127.0.0.1/login.jsp?Name=zhangshi&Age=30&Submit=%cc%E+%BD%BB
从上面的 URL请求中,很容易就可以辩认出表单提交的内容。(?之后的内容)另外由于 GET方法提交的数据是作为 URL请求的一部分所以提交的数据量不能太大
l POST方法
POST方法是 GET方法的一个替代方法,它主要是向 Web服务器提交表单数据,尤其是大批量的数据。 POST方法克服了 GET方法的一些缺点。通过 POST方法提交表单数据时,数据不是作为 URL请求的一部分而是作为标准数据传送给 Web服务器,这就克服了 GET方法中的信息无法保密和数据量太小的缺点。因此,出于安全的考虑以及对用户隐私的尊重,通常表单提交时采用 POST方法。
从编程的角度来讲,如果用户通过 GET方法提交数据,则数据存放在 QUERY_ STRING环境变量中,而 POST方法提交的数据则可以从标准输入流中获取。
HTTP应答与 HTTP请求相似, HTTP响应也由 3个部分构成,分别是:
l 状态行
l 响应头 (Response Header)
l 响应正文
在接收和解释请求消息后,服务器会返回一个 HTTP响应消息。
状态行由协议版本、数字形式的状态代码、及相应的状态描述,各元素之间以空格分隔。
格式 : HTTP-Version Status-Code Reason-Phrase CRLF
例如 : HTTP/1.1 200 OK /r/n
状态代码:
状态代码由 3位数字组成,表示请求是否被理解或被满足。
状态描述:
状态描述给出了关于状态代码的简短的文字描述。
状态代码的第一个数字定义了响应的类别,后面两位没有具体的分类。
第一个数字有五种可能的取值:
- 1xx: 指示信息—表示请求已接收,继续处理。
- 2xx: 成功—表示请求已经被成功接收、理解、接受。
- 3xx: 重定向—要完成请求必须进行更进一步的操作。
- 4xx: 客户端错误—请求有语法错误或请求无法实现。
- 5xx: 服务器端错误—服务器未能实现合法的请求。
状态代码 状态描述 说明
200 OK 客户端请求成功
400 Bad Request 由于客户端请求有语法错误,不能被服务器所理解。
401 Unauthonzed 请求未经授权。这个状态代码必须和 WWW-Authenticate报头域一起使用
403 Forbidden 服务器收到请求,但是拒绝提供服务。服务器通常会在响应正文中给出不提供服务的原因
404 Not Found 请求的资源不存在,例如,输入了错误的 URL。
500 Internal Server Error 服务器发生不可预期的错误,导致无法完成客户端的请求。
503 Service Unavailable 服务器当前不能够处理客户端的请求,在一段时间之后,服务器可能会恢复正常。
响应头
响应头可能包括:
Location:
Location响应报头域用于重定向接受者到一个新的位置。例如:客户端所请求的页面已不存在原先的位置,为了让客户端重定向到这个页面新的位置,服务 器端可以发回 Location响应报头后使用重定向语句,让客户端去访问新的域名所对应的服务器上的资源。当我们在 JSP中使用重定向语句的时候,服务器 端向客户端发回的响应报头中,就会有 Location响应报头域。
Server:
Server响应报头域包含了服务器用来处理请求的软件信息。它和 User-Agent请求报头域是相对应的,前者发送服务器端软件的信息,后者发送客户 端软件 (浏览器 )和操作系统的信息。下面是 Server响应报头域的一个例子: Server: Apache-Coyote/1.1
WWW-Authenticate:
WWW-Authenticate响应报头域必须被包含在 401(未授权的 )响应消息中,这个报头域和前面讲到的 Authorization请求报头域是 相关的,当客户端收到 401响应消息,就要决定是否请求服务器对其进行验证。如果要求服务器对其进行验证,就可以发送一个包含了 Authorization报头域的请求,下面是 WWW-Authenticate响应报头域的一个例子: WWW-Authenticate: Basic realm="Basic Auth Test!"
从这个响应报头域,可以知道服务器端对我们所请求的资源采用的是基本验证机制。
Content-Encoding:
Content-Encoding实体报头域被使用作媒体类型的修饰符,它的值指示了已经被应用到实体正文的附加内容编码,因而要获得 Content- Type报头域中所引用的媒体类型,必须采用相应的解码机制。 Content-Encoding主要用语记录文档的压缩方法,下面是它的一个例子: Content-Encoding: gzip。如果一个实体正文采用了编码方式存储,在使用之前就必须进行解码。
Content-Language:
Content-Language实体报头域描述了资源所用的自然语言。 Content-Language允许用户遵照自身的首选语言来识别和区分实体。 如果这个实体内容仅仅打算提供给丹麦的阅读者,那么可以按照如下的方式设置这个实体报头域: Content-Language: da。
如果没有指定 Content-Language报头域,那么实体内容将提供给所以语言的阅读者。
Content-Length:
Content-Length实体报头域用于指明正文的长度,以字节方式存储的十进制数字来表示,也就是一个数字字符占一个字节,用其对应的 ASCII码存储传输。
要注意的是:这个长度仅仅是表示实体正文的长度,没有包括实体报头的长度。
Content-Type
Content-Type实体报头域用语指明发送给接收者的实体正文的媒体类型。例如:
Content-Type: text/html;charset=ISO-8859-1
Content-Type: text/html;charset=GB2312
Last-Modified
Last-Modified实体报头域用于指示资源最后的修改日期及时间。
Expires
Expires实体报头域给出响应过期的日期和时间。通常,代理服务器或浏览器会缓存一些页面。当用户再次访问这些页面时,直接从缓存中加载并显示给用 户,这样缩短了响应的时间,减少服务器的负载。为了让代理服务器或浏览器在一段时间后更新页面,我们可以使用 Expires实体报头域指定页面过期的时 间。当用户又一次访问页面时,如果 Expires报头域给出的日期和时间比 Date普通报头域给出的日期和时间要早 (或相同 ),那么代理服务器或浏览器就 不会再使用缓存的页面而是从服务器上请求更新的页面。不过要注意,即使页面过期了,也并不意味着服务器上的原始资源在此时间之前或之后发生了改变。
Expires实体报头域使用的日期和时间必须是 RFC 1123中的日期格式,例如:
Expires: Thu, 15 Sep 2005 16:00:00 GMT
HTTP1.1的客户端和缓存必须将其他非法的日期格式 (也包括 0)看作已过期。例如,为了让浏览器不要缓存页面,我们也可以利用 Expires实体报头 域,设置它的值为 0,如下 (JSP): response.setDateHeader("Expires",0);
下面是一个 HTTP响应的例子:
HTTP/1.1 200 OK
Server:Apache Tomcat/5.0.12
Date:Mon,6Oct2003 13:23:42 GMT
Content-Length:112
介绍完基本的http协议内容后,下面就可以着手实现HttpServer了。因为这里主要是演示向服务器请求资源、接收资源的操作,所以此处比较重要的一步操作是获取请求行里面的URI地址,这个地址代表了资源的在服务器内部的相对路径。
因为是使用socket来实现,所以
第一步就是创建一个ServerSocket,即服务器socket,并为其指定一个端口:
server = new ServerSocket(PORT); if (server == null) System.exit(1);
第二步是要获取向ServerSocket发送请求的客户端Socket:client,并通过该client的输入流获取到请求行,得到请求资源的名称:
Socket client = null; client = server.accept(); if (client != null) { try { System.out.println("连接服务器成功!!..."); BufferedReader reader = new BufferedReader( new InputStreamReader(client.getInputStream())); // GET /test.jpg /HTTP1.1 String line = reader.readLine(); System.out.println("line: " + line); String resource = line.substring(line.indexOf('/'), line.lastIndexOf('/') - 5); System.out.println("the resource you request is: " + resource); resource = URLDecoder.decode(resource, "UTF-8");
第三步是根据请求资源的后缀名,引导到你想要回传的资源:
if (resource.endsWith(".mkv")) { transferFileHandle("videos/test.mkv", client); closeSocket(client); continue; } else if (resource.endsWith(".jpg")) { transferFileHandle("images/test.jpg", client); closeSocket(client); continue; } else if (resource.endsWith(".rmvb")) { transferFileHandle("videos/test.rmvb", client); closeSocket(client); continue; } else { PrintStream writer = new PrintStream( client.getOutputStream(), true); writer.println("HTTP/1.0 404 Not found");// 返回应答消息,并结束应答 writer.println();// 根据 HTTP 协议, 空行将结束头信息 writer.close(); closeSocket(client); continue; }
具体的回传资源的功能函数详细代码如下:
private void transferFileHandle(String path, Socket client) { File fileToSend = new File(path); if (fileToSend.exists() && !fileToSend.isDirectory()) { try { PrintStream writer = new PrintStream(client.getOutputStream()); writer.println("HTTP/1.0 200 OK");// 返回应答消息,并结束应答 writer.println("Content-Type:application/binary"); writer.println("Content-Length:" + fileToSend.length());// 返回内容字节数 writer.println();// 根据 HTTP 协议, 空行将结束头信息 FileInputStream fis = new FileInputStream(fileToSend); byte[] buf = new byte[fis.available()]; fis.read(buf); writer.write(buf); writer.close(); fis.close(); } catch (IOException e) { e.printStackTrace(); } } }
通过client的输出流,就可以将资源返回给浏览器。在验证过程中发现,图片格式会直接显示在浏览器中;视频格式就会提示用浏览器下载。这里也只试验了这几中情况。
下面是全部代码实现:
public class SocketHttpServer implements Runnable { private final static int PORT = 28081; private ServerSocket server = null; public static void main(String[] args) { new SocketHttpServer(); } public SocketHttpServer() { try { server = new ServerSocket(PORT); if (server == null) System.exit(1); new Thread(this).start(); } catch (IOException e) { e.printStackTrace(); } } @Override public void run() { while (true) { try { Socket client = null; client = server.accept(); if (client != null) { try { System.out.println("连接服务器成功!!..."); BufferedReader reader = new BufferedReader( new InputStreamReader(client.getInputStream())); // GET /test.jpg /HTTP1.1 String line = reader.readLine(); System.out.println("line: " + line); String resource = line.substring(line.indexOf('/'), line.lastIndexOf('/') - 5); System.out.println("the resource you request is: " + resource); resource = URLDecoder.decode(resource, "UTF-8"); String method = new StringTokenizer(line).nextElement() .toString(); System.out.println("the request method you send is: " + method); while ((line = reader.readLine()) != null) { if (line.equals("")) { break; } System.out.println("the Http Header is : " + line); } if ("post".equals(method.toLowerCase())) { System.out.println("the post request body is: " + reader.readLine()); } if (resource.endsWith(".mkv")) { transferFileHandle("videos/test.mkv", client); closeSocket(client); continue; } else if (resource.endsWith(".jpg")) { transferFileHandle("images/test.jpg", client); closeSocket(client); continue; } else if (resource.endsWith(".rmvb")) { transferFileHandle("videos/test.rmvb", client); closeSocket(client); continue; } else { PrintStream writer = new PrintStream( client.getOutputStream(), true); writer.println("HTTP/1.0 404 Not found");// 返回应答消息,并结束应答 writer.println();// 根据 HTTP 协议, 空行将结束头信息 writer.close(); closeSocket(client); continue; } } catch (Exception e) { System.out.println("HTTP服务器错误:" + e.getLocalizedMessage()); } } } catch (Exception e) { e.printStackTrace(); } } } private void closeSocket(Socket socket) { try { socket.close(); } catch (IOException ex) { ex.printStackTrace(); } System.out.println(socket + "离开了HTTP服务器"); } private void transferFileHandle(String path, Socket client) { File fileToSend = new File(path); if (fileToSend.exists() && !fileToSend.isDirectory()) { try { PrintStream writer = new PrintStream(client.getOutputStream()); writer.println("HTTP/1.0 200 OK");// 返回应答消息,并结束应答 writer.println("Content-Type:application/binary"); writer.println("Content-Length:" + fileToSend.length());// 返回内容字节数 writer.println();// 根据 HTTP 协议, 空行将结束头信息 FileInputStream fis = new FileInputStream(fileToSend); byte[] buf = new byte[fis.available()]; fis.read(buf); writer.write(buf); writer.close(); fis.close(); } catch (IOException e) { e.printStackTrace(); } } } }
这种功能的实现,代码量还是比较少的。要验证的话,只需在浏览器地址栏输入:http://192.168.7.107:28081/test.mkv,IP地址和端口号根据实际情况更改即可。
参考博文:
http://www.cnblogs.com/loveyakamoz/archive/2011/07/22/2113614.html