request请求数据包组成:请求行(request line)消息头(header)实体内容(Body)

  • Post author:
  • Post category:其他





HTTP客户请求数据格式






大多数servlet程序都是和浏览器客户以HTTP协议进行通信的,这需要编程人员对程序的基本功能和HTTP协议的具体操作有深入的理解。在学习servlet和Jsp编程时,有两点值得注意:首先是对HTTP协议的操作过程和数据格式足够熟悉,其次要灵活应用servlet的API中的有关方法正确高效地处理有关数据。






一、HTTP客户请求的数据格式说明




HTTP请求包括三部分:请求行(Request Line),头部(Headers)和实体内容(Body)。其中,请求行由请求方法(method),请求网址Request-URI和协议 (Protocol)构成,而消息头包括多个属性,实体内容(数据体)则可以被认为是附加在请求之后的文本或二进制文件,只有请求方式为post的时候,实体内容才会有数据(即请求参数)。



下面这个例子显示了一个HTTP请求的Header内容,这些数据是真正以网络HTTP协议从IE浏览器传递到Tomcat服务器上的。




GET /icwork/? search=product HTTP/1.1




Accept:image/gif,image/x-xbitmap,image/jpeg,image/pjpeg,application/vnd.ms-powerpoint,application/vnd.ms-excel,application/msword,*.*




Accept-Language:en-us




Accept-Encoding:gzip,deflate




User-Agent:Mozilla/4.0(compatible;MSIE 5.01;Windows NT 5.0;DigExt)




Host:www.icconcept.com:8080




Referer:http://www.yoursite.com/header.html




Connection:Keep-Alive




这段程序使用了6个Header,还有一些Header没有出现。我们参考这个例子具体解释HTTP请求格式。




1.HTTP请求行:请求行格式为Method Request-URI Protocol。在上面这个例子里,“GET /icwork/? search=pruduct HTTP/1.1”是请求行。




2.Accept:指浏览器或其他客户可以接爱的MIME文件格式。Servlet可以根据它判断并返回适当的文件格式。




3.Accept-Charset:指出浏览器可以接受的字符编码。英文浏览器的默认值是ISO-8859-1.




4.Accept-Language:指出浏览器可以接受的语言种类,如en或en-us,指英语。




5.Accept-Encoding:指出浏览器可以接受的编码方式。编码方式不同于文件格式,它是为了压缩文件并加速文件传递速度。浏览器在接收到Web响应之后先解码,然后再检查文件格式。




6.Authorization:当使用密码机制时用来标识浏览器。




7.Cache-Control:设置关于请求被代理服务器存储的相关选项。一般servlet用不到。




8.Connection:用来告诉服务器是否可以维持固定的HTTP连接。HTTP/1.1使用Keep-Alive为默认值,这样,当浏览器需要多个文件时(比如一个HTML文件和相关的图形文件),不需要每次都建立连接。




9.Content-Type:用来表名request的内容类型。可以用HttpServletRequest的getContentType()方法取得。




10.Cookie:浏览器用这个属性向服务器发送Cookie。Cookie是在浏览器中寄存的小型数据体,它可以记载和服务器相关的用户信息,也可以用来实现会话功能。




11.Expect:表时客户预期的响应状态。




12.From:给出客户端HTTP请求负责人的email地址。




13.Host:对应网址URL中的Web名称和端口号。




14.If-Match:供PUT方法使用。




15.If-Modified-Since:客户使用这个属性表明它只需要在指定日期之后更改过的网页。因为浏览器可以使用其存储的文件而不必从服务器请求,这样节省了Web资源。由于Servlet是动态生成的网页,一般不需要使用这个属性。




16.If-None-Match:和If-Match相反的操作,供PUT方法使用。




17.If-Unmodified-Since:和If-Match-Since相反。




18.Pragma:这个属性只有一种值,即Pragma:no-cache,表明如果servlet充当代理服务器,即使其有已经存储的网页,也要将请求传递给目的服务器。




19.Proxy-Authorization:代理服务器使用这个属性,Servlet一般用不到。




20.Range:如果客户有部分网页,这个属性可以请求剩余部分。




21.Referer:表明产生请求的网页URL。如比从网页/icconcept/index.jsp中点击一个链接到网页/icwork/search,在向服务器发送的GET/icwork/search中的请求中,Referer是http://hostname:8080/icconcept/index.jsp。这个属性可以用来跟踪Web请求是从什么网站来的。




22.Upgrage:客户通过这个属性设定可以使用与HTTP/1.1不同的协议。




23.User-Agent:是客户浏览器名称。




24.Via:用来记录Web请求经过的代理服务器或Web通道。




25.Warning:用来由客户声明传递或存储(cache)错误。




补充.Transfer-Encoding:




当不能预先确定报文体的长度时,不可能在头中包含Content-Length域来指明报文体长度,此时就需要通过Transfer-Encoding域来确定报文体长度。




通常情况下,Transfer-Encoding域的值应当为chunked,表明采用chunked编码方式来进行报文体的传输。chunked编码是HTTP/1.1 RFC里定义的一种编码方式,因此所有的HTTP/1.1应用都应当支持此方式。




chunked编码的基本方法是将大块数据分解成多块小数据,每块都可以自指定长度