内容提要

这一章内容较多,介绍了http报文的诸多相关概念,譬如起始行、首部、主体以及它们代表的含义等!同时还介绍了常见的状态码及其含义,常见的首部字段及其含义。本章内容较丰实,所以概念模糊的部分可以参阅原书相关章节!

报文流

这是形容http报文的

  • http报文是以一种类似的流的方式来发送数据的,所以报文流讲述了http报文的一些客观状态,相关术语:流入、流出形容事务处理。http报文任何时候是从上游向下游流入的!其中进过的节点既可能是上游,有可能是下游,如果从某个节点流出,那么相对于此节点流入的那个节点,它就是上游,反过来它就是下游!

报文的组成部分

  • 首先说明,报文由三个部分组成,起始行、首部、主体。起始行和首部都是ascll文本,而主体则可以是任意类型文件,比如二进制,视频等!且起始行和首部都已一个crlf作为结束符,并且首部与主体之间应始终存在一个以crlf序列作为结束的空行。当然了为了兼容老版本的http,这里有时并不是那么严格要求非要crlf同时存在!
  • 报文的语法

http报文分为请求报文和相应报文,其语法分别如下:

  1. //请求报文
  2. <method> <request-URL> <version>
  3. <headers>
  4. <entity-body>
  1. //响应报文
  2. <version> <status> <reason-phrase>
  3. <headers>
  4. <entity-body>

相关概念分别如下:

  1. 方法是客户端希望执行的动作,如GETPOST
  2. 请求url是指请求资源的路径
  3. http版本号,格式为http/<major>.<minor>,分别代表主要版本号和次要版本号,其含义应分开理解
  4. status code其实说白了就是用一个数字表示当前事务处于什么状态,便于开发者处理
  5. 原因短语,实际意义不大,就是为了方便人看的
  6. 首部就是一个包含零个或多个的键值对,键值对以crlf隔开,而键、值之间以‘:’隔开,期间包含一个可选的空格
  7. 主体任意格式组成的数据块,也是实际发送的内容
  • 起始行

分为请求行和响应行,格式前面一个在前面,相关概念不在赘述!

  • 首部

说一下首部分类,主要有五类:通用首部、请求首部、响应首部、主体首部、扩展首部。通用首部就是请求报文和响应报文都可以用,用以说明报文的一般属性;请求首部出现在请求报文中,用于客户端告诉服务器是什么情况,比如能接受什么,不能接受什么等;响应报文用于响应报文中,服务器端用来告诉客户端什么情况;主体首部用来描述主体的信息,比如主体的长度是多少等;扩展报文是非官方的报文,但是http也支持发送。

方法

  • 安全方法

能在服务器端有操作的就是非安全方法,比如delete、put、post,不在服务器端有操作的就是安全方法,比如get、head,当然了安全方法并非不能在服务器端有操作,这是开发者可以控制的!

  • GET方法用于请求服务器端发送某个资源

  • HEAD方法跟GET方法类似,区别就是不返回主体

  • PUT方法用于向服务器端修改、插入数据

  • POST方法用于向服务器端发送数据

  • TRACK方法用于向服务器端请求报文在发送的过程中经过了什么修改,主要用于测试

  • OPTIONS用于请求服务器告知其支持什么功能

  • DELETE用于向服务器删除某个指定的资源

  • 扩展方法其实类似于自定义方法

 状态码

  • 100-199 信息性状态码

  • 200-299 成功状态码 (常见200表示请求成功)

  • 300-399 重定向状态码 (常见302重定向)

  • 400-499 客户端错误状态码 (常见404,请求资源不存在)

  • 500-599 服务端错误状态码

常见状态码及其含义整理

  1. 状态码 原因短语 含义
  2. 100 Continue 说明收到了请求的初始部分,请客户端继续,发送了这个状态码之后,
  3. 服务器在收到请求之后必须进行响应。
  4. 101 Switching Protocols 说明服务器正在根据客户端的指定,将协议切换成Update首部所列的
  5. 协议
  6. 200 OK 请求没问题,实体的主体部分包含了所请求的资源
  7. 201 Created 用于创建服务器对象的请求(比如,PUT)。响应的实体主体部分中
  8. 应该包含各种引用了已创建的资源的URLLocation首部包含的则是最具体的引用。
  9. 202 Accepted 请求已被接受,但服务器还未对其执行任何动作。不能保证服务器会完成这
  10. 个请求;这只是意味着接受请求时,它看起来是有效的。服务器应该在实体的主体部分包含对请求状态的描述,或许还应该有对请求完成时间的估计(或者包含一个指针,指向可以获取此信息的位置)
  11. 203 Non-Authoritative 实体首部包含的信息不是来自原远端服务器,而是来自于资源的一份副本。
  12. Information 如果中间节点上有一份资源副本,但无法或者没有对它所发送的与资源有关的
  13. 元信息进行验证,就会出现这种情况
  14. 204 No Content 响应报文中包含若干首部和一个状态行,但没有实体的主体部分。主要用于在
  15. 浏览器不转为显示新文档的情况下,对其进行更新(比如刷新一个表单页面)
  16. 205 Reset Content 另一个主要用于浏览器的代码。负责告知浏览器清除当前页面中的所有HTML
  17. 表单元素
  18. 206 Partial Content 成功执行了一个部分或Range(范围)请求。稍后我们会看到,客户端可以通过
  19. 一些特殊的首部来获取部分或某个范围内的文档————这个状态码就说明范围请求成功了。
  20. 注:在对那些包含了重定向状态码的非HEAD请求进行响应时,最好要包含一个实体,并在实体中包含描述信息和指向(多个)重定向URL的链接。如:
  21. HTTP/1.1 301 OK
  22. Location: http://www.gentle-grooming.com/
  23. Content-Length: 56
  24. Content-Type: text/plain
  25. Please go to our partner site,
  26. www.gentle-grooming.com
  27. 300 Multiple Choices 客户端请求一个实际指向多个资源的URL时会返回这个状态码,比如服务器
  28. 上有某个HTML文档的英语和法语版本。返回这个代码时会带有一个选项列表;这样用户就可以选择它希望使用的那一项了。有多个版本可用时,客户端需要沟通解决。
  29. 301 Moved Permanently 在请求的URL已被移除时使用。响应的Location首部中应该包含资源现在所处
  30. URL
  31. 302 Found 301状态码类似,但是,客户端应该使用Location首部给出的URL来临时定位
  32. 资源。将来的请求仍应该使用老的URL
  33. 303 See Other 告知客户端应该用另一个URL来获取资源。新的URL位于响应报文的Location
  34. 首部。其主要母的是允许POST请求的响应将客户端定向到某个资源上去
  35. 304 Not Modified 客户端可以通过所包含的请求首部,使其请求变成有条件的。如果客户端发起
  36. 了一个条件GET请求,而最近资源未被修改的话,就可以用这个状态码来说明
  37. 资源未被修改。带有这个状态码的响应不应该包含实体的主体部分。
  38. 305 Use Proxy 用来说明必须通过一个代理访问资源;代理的位置由Location首部给出。很
  39. 重要的一点是,客户端是相对某个特定资源来解析这条响应的,不能假定所有请求。甚至所有对持有请求资源的服务器的请求都通过这个代理进行。如果客户端错误地让代理介入了某条请求,可能会引发破坏性的行为,而且会造成安全漏洞。
  40. 307 Temporary Redireat 301状态码类似;但客户端应该使用Location首部给出的URL来临时定位资源
  41. 。将来的请求应该使用老的URL
  42. 400 Bad Request 用于告知客户端发起了一个错误的请求
  43. 401 Unauthorized 返回适当的首部,用于获取客户端访问资源的权限
  44. 402 Payment Required 此状态码未使用,保留
  45. 403 Forbidden 服务器拒绝请求,可在响应主体中告知原因
  46. 404 Not Found 用于告知客户端请求的资源在服务器不存在
  47. 405 Method Not Allowd 告知客户端不支持当前方法,并在Allow首部返回支持的方法
  48. 406 Not Acceptable 没有客户端支持的资源类型
  49. 407 Proxy Authentication 401类似,不过用户代理服务器
  50. Requireed
  51. 408 Request Timeout 超时提醒
  52. 409 Conflict 请求会造成服务器冲突
  53. 410 Gone 404一样,只不过服务器曾经拥有过该请求资源
  54. 411 Length Required 要求客户端发送Content-Length首部
  55. 412 Precondition Failed 部分条件验证不通过
  56. 413 Request Entity Too Large 客户端发送的主体超过了服务器的希望的长度
  57. 414 Request URL Too Long 客户端请求的时间比服务希望的时间长
  58. 415 Unsupported Media Type 服务器无法理解客户端请求的主体类型
  59. 416 Requested Range Not 请求报文所请求的是指定资源的某个范围,而此范围无效或无法满足时
  60. Satisfiable ,使用此状态码
  61. 417 Expectation Failed 请求中包含Expect首部,服务器无法满足
  62. 500 Internal Server Error 服务器错误
  63. 501 Not Implemented 请求超出了服务器能处理的范围
  64. 502 Bad Gateway 作为代理或网关使用的服务器从请求响应链的下一条链路上收到了一条
  65. 伪响应(比如,它无法连接到其父网关)时,使用此状态码
  66. 503 Service Unavailable 用来说明服务器现在无法为请求提供服务,但将来可以。如果服务器
  67. 知道什么时候资源会变为可用的,可以在响应中包含包含一个
  68. Retry-After首部。
  69. 504 Gateway Timeout 与状态码408类似,只是这里的响应来自一个网关或代理,它们在等待另
  70. 一服务器对其请求进行响应时超时了
  71. 505 HTTP Version Not 服务器收到的请求使用了它无法或不愿支持的协议版本时,使用此
  72. Supported 状态码。有些服务器应用程序会选择不支持协议的早起版本

常见首部字段含义介绍

  • 注:首部分为通用首部、请求首部、响应首部、主体首部、扩展首部!

  • 通用首部

  1. 通用的信息性首部
  2. 首部 描述
  3. Connection 允许客户端和服务器指定与请求/响应连接有关的选项
  4. Date 提供了日期的时间标志,说明报文是什么时间创建的
  5. MIME-Version 给出了发送端使用的MIME版本
  6. Trailer 如果报文采用了分块传输编码方式,就可以用这个首部列出位于报文拖挂部分的首部集合
  7. Transfer-Encoding 告知接收端为了保证报文的可靠传输,对报文采用了什么编码方式
  8. Update 给出了发送端可能想要“升级”使用的新版本或协议
  9. Via 显示了报文经过的中间节点(代理、网关)
  10. 通用缓存首部
  11. 首部 描述
  12. Cache-Control 用于随报文传送缓存指示
  13. Pragma 另一种随报文传送指示的方式,但并不专用缓存
  • 请求首部
  1. 请求的信息性首部
  2. 首部 描述
  3. Client-IP 提供了运行客户端的机器的IP地址
  4. From 提供了客户端用户的E-mail地址
  5. Host 给出了接收请求的服务器的主机名和端口号
  6. Referer 提供了包含当前请求URL的文档的URL
  7. UA-Color 提供了与客户端显示器的显示颜色有关的信息
  8. UA-CPU 给出了客户端CPU的类型或制造商
  9. UA-Disp 提供了与客户端显示器(屏幕)能力有关的信息
  10. UA-OS 给出了运行在客户端机器上的操作系统名称及版本
  11. UA-Pixels 提供了客户端显示器的像素信息
  12. User-Agent 将发起请求的应用程序名称告知服务器
  13. Accept首部
  14. 首部 描述
  15. Accept 告诉服务器能够发送那些媒体类型
  16. Accept-Charset 告诉服务器能够给发送那些字符集
  17. Accept-Encoding 告诉服务器能够发送那些编码方式
  18. Accept-Language 告诉服务器能够发送那些语言
  19. TE 告诉服务器可以使用那些扩展传输编码
  20. 条件请求首部
  21. 首部 描述
  22. Expect 允许客户端列出某请求所要求的服务器行为
  23. If-Match 如果实体标记与文档当前的实体标记相匹配,就获取这份文档
  24. If-Modified-Since 除非在某个指定的日期之后资源被修改过,否则就限制这个请求
  25. If-None-Match 如果提供的实体标记与当前文档的标记不相符,就获取文档
  26. If-Range 允许对文档的某个范围进行条件请求
  27. If-Unmodified-Since 除非在某个指定日期之后资源没有被修改过,否则就限制这个请求
  28. Range 如果服务器支持范围请求,就请求资源的指定范围
  29. 安全请求首部
  30. 首部 描述
  31. Authorization 包含了客户端提供给服务器,以便对其自身进行认证的数据
  32. Cookie 客户端用它向服务器传送一个令牌————它并不是真正的安全首部,但确实隐含了安全功能
  33. Cookie2 用来说明请求端支持的cookie版本
  34. 代理请求首部
  35. 首部 描述
  36. Max-Forward 在通往源端服务器的路径上,将请求转发给其他代理或网关的最大次数————与TRACE方法一同
  37. 使用
  38. Proxy-Authorization Authorization首部相同,但这个首部是在与代理进行认证时使用的
  39. Proxy-Connection Connection首部相同,但这个首部是在与代理建立连接时使用的
  • 响应首部
  1. 响应的信息性首部
  2. 首部 描述
  3. Age (从最初创建开始)响应持续时间
  4. Public 服务器为其资源支持的请求方法列表
  5. Retry-After 如果资源不可用的话,在此日期或时间重试
  6. Server 服务器应用程序软件的名称和版本
  7. Title HTML文档来说,就是HTML文档的源端给出的标题
  8. Warning 比原因短语中更详细的警告报文
  9. 协商首部
  10. 首部 描述
  11. Accept-Ranges 对此资源来说,服务器可接受的范围类型
  12. Vary 服务器查看的其他首部的列表,可能会使响应发生变化;也就是说,这是一个首部列表,
  13. 服务器会根据这些首部的内容挑选处最合适的资源版本发送个客户端
  14. 安全响应首部
  15. 首部 描述
  16. Proxy-Authenticate 来自代理的对客户端的质询列表
  17. Set-Cookie 不是真正的安全首部,但隐含有安全功能;可以在客户端设置一个令牌,以便服务器对客户端
  18. 进行标志
  19. Set-Cookie2 Set-Cookie类似
  20. WWW-Authenticate 来自服务器的对客户端的质询列表
  • 实体首部
  1. 实体的信息性首部
  2. 首部 描述
  3. Allow 列出了可以对此实体执行的请求方法
  4. Location 告知客户端实体实际上位于何处;用于将接收端丁香到资源的位置上去
  5. 内容首部
  6. 首部 描述
  7. Content-Base 解析主体中的相对URL时使用的基础URL
  8. Content-Encoding 对主体执行的任意编码方式
  9. Content-Language 理解主体时最适宜使用的自然语言
  10. Content-Length 主体的长度或者尺寸
  11. Content-Location 资源实际所处的位置
  12. Content-MD5 主体的MD5校验和
  13. Content-Range 在整个资源中此实体表示的字节范围
  14. Content-Type 这个主体的对象类型
  15. 实体缓存首部
  16. 首部 描述
  17. ETag 与此实体相关的实体标记
  18. Expires 实体不再有效,要从原始的源端再次获取此实体的日期和时间
  19. Last-Modified 这个实体最后一次被修改的日期和时间