《图解HTTP》第一章个人学习思考

第一章 了解Web及其网络基础
1.1使用HTTP协议访问Web
1.2HTTP的诞生
1.3网络基础TCP/IP
1.4和HTTP相关协议:IP\TCP和DNS
1.5负责域名解析的DNS服务
1.6各种协议和HTTP协议的关系
1.7URI和URL
——————————————————
心得:
HTTP为知识共享而诞生的协议,属于TCP/IP协议族里的协议之一。
我们浏览web时候web是如何实现的?数据怎么传的?网络是如何通信的呢?

利用 TCP/IP 协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。
HTTP这个应用层协议和其他层的协议之间是什么一种关系?

1.1使用HTTP协议访问Web

网页浏览器(Web Browser)的地址里输入URL,web页面如何呈现?
根据web浏览器制定的地址栏的url,从浏览器向服务器端获取文件资源等信息,从而显示在web页面。
在这里插入图片描述
Web 使用一种名为 HTTP(HyperText Transfer Protocol,超文本传输协议 )的协议作为规范,完成从客户端到服务器端等一系列运作流程。而协议是指规则的约定。

1.2 HTTP诞生

1989 年 3 月,互联网还只属于少数人。在这一互联网的黎明期,HTTP 诞生了。CERN(欧洲核子研究组织)的蒂姆 • 伯纳斯 - 李(Tim BernersLee)博士提出了一种能让远隔两地的研究者们共享知识的设想。最初设想的基本理念是:借助多文档之间相互关联形成的超文本(HyperText),连成可相互参阅的 WWW(World Wide Web,万维网)。现在已提出了 3 项 WWW 构建技术,分别是:把 SGML(Standard Generalized Markup Language,标准通用标记语言)作为页面的文本标记语言的 HTML(HyperText Markup Language,超文本标记语言);作为文档传递协议的 HTTP ;指定文档所在地址的 URL(Uniform Resource Locator,统一资源定位符)。
HTTP/0.9
HTTP 于 1990 年问世。那时的 HTTP 并没有作为正式的标准被建立。现在的 HTTP 其实含有 HTTP1.0 之前版本的意思,因此被称为HTTP/0.9。
HTTP/1.0
HTTP 正式作为标准被公布是在 1996 年的 5 月,版本被命名为HTTP/1.0,并记载于 RFC1945。虽说是初期标准,但该协议标准至今仍被广泛使用在服务器端。
HTTP/1.1
1997 年 1 月公布的 HTTP/1.1 是目前主流的 HTTP 协议版本。当初的标准是 RFC2068,之后发布的修订版 RFC2616 就是当前的最新版本。

1.3 网络基础TCP/IP

TCP/IP 协议族
计算机与网络设备要相互通信,双方就必须基于相同的方法。比如,如何探测到通信目标、由哪一边先发起通信、使用哪种语言进行通信、怎样结束通信等规则都需要事先确定。不同的硬件、操作系统之间的通信,所有的这一切都需要一种规则。而我们就把这种规则称为协议(protocol)。
TCP/IP 是互联网相关各类协议族的总称
**协议中存在各式各样的内容。**从电缆的规格到 IP 地址的选定方法、寻找异地用户的方法、双方建立通信的顺序,以及 Web 页面显示需要处理的步骤,等等。
在这里插入图片描述
TCP/IP分层管理
TCP/IP 协议族按层次分别分为以下 4 层:应用层、传输层、网络层和数据链路层。

TCP/IP 层次化是有好处的。

  1. 如果互联网只由一个协议统筹,某个地方需要改变设计时,就必须把所有部分整体替换掉。而分层之后只需把变动的层替换掉即可。把各层之间的接口部分规划好之后,每个层次内部的设计就能够自由改动了。
  2. 设计网络时候,从各个层逐一设置。

应用层:
应用层决定了向用户提供应用服务时通信的活动。TCP/IP 协议族内预存了各类通用的应用服务。比如,FTP(File Transfer Protocol,文件传输协议)和 DNS(Domain Name System,域名系统)服务就是其中两类。HTTP 协议也处于该层。


传输层:
传输层对上层应用层,提供处于网络连接中的两台计算机之间的数据传输。在传输层有两个性质不同的协议。TCP(Transmission Control Protocol,传输控制协议)和 UDP(User Data Protocol,用户数据报协议)。


网络层(网络互连层):
网络层用来处理在网络上流动的数据包。数据包是网络传输的最小数据单位,该层规定了通过怎样的路径(所谓的传输路线)到达对方计算机,并把数据包传送给对方。
和对方计算机之间通过多台计算机或网络设备进行传输时,网络层所起的作用就是在众多的选项内选择一条传输路线。


链路层(又名数据链路层,网络接口层)
用来处理连接网络的硬件部分。包括控制操作系统、硬件的设备驱动、NIC(Network Interface Card,网络适配器,即网卡),及光纤等物理可见部分(还包括连接器等一切传输媒介)。硬件上的范畴均在链路层的作用范围之内。

在这里插入图片描述

利用 TCP/IP 协议族进行网络通信时,会通过分层顺序与对方进行通信。发送端从应用层往下走,接收端则往应用层往上走。

HTTP举例
1、作为发送端的客户端在应用层(HTTP协议)发出想看某个Web页面的HTTP请求。
2、在传输层(TCP协议)(HTTP请求报文)进行分割,并在各个报文上打上标记序号及端口号转发给网络层。
3、在网络层(IP协议),增加作为通信目的地的MAC地址后转发给链路层。
4、接收端的服务器在链路层接收到数据,按顺序往上层发送,一直到应用层,当传输到应用层,才真正接收到由客户端发送来的HTTP请求。
在这里插入图片描述

1.4 与 HTTP 关系密切的协议 : IP、TCP 和DNS

协议及其对应的层:
HTTP协议/DNS协议,应用层
TCP协议,传输层
IP协议,网络层

1.4.1 负责传输的IP协议

IP(Internet Protocol,因特网协议),网际协议位于网络层。TCP/IP协议族里的IP指的就是网际协议,“IP”和“IP 地址”别搞混,“IP”其实是一种协议的名称。
**IP协议作用——把各种数据包传送给对方。保证确实传送到对方那里。 **

问题:如何做到正确的传输给对方它所需要的数据呢?

  1. 第一个条件:IP地址
  2. 第二个条件:MAC地址(Media Access Control Address)

IP地址指明节点被分配到的地址,MAC地址是指网卡所属的固定地址。IP地址和MAC地址进行配对。IP地址可变换,但是MAC地址基本上不改变。(使用 ARP 协议凭借 MAC 地址进行通信)

**IP间的通信依赖MAC地址。**在网络上,通信的双方在同一局域网(LAN)内的情况是很少的,通常是经过多台计算机和网络设备中转才能连接到对方。而在进行中转时,会利用下一站中转设备的 MAC地址来搜索下一个中转目标。这时,会采用 ARP 协议(AddressResolution Protocol)。ARP 是一种用以解析地址的协议,根据通信方的 IP 地址就可以反查出对应的 MAC 地址。

在到达通信目标前中转过程里,计算机和路由器等网络设备获悉传输路线的机制称为路由选择。(routing) 帮助记忆:寄件人发件,快递公司收件到货物集散中心然后派件中转,达到收件人所在区域在层层分发直到到达地址。
在这里插入图片描述
1.4.2 确保可靠性的TCP协议
按层次分,TCP 位于传输层,提供可靠的字节流服务
字节流服务(Byte Stream Service)是指,为了方便传输,将大块数据分割成以报文段(segment)为单位的数据包进行管理。而可靠的传输服务是指,能够把数据准确可靠地传给对方。一言以蔽之,TCP 协议为了更容易传送大数据才把数据分割,而且 TCP 协议能够确认数据最终是否送达到对方。

如何实现数据包传输到正确的目标呢?

  1. 字节流服务方便传输
  2. 三次握手(three-way handshaking)策略。
    用 TCP 协议把数据包送出去后,TCP不会对传送后的情况置之不理,它一定会向对方确认是否成功送达。握手过程中使用了 TCP 的标志(flag) —— SYN(synchronize) 和ACK(acknowledgement)
  3. 其他手段

在这里插入图片描述

发送端首先发送一个带 SYN 标志的数据包给对方。接收端收到后,回传一个带有 SYN/ACK 标志的数据包以示传达确认信息。最后,发送端再回传一个带 ACK 标志的数据包,代表“握手”结束。若在握手过程中某个阶段莫名中断,TCP 协议会再次以相同的顺序发送相同的数据包。

1.5 负责域名解析的DNS服务

DNS(Domain Name System)服务是和HTTP协议一样位于应用层的协议,是提供域名到IP地址时间的解析服务。

DNS协议提供通过域名查找IP地址,或者逆向从IP地址反查域名的服务。

计算机可以被赋予IP地址,也可以被赋予主机名和域名。**用户通常使用主机名或域名来访问对方的计算机,**而不是直接通过 IP地址访问。因为与 IP 地址的一组纯数字相比,用字母配合数字的表示形式来指定计算机名更符合人类的记忆习惯。计算机通常通过纯数字的IP地址来访问

在这里插入图片描述

1.6 各种协议和HTTP协议的关系

IP 协议、TCP 协议和 DNS 服务在使用HTTP 协议的通信过程中各自发挥了哪些作用?
在这里插入图片描述

1.7 URI和URL

URI,统一资源标识符
URL,统一资源定位符
URI是用字符串标识的某一互联网资源,URL表示资源的地点(互联网上所处的位置),URL是URI的子集。

1.7.1 URI——Uniform Resource Identifier
Uniform:规定统一的格式可方便处理多种不同类型的资源,而不是根据上下文环境来识别资源指定的访问方式。
Resource:定义“可识别的任何东西”,除了文档文件、图像或服务(如当天天气预报)外可以区别于其他类型的,全都可作为资源。
Identifier:表示可标识的对象,也称为标识符。
URI 就是由某个协议方案表示的资源的定位标识符。协议方案是指访问资源所使用的协议类型名称。

1.7.2 URI格式
表示指定的URI,要使用涵盖全部必要信息的绝对URI、绝对URL以及相对URL.
相对URL是指从浏览器中基本URI处指定的URL,如/image/logo.gif。
在这里插入图片描述

http: 或 https: 等协议方案名获取访问资源时要指定协议类型。不区分字母大小写,最后附一个冒号(:)。
1、登入信息(认证)指定用户名和密码作为从服务端获取资源时必要的登入信息(身份认证)
2、服务器地址:使用绝对URI必须指定访问的服务器地址。地址可以是类似hackr.jp 这种 DNS 可解析的名称,或是 192.168.1.1 这类 IPv4 地址名,还可以是 [0:0:0:0:0:0:0:1] 这样用方括号括起来的 IPv6 地址名。
3、服务器端口号:
指定服务器连接的网络端口号。是可选项,用户省略则自动使用默认端口号。
4、带层次的文件路径:
指定服务器上的文件路径来定位特指的资源。
5、查询字符串:
针对已指定的文件路径内的资源,可以使用查询字符串传入任意参数,此项可选。
6、片段标识符
使用片段标识符通常可标记处已获取资源里的子资源(文档内的某个位置)。但在 RFC 中并没有明确规定其使用方法。该项也为可选项。

RFC(Request for Comments,征求修正意见书)

通常,应用程序会遵照由 RFC 确定的标准实现。可以说,RFC 是互联网的设计文档,要是不按照 RFC 标准执行,就有可能导致无法通信的状况。比如,有一台 Web 服务器内的应用服务没有遵照RFC 的标准实现,那 Web 浏览器就很可能无法访问这台服务器了。
由于不遵照 RFC 标准实现就无法进行 HTTP 协议通信,所以基本上客户端和服务器端都会以 RFC 为标准来实现 HTTP 协议。但也存在某些应用程序因客户端或服务器端的不同,而未遵照 RFC 标准,反而将自成一套的“标准”扩展的情况。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值