浏览器输入一个url地址发生的事情
1、域名解析:浏览器获得url地址,向操作系统请求该url对应的ip地址,操作系统查询dns(首先查询本地host文件,没有则查询网络)获得对应的ip地址
解释:url分割成几个部分:协议、网络地址、资源路径
协议:指从该计算机获取资源的方式,常见的是用。
(6)服务器发送给浏览器。
(7)释放tcp连接。
(8)浏览器显示“清华大学院系设置”文件index.htm中的所有文件。
浏览器在下载文件时,可以设置为只下载其中的文本部分。这样可使下载的速度加快。在这种情况下,文本中原来嵌入图像或声音的地方只用一个小图标来显示。用户若要下载这些图像或声音,可再用鼠标分别点击这些图标。每点击一次鼠标就重复执行一次类似于上面的8个步骤。也就是先建立tcp连接,再使用tcp连接传送命令和文件,最后释放tcp连接。
http使用了面向连接的tcp作为运输层协议,保证了数据的可靠传输。
http是无连接的
无连接的含义是限制每次连接只处理一个请求。服务器处理完客户的请求,并收到客户的应答后,即断开连接。采用这种方式可以节省传输时间。
早期这么做的原因是 http 协议产生于互联网,因此服务器需要处理同时面向全世界数十万、上百万客户端的网页访问,但每个客户端(即浏览器)与服务器之间交换数据的间歇性较大(即传输具有突发性、瞬时性),并且网页浏览的联想性、发散性导致两次传送的数据关联性很低,大部分通道实际上会很空闲、无端占用资源。因此 http 的设计者有意利用这种特点将协议设计为请求时建连接、请求完释放连接,以尽快将资源释放出来服务其他客户端。
http是无状态的
无状态是指协议对于事务处理没有记忆能力,服务器不知道客户端是什么状态。即我们给服务器发送 http 请求之后,服务器根据请求,会给我们发送数据过来,但是,发送完,不会记录任何信息。http 是一个无状态协议,这意味着每个请求都是独立的。
缺少状态意味着如果后续处理需要前面的信息,则它必须重传,这样可能导致每次连接传送的数据量增大。另一方面,在服务器不需要先前信息时它的应答就较快。
http 协议这种特性有优点也有缺点,优点在于解放了服务器,每一次请求“点到为止”不会造成不必要连接占用,缺点在于每次请求会传输大量重复的内容信息。
一次http过程
http协议首先要和服务器建立tcp连接。这是需要三次握手。当三次握手的前两部分完成后(经过了一个rtt时间后),万维网客户就把http请求报文作为第三次握手的第三个报文的数据发送给万维网服务器。万维网服务器收到http请求报文后,就把所请求的文档作为响应报文返回给客户。
http/1.0协议的缺点
http的主要缺点,就是每请求一个文档就要两倍rtt的开销。若一个主页上有很多链接的对象(如图片等)需要一次进行链接,那么每一次链接下载都导致2rtt的开销。另一种开销就是万维网客户和服务器没一次建立新的tcp连接都要分配缓存和变量。
http/1.1协议较好地解决了上面的问题,它使用持续连接。在万维网服务器发送响应后仍然在一段时间内保持这条连接,使同一个客户(浏览器)和服务器可以继续在这条连接上传送后续的http请求报文和响应报文。并且不限于传送同一个页面上链接的文档,而是只要这些文档都在一个服务器上就行。
http/1.1协议的持续连接有两种方式,即非流水线方式和流水线方式。
http的报文结构
http有两类报文:
(1)请求报文—–从客户端向服务器发送请求报文。
(2)响应报文—–从服务器到客户的回答。
http请求报文和响应报文都是由三个部分组成。可以看出这两种报文的区别就在于开始行不同。
(1)开始行,用于区别是请求报文还是响应报文。在请求报文中的开始行叫做请求行,而在响应报文中的开始行就叫做状态行。
(2)首部行,用于说明浏览器、服务器、或报文主体的一些信息。首部可以有好几行,但也可以不用。
(3)实体主体,在请求报文中一般不用这个字段,在响应报文中返回请求的内容,也可以不用。
请求报文的第一行“请求行”只有三个内容,方法,请求资源的url,以及http的版本。这里的方法是对请求的对象进行的操作,这些方法实际上也就是一些命令,请求报文的类型就是由它采用的方法决定的。
1、options
返回服务器针对特定资源所支持的http请求方法,也可以利用向web服务器发送‘*’的请求来测试服务器的功能性
2、head
向服务器索与get请求相一致的响应,只不过响应体将不会被返回。这一方法可以再不必传输整个响应内容的情况下,就可以获取包含在响应小消息头中的元信息。
3、get
向特定的资源发出请求。注意:get方法不应当被用于产生“副作用”的操作中,例如在web application中,其中一个原因是get可能会被网络蜘蛛等随意访问。
4、post
向指定资源提交数据进行处理请求(例如提交表单或者上传文件)。数据被包含在请求体中。post请求可能会导致新的资源的建立和/或已有资源的修改。
5、put
向指定资源位置上传其最新内容
6、delete
请求服务器删除request-url所标识的资源
7、trace
回显服务器收到的请求,主要用于测试或诊断
8、connect