域名概念回顾:
IP地址不易记忆,域名用于代替IP地址,方便记忆。
两台主机通信,是通过IP地址访问,所以需要将域名解析成IP地址。
早期使用Hosts文件解析域名,但随着域名的增多,工作量巨大,维护困难。
之后使用DNS (Domain Name Server,域名服务器) 进行域名解析。
1、HTML概述HTML叫做超文本标记语言,是一种规范,也是一种标准,它通过标记符号来标记要显示的网页中的各个部分。网页文件本身是一种文本文件,通过在文本文件中添加标记符,可以告诉浏览器如何显示其中的内容。 HTML命令可以说明文字,图形、动画、声音、表格、链接等。
HTML文件可以使用任何能够生成txt文件的文本编辑器来编辑,生成超文本标记语言文件,只用修改文件名后缀为“.html”或“.htm”即可。
2、HTML 基本标签2.1 HTML 语法规则HTML标签采用双标记符的形式,前后标记符对应,分别表示标记开始和结束,标记符中间的内容被标签描述。前标记符由“< XXX>”表示,结尾标记符多了一个“/”,由“< /XXX>”表示。
2.2 HTML 文件结构HTML文件最外层由< html> < /html>表示,说明该文件是用HTML语言描述的。在它里面是并列的头标签(< head>)和内容标签(< body>)。
HTML 文件结构如下:
?<html>?????<head>网页的内容描述信息</head>?????<body>网页显示的内容</body>?</html>头标签中常用标签:
标签描述< title>定义了文档的标题< base>定义了页面链接标签的默认链接地址< link>定义了一个文档和外部资源之间的关系< meta>定义了HTML文档中的元数据< script>定义了客户端的脚本文件< style>定义了HTML文档的样式文件内容标签中常用标签:
标签描述< table>定义一个表格< tr>定义了表格中的一行< td>定义了表格中某一行的一列< img>定义了一个图像< a>定义了一个超链接< p>定义了一行< br>定义了换行< font>定义了字体3、静态网页与动态网页3.1 静态网页在网站设计中,纯粹HTML格式的网页通常被称为“静态网页”,静态网页是标准的HTML文件,它的文件扩展名是.htm、.html。静态网页是网站建设的基础,早期的网站一般都是由静态网页制作的。
静态网页也可以出现各种动态的效果,如.GIF格式的动画、FLASH、滚动字幕等。这些“动态效果”只是视觉上的,与下面将要介绍的动态网页是不同的概念。
静态网页只要不修改代码,是不会改变的,每天展示的内容是一样的。静态网页只使用html语言,不使用其他高级程序语言。
3.2 动态网页所谓的动态网页,是指跟静态网页相对的一种网页编程技术。静态网页,随着HTML代码的生成,页面的内容和显示效果就基本上不会发生变化了——除非是修改页面代码。而动态网页则不然,页面代码虽然没有变,但是显示的内容却是可以随着时间、环境或者数据库操作的结果而发生改变的。
动态网页URL的后缀不是.htm、.html、.shtml、.xml等静态网页的常见网页制作格式,而是以.aspx、.asp、.jsp、.php、.perl、.cgi等形式为后缀,并且在动态网页网址中有一个标志性的符号——“?”。
动态网页是基本的html语法规范与Java、PHP、C#等高级程序设计语言、数据库编程等多种技术的融合,以期实现对网站内容和风格的高效、动态和交互式的管理。因此,从这个意义上来讲,凡是结合了HTML以外的高级程序设计语言和数据库技术进行的网页编程技术生成的网页都是动态网页。
3.3 动态网页语言早期的动态网页主要采用通用网关接口 CGI(Common Gateway Interface)技术,虽然 CGI 技术已经发展成熟而且功能强大, 但由于编程困难、效率低下、修改复杂,所以有逐渐被新技术取代的趋势。
目前常用的动态网页编程语言如下:(1)PHP
即Hypertext Preprocessor ( 超文本预处理器),它是当今Internet. 上 最为火热的脚本语言,其语法借鉴了C、 Java、PERL等语言,但只需要很少的编程知识你就能使用PHP建立一个真正交互的Web站点。
(2)JSP
即Java Server Pages (Java 服务器页面X,它是由Sun Microsystem 公司于1999年6月推出的新技术,是基于Java Servlet以及整个Java体系的web开发技术。
(3)Python
是一种面向对象、跨平台的动态类计算机程序设计语言,最初被设计用于编写自动化脚本(shell),随着版本的不断更新和语言新功能的添加,越来越多被用于独立的大型项目开发。
注:Python支持的并发量不高,假设python写的脚本需要10台服务器支撑的话,Go语言只需要1台服务器。
(4)Ruby
是一种简单快捷的面向对象( 面向对象程序设计)脚本语言,在20世纪90年代由日本人松本行弘(Yukihiro Matsumoto) 开发,遵守GPL协议和Ruby License。 它的灵感与特性来自于Perl、 Smalltalk、 Eiffel、 Ada 以及Lisp语言。
4、HTTP协议HTTP协议采用了请求/响应模型。客户端向服务器发送一个请求,请求头包含请求的方法、URL、协议版本、以及包含请求修饰符、客户信息和内容的类似于MIME的消息结构。服务器以一个状态行作为响应,响应的内容包括消息协议的版本,成功或者错误编码加上服务器信息、实体元信息以及可能的实体内容。
HTTP 已经演化出了很多版本,它们中的大部分都是向下兼容的:
HTTP/0.9:已过时。只接受 GET 一种请求方法,没有在通讯中指定版本号,且不支持请求头。由于该版本不支持 POST 方法,所以客户端无法向服务器传递太多信息。
HTTP/1.0:这是第一个在通讯中指定版本号的 HTTP 协议版本,至今仍被广泛采用,特别是在代理服务器中。
HTTP/1.1:引入了持久连接,即TCP连接默认不关闭,可以被多个请求复用,能很好地配合代理服务器工作。还支持管道方式机制,即在同一个TCP连接里面,客户端可以同时发送多个请求,以便降低线路负载,提高传输速度。
HTTP/2.0:完全多路复用,在一个连接里,客户端和浏览器都可以同时发送多个请求或回应,而且不用按照顺序一一对应。引入了头信息压缩机制,使用gzip或compress压缩后再发送。支持服务端推送,允许服务器未经请求,主动向客户端发送资源。
5、HTTP 方法HTTP 支持几种不同的请求命令,这些命令被称为 HTTP 方法(HTTP method)。每条 HTTP 请求报文都包含一个方法, 告诉服务器要执行什么动作,包括:获取一个页面,运行一个网关程序,删除一个文件等。最常用的获取资源的方法是 GET、POST、PUT。
HTTP方法:HTTP 方法描述GET对服务器资源获取的简单请求PUT向服务器提交数据,以修改数据POST用于发送包含用户提交数据的请求DELETE删除服务器上的某些资源HEAD请求页面的首部,获取资源的元信息CONNECT用于ssl隧道的基于代理的请求OPTIONS返回所有可用的方法,常用于跨域TRACE追踪 请求--响应的传输路径HTTP方法介绍:1、GET请求会向数据库发索取数据的请求,从而来获取信息,该请求不会产生副作用。无论进行多少次操作,结果都是一样的。
2、与GET不同的是,PUT请求是向服务器端发送数据的,从而改变信息,无论进行多少次PUT操作,其结果并没有不同。
3、POST请求同PUT请求类似,都是向服务器端发送数据的,但是该请求会改变数据的种类等资源,几乎目前所有的提交操作都是用POST请求的。
4、DELETE请求顾名思义,就是用来删除某一个资源的。
GET 和 POST 比较:GET 方法
从指定的服务器上获得数据
GET请求能被缓存
GET请求会保存在浏览器的浏览纪录里
GET请求有长度的限制
主要用于获取数据
查询的字符串会显示在URL后缀中,不安全
POST 方法
提交数据给指定服务器处理
POST请求不能被缓存
POST请求不会保存在浏览器的浏览纪录里
POST请求没有长度限制
查询的字符串不会显示在URL中,比较安全
6、HTTP 状态码HTTP 状态码(HTTP Status Code)是用以表示网页服务器 HTTP 响应状态的 3 位数字代码,当浏览器请求某一 URL 时, 服务器根据处理情况返回相应的处理状态。
通常正常的状态码为2xx,3xx(如200),如果出现异常会返回4xx,5xx(如404)。
状态码分类:
状态码首位已定义范围分类1xx100-101信息提示2xx200-206成功3xx300-305重定向4xx400-415客户端错误5xx500-505服务器错误HTTP 常见状态码:
状态码功能描述200一切正常301永久重定向302临时重定向401用户名或密码错误403禁止访问(客户端IP地址被拒绝)404请求的文件不存在414请求URL头部过长500服务器内部错误。比如脚本错误,编程语言语法错误502无效网关503当前服务不可用。web服务器不能处理HTTP请求,可能是临时超载或者是服务器进行停机维护。504网关请求超时。程序执行时间过长导致响应超时,例如程序需要执行20秒,而nginx最大响应等待时间为10秒,这样就会出现超时。产生502(无效网关)的原因:
1、数据包没有送到网卡,网络问题;
2、数据包送进去了(交换机能抓到包),但是网卡没收到,网卡问题或防火墙问题;
3、网卡接收到了,处理不了,服务问题。(比如服务器当前连接太多,响应太慢;页面素材太多,带宽不够。)
7、HTTP 请求流程分析用户在浏览器输入URL访问时,发起HTTP请求报文,请求中包括请求行、请求头、请求体,服务器收到请求后返回响应报文,包括状态行、响应头、响应体。
7.1 请求报文请求报文四部分:
请求行:请求行由请求方法、URL 以及协议版本三部分组成。
请求头:请求头为请求报文添加了一些附加信息,由“名/值”对组成,每行一对,名和值之间使用冒号分隔。
空行:请求头部的最后会有一个空行,表示请求头部结束,接下来为请求体,这一行非常重要,必不可少。
请求体:请求体是请求提交的参数,GET 方法已经在 URL 中指明了参数,所以提交时没有数据。POST 方法提交的参数在请求体中。
常用的请求头:
请求头描述Host接受请求的服务器地址,可以是 IP:端口号 ,也可以是域名User-Agent发送请求的应用程序名称Connection指定与连接相关的属性,如Connection:Keep-AliveAccept-Charset通知服务端可以发送的编码格式Accept-Encoding通知服务端可以发送的数据压缩格式Accept-Language通知服务端可以发送的语言7.2响应报文响应报文四部分:
状态行:状态行由协议版本,状态码,状态码描述三部分组成。
响应头:响应头与请求头部类似,为响应报文添加了一些附加信息。
空行:响应头部的最后会有一个空行,表示响应头部结束。
响应体:服务器返回的相应 HTML 数据,浏览器对其解析后显示页面。
常见响应头:
响应头描述Server服务器应用程序软件的名称和版本Content-Type响应正文的类型(是图片还是二进制字符串)Content-Length响应正文长度Content-Charset响应正文使用的编码Content-Encoding响应正文使用的数据压缩格式Content-Language响应正文使用的语言8 HTTP访问的过程HTTP访问的过程:
1、客户端通过域名进行访问,先进行DNS域名解析。
2、之后客户端请求与web服务器建立TCP连接(三次握手)。
3、建立连接后,客户端向web服务器发送一个HTTP请求。
4、服务器响应HTTP请求,客户端的浏览器得到HTML代码。
5、浏览器解析HTML代码,并请求HTML代码中的资源。(浏览器拿到HTML文件后,开始解析HTML代码,遇到静态资源时,就向服务器去请求下载。)
6、断开TCP连接(四次挥手),浏览器对页面进行渲染呈现给用户。
原文:https://juejin.cn/post/7094920322498953224
logo设计
创造品牌价值
¥500元起
APP开发
量身定制,源码交付
¥2000元起
商标注册
一个好品牌从商标开始
¥1480元起
公司注册
注册公司全程代办
¥0元起
查
看
更
多
爬虫全纪录——WEB协议基础之HTTP\/HTTPS协议(2)
HTTP协议是Web客户端与服务器之间进行通信的基础,定义了客户端请求Web页面和服务器响应的规则。在HTTP协议中,客户端与服务器之间采用请求\/响应模型。客户端向服务器发送请求报文,包含请求方法、URL、协议版本、请求头部和请求数据。服务器响应以状态行、响应头部、空行和响应数据组成。每个请求和响应都有特...
爬虫全纪录——WEB协议基础之HTTP\/HTTPS协议(2)
1.1 客户端连接至服务器 客户端,通常为浏览器,与服务器建立TCP套接字连接。例如,通过HTTP协议访问oakcms.cn。1.2 发送HTTP请求 客户端通过TCP套接字向服务器发送文本请求报文,报文包含请求方法、URL、协议版本、请求头部和请求数据。1.3 服务器响应请求 服务器解析请求,定位请求资源,将资源副本...
Web基础与HTTP协议
HTTP方法:HTTP 方法描述GET对服务器资源获取的简单请求PUT向服务器提交数据,以修改数据POST用于发送包含用户提交数据的请求DELETE删除服务器上的某些资源HEAD请求页面的首部,获取资源的元信息CONNECT用于ssl隧道的基于代理的请求OPTIONS返回所有可用的方法,常用于跨域TRACE追踪 请求--响应的传输路径HTTP方法介绍: 1、GET请求...
http协议有哪些
HTTP协议有多种,主要包括HTTP\/1.0、HTTP\/1.1、HTTP\/2以及HTTP\/3。一、HTTP\/1.0 HTTP\/1.0是互联网历史上最早的HTTP版本之一。这个版本定义了客户端与服务器之间请求和响应的标准,是Web的基础。其主要特点是简单性,尽管存在一些限制,比如不支持部分请求和响应的缓存控制等。二、HTTP\/1.1 HTTP\/...
什么是http协议,它是如何运用在web开发中的?
HTTP协议的运作基于客户-服务器模型。当用户在浏览器中输入网址或点击链接时,浏览器作为客户端,向服务器发起请求。服务器作为响应方,根据请求返回相应的网页内容。这个过程在幕后进行,你无需深入理解其内部机制,只需输入网址并等待加载即可。HTTP协议的简单性和通用性使其成为网络基础设施的核心。它支持...
什么是http协议它的作用是什么?
HTTP协议全称HyperTextTransferProtocol,翻译过来就是超文本传输协议,位于TCP\/IP四层模型当中的应用层。作用:在浏览器与服务器间传送文档。HTTP(HyperTextTransferProtocol)超文本传输协议,是基于应用层(TCP\/IP参考模型)的通信规范;是从Web服务器传输超文本到客户端的传输协议,无状态的传输协议;不仅能够...
http协议是什么
HTTP协议是一种应用层的协议,用于在计算机网络中传输数据,特别是在Web浏览器中与服务器进行通信。HTTP协议是一种请求-响应协议,它定义了客户端如何与服务器进行通信。以下是关于HTTP协议的详细解释:1.HTTP协议的基本概念:HTTP,全称为超文本传输协议,是一种指导数据如何在Web上传输的应用层协议。它...
HTTP和web有什么区别?
区别 他们两个是一种包含于被包含的关系,HTTP是超文本传输协议(HyperTextTransferProtocol)是互联网上应用最为广泛的一种网络协议。www即万维网(亦作“Web”、“WWW”、“'W3'”,英文全称为“WorldWideWeb”),是一个由许多互相链接的超文本组成的系统,通过互联网访问。这些资源通过超文本传输协议(...
Web前端开发者应该要懂的HTTP协议!
当客户端访问Web站点时,首先会通过DNS服务查询到域名的IP地址。然后浏览器生成HTTP请求,并通过TCP\/IP协议发送给Web服务器。Web服务器接收到请求后会根据请求生成响应内容,并通过TCP\/IP协议返回给客户端。相比于HTTP\/1.1的不足,HTTP\/2和HTTP\/3各有哪些优势呢?HTTP\/1.1有两个主要的缺点:安全不足...
web基本技术有哪些
HTTPHTTP是Web通信的基础协议,用于在浏览器和服务器之间传输数据。HTTP协议定义了数据如何在Web上传输,包括请求和响应的过程、状态码等。了解HTTP协议对于Web开发和调试非常重要。服务器技术服务器技术是Web开发中的重要组成部分。常见的服务器技术包括:Web服务器、数据库技术、后端编程技术等。这些技术用于...