http与www服务概念详解.docx
- 文档编号:14182641
- 上传时间:2023-06-21
- 格式:DOCX
- 页数:11
- 大小:187.80KB
http与www服务概念详解.docx
《http与www服务概念详解.docx》由会员分享,可在线阅读,更多相关《http与www服务概念详解.docx(11页珍藏版)》请在冰点文库上搜索。
http与www服务概念详解
http与www服务概念详解
用户访问网站基本流程
2)域名解析过程流程图
http协议简介:
HTTP协议,全称HyperTestTransferProtocol,中文名称超文本传输协议,是互联网上应用最为广泛的一种网络协议。
所有的www都必须遵守这个标准,设计HTTP最初的目的是为了提供一种发布和接收HTML页面的方法。
(HTTP(HyperTestTransferProtocol,超文本传输协议)是在万维网上进行通信时所用的协议方案,HTTP有很多应用,但是最著名的是应用于Web游览器和Web服务器之间的双工通信)。
WWW(WorldWideWeb),简称web,中文常译为”万维网”或”环球网”。
它是目前Internet上最方便,最受用户欢迎的信息服务类型。
http协议www服务默认端口是80。
加密的www服务https默认端口443。
端口对应的服务及工作方式
默认端口
服务
主要功能
工作方式
21
ftp
文件传输
Tcp
22
sshsftp
安全的远程登录
Tcp
25
smtp
邮件的传输
Tcp
3306
mysql
数据库存储
Tcp
小结:
http协议通信原理
1、http是osi模型中应用层协议。
http协议的重要应用是www服务。
2、DNS解析原理
3、http请求信息包含的内容。
4、http服务返回的内容,消息主体也消息头。
5、用户通过浏览器访问站服务器的请求到返回数据流程
静态网页:
概念:
在网站设计中,存粹HTML格式的网页(可以包含图片,JS(前端功能实现),CSS(样式)等)通常被称为”静态网页”。
特点:
所有程序在客户端解析,客户端如:
IE游览器,你编的是什么,它显示的就是什么,一旦编写完成,就不会有任何改变。
维护和更新比较麻烦。
扩展名:
对应程序文件的常见扩展名为:
htm,html,xml,shtml,jpg(gif,png,bmp等所有图片),js,css(样式),swf,avi,flv视频格式。
(1)静态网页每个网页都有一个固定的URL,且网页一般以.htm、html、.shtml等常见形式为后缀,而且地址中不含问号“?
”或“&”
(2)网页内容一经发布到网站服务器上,无论是否有用户访问,每个静态网页的内容都是保存在网页服务器上的,也就是说,静态网页是实实在在保存在服务器上的文件,每个网页都是一个独立的文件。
(3)静态网页的内容相对稳定,因此,容易被搜索引擎收录(优点,seo)
(4)静态网页没有数据库的支持,在网站制作和维护方面工作量较大,因此当网站信息量很大时完全依靠静态网页制作的方式比较困难(缺点)。
(5)静态网页的交互性较差,在功能方面有较大的限制(缺点)。
(6)网页程序在用户浏览器端解析,如IE浏览器,这样程序解析效率更高,由于服务端不进行解析,因此可以接受更多的并发访问,当客户端向服务器请求数据时,服务器直接把数据返回(不做任何解析),当客户端拿到数据后,在浏览器端解析展现出来。
静态网页小结:
1、客户浏览器端解析程序,效率很高。
2、扩展名格式html,shtml,jpg,wmv为主的格式。
3、后端没有数据库,没有和用户交互。
动态网页:
扩展名:
常见扩展名为asp,aspx,php,jsp,cgi,perl等
特点
(1)动态网页一般以数据库技术为基础,可以大大降低网站的维护工作量。
(2)采用动态网页技术的网站可以实现更多的功能,如用户注册,用户登录,在线调查,投票,用户管理,订单管理,发博文等等。
(3)动态网页大多并不是独立存在于服务器上的网页文件,只有当用户请求时服务器才返回一个完整的网页。
(4)动态网页中的“?
”对搜索的收录存在一定的问题,搜索引擎一般不可能从一个网站的数据库中访问全部网页,或者出于技术方面的考虑,搜索蜘蛛一般不会区抓取网址中的“?
”后面的内容,因此采用动态网页的网站在进行搜索引擎推广时需要做一定的技术处理(伪静态)才能适应搜索引擎的抓取的要求。
(5)程序在服务端解析,服务端:
php引擎,java容器(tomcat,resin,jboss)。
(6)由于程序在服务端解析,因此,会消耗大量的CPU和内存等资源,因此,效率远不如静态网页。
动态网页小结:
1、程序在服务端解析,一般以数据库为基础,可以大量的和用户交互
2、url地址后缀一般为asp,aspx,php,jsp,do,cgi,perl,并且常伴随?
,&
3、架构优化:
效率很差,并发也很低,尽可能转换成静态网页提供服务。
伪静态网页:
缺点:
性能没有提升。
反而降低了网站的性能。
伪静态特点:
从URL地址里看,给人感觉是静态内容(如地址结尾带html),通过rewrite规则实现URL重写。
地址规范、美观、有利于搜索引擎抓取。
伪静态小结:
1、动态网页伪装成静态。
2、目的:
便于搜索引擎收录,提升用户访问量和提升用户体验。
3、由于仅仅是伪装,实际上还是动态,性能没有提升,转换消耗资源因此性能反而下降。
4、 尽可能转换成真正的静态页面,除非并发量不是很大,用rewrite实现伪静态。
高并发网站架构从动态转静态不同业务产品实现的例子:
1、门户新闻业务(一旦发布完成,几乎不会改动)
对于新闻的业务静态化相对简单,有编辑人发布新闻,就可以生成静态文件,然后把静态内容同步到全国所有CDN服务器节点上,再对用户提供访问。
2、视频网站业务(一旦发布完成,几乎不会改动)。
优酷视频网,用户上传视频,需要经历审核-转码的过程,大概1-2个小时,审核-转码-推送。
3、blog/bbs/sns/微博社区业务、电商(淘宝,京东)(用户发布完成,可能会随时更新)
异步,消息中间件、消息队列。
1Web概念
1.1Web1.0
以静态、单向阅读为主,网站内信息可以直接和其他网站信息进行交互,能通过第三方信息平台同时对多家网站信息进行整合使用。
早期门户新闻类页面,或者传统的企业宣传的静态页面
特点:
由网站提供方来更新和维护内容。
1.2Web2.0
以动态页面为主,以用户为中心,网站由用户参与或编辑的。
产品如:
bbs,blog,sns,微博。
以分享为特征的实时网络,用户在互联网上拥有自己的数据,并能在不同的网站上使用。
特点:
以用户为中心,由用户上传或参与编辑维护内容。
1.3Web3.0
将以网络化和个性化为特征,提供更多人工智能服务,完全基于Web,用浏览器即可实现复杂的系统程序才具有的功能。
Web3.0的特征分析:
1、微内容(Widget)的自由整合与有效聚合
2、适合多种终端平台,实现信息服务的普适性
3、良好的人性化用户体验,以及基础性的个性化配置
4、有效和有序的数字新技术
2访问模式
2.1b/s模式
b/s模式—browser/server游览器/服务器结构,常见协议如http如:
apache服务。
b/s架构的全称为browser/server,即游览器/服务器结构。
Browser指的是web游览器,极少数事务逻辑在前端实现,但主要事务逻辑在服务器端实现,browser客户端,webapp服务器端和DB端够成所谓的三层架构。
B/S架构的系统无需特别安装,客户端只需web游览器即可。
B/S架构中,显示逻辑交给了web游览器,事务处理逻辑在放在webapp上,这样就避免了庞大的胖客户端,减少了客户端的压力。
因为客户端包含的逻辑很少,因此也被称为瘦客户端。
优点:
(1)无需安装客户端,有web游览器即可。
(2)BS架构可以直接放在广域网上,通过一定的权限控制实现多客户访问的目的,交互性较强。
(3)BS架构无需升级多个客户端,升级服务器即可。
缺点:
(1)在跨游览器上(要兼容各种游览器),BS架构不尽人意。
(2)BS架构的表现要达到CS程序的程度需要花费不少精力(需要测试人员做各种测试)。
(3)在速度和安全性上需要花费巨大的设计成本,这是BS架构的最大问题。
(4)客户端服务器端的交互是请求-响应模式,通常需要刷新页面,这并不是客户端乐意去做的。
2.2C/S模式
C/S模式-client/server,酒店管理系统。
考勤系统,会计用友软件,收银系统。
C/S架构是一种典型的两层架构,客户端服务器端架构,其客户端包含一个或多个在用户的电脑上运行的程序,而服务器端有两种,一种是数据库服务器端,客户端通过数据库连接访问服务器端的数据;另一种是socket服务器端,服务器端的程序通过socket与客户端的程序通信。
C/S架构也可以看做是胖客户端架构。
因为客户端需要实现绝大多数的业务逻辑和界面展示。
这种架构中,作为客户端的部分需要承受很大的压力,因为显示逻辑和事务处理都包含在其中,通过与数据库的交互(通常是SQL或存储过程的实现)来达到持久化数据,依次来满足实际项目的需要。
优点:
1、C/S架构的界面和操作可以很丰富。
2、安全性能可以很容易保证,实现多层认证也不难。
3、由于只有一层交互,因此相应速度较快。
4、服务器端和客户端可以更好的兼容。
缺点:
1、适用面窄,通常用于局域网中。
2、用户群固定。
由于程序需要安装才可以使用,因此不适合面向一些不可知的用户。
3、维护成本高,发生一次升级,则所有客户端的程序都需要改变。
3PVIPUV
3.1IP
IP即InternetProtocol,这里指独立IP数,独立IP数是指不同IP地址的计算机访问网站时被计的总次数。
独立IP数是衡量网站流量的一个重要指标。
一般一天内相同IP地址的客户端访问网站页面只会被记为一次。
3.2PV
PV(访问量):
即PageView,中文翻译为页面游览,即页面游览量或单击量,不管客户端是不是相同,也不管IP是不是相同,用户只要访问网站页面就会被计算PV,一次计一个PV。
一个来访者访问网站,可能产生若干PV数,但是独立IP数就只有1个,因此,如果对比一个网站的独立IP数和PV数,不难看出,PV一定会大于等于IP数,其比例视网站的业务而定,对于分类门户,可能会达到10:
1甚至更多。
3.3UV
UV(独立访客)即UniqueVisitor,同一个客户端(PC或移动端)访问网站被记为一个访客。
一天内相同的客户端访问同一个网站只记一次UV。
UV一般是以客户端Cookie等技术作为统计依据的,实际统计会有误差。
3.4企业网站对IP、PV、UV的度量
3.4.1对IP的度量
(1)分析所有Web服务器的访问日志信息,对IP地址段去重后计数,这是IT人员的基本计算手段。
(2)在网站的每个(所有)页面结尾,嵌入JS等统计程序代码,待用户加载网页后,IP即传给统计IP的服务器,这种方法一般被第三方统计公司或在企业内部开发日志分析程序时使用。
(3)用第三方大家比较信任的统计工具,例如:
谷歌的统计(GA)。
3.4.2对PV的度量
(1)分析web服务的访问日志(需要排除JS、CSS及各种图片的日志信息),只计算HTML、PHP等页面数量。
(2)在网站的每个页面结尾,嵌入JS等统计程序代码,带用户加载网页后,访问数量即传给统计PV的服务器,这种方法一般被第三方统计公司或在企业内部开发日志分析程序时使用。
(3)用第三方大家比较信任的统计工具,例如:
谷歌的统计(GA)。
3.4.3对UV的度量
(1)通过客户端HTTP请求报文分析
(2)通过cookie鉴别。
3.4.4对并发的理解
单位时间内,服务器能够同时处理的最大连接数(有的请求1秒才结束,有的请求可能10秒才结束)。
- 配套讲稿:
如PPT文件的首页显示word图标,表示该PPT已包含配套word讲稿。双击word图标可打开word文档。
- 特殊限制:
部分文档作品中含有的国旗、国徽等图片,仅作为作品整体效果示例展示,禁止商用。设计者仅对作品中独创性部分享有著作权。
- 关 键 词:
- http www 服务 概念 详解
![提示](https://static.bingdoc.com/images/bang_tan.gif)