一、操作系统基础:
操作系统是管理和控制计算机硬件与软件资源的计算机程序,是直接运行在“裸机”上的最基本的系统软件,任何其他软件都必须在操作系统的支持下运行。 例如从硬盘读取数据,或者从键盘获取输入等,而唯一可以做这些事情的就是操作系统,所以此时程序就需要向操作系统请求以程序的名义来执行这些操作。
所以操作系统内核分为两种模式,这两种模式;一个称为内核态,一个称为用户态。两者中切换的机制称为“系统调用”。
内核态:又称为“核心态”或者特权态(与之相对应的是用户态),该模式运行的时候可以对系统存储、外部设备进行访问。
用户态:所有用户程序都是运行在用户态,因为有时候需要做一些内核态的事情。
二、网络通信原理
互联网的本质就是一系列的网络协议:
现在,你有了一台计算机有操作系统,然后你再装个软件就可以正常的使用了,每个人都有一台自己的机器,但是却还没有互相通信。彼此是孤立的。
现在,两台电脑都装即时通讯工具,需要互发消息。如何愉快的玩耍,这时候需要internet。
那么,internet 是什么,举个例子:两台计算机与两个人现在打电话的原理是一样的(中国有多的方言,为了全中国人都可以听懂,大家统一讲普通话。)
现在,两个国家的人如何通话? 全世界几百个国家,你不可能学会好几百种语言,所以都用英语做为世界统一的通信标准语言。
现在,把计算机当成人,都在世界各地。internet就是计算机界的英语,也就是计算机的互联网标准协议→称为“互联网协议”(Internet Protocol Suite)
互联网协议的功能:定义计算机如何接入Internet,以及接入Internet的计算机通信的标准。
OSI七层模型和TCP/IP协议5层模型的对比:
每层运行常见物理设备:
Tcp/IP五层模型讲解:
将 应用层、表示层、会话层 并为应用层,从TCP/IP五层协议的角度阐述每层由来与功能,搞清楚每层的主要协议,就理解了整个互联网的原理。
在七层模型里面,越上层越靠近用户,越下越靠近硬件。
物理层:
物理层的由来: 上面提到,孤立的计算机之间要想一起玩,就必须接入Internet,言外之意就是计算机之间必须完成组网
物理层功能:主要是基于电器特性发送低电压(电信号),高电压对应数字1,低电压数字0。
数据链路层:
数据链路层由来:单纯的电信号0和1没有任何意义,必须规定电信号多少位一组,每组什么意思。
数据链路层的功能:定义了电信号的分组方式。后来形成了统一的标准,也就是以太网协议ethernet :
ethernet 规定:
- 一组电信号构成一个数据包,叫做“帧”
- 第一数据帧分成:报头head和数据data 两部分
Head 包含:(固定18个字节)
- 发送者/源地址,6个字节
- 接收者/目标地址,6个字节
- 数据类型,6个字节
data包含:(最短46字节,最长1500字节)
- 数据包的具体内容
head长度 + data长度=最短64字节,最长1518字节,超过最大限制就分片发送
Mac 地址:
head中包含的源和目标地址由来:ethernet规定接入Internet的设备都必须具备网卡,发送端和接收端的地址便是批网卡的地址,也就是mac地址。
Mac地址:每块网卡出厂时都被烧制上一个世界唯一的mac地址,长度为48位的2进制,通常由12位16进制数据表示(前6位是厂商编号,后六位是流水线号)
广播:
有了mac地址,同一 网络内的两台主机就可以通信了(一台主机通过arp协议获取另外一台主机的mac 地址) ethernet采用最原始的方式,广播的方式进行通信,即计算机通信基本靠吼。
网络层:
网络层的由来:有了ethernet、mac地址、广播的发送方式,世界上的计算机就可以彼此通信了,问题是世界范围的互联网是一个个彼此隔离的小的局域网组成的,那么如果所有的通信都采用以太网的广播方式,那么一台机器发送的“包”全世界都会收到,
这不仅仅是效率低的问题了,这会是一种灾难,
上图结论:必须找出一种方法来区分哪些计算机属于同一广播域,哪些不是,如果是就采用广播的方式发送,如果不是,就采用路由的方式(向不同广播域/ 子网分发数据包),mac 地址是无法区分的,它只跟厂商有关
网络层功能:引入一套新的地址用来区分不同的广播域/ 子网,这套地址即网络地址
IP协议:
- 规定网络地址的协议叫IP协议,它定义的地址称之为IP地址,广泛采用的V4版本即IPV4,它规定网络地址由32位2进制表示
- 范围0.0.0.0~255.255.255.255
- 一个IP地址通常写成四段十进制数,例172.16.10.1
IP地址分成两部分
- 网络部分:标识子网
- 主机部分:标识主机
注意:单纯的IP地址段只是标识了IP地址的种类,从网络部分或主机部分都无法辨识一个IP所处的子网。
例:172.16.10.1与172.16.10.2 并不能确定二者处于同一个子网。
子网掩码
所谓‘子网掩码’,就是表示子网络特征的一个参数。它在形式上等同于IP地址,也是一个32位进制数字,它的网络部分全部为1,主机部分全部为0。比如,IP地址172.16.10.1,如果已知网络部分是前24位,主机是后8位,那么子网络掩码就是11111111 .11111111 .11111111.00000000,写成十进制就是255.255.255.0
知道‘子网掩码’,我们就能判断,任意两个IP地址是否处在同一个子网络。方法是将两个IP地址与子网掩码分别进行AND运算(两个数位都为1,运算结果为1,否则为0),然后比较结果是否相同,如果是的话,就表明它们在同一个子网络中,否则不是。
比如已知IP地址172.16.10.1和172.16.10.2 的子网掩码都是255.255.255.0,请问它们是否在同一个子网络?两者与子网掩码分别进行AND运算,
172.16.10.1 10101100.00010000.00001010.00000001
255.255.255.0:11111111.11111111.11111111.00000000
AND运算的网络地址结果是:10101100.00010000.00001010.00000000 = 172.16.10.0
172.16.10.2:10101100.00010000.00001010.000000010
255255.255.255.0:11111111.11111111.11111111.00000000
AND运算得网络地址结果:10101100.00010000.00001010.000000001->172.16.10.0
结果都是172.16.10.0,因此它们在同一个子网络。
IP数据包
ip数据包也分为head和data部分,无须为ip包定义单独的栏位,直接放入以太网包的data部分
head:长度为20到60字节
data:最长为65,515字节。
而以太网数据包的”数据”部分,最长只有1500字节。因此,如果IP数据包超过了1500字节,它就需要分割成几个以太网数据包,分开发送了。
传输层:
传输层的由来:网络层的ip帮我们区分子网,以太网层的mac帮我们找到主机,然后大家使用的都是应用程序,你的电脑上可能同时开启qq,暴风影音,等多个应用程序,
那么我们通过ip和mac找到了一台特定的主机,如何标识这台主机上的应用程序,答案就是端口,端口即应用程序与网卡关联的编号。
传输层功能:建立端口到端口的通信
补充:端口范围0-65535,0-1023为系统占用端口
tcp协议:
可靠传输,TCP数据包没有长度限制,理论上可以无限长,但是为了保证网络的效率,通常TCP数据包的长度不会超过IP数据包的长度,以确保单个TCP数据包不必再分割。
UDP协议:
不可靠传输,“报头”部分一共只有8个字节,总长度不超过65535字节,正好放进一个数据包。
Tcp报文:
tcp三次握手和四次挥手
应用层:
应用层的由来:用户使用的都是应用程序,均工作于应用层,互联网开发的,大家都可以开发自己的应用程序,数据多种多样,必须规定好数据的组织形式。
应用层功能:规定应用程序的数据格式
例:TCP协议可以为各种各样的程序传递数据,比如Email、WWW、FTP等等。那么,必须有不同协议规定电子邮件、网页、FTP数据的格式,这些应用程序协议就构成了”应用层”。
Socket:
我们知道两个进程如果需要进行通讯最基本的一个前提能能够唯一的标示一个进程,在本地进程通讯中我们可以使用PID来唯一标示一个进程,但PID只在本地唯一,网络中的两个进程PID冲突几率很大,这时候我们需要另辟它径了,我们知道IP层的ip地址可以唯一标示主机,而TCP层协议和端口号可以唯一标示主机的一个进程,这样我们可以利用ip地址+协议+端口号唯一标示网络中的一个进程。
能够唯一标示网络中的进程后,它们就可以利用socket进行通信了,什么是socket呢?我们经常把socket翻译为套接字,socket是在应用层和传输层之间的一个抽象层,它把TCP/IP层复杂的操作抽象为几个简单的接口供应用层调用已实现进程在网络中通信。
Socket 其实也就是API。