浮点数是指浮点数参与的运算,这种运算通常伴随着因为无法精确表示而进行的近似或舍入。
一个浮点数a由两个数m和e来表示:a = m × b^e。在任意一个这样的系统中,我们选择一个基数b(记数系统的基)和精度p(即使用多少位来存储)。m(即尾数)是形如±d.ddd...ddd的p位数(每一位是一个介于0到b-1之间的整数,包括0和b-1)。如果m的第一位是非0整数,m称作规格化的。有一些描述使用一个单独的符号位(s 代表+或者-)来表示正负,这样m必须是正的。e是指数。
在计算机中表示一个浮点数,其结构如下:
尾数部分(定点小数) 阶码部分(定点整数): 阶符±, 阶码e,数符±,尾数m。这种设计可以在某个固定长度的存储空间内表示定点数无法表示的更大范围的数。
浮点加法减法运算
设有两个浮点数x和y,它们分别为
x = Mx*2^Ex
y = My*2^Ey
其中Ex和Ey分别为数x和y的阶码,Mx和My为数x和y的尾数。
两浮点数进行加法和减法的运算规则是
设 Ex小于等于Ey,则 x±y = (Mx*2^(Ex-Ey)±My)*2^Ey,
完成浮点加减运算的操作过程大体分为四步:
1. 0 操作数的检查;
2. 比较阶码大小并完成对阶;
3. 尾数进行加或减运算;
4. 结果规格化并进行舍入处理。
⑴ 0 操作数检查
浮点加减运算过程比定点运算过程复杂。如果判知两个操作数x或y中有一个数为0,即可得知运算结果而没有必要再进行后续的一系列操作以节省运算时间。0操作数检查步骤则用来完成这一功能。
⑵ 比较阶码大小并完成对阶
两浮点数进行加减,首先要看两数的阶码是否相同,即小数点位置是否对齐。若二数阶码相同,表示小数点是对齐的,就可以进行尾数的加减运算。反之,若二数阶码不同,表示小数点位置没有对齐,此时必须使二数阶码相同,这个过程叫作对阶。要对阶,首先应求出两数阶码Ex和Ey之差,即△E = Ex-Ey。
若△E=0,表示两数阶码相等,即Ex=Ey;若△E>0,表示Ex>Ey;若△E<0,表示Ex<Ey。
当Ex≠Ey 时,要通过尾数的移动以改变Ex或Ey,使之相等。原则上,既可以通过Mx移位以改变Ex来达到Ex=Ey,也可以通过My移位以改变Ey来实现Ex=Ey。但是,由于浮点表示的数多是规格化的,尾数左移会引起最高有效位的丢失,造成很大误差。尾数右移虽引起最低有效位的丢失,但造成误差较小。因此,对阶操作规定使尾数右移,尾数右移后阶码作相应增加,其数值保持不变。显然,一个增加后的阶码与另一个阶码相等,增加的阶码的一定是小阶。因此在对阶时,总是使小阶向大阶看齐,即小阶的尾数向右移位(相当于小数点左移)每右移一位,其阶码加1,直到两数的阶码相等为止,右移的位数等于阶差△E。
⑶ 尾数求和运算
对阶结束后,即可进行尾数的求和运算。不论加法运算还是减法运算,都按加法进行操作,其方法与定点加减法运算完全一样。
⑷ 结果规格化
在浮点加减运算时,尾数求和的结果也可以得到01.ф…ф或10.ф…ф,即两符号位不等,这在定点加减法运算中称为溢出,是不允许的。但在浮点运算中,它表明尾数求和结果的绝对值大于1,向左破坏了规格化。此时将运算结果右移以实现规格化表示,称为向右规格化。规则是:尾数右移1位,阶码加1。当尾数不是1.M时需向左规格化。
⑸ 舍入处理
在对阶或向右规格化时,尾数要向右移位,这样,被右移的尾数的低位部分会被丢掉,从而造成一定误差,因此要进行舍入处理。
简单的舍入方法有两种:一种是"0舍1入"法,即如果右移时被丢掉数位的最高位为0则舍去,为1则将尾数的末位加"1"。另一种是"恒置一"法,即只要数位被移掉,就在尾数的末尾恒置"1"。
在IEEE754标准中,舍入处理提供了四种可选方法:
就近舍入其实质就是通常所说的"四舍五入"。例如,尾数超出规定的23位的多余位数字是10010,多余位的值超过规定的最低有效位值的一半,故最低有效位应增1。若多余的5位 是01111,则简单的截尾即可。对多余的5位10000这种特殊情况:若最低有效位现为0,则截 尾;若最低有效位现为1,则向上进一位使其变为 0。
朝0舍入 即朝数轴原点方向舍入,就是简单的截尾。无论尾数是正数还是负数,截尾都使取值的绝对值比原值的绝对值小。这种方法容易导致误差积累。
朝+∞舍入 对正数来说,只要多余位不全为0则向最低有效位进1;对负数来说则是简单的截尾。
朝-∞舍入 处理方法正好与 朝+∞舍入情况相反。对正数来说,只要多余位不全为0则简单截尾;对负数来说,向最低有效位进1。
⑹ 溢出处理
浮点数的溢出是以其阶码溢出表现出来的。在加\减运算过程中要检查是否产生了溢出:若阶码正常,加(减)运算正常结束;若阶码溢出,则要进行相应处理。另外对尾数的溢出也需要处理。
阶码上溢 超过了阶码可能表示的最大值的正指数值,一般将其认为是+∞和-∞。
阶码下溢 超过了阶码可能表示的最小值的负指数值,一般将其认为是0。
尾数上溢 两个同符号尾数相加产生了最高位向上的进位,将尾数右移,阶码增1来重新对齐。
尾数下溢 在将尾数右移时,尾数的最低有效位从尾数域右端流出,要进行舍入处理。
本回答被网友采纳计算机组成原理--浮点数表示方法
计算机组成原理中,浮点数的表示方法基于二进制的灵活性,通过调整小数点位置实现数值的表示。浮点数主要由四个部分组成:阶符、阶码、数符和尾数。一般来说,32位的计算机中会用7位表示阶码,1位表示阶符,剩下的23位表示尾数,1位表示数符的正负。例如,一个可能的表示方式是用两个字节(即16位)来...
计算机组成原理——浮点数表示方法
步骤如下:1把整数部分转换成二进制.2把小数部分转换成二进制.3在两部分之间加上小数点.浮点数还可以规范化,浮点数可以用单精度表示法和双精度表示法.规范化只存储这个数的三个部分的信息:符号,指教和尾数.如+1000111.0101规范化后为+ 2^6 * 1.0001110101符号 指数 尾数规范化数的单精度表示法如+...
计算机组成原理--浮点数表示方法
在计算机系统中,浮点数是一种用于表示实数的数值形式。它主要由符号位、指数部分和尾数部分组成。通过这三部分的组合,计算机可以精确地表示很大或很小的实数,并涵盖正常的数值范围。二、浮点数的详细解释 1. 符号位:浮点数的最高位通常用作符号位,表示数的正负。0表示正数,1表示负数。2. 指数部分...
计算机组成原理——浮点数表示方法
就是在二进制中,一个数的小数点可以可以通过乘以2的幂次来改变位置,这是其原理 。浮点数的组成:阶符+ 阶码 +数符+ 尾数 计算机中表示浮点数的字长通常为32位,其中7位作阶码,1位为阶符,23位尾数,1位作数符 例如用2个字节表示一个浮点数(32写起来麻烦,所以用2个字节就是16位来举例,呵...
计算机组成原理,用IEEE32位浮点格式表示如下数
为了表示浮点数,数被分为两部分:整数部分和小数部分。例如,浮点数14.234就有整数部分14和小数部分0.234.首先把浮点数转换成二进制数。解:由于符号为正就用0表示.指数是6,在Excess_127表示法中,给指数加上127得到133,用二进制表示,就是.尾数是当把位数增加到32位,得到。注意不可以漏掉左边的0...
【计算机组成原理】定点数与浮点数
因此,计算机科学借鉴了科学记数法,浮点数计算方式为K=(-1)^S*M*2^N。其中,S表示符号位,M为尾数,N为阶码。虽然浮点数可以存储大数值,但不同厂商对浮点数表示存在差异,如0.35可表示为0.35或0.0035X[公式],这导致程序移植性差。为解决此问题,IEEE制定了浮点数表示标准,即IEEE 754,该...
浮点数转二进制数
学过 《计算机组成原理》 或者类似 《计算机系统》 这些课程的小伙伴们应该都知道,浮点数在计算机中的存储方式遵循 IEEE 754 浮点数计数标准 ,可以表示为:采用 尾数 + 阶码 的编码方式,更通俗一点说,就是类似于数学课本上所学的 科学计数法 表示方式: 有效数字 + 指数位 !因此,只要给出: ...
规格化浮点数的计算机组成原理
若不对浮点数的表示作出明确规定,同一个浮点数的表示就不是唯一的。例如,十进制数可以表示成1.11×10ˇ0,0.111×10ˇ1,0.0111×10ˇ2等多种形式。为了提高数据的表示精度,当尾数得值不为0时,尾数域的最高有效位应为1,这称为浮点数的规格化表示。否则以修改阶码同时左右移小数点位置的办法...
【计算机组成原理】定点数与浮点数
为解决数值表示的不统一问题,计算机科学借鉴了浮点数的计算方法,如K=(-1)^S*M*2^N,其中S、M和N分别代表符号、尾数和阶码。起初,浮点数的表示标准各异,导致移植性差。为解决这一问题,IEEE发布了浮点数的标准,如IEEE 754,统一了32位和64位浮点数的表示规则,确保不同平台上的相同数值表示...
关于计算机组成原理中浮点数的概念问题
浮点数在计算机中的表示就好像我们现实中使用的科学计数法一样。当你的机器硬件为用定点表示小数时,那么小数位就固定了,当使用浮点小数 时,那么小数位就不固定。例如:3.5:用定点表示法,小数点定在D8位上(这个位由机器硬件决定)则32位表示的二进制数为0000 0000 0000 0000 0000 0011 .0000 0...