数字类型包括两字节、四字节和八字节整数,四字节和八字节浮点数,以及可选精度的十进制数。 表 8.2 列出了可用的类型。
表 8.2. 数字类型
名称 | 存储大小 | 说明 | 范围 |
---|---|---|---|
smallint |
2 字节 | 小范围整数 | -32768 至 +32767 |
integer |
4 字节 | 整数的典型选择 | -2147483648 至 +2147483647 |
bigint |
8 字节 | 大范围整数 | -9223372036854775808 至 +9223372036854775807 |
decimal |
可变 | 用户指定的精度,精确 | 小数点前最多 131072 位数字;小数点后最多 16383 位数字 |
numeric |
可变 | 用户指定的精度,精确 | 小数点前最多 131072 位数字;小数点后最多 16383 位数字 |
实数 |
4 字节 | 可变精度,不精确 | 6 位小数精度 |
double precision |
8 字节 | 可变精度,不精确 | 15 位小数精度 |
smallserial |
2 字节 | 小自增整数 | 1 至 32767 |
serial |
4 字节 | 自增整数 | 1 至 2147483647 |
bigserial |
8 字节 | 大自增整数 | 1 至 9223372036854775807 |
数值类型的常量语法在 第 4.1.2 节 中进行了描述。数值类型具有全套对应的算术运算符和函数。有关更多信息,请参阅 第 9 章。以下各节详细描述了这些类型。
类型 smallint
、integer
和 bigint
存储整数,即没有分数部分的数字,范围各不相同。尝试存储超出允许范围的值将导致错误。
类型 integer
是常见选择,因为它在范围、存储大小和性能之间提供了最佳平衡。smallint
类型通常仅在磁盘空间非常宝贵时使用。bigint
类型设计为在 integer
类型的范围不足时使用。
SQL 仅指定整数类型 integer
(或 int
)、smallint
和 bigint
。类型名称 int2
、int4
和 int8
是扩展,也由其他一些 SQL 数据库系统使用。
类型 numeric
可以存储具有非常多位数字的数字。特别建议用于存储货币金额和其他需要精确性的数量。使用 numeric
值进行的计算在可能的情况下产生精确的结果,例如加法、减法、乘法。但是,与整数类型或下一节中描述的浮点类型相比,对 numeric
值进行的计算非常慢。
我们在下面使用以下术语:numeric
的精度是整数中有效数字的总数,即小数点两侧的数字数。 numeric
的刻度是小数部分中十进制数字的计数,即小数点右侧的计数。因此,数字 23.5141 的精度为 6,刻度为 4。整数可以被认为具有零刻度。
numeric
列的最大精度和最大刻度都可以配置。要声明类型为 numeric
的列,请使用语法
NUMERIC(precision
,scale
)
精度必须为正数,而刻度可以为正数或负数(见下文)。或者
NUMERIC(precision
)
选择刻度 0。指定
NUMERIC
如果没有指定任何精度或刻度,则会创建一个 “无约束 numeric” 列,其中可以存储任何长度的数字值,直至实现限制。这种类型的列不会将输入值强制转换为任何特定刻度,而具有声明刻度的 numeric
列会将输入值强制转换为该刻度。(SQL 标准要求默认刻度为 0,即强制转换为整数精度。我们发现这有点没用。如果您担心可移植性,请始终明确指定精度和刻度。)
在 numeric
类型声明中可以明确指定的最大精度为 1000。无约束 numeric
列受 表 8.2 中描述的限制。
如果要存储的值的标度大于列的声明标度,系统会将该值舍入到指定的小数位数。然后,如果小数点左侧的位数超过声明精度减去声明标度,则会引发错误。例如,声明为
NUMERIC(3, 1)
的列会将值舍入到 1 位小数,并且可以存储 -99.9 到 99.9(包括 -99.9 和 99.9)之间的值。
从 PostgreSQL 15 开始,允许声明标度为负数的 numeric
列。然后,值会舍入到小数点左侧。精度仍然表示未舍入的数字的最大数量。因此,声明为
NUMERIC(2, -3)
的列会将值舍入到最接近的千位,并且可以存储 -99000 到 99000(包括 -99000 和 99000)之间的值。还允许声明大于声明精度的标度。此类列只能保存小数值,并且要求小数点右侧的零位数至少为声明标度减去声明精度。例如,声明为
NUMERIC(3, 5)
的列会将值舍入到 5 位小数,并且可以存储 -0.00999 到 0.00999(包括 -0.00999 和 0.00999)之间的值。
PostgreSQL 允许 numeric
类型声明中的标度为 -1000 到 1000 范围内的任何值。但是,SQL 标准要求标度在 0 到 precision
范围内。使用该范围之外的标度可能无法移植到其他数据库系统。
数值以物理方式存储,没有任何额外的前导或尾随零。因此,列的声明精度和标度是最大值,而不是固定分配。(从这个意义上说,numeric
类型更类似于 varchar(
而不是 n
)char(
。)实际存储要求是每组四个十进制数字两个字节,加上三到八个字节的开销。n
)
除了普通数值外,numeric
类型还有几个特殊值
无穷大
- 无穷大
NaN
这些值改编自 IEEE 754 标准,分别表示““无穷大””、““负无穷大””和““非数字””。在 SQL 命令中将这些值写为常量时,必须用引号将它们引起来,例如 UPDATE table SET x = '-Infinity'
。在输入时,这些字符串以不区分大小写的方式识别。无穷大值也可以拼写为 inf
和 -inf
。
无穷大值的行为符合数学预期。例如,Infinity
加上任何有限值等于 Infinity
,Infinity
加上 Infinity
也等于 Infinity
;但 Infinity
减去 Infinity
等于 NaN
(非数字),因为它没有明确的解释。请注意,无穷大只能存储在不受约束的 numeric
列中,因为它在概念上超过了任何有限精度限制。
NaN
(非数字)值用于表示未定义的计算结果。通常,任何带有 NaN
输入的操作都会产生另一个 NaN
。唯一的例外是当操作的其他输入使得如果用任何有限或无限数字值替换 NaN
,将获得相同的输出;然后,该输出值也用于 NaN
。(此原理的一个示例是 NaN
提升到零次幂会产生一。)
在大多数“非数字”概念的实现中,NaN
不被视为等于任何其他数字值(包括 NaN
)。为了允许对 numeric
值进行排序并在基于树的索引中使用它们,PostgreSQL 将 NaN
值视为相等,并且大于所有非 NaN
值。
类型 decimal
和 numeric
是等效的。这两种类型都是 SQL 标准的一部分。
在舍入值时,numeric
类型将舍入值舍入到远离零,而(在大多数计算机上)real
和 double precision
类型将舍入值舍入到最接近的偶数。例如
SELECT x, round(x::numeric) AS num_round, round(x::double precision) AS dbl_round FROM generate_series(-3.5, 3.5, 1) as x; x | num_round | dbl_round ------+-----------+----------- -3.5 | -4 | -4 -2.5 | -3 | -2 -1.5 | -2 | -2 -0.5 | -1 | -0 0.5 | 1 | 0 1.5 | 2 | 2 2.5 | 3 | 2 3.5 | 4 | 4 (8 rows)
数据类型 real
和 double precision
是不精确的、可变精度的数字类型。在当前支持的所有平台上,这些类型都是 IEEE 标准 754 二进制浮点算术(分别为单精度和双精度)的实现,前提是底层处理器、操作系统和编译器支持它。
不精确意味着某些值无法精确转换为内部格式,并且存储为近似值,因此存储和检索值可能会出现细微差异。管理这些错误以及它们如何在计算中传播是整个数学和计算机科学分支的主题,这里将不讨论,除了以下几点
如果您需要精确的存储和计算(例如货币金额),请改用 numeric
类型。
如果您想对这些类型进行复杂的计算,尤其是当您依赖边界情况(无穷大、下溢)中的特定行为时,您应该仔细评估实现。
比较两个浮点值是否相等可能无法始终按预期工作。
在所有当前受支持的平台上,real
类型的范围约为 1E-37 至 1E+37,精度至少为 6 位小数。 double precision
类型的范围约为 1E-307 至 1E+308,精度至少为 15 位。太大或太小的值将导致错误。如果输入数字的精度太高,可能会进行舍入。太接近于零且无法表示为与零不同的数字将导致下溢错误。
默认情况下,浮点值以其最短精确十进制表示形式以文本形式输出;产生的十进制值更接近于真实的存储二进制值,而不是以相同二进制精度表示的任何其他值。(但是,输出值当前从不 完全 介于两个可表示值之间,以避免输入例程不正确地遵守舍入到最接近偶数规则的广泛错误。)对于 float8
值,此值最多使用 17 位有效小数位,对于 float4
值,最多使用 9 位有效小数位。
这种最短精确输出格式比历史舍入格式生成得快得多。
为了与 PostgreSQL 旧版本生成的输出兼容,并允许降低输出精度,可以使用 extra_float_digits 参数来选择舍入的十进制输出。设置值为 0 会恢复将值舍入为 6(对于 float4
)或 15(对于 float8
)个有效小数位的先前默认值。设置负值会进一步减少数字数量;例如,-2 将分别将输出舍入为 4 或 13 位。
任何大于 0 的 extra_float_digits 值都会选择最短精确格式。
历史上,想要精确值的应用程序必须将 extra_float_digits 设置为 3 才能获得它们。为了在版本之间实现最大的兼容性,他们应该继续这样做。
除了普通数字值之外,浮点类型还有几个特殊值
无穷大
- 无穷大
NaN
这些分别表示 IEEE 754 特殊值 “无穷大”、“负无穷大” 和 “非数字”。在 SQL 命令中将这些值写为常量时,必须用引号将它们引起来,例如 UPDATE table SET x = '-Infinity'
。在输入时,这些字符串以不区分大小写的方式被识别。无穷大值还可以拼写为 inf
和 -inf
。
IEEE 754 规定 NaN
不应与任何其他浮点值(包括 NaN
)相等。为了允许对浮点值进行排序并在基于树的索引中使用它们,PostgreSQL 将 NaN
值视为相等,并且大于所有非 NaN
值。
PostgreSQL 还支持 SQL 标准符号 float
和 float(
来指定不精确的数字类型。在此,p
)p
指定以 二进制 数字表示的最小可接受精度。PostgreSQL 接受 float(1)
到 float(24)
来选择 real
类型,而 float(25)
到 float(53)
选择 double precision
。超出允许范围的 p
值会引发错误。float
未指定精度时,表示 double precision
。
本节介绍一种 PostgreSQL 特有的创建自动增量列的方法。另一种方法是使用 SQL 标准标识列功能,详见 CREATE TABLE。
数据类型 smallserial
、serial
和 bigserial
不是真正的类型,而只是创建唯一标识符列的一种符号便利(类似于某些其他数据库支持的 AUTO_INCREMENT
属性)。在当前实现中,指定
CREATE TABLEtablename
(colname
SERIAL );
等效于指定
CREATE SEQUENCEtablename
_colname
_seq AS integer; CREATE TABLEtablename
(colname
integer NOT NULL DEFAULT nextval('tablename
_colname
_seq') ); ALTER SEQUENCEtablename
_colname
_seq OWNED BYtablename
.colname
;
因此,我们创建了一个整数列,并安排从序列生成器分配其默认值。应用 NOT NULL
约束以确保无法插入空值。(在大多数情况下,您还需要附加 UNIQUE
或 PRIMARY KEY
约束,以防止意外插入重复值,但这并不是自动的。)最后,该序列被标记为 “由” 该列“拥有”,以便在删除该列或表时将其删除。
由于 smallserial
、serial
和 bigserial
是使用序列实现的,因此即使从未删除任何行,列中出现的数值序列中也可能存在“空洞”或间隙。即使包含该值的行的从未成功插入到表列中,从序列分配的值仍然会被“用完”。例如,如果插入事务回滚,可能会发生这种情况。有关详细信息,请参见 第 9.17 节 中的 nextval()
。
要将序列的下一个值插入到 serial
列中,请指定 serial
列应分配其默认值。这可以通过从 INSERT
语句中的列列表中排除该列,或通过使用 DEFAULT
关键字来完成。
类型名称 serial
和 serial4
是等效的:两者都创建 integer
列。类型名称 bigserial
和 serial8
的工作方式相同,只是它们创建 bigint
列。如果预计在表的生命周期内使用超过 231 个标识符,则应使用 bigserial
。类型名称 smallserial
和 serial2
的工作方式也相同,只是它们创建 smallint
列。
为 serial
列创建的序列在拥有该列被删除时会自动删除。您可以在不删除列的情况下删除序列,但这会强制删除列默认表达式。