PostgreSQL 的文本搜索功能的当前限制是
每个词素的长度必须小于 2 千字节
tsvector
(词素 + 位置)的长度必须小于 1 兆字节
词素的数量必须小于 264
tsvector
中的位置值必须大于 0 且不超过 16,383
在 <
(FOLLOWED BY)N
>tsquery
运算符中的匹配距离不能超过 16,384
每个词素不超过 256 个位置
tsquery
中的节点(词素 + 运算符)数量必须小于 32,768
作为比较,PostgreSQL 8.1 文档包含 10,441 个唯一单词,总共 335,420 个单词,最频繁的单词 “postgresql” 在 655 个文档中被提及 6,127 次。
另一个示例——PostgreSQL 邮件列表存档包含 910,989 个唯一单词,在 461,020 条消息中包含 57,491,343 个词素。