Meissel–Lehmer 算法
「Meissel–Lehmer 算法」是一种能在亚线性时间复杂度内求出 1 ∼𝑛
内质数个数的一种算法。
记号规定
[𝑥]
表示对 𝑥
下取整得到的结果。
𝑝𝑘
表示第 𝑘
个质数,𝑝1 =2
。
𝜋(𝑥)
表示 1 ∼𝑥
范围内素数的个数。
𝜇(𝑥)
表示莫比乌斯函数。
对于集合 𝑆
,#𝑆
表示集合 𝑆
的大小。
𝛿(𝑥)
表示 𝑥
最小的质因子。
𝑃+(𝑥)
表示 𝑥
最大的质因子。
Meissel–Lehmer 算法求 π(x)
定义 𝜙(𝑥,𝑎)
为所有小于 𝑥
的正整数中满足其所有质因子都大于 𝑝𝑎
的数的个数,即:
𝜙(𝑥,𝑎)=#{𝑛≤𝑥∣𝑛mod𝑝=0⟹𝑝>𝑝𝑎}(1)
再定义 𝑃𝑘(𝑥,𝑎)
表示为所有小于 𝑥
的正整数中满足可重质因子恰好有 𝑘
个且所有质因子都大于 𝑝𝑎
的数的个数,即:
𝑃𝑘(𝑥,𝑎)=#{𝑛≤𝑥∣𝑛=𝑞1𝑞2⋯𝑞𝑘⟹∀𝑖,𝑞𝑖>𝑝𝑎}(2)
特殊的,我们定义:𝑃0(𝑥,𝑎) =1
,如此便有:
𝜙(𝑥,𝑎)=𝑃0(𝑥,𝑎)+𝑃1(𝑥,𝑎)+⋯+𝑃𝑘(𝑥,𝑎)+⋯
这个无限和式实际上是可以表示为有限和式的,因为在 𝑝𝑘𝑎 >𝑥
时,有 𝑃𝑘(𝑥,𝑎) =0
。
设 𝑦
为满足 𝑥1/3 ≤𝑦 ≤𝑥1/2
的整数,再记 𝑎 =𝜋(𝑦)
。
在 𝑘 ≥3
时,有 𝑃1(𝑥,𝑎) =𝜋(𝑥) −𝑎
与 𝑃𝑘(𝑥,𝑎) =0
,由此我们可以推出:
𝜋(𝑥)=𝜙(𝑥,𝑎)+𝑎−1−𝑃2(𝑥,𝑎)(3)
这样,计算 𝜋(𝑥)
便可以转化为计算 𝜙(𝑥,𝑎)
与 𝑃2(𝑥,𝑎)
。
计算 P₂(x,a)
由等式 (2)
我们可以得出 𝑃2(𝑥,𝑎)
等于满足 𝑦 <𝑝 ≤𝑞
且 𝑝𝑞 ≤𝑥
的质数对 (𝑝,𝑞)
的个数。
首先我们注意到 𝑝 ∈[𝑦+1,√𝑥]
。此外,对于每个 𝑝
,我们都有 𝑞 ∈[𝑝,𝑥/𝑝]
。因此:
𝑃2(𝑥,𝑎)=∑𝑦<𝑝≤√𝑥(𝜋(𝑥𝑝)−𝜋(𝑝)+1)(4)
当 𝑝 ∈[𝑦+1,√𝑥]
时,我们有 𝑥𝑝 ∈[1,𝑥𝑦]
。因此,我们可以筛区间 [1,𝑥𝑦]
,然后对于所有的的质数 𝑝 ∈[𝑦+1,√𝑥]
计算 𝜋(𝑥𝑝) −𝜋(𝑝) +1
。为了减少上述算法的空间复杂度,我们可以考虑分块,块长为 𝐿
。若块长 𝐿 =𝑦
,则我们可以在 𝑂(𝑥𝑦loglog𝑥)
的时间复杂度,𝑂(𝑦)
的空间复杂度内计算 𝑃2(𝑥,𝑎)
。
计算 ϕ(x,a)
对于 𝑏 ≤𝑎
,考虑所有不超过 𝑥
的正整数,满足它的所有质因子都大于 𝑝𝑏−1
。这些数可以被分为两类:
- 可以被 𝑝𝑏
整除的; - 不可以被 𝑝𝑏
整除的。
属于第 1
类的数有 𝜙(𝑥𝑝𝑏,𝑏−1)
个,属于第二类的数有 𝜙(𝑥,𝑏)
个。
因此我们得出结论:
定理 5.1
: 函数 𝜙
满足下列性质
𝜙(𝑢,0)=[𝑢](5)
𝜙(𝑥,𝑏)=𝜙(𝑥,𝑏−1)−𝜙(𝑥𝑝𝑏,𝑏−1)(6)
计算 𝜙(𝑥,𝑎)
的简单方法可以从这个定理推导出来:我们重复使用等式 (7)
,知道最后得到 𝜙(𝑢,0)
。这个过程可以看作从根节点 𝜙(𝑥,𝑎)
开始创建有根二叉树,图 1
画出了这一过程。通过这种方法,我们得到如下公式:
𝜙(𝑥,𝑎)=∑1≤𝑛≤𝑥𝑃+(𝑛)≤𝑦𝜇(𝑛)[𝑥/𝑛]
𝜙(𝑥,𝑎)↙↘𝜙(𝑥,𝑎−1)−𝜙(𝑥𝑝𝑎,𝑎−1)↙↓↓↘𝜙(𝑥,𝑎−2)𝜙(𝑥𝑝𝑎−1,𝑎−2)−𝜙(𝑥𝑝𝑎,𝑎−2)𝜙(𝑥𝑝𝑎𝑝𝑎−1,𝑎−2)⋮
上图表示计算 𝜙(𝑥,𝑎)
过程的二叉树:叶子节点权值之和就是 𝜙(𝑥,𝑎)
。
但是,这样需要计算太多东西。因为 𝑦 ≥𝑥1/3
,仅仅计算为 3
个 不超过 𝑦
质数的乘积的数,如果按照这个方法计算,会有至少 𝑥log3𝑥
个项,没有办法我们对复杂度的需求。
为了限制这个二叉树的「生长」,我们要改变原来的终止条件。这是原来的终止条件。
终止条件 1
: 如果 𝑏 =0
,则不要再对节点 𝜇(𝑛)𝜙(𝑥𝑛,𝑏)
调用等式 (6)
。
我们把它改成更强的终止条件:
终止条件 2
: 如果满足下面 2
个条件中的一个,不要再对节点 𝜇(𝑛)𝜙(𝑥𝑛,𝑏)
调用等式 (6)
:
- 𝑏 =0
且 𝑛 ≤𝑦
; - 𝑛 >𝑦
。
我们根据 终止条件 2
将原二叉树上的叶子分成两种:
- 如果叶子节点 𝜇(𝑛)𝜙(𝑥𝑛,𝑏)
满足 𝑛 ≤𝑦
,则称这种叶子节点为 普通叶子; - 如果叶子节点 𝜇(𝑛)𝜙(𝑥𝑛,𝑏)
满足 𝑛 >𝑦
且 𝑛 =𝑚𝑝𝑏(𝑚≤𝑦)
,则称这种节点为 特殊叶子。
由此我们得出:
定理 5.2
: 我们有:
𝜙(𝑥,𝑎)=𝑆0+𝑆(7)
其中 𝑆0
表示 普通叶子 的贡献:
𝑆0=∑𝑛≤𝑦𝜇(𝑛)[𝑥𝑛](8)![S_0=\sum_{n\le y}{\mu\left(n\right)\left[\dfrac xn\right]}\tag{8}]()
𝑆
表示 特殊叶子 的贡献:
𝑆=∑𝑛/𝛿(𝑛)≤𝑦≤𝑛𝜇(𝑛)𝜙(𝑥𝑛,𝜋(𝛿(𝑛))−1)(9)
计算 𝑆0
显然是可以在 𝑂(𝑦loglog𝑥)
的时间复杂度内解决的,现在我们要考虑如何计算 𝑆
。
计算 S
我们有:
𝑆=−∑𝑝≤𝑦 ∑𝛿(𝑚)>𝑝𝑚≤𝑦<𝑚𝑝𝜇(𝑚)𝜙(𝑥𝑚𝑝,𝜋(𝑝)−1)(10)
我们将这个等式改写为:
𝑆=𝑆1+𝑆2+𝑆3
其中:
𝑆1=−∑𝑥1/3<𝑝≤𝑦 ∑𝛿(𝑚)>𝑝𝑚≤𝑦<𝑚𝑝𝜇(𝑚)𝜙(𝑥𝑚𝑝,𝜋(𝑝)−1)
𝑆2=−∑𝑥1/4<𝑝≤𝑥1/3 ∑𝛿(𝑚)>𝑝𝑚≤𝑦<𝑚𝑝𝜇(𝑚)𝜙(𝑥𝑚𝑝,𝜋(𝑝)−1)
𝑆3=−∑𝑝≤𝑥1/4 ∑𝛿(𝑚)>𝑝𝑚≤𝑦<𝑚𝑝𝜇(𝑚)𝜙(𝑥𝑚𝑝,𝜋(𝑝)−1)
注意到计算 𝑆1,𝑆2
的和式中涉及到的 𝑚
都是质数,证明如下:
如果不是这样,因为有 𝛿(𝑚) >𝑝 >𝑥1/4
,所以有 𝑚 >𝑝2 >√𝑥
,这与 𝑚 ≤𝑦
矛盾,所以原命题成立。
更多的,当 𝑚𝑝 >𝑥1/2 ≥𝑦
时,有 𝑦 ≤𝑚𝑝
。因此我们有:
𝑆1=∑𝑥1/3<𝑝≤𝑦 ∑𝑝<𝑞≤𝑦𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)
𝑆2=∑𝑥1/4<𝑝≤𝑥1/3 ∑𝑝<𝑞≤𝑦𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)
计算 S₁
因为:
𝑥𝑝𝑞<𝑥1/3<𝑝
所以:
𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)=1
所以计算 𝑆1
的和式中的项都是 1
。所以我们实际上要计算质数对 (𝑝,𝑞)
的个数,满足:𝑥1/3 <𝑝 <𝑞 ≤𝑦
。
因此:
𝑆1=(𝜋(𝑦)−𝜋(𝑥1/3))(𝜋(𝑦)−𝜋(𝑥1/3)−1)2
有了这个等式我们便可以在 𝑂(1)
的时间内计算 𝑆1
。
计算 S₂
我们有:
𝑆2=∑𝑥1/4<𝑝≤𝑥1/3 ∑𝑝<𝑞≤𝑦𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)
我们将 𝑆2
分成 𝑞 >𝑥𝑝2
与 𝑞 ≤𝑥𝑝2
两部分:
𝑆2=𝑈+𝑉
其中:
𝑈=∑𝑥1/4<𝑝≤𝑥1/3 ∑𝑝<𝑞<𝑦𝑞>𝑥/𝑝2𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)
𝑉=∑𝑥1/4<𝑝≤𝑥1/3 ∑𝑝<𝑞<𝑦𝑞≤𝑥/𝑝2𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)
计算 U
由 𝑞 >𝑥𝑝2
可得 𝑝2 >𝑥𝑞 ≤𝑥𝑦,𝑝 >√𝑥𝑦
,因此:
𝑈=∑√𝑥/𝑦<𝑝≤𝑥1/3 ∑𝑝<𝑞≤𝑦𝑞>𝑥/𝑝2𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)
因此:
𝑈=∑√𝑥/𝑦<𝑝≤𝑥1/3#{𝑞∣𝑥𝑝2<𝑞≤𝑦}
因此:
𝑈=∑√𝑥/𝑦<𝑝≤𝑥1/3(𝜋(𝑦)−𝜋(𝑥𝑝2))
因为有 𝑥𝑝2 <𝑦
,所以我们可以预处理出所有的 𝜋(𝑡)(𝑡≤𝑦)
,这样我们就可以在 𝑂(𝑦)
的时间复杂度内计算出 𝑈
。
计算 V
对于计算 𝑉
的和式中的每一项,我们都有 𝑝 ≤𝑥𝑝𝑞 <𝑥1/2 <𝑝2
。因此:
𝜙(𝑥𝑝𝑞,𝜋(𝑝)−1)=1+𝜋(𝑥𝑝𝑞)−(𝜋(𝑝)−1)=2−𝜋(𝑝)+𝜋(𝑥𝑝𝑞)
所以 𝑉
可以被表示为:
𝑉=𝑉1+𝑉2
其中:
𝑉1=∑𝑥1/4<𝑝≤𝑥1/3 ∑𝑝<𝑞≤min(𝑥/𝑝2,𝑦)(2−𝜋(𝑝))
𝑉2=∑𝑥1/4<𝑝≤𝑥1/3 ∑𝑝<𝑞≤min(𝑥/𝑝2,𝑦)𝜋(𝑥𝑝𝑞)
预处理出 𝜋(𝑡)(𝑡≤𝑦)
我们就可以在 𝑂(𝑥1/3)
的时间复杂度内计算出 𝑉1
。
考虑我们如何加速计算 𝑉2
的过程。我们可以把 𝑞
的贡献拆分成若干个 𝜋(𝑥𝑝𝑞)
为定值的区间上,这样就只需要计算出每一个区间的长度和从一个区间到下一个区间的 𝜋(𝑥𝑝𝑞)
的改变量。
更准确的说,我们首先将 𝑉2
分成两个部分,将 𝑞 ≤min(𝑥𝑝2,𝑦)
这个复杂的条件简化:
𝑉2=∑𝑥1/4<𝑝≤√𝑥/𝑦 ∑𝑝<𝑞≤𝑦𝜋(𝑥𝑝𝑞)+∑√𝑥/𝑦<𝑝≤𝑥1/3 ∑𝑝<𝑞≤𝑥/𝑝2𝜋(𝑥𝑝𝑞)
接着我们把这个式子改写为:
𝑉2=𝑊1+𝑊2+𝑊3+𝑊4+𝑊5
其中:
𝑊1=∑𝑥1/4<𝑝≤𝑥/𝑦2 ∑𝑝<𝑞≤𝑦𝜋(𝑥𝑝𝑞)
𝑊2=∑𝑥/𝑦2<𝑝≤√𝑥/𝑦 ∑𝑝<𝑞≤√𝑥/𝑝𝜋(𝑥𝑝𝑞)
𝑊3=∑𝑥/𝑦2<𝑝≤√𝑥/𝑦 ∑√𝑥/𝑝<𝑞≤𝑦𝜋(𝑥𝑝𝑞)
𝑊4=∑√𝑥/𝑦<𝑝≤𝑥1/3 ∑𝑝<𝑞≤√𝑥/𝑝𝜋(𝑥𝑝𝑞)
𝑊5=∑√𝑥/𝑦<𝑝≤𝑥1/3 ∑√𝑥/𝑝<𝑞≤𝑥/𝑝2𝜋(𝑥𝑝𝑞)
计算 W₁ 与 W₂
计算这两个值需要计算满足 𝑦 <𝑥𝑝𝑞 <𝑥1/2
的 𝜋(𝑥𝑝𝑞)
的值。可以在区间 [1,√𝑥]
分块筛出。在每个块中我们对于所有满足条件的 (𝑝,𝑞)
都累加 𝜋(𝑥𝑝𝑞)
。
计算 W₃
对于每个 𝑝
,我们把 𝑞
分成若干个区间,每个区间都满足它们的 𝜋(𝑥𝑝𝑞)
是定值,每个区间我们都可以 𝑂(1)
计算它的贡献。当我们获得一个新的 𝑞
时,我们用 𝜋(𝑡)
(𝑡 ≤𝑦
)的值表计算 𝜋(𝑥𝑝𝑞)
。𝑦
以内的质数表可以给出使得 𝜋(𝑡) <𝜋(𝑡 +1) =𝜋(𝑥𝑝𝑞)
成立的 𝑡
。以此类推使得 𝜋(𝑥𝑝𝑞)
变化的下一个 𝑞
的值。
计算 W₄
相比于 𝑊3
,𝑊4
中 𝑞
更小,所以 𝜋(𝑥𝑝𝑞)
改变得更快。这时候再按照计算 𝑊3
的方法计算 𝑊4
就显得没有任何优势。于是我们直接暴力枚举数对 (𝑝,𝑞)
来计算 𝑊4
。
计算 W₅
我们像计算 𝑊3
那样来计算 𝑊5
。
计算 S₃
我们使用所有小于 𝑥1/4
的素数一次筛出区间 [1,𝑥𝑦]
。当我们的筛法进行到 𝑝𝑘
的时候,我们算出了所有 𝑚
满足没有平方因子并且 𝛿(𝑚) >𝑝𝑘
的 −𝜇(𝑚)𝜙(𝑥𝑚𝑝𝑘,𝑘−1)
值。这个筛法是分块进行的,我们在筛选间隔中维护一个二叉树,以实时维护所有素数筛选到给定素数后的中间结果。这样我们就可以只用 𝑂(log𝑥)
的时间复杂度求出在筛法进行到某一个值的时候没有被筛到的数的数量。
算法的时空复杂度
时空复杂度被如下 3
个过程影响:
- 计算 𝑃2(𝑥,𝑎)
; - 计算 𝑊1,𝑊2,𝑊3,𝑊4,𝑊5
; - 计算 𝑆3
。
计算 P₂(x,y) 的复杂度
我们已经知道了这个过程的时间复杂度为 𝑂(𝑥𝑦loglog𝑥)
,空间复杂度为 𝑂(𝑦)
。
计算 W₁,W₂,W₃,W₄,W₅ 的复杂度
计算 𝑊1,𝑊2
所进行的块长度为 𝑦
的筛的时间按复杂度为 𝑂(√𝑥loglog𝑥)
,空间复杂度为 𝑂(𝑦)
。
计算 𝑊1
所需的时间复杂度为:
𝜋(𝑥𝑦2)𝜋(𝑦)=𝑂(𝑥𝑦log2𝑥)
计算 𝑊2
的时间复杂度为:
𝑂⎛⎜ ⎜ ⎜⎝∑𝑥/𝑦2<𝑝≤√𝑥/𝑦𝜋(√𝑥𝑝)⎞⎟ ⎟ ⎟⎠=𝑂(𝑥3/4𝑦1/4log2𝑥)
因此,计算 𝑊3
的时间复杂度为:
𝑂⎛⎜ ⎜ ⎜⎝∑𝑥/𝑦2<𝑝≤√𝑥/𝑦𝜋(√𝑥𝑝)⎞⎟ ⎟ ⎟⎠=𝑂(𝑥3/4𝑦1/4log2𝑥)
计算 𝑊4
的时间复杂度为:
𝑂⎛⎜ ⎜ ⎜⎝∑√𝑥/𝑦<𝑝≤𝑥1/3𝜋(√𝑥𝑝)⎞⎟ ⎟ ⎟⎠=𝑂(𝑥2/3log2𝑥)
计算 𝑊5
的时间复杂度为:
𝑂⎛⎜ ⎜ ⎜⎝∑√𝑥/𝑦<𝑝≤𝑥1/3𝜋(√𝑥𝑝)⎞⎟ ⎟ ⎟⎠=𝑂(𝑥2/3log2𝑥)
计算 S₃ 的复杂度
对于预处理:由于要快速查询 𝜙(𝑢,𝑏)
的值,我们没办法用普通的筛法 𝑂(1)
求出,而是要维护一个数据结构使得每次查询的时间复杂度是 𝑂(log𝑥)
,因此时间复杂度为 𝑂(𝑥𝑦log𝑥loglog𝑥)
。
对于求和:对于计算 𝑆3
和式中的每一项,我们查询上述数据结构,一共 𝑂(log𝑥)
次查询。我们还需要计算和式的项数,即二叉树中叶子的个数。所有叶子的形式均为 ±𝜙(𝑥𝑚𝑝𝑏,𝑏−1)
,其中 𝑚 ≤𝑦,𝑏 <𝜋(𝑥1/4)
。因此,叶子的数目是 𝑂(𝑦𝜋(𝑥1/4))
级别的。所以计算 𝑆3
的总时间复杂度为:
𝑂(𝑥𝑦log𝑥loglog𝑥+𝑦𝑥1/4)
总复杂度
这个算法的空间复杂度为 𝑂(𝑦)
,时间复杂度为:
𝑂(𝑥𝑦loglog𝑥+𝑥𝑦log𝑥loglog𝑥+𝑥1/4𝑦+𝑥2/3log2𝑥)
我们取 𝑦 =𝑥1/3log3𝑥loglog𝑥
,就有最优时间复杂度为 𝑂(𝑥2/3log2𝑥)
,空间复杂度为 𝑂(𝑥1/3log3𝑥loglog𝑥)
。
一些改进
我们在这里给出改进方法,以减少算法的常数,提高它的实际效率。
参考资料与拓展阅读
本文翻译自:Computing 𝜋(𝑥)
: the Meissel, Lehmer, Lagarias, Miller, Odlyzko method
本页面最近更新:2024/4/27 21:57:06,更新历史
发现错误?想一起完善? 在 GitHub 上编辑此页!
本页面贡献者:Tiphereth-A, Early0v0, Enter-tainer, Peanut-Tang, 1196131597, Alpacabla, alphagocc, CCXXXI, GHLinZhengyu, Great-designer, ljy2009, megakite, Menci, r-value, StudyingFather, Vxlimo, Xeonacid
本页面的全部内容在 CC BY-SA 4.0 和 SATA 协议之条款下提供,附加条款亦可能应用