「ZJOI2018」树

前言

置换同构计数真是令人头大,感觉依然不是特别懂

分析与初步构想


设按照题意生成的$n$个节点有标号有根树族为$\mathcal{T}_n$,对于某种树形$T$的生成方案数为$c(T)$

则答案显然是$\cfrac{\sum _{T\in \mathcal{T}_n} c^k(T)} {(n-1)!^k}$

$k$的量级意味着我们无法完成有关$c^k(T)$的展开,因此要在最开始的计算中就将$k$这个幂次加入

为此定义$F_{i,n}=\sum _{T\in \mathcal{T}_n} c^{ik}(T)$

则我们要计算的答案就是$\cfrac{F_{1,n} } {(n-1)!^k}$

容易发现有意义的$F_{i,j}$规模为$O(\sum \sum [ij\leq n])=O(n\ln n)$

关于为什么$F_{i,n}$会有第一维,会在下面出现

ps: 我的两个维度好像和别人是反的



计算过程分析


考虑递推计算$F_{i,n}$

容易发现对于任意一个$F_{i,n}$的计算只需要令$k\rightarrow ik$

为了简化描述,我们先以计算$F_{1,…}$为例

对于同构树计数,子树的叠加是无序的背包问题,树形之间存在着置换同构

而每棵子树的编号之间可以任意归并,因此需要$\text{EGF}$的背包合并每棵子树

显然同构仅出现在同种大小的子树中,因此可以对于不同大小的子树分离

假设对于大小为$n$的子树,出现了$m$种不同的树形$T_1,T_2,\ldots T_m$,每种出现了$a_i$个

则答案应该为$\displaystyle \sum_{T_i\ne T_j} \frac{1} {(n!)^m}\prod \frac{c^{a_ik}(T_i)} {(a_i!)^k}$

其中$(a_i!)^k$除去同构树之间无排列序的方案数

普通的背包计数难以处理$T_i\ne T_j$的限制

因此考虑用$\text{Burnside}$引理解决置换同构问题



同构出现于$m$棵树之间,因此我们置换群为对于$m$的排列置换群

显然任意一个排列置换的的结果是若干个置换环,环上的树树形相同

则对于一个置换$f$,设其生成了大小分别为$b_1,b_2,\ldots, b_m$的置换环

理想情况下其不动点的式子计算如下

$\displaystyle \text{fix}(f)=\frac{(n\sum b_i)!} {(n!)^{\sum b_i} }\cdot \frac{F_{b_i,n} } {(b_i!)^k}$

(这就是为什么要给$F$添加第一维)

其中$\cfrac{(n\sum b_i)!} {(n!)^{\sum b_i} }$处理了$\sum b_i$棵树的点编号,实际上这两个权值可以在计算的最后加入,因此下面忽略掉

而实际上,在不动点中直接加入$\cfrac{1} {(b_i!)^k}$是错的

原因在于让这样的 置换环权值 带入$\text{Burnside}$引理之后

最终的 同构类权值 并不是我们想要的$\cfrac{1} {(a_i!)^k}$



考虑 待定求解 一个置换环系数的$\text{EGF}$,设其为$A(x)$

相较于上面的枚举$f$的式子,这里的计算中系数还需要考虑对于每种$b_i$,等价的置换$f$个数

这同样需要对于每棵子树的$\text{EGF}$合并,系数为$\cfrac{1} {b_i!}$

而一个环上的点存在一个环排列$(b_i-1)!$,两者合并即$\cfrac{1} {b_i}$

注意这一部分并未被加入$A(x)$中

然而这也恰好使得$\text{Burnside}$引理的系数$\frac{1} {m!}$和置换元素的$\text{EGF}$系数相抵消

不妨设添加环系数$\text{EGF}$的变换为$\hat A_i=\cfrac{A_i} {i}$

所以,则最终的计算中$\text{Burnside}$引理的答案就是$\text{exp}(\hat A(x))$



我们希望最终一个 合法的同构类 的权值为$\cfrac{1} {(a_i!)^k}$

而容易发现实际上 最终的同构类 是由我们初始枚举的置换环 的$\text{exp}$

因此$\cfrac{1} {a_i!}$应当是置换环系数经过环元素$\text{exp}$叠加的结果

设$B(x)=\cfrac{x^i} {(i!)^k},C_i=\cfrac{A_i} {F_{n,i} }$

则$B(x)=\text{exp}(\hat C(x))$,对于$B(x)$取$\ln$得到$\hat C(x)$

加入系数得到我们前面所待定的$A(x)$,即可进行最后的$\text{exp}(\hat A(x))$计算

ps:

你会发现可以直接忽略环$\text{EGF}$变换,全程只有$\hat C(x),\hat A(x)$,在过渡中这个变换的系数直接消失了

在这里提到这个系数是为了避免不必要的误解,同时也强调其他时候使用$\text{Burnside}$引理需要添加这个系数



算法实现简谈


倒序枚举$F_{i,j}$的$i$,正序枚举大小$j$,边界条件自然是$F_{i,1}=1$

确定了一个$i$后,就可以预处理$\ln$ 求出置换环系数,这里有$\frac{n} {i}$个

按照每个$i$,上面式子中的$k\rightarrow ik$

按照$j$从小到大计算$F_{i,j}$,每次得到$F_{i,j}$之后

计算关于大小为$j$的树的背包系数,这里系数的个数为$l=\frac{n} {ij}$

将先前的系数补上$F_{d,j}$,再做$\text{exp}$,最后把前面扔掉的$\cfrac{1} {(n!)^{\sum a_i} }$补上,( $(n\sum a_i)!$直接作为后面$\text{EGF}$合并的系数)

然后将它补进前面累和的背包里,就能得到这一项的值

注意前面算的式子都是计算儿子的,最后还要加上自己的大小1

当然,计算$\text{exp},\ln$需要下面的帮助


$\text{exp}$的$O(n^2)$方法

$F(x)=\text{exp}(G(x))$

$F’(x)=\text{exp}(G(x))G’(x)$

$F’(x)=F(x)G’(x)$

先计算出$G’(x)$,然后$O(n^2)$依次得到$F’(x)$的第$i$项,就能知道$F(x)$的第$i+1$项


$\ln$的$O(n^2)$方法

$F(x)=\ln G(x)$

$F’(x)G(x)=G’(x)$

边界$[x^0]G(x)=1,[x^0]F(x)=0$

暴力推$F’(x)$的每一项即可



进一步优化

上面的计算时,每次求得一个$\hat A(x)$,都做一次$\text{exp}$,然后背包合并

但是实际上,我们可以先将$\hat A(x)$放在一起,然后一起做$\text{exp}$

具体的,每次得到$F_{i,j}$之和,我们就可以确定$\sum \hat A(x)$的第$j$项

那么在维护$\sum \hat A(x)$的同时,也依次递推$\text{exp}(\sum \hat A(x))$的$j$项

这样不仅去掉的背包的过程,也少了很多次$\text{exp}$

Montegomery

最后是喜闻乐见的套板子时间

复杂度分析


未优化

相对于$\text{exp}$,求$\ln$的复杂度可以忽略

而$\text{exp}$每次大小是$\frac{n} {ij}$,即$O(\sum \sum \cfrac{n^2} {i^2j^2})=O(n^2)$

最后的复杂度反而在于背包合并$\text{EGF}$,为$O(n^2\ln n)$

优化后

同步求$\text{exp}$的复杂度为$O((\cfrac{n} {i})^2)=O(n^2)$

Code1:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
const int N=2010;

int n,k,P;
ll qpow(ll x,ll k=P-2) {
ll res=1;
for(;k;k>>=1,x=x*x%P) if(k&1) res=res*x%P;
return res;
}
int F[N][N],T[N],H[N],C[N];
int I[N],J[N],Inv[N];
void Exp(int *a,int n){
static int b[N];
rep(i,1,n) b[i-1]=1ll*a[i]*i%P;
rep(i,0,n) a[i]=0;
a[0]=1;
rep(i,0,n-1) {
int s=0;
rep(j,0,i) s=(s+1ll*a[i-j]*b[j])%P;
a[i+1]=1ll*s*Inv[i+1]%P;
}
}

void Ln(int *a,int n){
static int b[N];
rep(i,0,n) b[i]=a[i];
rep(i,0,n-1) {
int s=1ll*b[i+1]*(i+1)%P;
rep(j,0,i-1) s=(s-1ll*a[j]*b[i-j])%P;
Mod2(s),a[i]=s;
}
drep(i,n,1) a[i]=1ll*a[i-1]*Inv[i]%P;
a[0]=0;
}

int IK[N],JK[N];

int main(){
n=rd(),k=rd(),P=rd();
Inv[0]=Inv[1]=1;
rep(i,2,n) Inv[i]=1ll*(P-P/i)*Inv[P%i]%P;
rep(i,*I=*J=1,n) I[i]=1ll*I[i-1]*qpow(Inv[i],k)%P,J[i]=1ll*J[i-1]*qpow(i,k)%P;

drep(i,n,1) {
int m=n/i;
rep(j,*H=1,m) H[j]=0;
rep(j,0,m) IK[j]=qpow(I[j],i),JK[j]=qpow(J[j],i);
rep(j,*C=1,m) C[j]=IK[j];
Ln(C,m);
rep(j,1,m) {
F[i][j]=1ll*H[j-1]*JK[j-1]%P;

int u=m/j;
T[0]=0;
rep(x,1,u) T[x]=1ll*C[x]*F[i*x][j]%P;
Exp(T,u);
int t=1;
rep(x,1,u) t=1ll*t*IK[j]%P,T[x]=1ll*T[x]*t%P;
drep(x,m,1) rep(y,1,x/j) H[x]=(H[x]+1ll*H[x-y*j]*T[y])%P;
}
}
int ans=1ll*F[1][n]*I[n-1]%P;
printf("%d\n",ans);
}

Code2:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
#include<cstdio>
using namespace std;
typedef long long ll;
#define Mod1(x) ((x>=P)&&(x-=P))
#define Mod2(x) ((x<0)&&(x+=P))
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)
enum{N=2010};
int n,k,P;
ll qpow(ll x,ll k=P-2) {
ll res=1;
for(;k;k>>=1,x=x*x%P) if(k&1) res=res*x%P;
return res;
}
int H[N],F[N][N],T[N],C[N];
int I[N],J[N],Inv[N],Fac[N];
int IK[N],JK[N];
void Ln(int *a,int n){
static int b[N];
rep(i,0,n) b[i]=a[i];
rep(i,0,n-1) {
int s=1ll*b[i+1]*(i+1)%P;
rep(j,0,i-1) s=(s-1ll*a[j]*b[i-j])%P;
Mod2(s),a[i]=s;
}
drep(i,n,1) a[i]=1ll*a[i-1]*Inv[i]%P;
a[0]=0;
}


int main(){
scanf("%d%d%d",&n,&k,&P);
Inv[0]=Inv[1]=1;
rep(i,2,n) Inv[i]=1ll*(P-P/i)*Inv[P%i]%P;
rep(i,*I=*J=1,n) I[i]=1ll*I[i-1]*qpow(Inv[i],k)%P,J[i]=1ll*J[i-1]*qpow(i,k)%P;
rep(i,*Fac=1,n) Fac[i]=1ll*Fac[i-1]*i%P;

drep(i,n,1) {
int m=n/i;
rep(j,*H=1,m) H[j]=T[j]=0;
rep(j,0,m) IK[j]=qpow(I[j],i),JK[j]=qpow(J[j],i);
rep(j,*C=1,m) C[j]=IK[j];
Ln(C,m);
rep(j,1,m) {
F[i][j]=1ll*H[j-1]*JK[j-1]%P;
int u=m/j,t=1;
T[0]=0;
rep(x,1,u) t=1ll*t*IK[j]%P,T[x*j]=(T[x*j]+1ll*C[x]*F[i*x][j]%P*t%P*x*j)%P;
rep(x,1,j) H[j]=(H[j]+1ll*H[j-x]*T[x])%P;
H[j]=1ll*H[j]*Inv[j]%P;
}
}
int ans=1ll*F[1][n]*I[n-1]%P;
printf("%d\n",ans);
}

Code3:

Loj Submission

吐槽:实际上套了板子之后已经比loj上的所有人都快了

但是由于新旧评测机的问题~~~,总时间就显得慢了

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
#include<bits/stdc++.h>
using namespace std;
typedef long long ll;
#define rep(i,a,b) for(int i=a,i##end=b;i<=i##end;++i)
#define drep(i,a,b) for(int i=a,i##end=b;i>=i##end;--i)

enum{N=2010};
int n,k,P;
using u32=uint32_t;
using i32=int32_t;
using u64=uint64_t;
using i64=int64_t;

static u32 m,m2,inv,r2;
u32 getinv(){
u32 inv=m;
for(int i=0;i<4;++i) inv*=2-inv*m;
return inv;
}
struct Mont{
private :
u32 x;
public :
static u32 reduce(u64 x){
u32 y=(x+u64(u32(x)*inv)*m)>>32;
return i32(y)<0?y+m:y;
}
Mont(){ ; }
Mont(i32 x):x(reduce(u64(x)*r2)) { }
Mont& operator += (const Mont &rhs) { return x+=rhs.x-m2,i32(x)<0&&(x+=m2),*this; }
Mont& operator -= (const Mont &rhs) { return x-=rhs.x,i32(x)<0&&(x+=m2),*this; }
Mont& operator *= (const Mont &rhs) { return x=reduce(u64(x)*rhs.x),*this; }
friend Mont operator + (Mont x,const Mont &y) { return x+=y; }
friend Mont operator - (Mont x,const Mont &y) { return x-=y; }
friend Mont operator * (Mont x,const Mont &y) { return x*=y; }
i32 get(){
u32 res=reduce(x);
return res>=m?res-m:res;
}
} H[N],F[N][N],T[N],C[N],I[N],J[N],Inv[N],IK[N],JK[N];
Mont qpow(Mont x,ll k=P-2) {
Mont res(1);
for(;k;k>>=1,x*=x) if(k&1) res*=x;
return res;
}
void Init(int m) {
::m=m,m2=m*2;
inv=-getinv();
r2=-u64(m)%m;
}

void Ln(Mont *a,int n){
static Mont b[N];
rep(i,0,n) b[i]=a[i];
rep(i,0,n-1) {
Mont s=b[i+1]*(i+1);
rep(j,0,i-1) s-=a[j]*b[i-j];
a[i]=s;
}
drep(i,n,1) a[i]=a[i-1]*Inv[i];
a[0]=0;
}

int main(){
scanf("%d%d%d",&n,&k,&P),Init(P);
Inv[0]=Inv[1]=1;
rep(i,2,n) Inv[i]=(P-P/i)*Inv[P%i];
I[0]=J[0]=1;
rep(i,1,n) I[i]=I[i-1]*qpow(Inv[i],k),J[i]=J[i-1]*qpow(i,k);

drep(i,n,1) {
int m=n/i;
rep(j,1,m) T[j]=0;
rep(j,0,m) IK[j]=qpow(I[j],i),JK[j]=qpow(J[j],i);
C[0]=H[0]=1;
rep(j,1,m) C[j]=IK[j];
Ln(C,m);
rep(j,1,m) {
F[i][j]=H[j-1]*JK[j-1];
Mont t=1;
rep(x,1,m/j) t=t*IK[j],T[x*j]+=C[x]*F[i*x][j]*t*(x*j);
H[j]=0;
rep(x,1,j) H[j]+=H[j-x]*T[x];
H[j]=H[j]*Inv[j];
}
}
Mont ans=F[1][n]*I[n-1];
printf("%d\n",ans.get());
}