P9655 [GROI-R2] Beside You

wgyhm

2023-11-08

dp, 典, 长链剖分

Description

题目很长，超级差评。

给定一颗括号树（即每个点都有一个括号）。

要求找到一个树上的最大子结构，使得这个子结构连通，且从这个结构的根（即选择的子结构在原树高度最低的节点）出发到达每一个叶子结点（除根之外所有度数不超过 $1$ 的节点）的链构成的括号序列合法。

$n\le 5\times 10^5$

Solution

这道题目 $O(n)$ 的长剖真是很妙啊。在算法实现上也是。

经典套路把一个左括号变成 $1$，右括号变成 $-1$，那么一个序列是合法的充要条件就是总和为 $0$，所有前缀和的值都 $\ge 0$。

但是这样在本题不太好啊，如果考虑 dp 的话就要想从子树合并过来。所以在这题中，可以把右括号变成 $1$，左括号变成 $-1$，每次转移的时候强制保证后缀和保证 $\ge 0$。这样就很自然的设出 $f_{x,i}$ 表示在 $x$ 的子树中，后缀和为 $i$ 的最大的能选的数。

我们需要维护 $f_{x,i+a_x}\gets \sum f_{y,i}$，还要将 $f_{x,i}$ 中有值的数 $+1$，也就是把 $x$ 不作为叶子节点选进去。

这样直接做是 $O(n^2)$ 的。

我们观察到第二维的范围最大为深度，且每次最多左右移动一位。这就与长剖优化 dp 的经典场景，第二维下标为深度很像啊！

想到这里，合并是平凡的，但还有一个关键在于，将 $f_{x,i}>0$ 的地方 $+1$。考虑打上标记 $t_{x,i}$ 表示 $f_{x,j\ge i}$ 的部分 $+t_{x,i}$。我们可以以类似于懒惰标记的形式，要用到了就把标记暴力打到 $f$ 上去，$t$ 往后推，否则接着合并上去。

#include<bits/stdc++.h>
#define ll long long
#define ull unsigned long long
#define maxn 2000005
#define put() putchar('\n')
#define Tp template<typename T>
#define Ts template<typename T,typename... Ar>
using namespace std;
Tp void read(T &x){
    int f=1;x=0;char c=getchar();
    while (c<'0'||c>'9') {if (c=='-') f=-1;c=getchar();}
    while (c>='0'&&c<='9') {x=x*10+c-'0';c=getchar();}
    x*=f;
}
namespace Debug{
	Tp void _debug(char* f,T t){cerr<<f<<'='<<t<<endl;}
	Ts void _debug(char* f,T x,Ar... y){while(*f!=',') cerr<<*f++;cerr<<'='<<x<<",";_debug(f+1,y...);}
	#define gdb(...) _debug((char*)#__VA_ARGS__,__VA_ARGS__)
}using namespace Debug;
#define fi first
#define se second
#define mk make_pair
const int mod=1e9+7;
int power(int x,int y=mod-2) {
	int sum=1;
	while (y) {
		if (y&1) sum=sum*x%mod;
		x=x*x%mod;y>>=1;
	}
	return sum;
}
int a[maxn];
int buff[maxn*2],*f[maxn],*fp=buff;
int bt[maxn*2],*t[maxn],*tp=bt;
int deep[maxn],son[maxn],top[maxn];
vector<int>to[maxn];
void dfs1(int x,int pre) {
	deep[x]=1;
	for (auto y:to[x]) if (y^pre) {
		dfs1(y,x);
		deep[x]=max(deep[x],deep[y]+1);
		if (deep[x]==deep[y]+1) son[x]=y;
	}
}
int ans,n;
void update(int x,int p) {
	p=min(deep[x],p);
	int s=0,i;
	for (i=top[x];i<=p;i++) {
		s+=t[x][i];
		if (f[x][i]) f[x][i]+=s;
		t[x][i]=0;
	}
	if (p+1<=deep[x]) t[x][p+1]+=s;
	top[x]=p+1; 
}
void dfs2(int x,int pre) {
	int i;
	if (son[x]) {
		int y=son[x],i;
		f[y]=f[x]+a[x];
		t[y]=t[x]+a[x];
		dfs2(y,x);
		if (a[x]==-1) {//不能转移 -1。
			update(son[x],1);
			f[y][0]=0;
		}
	}
	for (auto y:to[x]) if (y!=son[x]&&y!=pre) {
		f[y]=fp+deep[y]+2,fp+=deep[y]*2+4;
		t[y]=tp+deep[y]+2,tp+=deep[y]*2+4;
		dfs2(y,x);
		update(y,deep[y]);
		update(x,deep[y]+1);
		if (a[x]==1) {
			for (i=0;i<=deep[y];i++) f[x][i+1]+=f[y][i];
		} 
		else {
			for (i=1;i<=deep[y];i++) f[x][i-1]+=f[y][i];
		} 
	}
	if (a[x]==1&&!f[x][1]) {
		update(x,1);
		f[x][1]=1;
		if (f[x][0]) f[x][0]++;
		if (deep[x]>=2) t[x][2]++,top[x]=0;
	}
	else t[x][0]++,top[x]=0;
	if (f[x][0]) ans=max(ans,f[x][0]+t[x][0]);
}
signed main(void){
	int i,x,y;char ch;
	read(n);
	for (cin>>ch,i=1;i<=n;i++) {
		if (ch==')') a[i]=1;
		else a[i]=-1;
		ch=getchar();
	}
	for (i=1;i<n;i++) {
		read(x),read(y);
		to[x].push_back(y);
		to[y].push_back(x);
	}
	dfs1(1,0);
	f[1]=fp+deep[1]+2,fp+=deep[1]*2+4;
	t[1]=tp+deep[1]+2,tp+=deep[1]*2+4;
	dfs2(1,0);
	printf("%d\n",ans);
	return 0;
}

现在来分析推标记的复杂度。可以类似于长剖合并的复杂度那样。观察到每个点在非合并的阶段推标记的次数都是 $O(1)$ 的。而在合并的时候，链上的每个点又最多会遍历一次。每条链只有在最顶端的时候会被合并一次。所以是 $O(n)$ 的。就是常数有点小大。