@description@

给定一个整数 N,统计有多少个 0~2N-1 的排列 \(P_0, P_1, ..., P_{2N-1}\) 满足:
\[N^2 \le i^2 + P_i^2 \le (2N)^2 (0 \le i < 2N)\]

求合法排列数量 mod m。

Constraints
1≤N≤250, 2≤M≤10^9

Input
输入格式如下:
N M
Output
输出合法排列数量 mod m。

Sample Input 1
2 998244353
Sample Output 1
4

@solution@

根据条件 \(N^2 \le i^2 + P_i^2 \le (2N)^2\),我们可以求得 \(P_i\) 的上下界 \(lb_i \le P_i \le rb_i\)
\(0 \le i < N\) 时,\(lb_i = \sqrt{N^2 - i^2}, rb_i = \sqrt{(2N)^2 - i^2}\)
\(N \le i < 2N\) 时,\(lb_i = 0, rb_i = \sqrt{(2N)^2 - i^2}\)

注意到当 \(i \ge N\)\(lb_i\) 就始终等于 0 了。这意味着有一半元素有着相同下界。
假如 \(lb_i\) 全都为 0,是否有快捷的计算方法呢?

假如 \(lb_i\) 全都为 0,将 \(rb_i\) 从小到大排好序得到 \(rb'_i\),然后从小到大依次考虑每一个 \(rb'_i\) 的贡献。
因为较大的 \(rb'_i\) 一定包含较小的 \(rb'_j\),这意味着无论 j 选择什么,i 总是会少一个可选择的数。
\(rb'_i\) 对应可以选择 \(rb'_i + 1\) 种数(注意可以选 0),删去前面的已经被占用的就只剩\(rb'_i + 1 - i\) 种数(注意下标从 0 开始)。
那么总贡献为 \(\prod_{i=0}^{2N-1}(rb'_i + 1 - i)\)

对于有下界的情况,考虑经典容斥一波。
枚举哪些数强制 < lb,那么那些数的限制对应变成 \(P_i < lb_i\),即 \(P_i \le lb_i - 1\)。然后就又可以使用我们上面的方法进行计数。
但是这个是指数级的算法。考虑根据题目性质进行优化。

首先只有 0 ~ N-1 这些数可能会 < lb,那么我们只容斥 0 ~ N-1 的部分。
然后,如果你打个表(或者直接观察),你会发现随着 i 增大,\(lb_i\)\(rb_i\) 是递减的。
而我们计数的时候需要排序后的结果,所以这个性质的价值很大。
最后一点,对于 0 ~ N-1 这些数,有 \(\max\{lb\} <= \min\{rb\}\)

有了这些结论,我们就可以设计我们的算法了。假设我想要求 k 个 < lb 的方案数 f(k):

N ~ 2N-1 这些数只能取 rb 为上界。排完序后那些比它们上界小的,要么是 N ~ 2N-1 中由于单调性而较小的,要么是 0 ~ N-1 中取 lb-1 为上界时比较小的。

0 ~ N-1 这些数,当取 lb-1 为上界时大致同上,要么是 0 ~ N-1 中由于单调性而较小的,要么是 N ~ 2N-1 较小的。
而取 rb 为上界时,首先有 N ~ 2N-1 由于单调性所以所有都比它小,其次那 k 个取 lb-1 为上界的一定比它小(由上面的性质),最后有 0 ~ N 中那些由于单调性而比它小的。

由此,我们将 0 ~ N-1 以 lb-1 为第一关键字,rb 为第二关键字; N ~ 2N-1 以 rb 为第一关键字,0 为第二关键字,全部进行排序。
从小到大作 dp,令 dp(i, j) 表示前 i 个选出 j 个 < lb 的方案数。最后 f(k) = dp(2N, k)。

总方案为 f(0) - f(1) + ...
时间复杂度 O(n^3)。

@accepted code@

#include <cstdio>
#include <iostream>
#include <algorithm>
using namespace std;
#define mp make_pair
#define fi first
#define se second
typedef pair<int, int> pii;
const int MAXN = 500;
int N, M;
int add(int x, int y) {return (x + y) % M;}
int mul(int x, int y) {return 1LL*x*y % M;}
int sub(int x, int y) {return add(x, M-y);}
int f[MAXN + 5][MAXN + 5]; pii a[MAXN + 5];
int solve(int t) {
    int cnt1 = 0, cnt2 = 0;
    f[0][0] = 1;
    for(int i=0;i<2*N;i++) {
        if( a[i].se == 0 ) {
            for(int j=0;j<=cnt2;j++)
                f[i+1][j] = mul(f[i][j], a[i].fi - (cnt1 + j) + 1);
            cnt1++;
        }
        else {
            f[i+1][0] = 0;
            for(int j=0;j<=cnt2;j++)
                f[i+1][j+1] = mul(f[i][j], a[i].fi - (cnt1 + j) + 1);
            for(int j=0;j<=cnt2;j++)
                f[i+1][j] = add(f[i+1][j], mul(f[i][j], a[i].se - (N + cnt2 - j + t) + 1));
            cnt2++;
        }
    }
    return f[2*N][t];
}
int main() {
    scanf("%d%d", &N, &M);
    for(int i=0;i<N;i++) {
        a[i].fi = 0, a[i].se = 2*N - 1;
        while( a[i].fi*a[i].fi + i*i < N*N ) a[i].fi++; a[i].fi--;
        while( a[i].se*a[i].se + i*i > 4*N*N ) a[i].se--;
    }
    for(int i=N;i<2*N;i++) {
        a[i].fi = 2*N - 1, a[i].se = 0;
        while( a[i].fi*a[i].fi + i*i > 4*N*N ) a[i].fi--;
    }
    sort(a, a + 2*N);
    int ans = 0;
    for(int i=N;i>=0;i--)
        ans = sub(solve(i), ans);
    printf("%d\n", ans);
}

@details@

抱歉,我不会组合计数.jpg。

12-28 08:22