710-黑名单中的随机数(Random Pick with Blacklist)
发表于:2021-12-03 | 分类: 困难
You are given an integer n and an array of unique integers blacklist. Design an algorithm to pick a random integer in the range [0, n - 1] that is not in blacklist. Any integer that is in the mentioned range and not in blacklist should be equally likely to be returned.

Optimize your algorithm such that it minimizes the number of calls to the built-in random function of your language.

Implement the Solution class:

  • Solution(int n, int[] blacklist) Initializes the object with the integer n and the blacklisted integers blacklist.
  • int pick() Returns a random integer in the range [0, n - 1] and not in blacklist.


Example 1:

["Solution", "pick", "pick", "pick", "pick", "pick", "pick", "pick"]
[[7, [2, 3, 5]], [], [], [], [], [], [], []]
[null, 0, 4, 1, 6, 1, 0, 4]

Solution solution = new Solution(7, [2, 3, 5]);
solution.pick(); // return 0, any integer from [0,1,4,6] should be ok. Note that for every call of pick,
                 // 0, 1, 4, and 6 must be equally likely to be returned (i.e., with probability 1/4).
solution.pick(); // return 4
solution.pick(); // return 1
solution.pick(); // return 6
solution.pick(); // return 1
solution.pick(); // return 0
solution.pick(); // return 4



  • 1 <= n <= 109
  • 0 <= blacklist.length <- min(105, n - 1)
  • 0 <= blacklist[i] < n
  • All the values of blacklist are unique.
  • At most 2 * 104 calls will be made to pick.


给定一个包含 [0,n) 中不重复整数的黑名单 blacklist ,写一个函数从 [0, n) 中返回一个不在 blacklist 中的随机整数。

对它进行优化使其尽量少调用系统方法 Math.random()


  1. 1 <= n <= 1000000000
  2. 0 <= blacklist.length < min(100000, N)
  3. [0, n) 不包含 n ,详细参见 interval notation 。

示例 1:


示例 2:


示例 3:


示例 4:



输入是两个列表:调用成员函数名和调用的参数。Solution的构造函数有两个参数,n 和黑名单 blacklistpick 没有参数,输入参数是一个列表,即使参数为空,也会输入一个 [] 空列表。



方法一:维护白名单 [超出时间限制,超出空间限制]


我们首先在集合中放入 [0, N) 中的所有整数,随后移除所有在黑名单中出现过的数,并把剩下的数放入列表中,就得到了白名单。

class Solution { public: vector<int> w; Solution(int n, vector<int> blacklist) { unordered_set<int> W; for (int i = 0; i < n; i++) W.insert(i); for (int x : blacklist) W.erase(x); for (auto it = W.begin(); it != W.end(); it++) w.push_back(*it); } int pick() { return w[rand() % w.size()]; } };
class Solution { List<Integer> w; Random r; public Solution(int n, int[] b) { w = new ArrayList<>(); r = new Random(); Set<Integer> W = new HashSet<>(); for (int i = 0; i < n; i++) W.add(i); for (int x : b) W.remove(x); for (int x : W) w.add(x); } public int pick() { return w.get(r.nextInt(w.size())); } }

然而题目中的 N 的最大值为 1000000000,将所有的数放入集合中会超出时间限制,并且存储这个白名单会超出空间限制。


  • 时间复杂度:$O(N)$。预处理的时间复杂度为 $O(N)$,超出了时间限制。随机选择的时间复杂度为 $O(1)$。

  • 空间复杂度:$O(N)$,超出了空间限制。

方法二:二分查找 [通过]


通过 N 和黑名单列表,我们可以知道白名单中的数的数量 M。我们可以在 0M - 1 之间产生随机数 k,通过在黑名单上二分查找的方法,得到白名单中第 k 个数。



我们设黑名单为 B,白名单为 W,给定 k,需要得到白名单中的第 k 个数 W[k]

首先我们将黑名单中的数进行排序,并在黑名单上二分查找。初始的值为 lo = 0hi = len(B) - 1,在二分查找的每一轮中:

  • mid = (lo + hi + 1) / 2

  • c = B[mid] - mid,表示比 B[mid] 小的在白名单中的数的个数;

  • 如果 c > k,说明 B[mid] 大于 W[k],因此设置 hi = mid - 1

  • 如果 c <= k,说明 B[mid] 小于 W[k],因此设置 lo = mid

在二分查找结束后,会有两种情况。第一种是 B 中最小的数都大于 k,那么此时 W[k] 就等于 k。第二种是 W[k] 大于 B[lo],那么此时 W[k] 等于 k + lo + 1

class Solution { int n; vector<int> b; public: Solution(int N, vector<int> blacklist) { n = N; sort(blacklist.begin(), blacklist.end()); b = blacklist; } int pick() { int k = rand() % (n - b.size()); int lo = 0; int hi = b.size() - 1; while (lo < hi) { int i = (lo + hi + 1) / 2; if (b[i] - i > k) hi = i - 1; else lo = i; } return lo == hi && b[lo] - lo <= k ? k + lo + 1 : k; } };
class Solution { int n; vector<int> b; public: Solution(int N, vector<int> blacklist) { n = N; sort(blacklist.begin(), blacklist.end()); b = blacklist; } int pick() { int k = rand() % (n - b.size()); int lo = 0; int hi = b.size() - 1; while (lo < hi) { int i = (lo + hi + 1) / 2; if (b[i] - i > k) hi = i - 1; else lo = i; } return lo == hi && b[lo] - lo <= k ? k + lo + 1 : k; } };


  • 时间复杂度:预处理的时间复杂度为 $O(B\log B)$,随机选择的时间复杂度为 $O(\log B)$。

  • 空间复杂度:根据使用的排序算法是否为原地排序,空间复杂度为 $O(B)$ 或 $O(1)$。

方法三:黑名单映射 [通过]


白名单中数的个数为 N - len(B),那么可以直接在 [0, N - len(B)) 中随机生成整数。我们把所有小于 N - len(B) 且在黑名单中数一一映射到大于等于 N - len(B) 且出现在白名单中的数。这样一来,如果随机生成的整数出现在黑名单中,我们就返回它唯一对应的那个出现在白名单中的数即可。

例如当 N = 6B = [0, 2, 3] 时,我们在 [0, 3) 中随机生成整数,并将 2 映射到 43 映射到 5,这样随机生成的整数就是 [0, 1, 4, 5] 中的一个。


我们将黑名单分成两部分,第一部分 X 的数都小于 N - len(B),需要进行映射;第二部分 Y 的数都大于等于 N - len(B),这些数不需要进行映射,因为并不会随机到它们。

我们先用 Y 构造出 W,表示大于等于 N - len(B) 且在白名单中的数,XW 的长度一定是相等的。随后遍历 XW,构造一个映射表(HashMap)M,将 XW 中的数构造一一映射。

[0, N - len(B)) 中随机生成整数 a 时,如果 a 出现在 M 中,则将它的映射返回,否则直接返回 a

class Solution { public: unordered_map<int, int> m; int wlen; Solution(int n, vector<int> b) { wlen = n - b.size(); unordered_set<int> w; for (int i = wlen; i < n; i++) w.insert(i); for (int x : b) w.erase(x); auto wi = w.begin(); for (int x : b) if (x < wlen) m[x] = *wi++; } int pick() { int k = rand() % wlen; return m.count(k) ? m[k] : k; } };
class Solution { Map<Integer, Integer> m; Random r; int wlen; public Solution(int n, int[] b) { m = new HashMap<>(); r = new Random(); wlen = n - b.length; Set<Integer> w = new HashSet<>(); for (int i = wlen; i < n; i++) w.add(i); for (int x : b) w.remove(x); Iterator<Integer> wi = w.iterator(); for (int x : b) if (x < wlen) m.put(x, wi.next()); } public int pick() { int k = r.nextInt(wlen); return m.getOrDefault(k, k); } }


  • 时间复杂度:预处理的时间复杂度为 $O(B)$,随机选择的时间复杂度为 $O(1)$。

  • 空间复杂度:$O(B)$。


