原文链接: https://leetcode-cn.com/problems/maximum-length-of-a-concatenated-string-with-unique-characters
英文原文
You are given an array of strings arr
. A string s
is formed by the concatenation of a subsequence of arr
that has unique characters.
Return the maximum possible length of s
.
A subsequence is an array that can be derived from another array by deleting some or no elements without changing the order of the remaining elements.
Example 1:
Input: arr = ["un","iq","ue"] Output: 4 Explanation: All the valid concatenations are: - "" - "un" - "iq" - "ue" - "uniq" ("un" + "iq") - "ique" ("iq" + "ue") Maximum length is 4.
Example 2:
Input: arr = ["cha","r","act","ers"] Output: 6 Explanation: Possible longest valid concatenations are "chaers" ("cha" + "ers") and "acters" ("act" + "ers").
Example 3:
Input: arr = ["abcdefghijklmnopqrstuvwxyz"] Output: 26 Explanation: The only string in arr has all 26 characters.
Example 4:
Input: arr = ["aa","bb"] Output: 0 Explanation: Both strings in arr do not have unique characters, thus there are no valid concatenations.
Constraints:
1 <= arr.length <= 16
1 <= arr[i].length <= 26
arr[i]
contains only lowercase English letters.
中文题目
给定一个字符串数组 arr
,字符串 s
是将 arr
某一子序列字符串连接所得的字符串,如果 s
中的每一个字符都只出现过一次,那么它就是一个可行解。
请返回所有可行解 s
中最长长度。
示例 1:
输入:arr = ["un","iq","ue"] 输出:4 解释:所有可能的串联组合是 "","un","iq","ue","uniq" 和 "ique",最大长度为 4。
示例 2:
输入:arr = ["cha","r","act","ers"] 输出:6 解释:可能的解答有 "chaers" 和 "acters"。
示例 3:
输入:arr = ["abcdefghijklmnopqrstuvwxyz"] 输出:26
提示:
1 <= arr.length <= 16
1 <= arr[i].length <= 26
arr[i]
中只含有小写英文字母
通过代码
高赞题解
基本分析
根据题意,可以将本题看做一类特殊的「数独问题」:在给定的 arr
字符数组中选择,尽可能多的覆盖一个 $1 * 26$ 的矩阵。
对于此类「精确覆盖」问题,换个角度也可以看做「组合问题」。
通常有几种做法:DFS
、剪枝 DFS
、二进制枚举、模拟退火、DLX
。
其中一头一尾解法过于简单和困难,有兴趣的同学自行了解与实现。
剪枝 DFS
根据题意,可以有如下的剪枝策略:
- 预处理掉「本身具有重复字符」的无效字符串,并去重;
- 由于只关心某个字符是否出现,而不关心某个字符在原字符串的位置,因此可以将字符串使用
int
进行表示; - 由于使用
int
进行表示,因而可以使用「位运算」来判断某个字符是否可以被追加到当前状态中; DFS
过程中维护一个total
,代表后续未经处理的字符串所剩余的“最大价值”是多少,从而实现剪枝;- 使用
lowbit
计算某个状态对应的字符长度是多少; - 使用「全局哈希表」记录某个状态对应的字符长度是多少(使用
static
修饰,确保某个状态在所有测试数据中只会被计算一次); - 【未应用】由于存在第 $4$ 点这样的「更优性剪枝」,理论上我们可以根据「字符串所包含字符数量」进行从大到小排序,然后再进行
DFS
这样效果理论上会更好。想象一下如果存在一个包含所有字母的字符串,先选择该字符串,后续所有字符串将不能被添加,那么由它出发的分支数量为 $0$;而如果一个字符串只包含单个字母,先决策选择该字符串,那么由它出发的分支数量必然大于 $0$。但该策略实测效果不好,没有添加到代码中。
代码:
[]class Solution { // 本来想使用如下逻辑将「所有可能用到的状态」打表,实现 O(1) 查询某个状态有多少个字符,但是被卡了 // static int N = 26, M = (1 << N); // static int[] cnt = new int[M]; // static { // for (int i = 0; i < M; i++) { // for (int j = 0; j < 26; j++) { // if (((i >> j) & 1) == 1) cnt[i]++; // } // } // } static Map<Integer, Integer> map = new HashMap<>(); int get(int cur) { if (map.containsKey(cur)) { return map.get(cur); } int ans = 0; for (int i = cur; i > 0; i -= lowbit(i)) ans++; map.put(cur, ans); return ans; } int lowbit(int x) { return x & -x; } int n; int ans = Integer.MIN_VALUE; int[] hash; public int maxLength(List<String> _ws) { n = _ws.size(); HashSet<Integer> set = new HashSet<>(); for (String s : _ws) { int val = 0; for (char c : s.toCharArray()) { int t = (int)(c - 'a'); if (((val >> t) & 1) != 0) { val = -1; break; } val |= (1 << t); } if (val != -1) set.add(val); } n = set.size(); if (n == 0) return 0; hash = new int[n]; int idx = 0; int total = 0; for (Integer i : set) { hash[idx++] = i; total |= i; } dfs(0, 0, total); return ans; } void dfs(int u, int cur, int total) { if (get(cur | total) <= ans) return; if (u == n) { ans = Math.max(ans, get(cur)); return; } // 在原有基础上,选择该数字(如果可以) if ((hash[u] & cur) == 0) { dfs(u + 1, hash[u] | cur, total - (total & hash[u])); } // 不选择该数字 dfs(u + 1, cur, total); } }
二进制枚举
首先还是对所有字符串进行预处理。
然后使用「二进制枚举」的方式,枚举某个字符串是否被选择。
举个🌰,$(110){2}$ 代表选择前两个字符串,$(011){2}$ 代表选择后两个字符串,这样我们便可以枚举出所有组合方案。
代码:
[]class Solution { static Map<Integer, Integer> map = new HashMap<>(); int get(int cur) { if (map.containsKey(cur)) { return map.get(cur); } int ans = 0; for (int i = cur; i > 0; i -= lowbit(i)) ans++; map.put(cur, ans); return ans; } int lowbit(int x) { return x & -x; } int n; int ans = Integer.MIN_VALUE; Integer[] hash; public int maxLength(List<String> _ws) { n = _ws.size(); HashSet<Integer> set = new HashSet<>(); for (String s : _ws) { int val = 0; for (char c : s.toCharArray()) { int t = (int)(c - 'a'); if (((val >> t) & 1) != 0) { val = -1; break; } val |= (1 << t); } if (val != -1) set.add(val); } n = set.size(); if (n == 0) return 0; hash = new Integer[n]; int idx = 0; for (Integer i : set) hash[idx++] = i; for (int i = 0; i < (1 << n); i++) { int cur = 0, val = 0; for (int j = 0; j < n; j++) { if (((i >> j) & 1) == 1) { if ((cur & hash[j]) == 0) { cur |= hash[j]; val += get(hash[j]); } else { cur = -1; break; } } } if (cur != -1) ans = Math.max(ans, val); } return ans; } }
模拟退火
事实上,可以将原问题看作求「最优前缀序列」问题,从而使用「模拟退火」进行求解。
具体的,我们可以定义「最优前缀序列」为 组成最优解所用到的字符串均出现在排列的前面。
举个🌰,假如构成最优解使用到的字符串集合为 [a,b,c]
,那么对应 [a,b,c,...]
、[a,c,b,...]
均称为「最优前缀序列」。
不难发现,答案与最优前缀序列是一对多关系,这指导我们可以将「参数」调得宽松一些。
具有「一对多」关系的问题十分适合使用「模拟退火」,使用「模拟退火」可以轻松将本题 arr.length
数据范围上升到 $60$ 甚至以上(非严谨计算,只是以前见过数据范围大到只能使用「模拟退火」
调整成比较宽松的参数可以跑赢「二进制枚举」,但为了以后增加数据不容易被 hack,还是使用 N=400
& fa=0.90
的搭配。
「模拟退火」的几个参数的作用在 这里 说过了,不再赘述。
代码:
[]class Solution { static Map<Integer, Integer> map = new HashMap<>(); int get(int cur) { if (map.containsKey(cur)) { return map.get(cur); } int ans = 0; for (int i = cur; i > 0; i -= lowbit(i)) ans++; map.put(cur, ans); return ans; } int lowbit(int x) { return x & -x; } int n; int ans = Integer.MIN_VALUE; Random random = new Random(20210619); double hi = 1e4, lo = 1e-4, fa = 0.90; int N = 400; int calc() { int mix = 0, cur = 0; for (int i = 0; i < n; i++) { int hash = ws[i]; if ((mix & hash) == 0) { mix |= hash; cur += get(hash); } else { break; } } ans = Math.max(ans, cur); return cur; } void swap(int[] arr, int i, int j) { int c = arr[i]; arr[i] = arr[j]; arr[j] = c; } void sa() { for (double t = hi; t > lo; t *= fa) { int a = random.nextInt(n), b = random.nextInt(n); int prev = calc(); swap(ws, a, b); int cur = calc(); int diff = prev - cur; if (Math.log(diff / t) >= random.nextDouble()) { swap(ws, a, b); } } } int[] ws; public int maxLength(List<String> _ws) { // 预处理字符串:去重,剔除无效字符 // 结果这一步后:N 可以下降到 100;fa 可以下降到 0.70,耗时约为 78 ms // 为了预留将来添加测试数据,题解还是保持 N = 400 & fa = 0.90 的配置 n = _ws.size(); HashSet<Integer> set = new HashSet<>(); for (String s : _ws) { int val = 0; for (char c : s.toCharArray()) { int t = (int)(c - 'a'); if (((val >> t) & 1) != 0) { val = -1; break; } val |= (1 << t); } if (val != -1) set.add(val); } n = set.size(); if (n == 0) return 0; ws = new int[n]; int idx = 0; for (Integer i : set) ws[idx++] = i; while (N-- > 0) sa(); return ans; } }
最后
如果有帮助到你,请给题解点个赞和收藏,让更多的人看到 ~ (“▔□▔)/
也欢迎你 关注我(公主号后台回复「送书」即可参与长期看题解学算法送实体书活动)或 加入「组队打卡」小群 ,提供写「证明」&「思路」的高质量题解。
所有题解已经加入 刷题指南,欢迎 star 哦 ~
统计信息
通过次数 | 提交次数 | AC比率 |
---|---|---|
35435 | 72164 | 49.1% |
提交历史
提交时间 | 提交结果 | 执行时间 | 内存消耗 | 语言 |
---|