题目来源:https://leetcode-cn.com/problems/count-words-obtained-after-adding-a-letter/
大致题意:
给两个字符串数组 startWords、targetWords,所有的字符串由小写字母组成,且均不含重复字母,判断 targetWords 的字符串所含的字母种类正好比 startWords 的字符串的字符种类多一个,返回符合条件的targetWords 字符串个数
思路
既然只含小写字母,而且仅判断两个字符串的字符种类,于是可以使用状态压缩,将字符串压缩为一个 26 位 2 进制的整数,也就是 int 类型即可:从 a 开始,有哪个字母,就将对应 2 进制位置 1
于是可以将 startWords 的字符串压缩后放入哈希表,然后对于 targetWords 的每个字符串,遍历它的字符,挨个去掉后判断哈希表中是否有相同的数(字符串压缩后的数)
字符串压缩
- 将 startWords 元素压缩并放入哈希表
- 遍历 targetWords,对于每个元素,先压缩,然后遍历逐个字母,将字母对应的二进制数与原字符串压缩后的数进行异或运算(效果相当于在原字符串中去掉该字母后进行压缩),然后判断哈希表是否存在运算后的数
代码:
public int wordCount(String[] startWords, String[] targetWords) {
int n = startWords.length;
int m = targetWords.length;
Set<Integer> start = new HashSet<>();
int[] target = new int[m];
// 将 startWords 压缩后放入哈希表
for (int i = 0; i < n; i++) {
start.add(condense(startWords[i]));
}
// 将 targetWords 压缩后存入数组
for (int i = 0; i < m; i++) {
target[i] = condense(targetWords[i]);
}
int ans = 0;
for (int i = 0; i < m; i++) {
int len = targetWords[i].length();
// 挨个去掉字符串的字母
for (int j = 0; j < len; j++) {
// 将字母变为对应二进制数,并与原字符串压缩数进行异或运算
/*
如 ace 对应二进制数 10101
c 对应二进制数 00100
异或后为 10001,也就是 ae 对应的二进制数
*/
int c = targetWords[i].charAt(j) - 'a';
int num = target[i] ^ (1 << c);
// 如果存在该数,表示当前字符串满足条件,不用再继续判断
if (start.contains(num)) {
ans++;
break;
}
}
}
return ans;
}
// 字符串压缩为整数
public int condense(String word) {
int num = 0;
int n = word.length();
for (int i = 0; i < n; i++) {
// 逐个取出字母,然后将对应的二进制位置 1
num |= 1 << (word.charAt(i) - 'a');
}
return num;
}