哈希表
基础知识
哈希表和链表都是属于基础数据结构的一种,都是必须掌握牢靠的知识。
简单来说就是使用数据得到的哈希值来作为哈希表的key用于获取数据。
用于求哈希值的的函数被我们称为哈希函数,通过哈希函数我们可以把数据映射到我们的哈希表上。
显然,在我们计算哈希值的时候我们不可避免的会出现两个数据计算出的哈希值相同。这种不同数据,哈希值相同的情况我们称为哈希碰撞
在出现了哈希碰撞之后,我们应该如何解决呢?
在这里我们介绍两种解决的方案:
- 拉链法
- 线性探测法(开放寻址法)
拉链法:
如图所示,我们假设在哈希值为0的地方产生了冲突,于是我们可以在哈希值为0的位置存一个指针,指向一个链表。我们使用链表存储相同哈希的数据。
线性探测法:
线性探测法要求哈希表 实际的大小 > 数据的大小 。因为线性探测法处理冲突的方法是从哈希值的位置开始一直寻找一个不冲突的位置来存储数据。
如图,当a和b哈希值相同的时候,我们从a的位置开始往下找到第一个没有存储数据的位置存放b(如图就是位置3)。
实现方式
哈希表在实际中的常见实现方式有三种:
- 数组
- set (集合)
- map (映射)
我们可以根据题目的具体要求和实现难易,选择合适的实现方式。
总的来说,当我们要以O(1)
的时间复杂度判断一个数是否在一个集合中存在时,我们就可以考虑使用哈希表。
242.有效的字母异位词
题意:给定两个字符串 s 和 t ,编写一个函数来判断 t 是否是 s 的字母异位词。
示例 1: 输入: s = "anagram", t = "nagaram" 输出: true
示例 2: 输入: s = "rat", t = "car" 输出: false
说明: 你可以假设字符串只包含小写字母。
思路:题目的要求可以抽象为两个字符串是否为完全相同的字母(数量也相同)组成,根据我们刚刚总结的哈希表的作用,我们可以使用哈希表存一个字符串中包含的所有字母及其个数。
这样在遍历另一个字符串的时候,我们就可以快速的判断该字符是否在前一个字符串中出现。
本题可以使用map实现,但是使用数组会更快且更简单。
我们申请一个数组大小为26位,现在我们就可以按下标0-25 对应 a-z,数组存的值为该字母出现的次数。
代码:
class Solution {
public boolean isAnagram(String s, String t) {
int[] map = new int[26];
if (s.length() != t.length()) return false;
for (int i = 0; i < s.length(); i ++ ) {
map[s.charAt(i) - 'a'] ++;
map[t.charAt(i) - 'a'] --;
}
for (int cnt : map) {
if (cnt != 0) return false; // 如果一个字母在s和t中出现的次数不一样,那么存的值一定不为0
}
return true;
}
}
349. 两个数组的交集
题意:给定两个数组,编写一个函数来计算它们的交集。
示例:
说明: 输出结果中的每个元素一定是唯一的。 我们可以不考虑输出结果的顺序。
思路
根据题意,我们不能看出我们需要存储一个字符串的字符,然后判断另一个字符是否在该集合中,如果在我们就把它加入到答案里,注意每个元素是唯一的,这就说明答案中元素是没有重复的。
根据没有重复的这个性质,我们可以使用set来实现哈希表,因为set可以去重。
代码
class Solution {
public int[] intersection(int[] nums1, int[] nums2) {
Set<Integer> set = new HashSet<>();
Set<Integer> set1 = new HashSet<>();
for (int x : nums1) set.add(x);
for (int x : nums2) set1.add(x);
return intersectionFunc(set, set1);
}
public int[] intersectionFunc(Set<Integer> set, Set<Integer> set1) {
if (set.size() < set1.size()) return intersectionFunc(set1, set);
Set<Integer> res = new HashSet<>();
for (int x : set1) {
if (set.contains(x)) res.add(x);
}
return res.stream().mapToInt(x -> x).toArray();
}
}
第202题. 快乐数
题意:编写一个算法来判断一个数 n 是不是快乐数。
「快乐数」定义为:对于一个正整数,每一次将该数替换为它每个位置上的数字的平方和,然后重复这个过程直到这个数变为 1,也可能是 无限循环 但始终变不到 1。如果 可以变为 1,那么这个数就是快乐数。
如果 n 是快乐数就返回 True ;不是,则返回 False 。
示例:
输入:19
输出:true
解释:
1^2 + 9^2 = 82
8^2 + 2^2 = 68
6^2 + 8^2 = 100
1^2 + 0^2 + 0^2 = 1
思路
本题的是不断循环的过程,当中途出现重复值的时候,程序一定会陷入死循环,所以此时我们退出循环。
那我们怎么判断一个值在之前出现过呢,显而易见我们可以使用哈希表存储每一个计算出来的值。
根据思路不难写出代码,另外一个要注意的点就是把数字的每一位加上起来求和的过程。我们可以使用取模运算每次取到数的最后一位,再让该数减少一位。
代码
class Solution {
public boolean isHappy(int n) {
Set<Integer> hash = new HashSet<>();
while (true) {
int res = getSum(n);
if (res == 1) return true;
if (hash.contains(res)) return false;
else hash.add(res);
n = res;
}
}
public int getSum(int n) {
int sum = 0;
while (n > 0) {
sum += Math.pow(n % 10, 2);
n /= 10;
}
return sum;
}
}
1. 两数之和
题意:给定一个整数数组 nums 和一个目标值 target,请你在该数组中找出和为目标值的那 两个 整数,并返回他们的数组下标。
你可以假设每种输入只会对应一个答案。但是,数组中同一个元素不能使用两遍。
示例:
给定 nums = [2, 7, 11, 15], target = 9
因为 nums[0] + nums[1] = 2 + 7 = 9
所以返回 [0, 1]
思路
根据题意,我们很容易就能想到一个暴力的解法,即两层循环枚举两个数并计算他们的和是否等于target。但是这样的时间复杂度为O(n2)
我们该如何优化它呢?因为target的值是固定的,我们假设两个数满足的数为x和y,可以得到x + y = target
。 当我们固定x的值时,y的值也被固定为y = targer - x
所以我们可以只枚举一个值,然后查询另一个值是否在数组中存在即可。
代码
class Solution {
public int[] twoSum(int[] nums, int target) {
Map<Integer, Integer> map = new HashMap<>();
int[] ans = new int[2];
for (int i = 0; i < nums.length; i ++ ) {
if (map.containsKey(target - nums[i])) {
ans[0] = map.get(target - nums[i]);
ans[1] = i;
break;
} else {
map.put(nums[i], i);
}
}
return ans;
}
}
第454题.四数相加II
题意:给定四个包含整数的数组列表 A , B , C , D ,计算有多少个元组 (i, j, k, l) ,使得 A[i] + B[j] + C[k] + D[l] = 0。
为了使问题简单化,所有的 A, B, C, D 具有相同的长度 N,且 0 ≤ N ≤ 500 。所有整数的范围在 -2^28 到 2^28 - 1 之间,最终结果不会超过 2^31 - 1 。
思路
本题思路同两数之和,我们可以先存储A + B的值, 再枚举B 和 C, 查询是否存在满足 0 - A - B的值存在。
因为题目只用满足的数目,所以我们只需要在 查询到满足0 - A - B的值时将ans++即可
本题还有一个值得注意的点,就是在存储A + B的值的时候我们需要保存 A 和 B 中 相同和的次数,所以我们选择使用map来实现哈希表。
代码
class Solution {
public int fourSumCount(int[] nums1, int[] nums2, int[] nums3, int[] nums4) {
Map<Integer, Integer> hash = new HashMap<>();
int ans = 0;
for (int i : nums1)
for (int j : nums2) {
if (hash.containsKey(i + j)) {
hash.put(i + j, hash.get(i + j) + 1);
} else {
hash.put(i + j, 1);
}
}
for (int i :nums3)
for (int j : nums4) {
if (hash.containsKey(0 - i - j)) {
ans += hash.get(0 - i - j);
}
}
return ans;
}
}
383. 赎金信
题意:给定一个赎金信 (ransom) 字符串和一个杂志(magazine)字符串,判断第一个字符串 ransom 能不能由第二个字符串 magazines 里面的字符构成。如果可以构成,返回 true ;否则返回 false。
(题目说明:为了不暴露赎金信字迹,要从杂志上搜索各个需要的字母,组成单词来表达意思。杂志字符串中的每个字符只能在赎金信字符串中使用一次。)
注意:
你可以假设两个字符串均只含有小写字母。
canConstruct("a", "b") -> false
canConstruct("aa", "ab") -> false
canConstruct("aa", "aab") -> true
思路
鉴于是存的字母及其出现次数,所以我们采用数组来实现哈希表。
我们可以先存储杂志上出现的字母及其出现次数。然后枚举赎金信的每一个字符在哈希表中查询,如果该字母在哈希表中为0,即为该字母在杂志不存在所以返回false。
如果不等于0我们让该值减减,表示使用了一个杂志的字母了。
当遍历完整个字符串后还没有找到一个字母在杂志中没有,则返回true。
代码
class Solution {
public boolean canConstruct(String ransomNote, String magazine) {
int[] map = new int[26];
for (int i = 0; i < magazine.length(); i ++ ) {
map[magazine.charAt(i) - 'a'] ++;
}
for (int i = 0; i < ransomNote.length(); i ++ ) {
if (map[ransomNote.charAt(i) - 'a'] == 0) return false;
else map[ransomNote.charAt(i) - 'a'] --;
}
return true;
}
}
第15题. 三数之和
题意:给你一个包含 n 个整数的数组 nums,判断 nums 中是否存在三个元素 a,b,c ,使得 a + b + c = 0 ?请你找出所有满足条件且不重复的三元组。
注意: 答案中不可以包含重复的三元组。
示例:
给定数组 nums = [-1, 0, 1, 2, -1, -4],
满足要求的三元组集合为: [ [-1, 0, 1], [-1, -1, 2] ]
思路
本题可以使用哈希表来解,但是使用哈希表时去重的步骤很复杂,而且使用哈希法解题的时候时间复杂度为O(n2)
所以本题和接下来的四数之和我们都选择使用双指针的解法。
本来我们需要枚举三个数,时间复杂度为O(n3)
, 在我们使用双指针后可以优化到O(n2)
。
具体的,我们枚举一个数i,然后令left = i + 1, right = n - 1 (n 为数组的长度)。注意,在我们使用双指针操作时我们必须先把数组排序。
因为数组排序后是递增的,所以我们可以得到一下的性质:
- 当
nums[i] + nums[left] + nums[right] > 0
时,我们可以让right --
,使得结果向等于0靠近。 - 当
nums[i] + nums[left] + nums[right] < 0
时, 我们可以让lef ++
,使得结果向等于0靠近。
对于这两种性质我们可以为循环剪枝:
- 当
x + nums[i + 1] + nums[i + 2] > 0
时,证明当前的i 加上最小的两个数也大于0了,又因为数组递增,所以i之后同样不会有解break。 - 当
x + nums[n - 1] + nums[n - 2] < 0
时,证明当前的i 加上最大的两个值还是小于0的,但是因为i之后的数可能比它大所以直接continue。
我们继续考虑怎么去重,我们需要对三个数都去重,我们假设三个数为a,b,c
对于a 即 nums[i]的去重,有一个问题,是判断 nums[i] 与 nums[i + 1]是否相同,还是判断 nums[i] 与 nums[i-1] 是否相同。
这里存在一个陷阱,大家可能觉得这两种情况不是一样的嘛,实际上两者的意义并不同。
我们以 nums[i] 与 nums[i + 1]是否相同进行判断的时候,nums[i + 1] 对应这 nums[left] 这实际上是保证了三元组中不存在重复元素,和题目要求的不重复的三元组不同。
所以我们在for循环的一开始先对a去重:if (i > 0; nums[i] == nums[i - 1]) continue;
对于 b 和 c的去重怎么考虑呢?
同样的我们可以参考a的去重模式,但是left 和 right 是一个不断枚举的值所以我们要在while循环里面对left 和 right 一直判断,更新
ans.add(Arrays.asList(x, nums[j], nums[k]));
while (j < k && nums[j] == nums[j + 1]) j ++;
while (k > j && nums[k] == nums[k - 1]) k --;
j ++;
k --;
代码
class Solution {
public List<List<Integer>> threeSum(int[] nums) {
Arrays.sort(nums);
List<List<Integer>> ans = new ArrayList<List<Integer>>();
int n = nums.length;
for (int i = 0; i < n - 2; i ++ ) {
int x = nums[i];
if (i != 0 && nums[i] == nums[i - 1]) continue;
if (x + nums[i + 1] + nums[i + 2] > 0) break;
if (x + nums[n - 1] + nums[n - 2] < 0) continue;
int j = i + 1;
int k = n - 1;
while (j < k) {
int sum = x + nums[j] + nums[k];
if (sum > 0) k --;
else if (sum < 0) j ++;
else {
ans.add(Arrays.asList(x, nums[j], nums[k]));
while (j < k && nums[j] == nums[j + 1]) j ++;
while (k > j && nums[k] == nums[k - 1]) k --;
j ++;
k --;
}
}
}
return ans;
}
}
第18题. 四数之和
题意:给定一个包含 n 个整数的数组 nums 和一个目标值 target,判断 nums 中是否存在四个元素 a,b,c 和 d ,使得 a + b + c + d 的值与 target 相等?找出所有满足条件且不重复的四元组。
注意:
答案中不可以包含重复的四元组。
示例: 给定数组 nums = [1, 0, -1, 0, -2, 2],和 target = 0。 满足要求的四元组集合为: [ [-1, 0, 0, 1], [-2, -1, 1, 2], [-2, 0, 0, 2] ]
思路
四数之和,和15.三数之和是一个思路,都是使用双指针法, 基本解法就是在三数之和的基础上再套一层for循环。
但是剪枝的逻辑和三数之和略有不同,因为target不再是固定为0的值,所以我们可以这修改剪枝的条件if (nums[i] > 0 && nums[i] > target) return ans;
代码
class Solution {
public List<List<Integer>> fourSum(int[] nums, int target) {
Arrays.sort(nums);
int n = nums.length;
List<List<Integer>> ans = new ArrayList<>();
for (int i = 0; i < n; i ++ ) {
if (nums[i] > 0 && nums[i] > target) return ans;
if (i > 0 && nums[i] == nums[i - 1]) continue;
for (int j = i + 1; j < n; j ++ ) {
if (j > i + 1 && nums[j] == nums[j - 1]) continue;
int left = j + 1;
int right = n - 1;
while (left < right) {
long sum = (long) nums[i] + nums[j] + nums[left] + nums[right];
if (sum > target) right --;
else if (sum < target) left ++;
else {
ans.add(Arrays.asList(nums[i], nums[j], nums[left], nums[right]));
while (left < right && nums[left] == nums[left + 1]) left ++;
while (right > left && nums[right] == nums[right - 1]) right --;
left ++;
right --;
}
}
}
}
return ans;
}
}