- 哈希表基础
- 哈希表写题基础
- 字符串类
- 有效的字母异位词
- ArrayList用法
- 两个数组的交集
- 两数之和
哈希表基础
哈希函数: 哈希表使用哈希函数将键转换为数组的索引。理想情况下,哈希函数应该将键均匀分布在数组中,以减少冲突(两个键映射到同一个索引)的可能性。
数组: 哈希表底层通常是一个数组,数组的每个槽位可以存储一个或多个键值对。
冲突解决: 当两个或更多的键哈希到同一个索引时,会发生冲突。Java的HashMap通过链表或红黑树来解决冲突:
链地址法(Separate Chaining):在发生冲突时,元素将被添加到该索引处的链表中。从Java 8开始,当链表长度超过一定阈值(默认为8)时,链表会转换为红黑树,以提高效率。
开放地址法(Open Addressing):不是Java HashMap的实现方式,但在其他语言或库中可能会看到。这种方法通过寻找数组中的另一个空槽来解决冲突。
哈希表写题基础
什么时候用哈希表?
一般哈希表都是用来快速判断一个元素是否出现集合里。例如要查询一个名字是否在这所学校里。要枚举的话时间复杂度是O(n),但如果使用哈希表的话, 只需要O(1)就可以做到。
怎么用哈希表
1.数组模拟
针对给的数据范围比较小,这种方式一般性能比较高,代价比较低。
2.java中的HashMap。
针对一般情况,代价比较高。
java中HashMap要掌握的点。
主要了解它的操作。
创建:
HashMap<Integer, String> map = new HashMap<>();
//HashMap的键(Key)和值(Value)必须是对象类型,
//不能直接使用基本数据类型,如 int、double、char 等。
//这是因为Java的集合框架(Collections Framework)是在对象类型上构建的,
//不支持基本类型。
这里补充一个自动装箱,拆箱机制,实现类型转对象
Java提供了自动装箱(autoboxing)和拆箱(unboxing)机制,这使得在使用基本数据类型和它们的包装类(如 Integer、Double、Character 等)时更加方便。
装箱(Autoboxing):自动将基本数据类型转换为相应的对象类型。例如,当你将一个 int 类型的值放入 HashMap 中时,它会自动转换为 Integer 对象。
拆箱(Unboxing):自动将对象类型转换回基本数据类型。例如,从 HashMap 中取出一个 Integer 对象时,可以自动转换为 int 类型。
看一个例子
HashMap<Integer, Integer> map = new HashMap<>();
int key = 1;
int value = 100;
// 自动装箱:int 转为 Integer
//也就是说定义归定义,但是用的时候可以直接用,尽管你是普通类型,但是会自动装修
map.put(key, value);
// 自动拆箱:从 HashMap 获取的 Integer 自动转为 int
//获取里面的东西,可以直接赋给普通类型的,会自动拆箱。
int retrievedValue = map.get(key);
System.out.println("Value: " + retrievedValue); // 输出: Value: 100
总的来说,声明的时候,用对象类型,但是使用的时候不用考虑对象类型,会自动装拆箱。
插入元素:
map.put(1, "one"); // 将键为1,值为"one"的键值对插入到HashMap中
访问元素:
String value = map.get(1); // 返回键为1的元素的值,如果不存在,则返回null
检查键存在:
boolean hasKey = map.containsKey(1); // 检查键为1的元素是否存在
删除元素:
map.remove(1); // 删除键为1的元素
遍历:
for (Map.Entry<Integer, String> entry : map.entrySet()) {
System.out.println("Key: " + entry.getKey() + ", Value: " + entry.getValue());
}
特性:
无序:HashMap不保证元素的顺序,元素的存储取决于哈希函数。
键的唯一性:每个键在HashMap中必须是唯一的。
null键和null值:HashMap允许使用一个null键和多个null值。
时间复杂度:理想情况下,HashMap的get和put操作的时间复杂度为O(1)。但在最坏的情况下(大量冲突时),复杂度可能退化到O(n)。
字符串类
在做下面的题需要用到很多字符串的知识,这里进行补充。
String 类是一个非常重要且常用的类,用于表示和操作字符序列。由于 String 在Java中是不可变的(immutable),任何修改 String 的操作都会生成一个新的 String 对象,而不是修改原始对象。这种设计有助于提高程序的安全性和效率,尤其是在多线程环境中。
创建字符串
直接赋值:String s = “Hello”;
通过构造函数:String s = new String(“Hello”);
相关常用api:
长度:
int length():返回字符串的长度。 ★
字符访问:
char charAt(int index):返回指定索引处的字符。 ★
int indexOf(int ch):返回指定字符首次出现的字符串内的索引。
int indexOf(String str):返回指定子字符串首次出现的字符串内的索引。
int lastIndexOf(int ch):返回指定字符最后一次出现的索引。
int lastIndexOf(String str):返回指定子字符串最后一次出现的索引。
字符串比较:
boolean equals(Object anotherObject):比较两个字符串的内容是否相同。
boolean equalsIgnoreCase(String anotherString):忽略大小写比较两个字符串。
int compareTo(String anotherString):字典顺序比较两个字符串。
子字符串:
String substring(int beginIndex):返回一个新的字符串,它是此字符串的一个子字符串,从指定索引开始到结尾。
String substring(int beginIndex, int endIndex):返回一个新字符串,它是此字符串的一个子字符串,从 beginIndex 开始到 endIndex-1。
字符串修改:
String concat(String str):将指定字符串连接到此字符串的结尾。
String replace(char oldChar, char newChar):返回一个新字符串,它是通过用 newChar 替换此字符串中出现的所有 oldChar 得到的。
String trim():返回此字符串移除了前导和尾部空白的副本。 ★
String toLowerCase():使用默认语言环境的规则将此 String 中的所有字符都转换为小写。
String toUpperCase():使用默认语言环境的规则将此 String 中的所有字符都转换为大写。
搜索和替换:
boolean startsWith(String prefix):测试此字符串是否以指定的前缀开始。
boolean endsWith(String suffix):测试此字符串是否以指定的后缀结束。
String[] split(String regex):根据匹配给定的正则表达式来拆分此字符串
转换:
char[] toCharArray():将此字符串转换为一个新的字符数组。 ★
掌握几个打星的即可。
有效的字母异位词
想到统计字符串每个字符的个数,那想到的就是遍历字符串进行累加。这很容易想到用哈希的思想。所以这里的做法主要就是哈希。
哈希有数组模拟,也可以用HashMap映射。
这里由于数据范围有限,所以用数组模拟就比较好。所以这里有
解法1:
开一个长度为26的int类型的数组。利用字符之间运算可以得到int数字来确认下标。这样也可以完成对应字符数的统计。
扫描字符串1,利用charAt()获取字符,然后进行统计++。
再去扫描字符串2,但是对应字符的进行相减抵消
最后检查数组是否全0,全0代表全部字符抵消,那就是两个字符串每个字符的数量相同。
class Solution {
public boolean isAnagram(String s, String t) {
int[] num = new int[26]; //创建数组,对应26个英文字母
for(int i = 0;i<s.length();i++){
num[s.charAt(i)-'a']++; //扫描字符串s,进行字符统计
}
for(int i = 0;i<t.length();i++){
num[t.charAt(i)-'a']--; //扫描字符串t,进行字符抵消
}
for(int i = 0;i<num.length;i++){
if(num[i] !=0){
return false; //扫描统计数组,看是否全为0,完成抵消
}
}
return true;
}
}
ArrayList补充 注意是个类
ArrayList 是一种基于数组实现的可变大小的动态数组类,它属于 java.util 包。与普通数组相比,ArrayList 可以动态地增加和减少元素,这使得它在处理不确定数量的数据时非常有用,特别是在算法和数据结构问题中。
主要特点
动态扩容:ArrayList 的容量可以根据需要自动增加,当添加元素使得内部数组容量不足时,ArrayList 会自动创建一个新的更大的数组,并将旧数组的内容复制到新数组中。
随机访问:ArrayList 支持快速随机访问,即可以在常数时间内访问任何位置的元素,这是因为它内部是通过数组实现的。
类型安全:ArrayList 是泛型类,可以指定存储在其中的元素类型,这样可以在编译时期就检查到类型错误。
使用:
1.导包:
import java.util.ArrayList;
2.创建 ArrayList
不带初始容量的创建:
ArrayList<Integer> list = new ArrayList<>();
带初始容量的创建:
ArrayList<Integer> list = new ArrayList<>(10); // 初始容量为10
常用方法
添加元素:
add(E e):在列表的末尾添加一个元素。
add(int index, E element):在指定位置添加一个元素,其他元素向后移动。
访问元素:
get(int index):返回指定位置的元素。
修改元素:
set(int index, E element):替换指定位置的元素,并返回原来的元素。
删除元素:
remove(int index):删除指定位置的元素,返回被删除的元素。
remove(Object o):删除指定的对象,如果存在的话。
大小和清空:
size():返回列表中的元素个数。
clear():删除列表中的所有元素。
判断和搜索:
isEmpty():判断列表是否为空。
contains(Object o):判断列表是否包含指定的对象。
下面例子包含了增删查改
import java.util.ArrayList;
import java.util.Arrays;
public class ArrayListExample {
public static void main(String[] args) {
// 创建 ArrayList
ArrayList<String> fruits = new ArrayList<>();
// 添加元素
fruits.add("Apple");
fruits.add("Banana");
fruits.add("Cherry");
// 使用 Arrays.asList 初始化另一个 ArrayList
ArrayList<String> vegetables = new ArrayList<>(Arrays.asList("Carrot", "Potato", "Cabbage"));
// 访问元素 get() 也是利用下标
System.out.println("First fruit: " + fruits.get(0)); // 输出 Apple
// 修改元素 set() 也是利用下标
fruits.set(1, "Blueberry"); // 将 Banana 替换为 Blueberry
// 遍历 ArrayList可以用增强for
System.out.println("Fruits:");
for (String fruit : fruits) {
System.out.println(fruit);
}
// 删除元素 可以按值删,也可以按下标删
fruits.remove("Cherry"); // 删除元素 Cherry
fruits.remove(0); // 删除索引为 0 的元素(现在是 Apple)
// 判断是否为空 判空函数isEmpty()
if (!fruits.isEmpty()) {
System.out.println("Fruits list is not empty.");
}
}
}
注意ArrayList并不是就是数组,如果结果让你返回数组,那么就是老实遍历ArrayList构建结果数组。还是for遍历,ArrayList的长度是size(),
两个数组的交集
思路:哈希
题目还是限定了数字的范围,所以还是可以用数组模拟哈希的做法。但是这次使用boolean数组不用int,主要是方便设置元素已经加入结果集。
流程:
1.先遍历nums1,统计出现的字符到num1。
2.然后再去遍历nums2,去num1中查找是否出现过,出现过就加入结果集,然后把对应的num1的值置为false,防止后续再次加入。
class Solution {
public int[] intersection(int[] nums1, int[] nums2) {
boolean[] num1 = new boolean[1005]; //哈希表,用于统计出现数字。
ArrayList<Integer> result = new ArrayList<>(); //存结果集
for(int i = 0;i<nums1.length;i++){
num1[nums1[i]] = true;
}
for(int i = 0;i<nums2.length;i++){
if(num1[nums2[i]] != false){
result.add(nums2[i]);
num1[nums2[i]] = false;
}
}
int[] resultArray = new int[result.size()];
for(int i = 0;i<resultArray.length;i++){
resultArray[i] = result.get(i);
}
return resultArray;
}
}
方法2:排序,然后双指针。
两数之和
两个for就慢了,一个for就用哈希。因为哈希的作用就是优化查找到O(1)
这个哈希有值得学习的技巧。
如果起手按之前的思路无脑先遍历收集。那么就会出现新的问题:
比如[3,3]这种,如果用遍历思想,那就还要多加一个判断是不是同一个元素,十分的麻烦。
正确思路:
首先这种思路突破了一件事,为什么会有上面说的多加一个判断这种问题,那是因为按这种思路,最终每个元素都会访问两次。这里的优化就是直接走到底。不回头。
所以我总结为:哈希走到底,不回头。边走边处理
还有有时候结果只要求存两个结果,那就可以这样开两个数组返回。很方便。
流程:
1.创建一个哈希表,key是数组里的数字,value是该数字在数组中的下标。
2.创建一个长度为2的数组存结果。
3.开始遍历数组,遍历的时候进行其相加的另一个值的计算,然后立即用hash进行查找,(而且题目并不限制答案中谁先谁后)。如果目标元素并不在hash表中,那就把这个数字加入hash表。这样可以发现一直在往前走,并没有元素的重复访问。所以当一旦发现目标元素时,是不用担心元素是同一个元素的风险。因为他是进行判断后才加入到hash中。
class Solution {
public int[] twoSum(int[] nums, int target) {
HashMap<Integer,Integer> hmap = new HashMap<>();//创建一个hash表
int[] result = new int[2]; //结果集
for(int i = 0;i<nums.length;i++){//遍历数组
int temp = target - nums[i]; //计算另一个目标结果
if(hmap.containsKey(temp)){ //查看目标结果是否在扫过的hash表中。
result[1] = i; //如果在就把当前的下标加入结果集
result[0] = hmap.get(temp); //将另一个目标元素,通过hash获取其下标也加入结果集
return result; //直接返回结果
}
hmap.put(nums[i],i); //如果没有找到,那就把该元素加入hash中。
}
return null;
}
}
//这样始终在处理前面,就不会导致遍历做法中,两次访问到同一元素的问题。