数据结构


数组

数组是一种用连续的内存空间存储相同数据类型的线性数据结构

数组下标为什么从0开始

寻址公式是:baseAddress+i*dataTypeSize

计算下表的内存地址效率较高,少一次加减操作

数组查找的时间复杂度

1.通过下标查询O(1)

2.位置下标查找O(n)

3.位置下标但排序,二分法查找O(logn)

插入与删除时间复杂度

插入和删除时,为了保证数组内存的连续性,需要挪动数组元素,平均时间复杂度为O(n)

ArrayList底层的实现原理

1.ArrayList底层使用动态数组实现的

2.ArrayList初始容量为0,当第一次添加数据时才会初始化为10

3.ArrayList在进行扩容时容量是原来的1.5倍,每次扩容都要拷贝数组

4.ArrayList在添加数据时

a.确保数组已使用长度(size)加1之后足够存下一个数据

b.计算数组的容量,若当前数组已使用长度+1后的大于当前的数组长度,则用grow方法扩容(1.5倍)

c.确保新增的数据有地方存储之后,则将新元素添加到位于size的位置上

d.返回添加成功布尔值

ArrayList list = new ArrayList(10)中的list扩容几次

无扩容,用add方法时才扩容

如何实现数组和list之间的转换

List转为array是toArray, array转为List是asList

list转array,修改list后array不影响

array转list,修改arrat后list也会修改

ArrayList和LinkedList的区别

1.底层数据结构

a.ArrayList是动态数组的数据结构实现

b.LinkedList是双向链表的数据结构实现

2.操作数据效率

a.查找已知索引:ArrayList是O(1),LinkedList是O(n)

b.查找未知索引:都是O(n)

c.新增与删除:arraylist尾部是O(1),其余是O(n)

​ Linkedlist头部是O(1),其余是O(n)

3.内存空间占用

1.ArrayList底层是数组,内存连续,节省内存

2.LinkedList底层是双线链表,需要存储数据和两个指针,更占用内存

4.线程安全

ArrayList和LinkedList都不是线程安全的

若要保证线程安全,有两个方案

a.在方法内使用,局部变量是线程安全的

b.使用线程安全的ArrayList与LinkedList—>加锁SynchronizedList

二叉树

二叉搜索树(子节点左小右大): 查增删(一般是O(logn), 极端是O(n))

红黑树:是一种自平衡的二叉搜索树

红黑树的5个性质:

1.节点要么是红色,要么是黑色

2.根节点都是黑色

3.叶子节点都是黑色的空节点

4.红黑树中红色节点的子节点都是黑色

5.从任一节点到叶子节点的所有路径都包含相同数目的黑色节点

在添加或删除节点时,若不符合这些性质会发生旋转,以达到所有性质

增删查都是O(logn)

什么是散列表(哈希表)

1.散列表又名哈希表

2.根据键(key)直接访问在内存存储位置值(value)的数据结构

3.由数组演化而来,利用了数组支持按照下标随机访问数据

散列冲突

1.散列冲突又称哈希冲突,哈希碰撞

2.指多个key映射到同一个数组下标位置

散列冲突-链表法(拉链)

1.数组的每个下表位置称之为桶(bucket)或槽(slot)

2.每个bucket都会对应一条链表或红黑树

3.hash冲突后的元素都会放到相同槽位对应的链表或红黑树中

Hashmap的实现原理

1.底层使用hash表(散列表)数据结构,即数组+链表;红黑树

2.添加数据时,计算key的值确定元素在数组中的下标

a.key相同则替换

b.不同则存入链表或红黑树中

获取数据通过key的hash计算数组下表获取元素

HashMap的jdk1.7和jdk1.8有什么区别

1.jdk1.8之前采用拉链法,数组+链表

2.jdk1.8之后采用数组+链表+红黑树,链表长度大于8且数组长度大于64则会从链表转化为红黑树

HashMap的put方法的具体流程

1.判断链值对数组table是否为空或null,否则执行resize()进行扩容

2.根据键值key计算hash值得到数组索引

3.判断table[i]==null,条件成立就直接新建节点添加

4.若table[i]==null不成立,则

a.判断table[i]的首个元素是否和key一样,若相同则直接覆盖value

b.判断table[i]是否为treeNode,即table[i]是否为红黑树,如果是红黑树,则直接在树中插入键值对

c.遍历table[i],链表尾部插入数据然后判断链表长度是否大于8,大于8转为红黑树,在红黑树中执行插入操作,遍历过程中若发现了key已经存在则直接覆盖

5.插入成功后,判断实际存在的键值对size是否超过了最大thread(数组长度*0.75),若超过就扩容

HashMap的扩容机制

1.在添加元素或初始化时需要调用resize方法进行扩容,第一次添加数据初始化数组长度为16,以后每次扩容都是达到了扩容阈值(数组长度*0.75)

2.每次扩容的时候都是扩容之前容量的2倍

3.扩容之后会新创建一个数组,需要把老数组中的数据挪动到新的数组中

a.没有hash冲突的节点,则直接使用e.hash&(newCap-1)计算新数组的索引位置

b.如果是红黑树,则走红黑树的添加

c.如果是链表则需要遍历链表,可能需要拆分链表,判断e.hash&oldCap是否为0,若为0,该元素停留在原始位置,否则移动至原始位置+增加的数组大小这个位置上

HashMap的寻址算法

1.计算对象的hashcode()

2.再进行调用hash()方法进行二次哈希,hashcode值右移16位再异或运算,让哈希分布更为均匀

3.最后(capacity-1)&hash得到索引

为何HashMap的数组长度一定是2的次幂

1.计算索引时效率更好:如果是2的n次幂可以使用位与运算代替取模

2.扩容时重新计算索引效率更高:hash&oldCap==0的元素留在原来的位置,否则新位置=旧位置+oldCap


文章作者: 靳雨晨
版权声明: 本博客所有文章除特別声明外,均采用 CC BY 4.0 许可协议。转载请注明来源 靳雨晨 !
  目录