[toc]

堆的定义

***堆(heap)***是计算机科学中一类特殊的数据结构的统称。堆通常是一个可以被看做一棵树的数组对象。堆总是满足下列性质:

  • 堆中某个结点的值总是不大于或不小于其父结点的值;
  • 堆总是一棵完全二叉树

将根结点最大的堆叫做最大堆或大根堆,根结点最小的堆叫做最小堆或小根堆。常见的堆有二叉堆、[斐波那契堆]等。

堆是非线性数据结构,相当于一维数组,有两个直接后继。

逻辑

堆的定义如下:n个元素的序列{k1,k2,ki,…,kn}当且仅当满足下关系时,称之为堆。有如下事实: Ki >= K(2i),Ki >= K(i+1)或者Ki <= K(2i),Ki <= K(i+1)

若将和此次序列对应的一维数组(即以一维数组作此序列的存储结构)看成是一个完全二叉树,则堆的含义表明,完全二叉树中所有非终端结点的值均不大于(或不小于)其左、右孩子结点的值。由此,若序列{k1,k2,…,kn}是堆,则堆顶元素(或完全二叉树的根)必为序列中n个元素的最小值(或最大值)。 这里我们以最大堆为例进行讲解,如下图:

下图用将堆的索引标记出:

实现

如何实现堆呢?

第一步:堆的构建

#include <iostream>
#include <algorithm>
#include <string>
#include <ctime>
#include <cmath>
#include <cassert>

using namespace std;
//使用模板函数
template<typename Item>
class MaxHeap{

private:
    Item *data; //作为数组的指针
    int count; //表示为数组的索引
    int capacity; //表示堆的容量
   
public:
    //构造函数
    //构造一个空堆
    MaxHeap(int capacity) {
        //动态的开辟一片空间,并将data指向该空间
        data = new Item[capacity + 1];
        count = 0;
        this->capacity = capacity;
    }
   //析构函数,将new的空间释放掉
    ~MaxHeap(){
        delete []data;
    }

    //返回堆的大小
    int size(){
        return count ;
    }
    //判断是否为空堆
    bool is_empty(){
        return count == 0;
    }

};

现在我们就将堆构造完成了,现在我们构建的堆好像没有什么用,我们还需要对进行数据的插入(Shift Up)和取出(Shift Down)操作,下面分别来实现。

第二步:Shift Up和Shift Down

1. Shift Up

首先我们需要了解什么是Shift Up:

就是将堆中插入元素的操作,其逻辑为:从堆后一个节点插入元素,如下图:

插入元素后必须维护堆的定义,所以需要将新插入的元素做比较,其方法是:

将新元素跟它所在节点的上一个节点 (新元素的父节点) 的数比较,如下图中:

53 > 16 需要将两元素位置互换

互换位置后就变成了下图:

然后仍然需要维护堆的定义所以需要将52和它的父节点的元素做比较:

52 > 41,所以将两元素位置互换

就得到下图,但仍然需要维护堆的定义,所以继续比较

最后就变成了下图

这就是整个ShiftUp操作

下面上代码

//向堆中插入元素
int insert(Item item){
    //我们这里的对的根节点从索引为1开始,所以需要capacity+1的空间
    //assert用于判断是否满足capacity+1 > capacity
    assert(capacity+1 > capacity);
    data[count+1] = item; 
    count++;
    ShiftUp(count);
}

这里我将构造函数ShiftUp()写在private中,用户不需要看到我们背后的逻辑

private:
    Item *data; //作为数组的指针
    int count; //表示为数组的索引
    int capacity; //表示堆的容量

    //构造shiftUp
    void ShiftUp(int k){
        while(k>1 && data[k/2] > data[k]){
            swap(data[k/2], data[k]);
            k/=2;
        }
    }

完成了Shift Up,下面我们来完成Shift Down

2. Shift Down

Shift Down是指从堆中将元素取出,其取出操作是:

将堆中的第一个元素取出

然后将堆最后一个元素放到原来取出元素的位置

然后将该元素的左右孩子节点的元素进行比较 (如下图将52和30比较),然后将该元素和左右孩子节点中值大的元素进行位置互换

如下图:

然后在将该元素现在所在的节点的左右孩子节点的元素进行比较

得到如下图:

此时还会判断16 和15两元素的大小

此时ShiftDown就完成了

下面上代码

Item extractMax(){
    assert(count>0);
    //将第一个元素取出
    Item ret = data[1];
   //将最后一个元素放置第一个位置
    swap(data[1], data[count]);
    //将多余的位置消去
    count--;
    ShiftDown(1);

    return ret;
}

仍然将ShiftDown放在private中

private:
    Item *data; //作为数组的指针
    int count; //表示为数组的索引
    int capacity; //表示堆的容量

    //构造shiftUp
    void shiftUp(int k){
        while(k>1 && data[k/2] > data[k]){
            swap(data[k/2], data[k]);
            k/=2;
        }
    }

    void ShiftDown(int k){
        //判断是否存在左孩子
        while(2*k < count){
            int j = 2*k;
            //是否存在右孩子
            if(j+1 < count && data[j+1] > data[j])
                j++;
           //data[j]是data[2*k],data[2*k+1]中的最大值
            if(data[k] > data[j])
                break;
            swap(data[k]), data[j];
        }
    }

源码

这样堆就完成了,下面我们将整个源码给出:

C++实现:


#include <iostream>
#include <algorithm>
#include <string>
#include <ctime>
#include <cmath>
#include <cassert>

using namespace std;
//使用模板函数
template<typename Item>
class MaxHeap{

private:
    Item *data; //作为数组的指针
    int count; //表示为数组的索引
    int capacity; //表示堆的容量

    //构造shiftUp
    void shiftUp(int k){
        while(k>1 && data[k/2] > data[k]){
            swap(data[k/2], data[k]);
            k/=2;
        }
    }

    void ShiftDown(int k){
        //判断是否存在左孩子
        while(2*k < count){
            int j = 2*k;
            //是否存在右孩子
            if(j+1 < count && data[j+1] > data[j])
                j++;
           //data[j]是data[2*k],data[2*k+1]中的最大值
            if(data[k] > data[j])
                break;
            swap(data[k]), data[j];
        }
    }

public:
    //构造函数
    //构造一个空堆
    MaxHeap(int capacity) {
        //动态的开辟一片空间,并将data指向该空间
        data = new Item[capacity + 1];
        count = 0;
        this->capacity = capacity;
    }
   //析构函数,将new的空间释放掉
    ~MaxHeap(){
        delete []data;
    }

    //返回堆的大小
    int size(){
        return count ;
    }
    //判断是否为空堆
    bool is_empty(){
        return count == 0;
    }

    int insert(Item item){
        //我们这里的对的根节点从索引为1开始,所以需要capacity+1的空间
        //assert用于判断是否满足capacity+1 > capacity
        assert(capacity+1 > capacity);
        data[count+1] = item; //向对插入元素
        count++;
        shiftUp(count);
    }

    Item extractMax(){
        assert(count>0);
        //将第一个元素取出
        Item ret = data[1];

        swap(data[1], data[count]);
        count--;
        ShiftDown(1);

        return ret;
    }

};

Golang实现:

数组索引0为堆顶

//最小堆
type heap struct {
	data []int
}

func (this *heap)Insert(x int){
	this.data = append(this.data, x)
	this.shiftUp(len(this.data)-1)
}

func (this *heap)Delete() int {
	oldtop := this.data[0]
	this.data[0] = this.data[len(this.data)-1]
	this.data = this.data[:len(this.data)-1]
	this.shiftDown(1)
	return oldtop
}

//上浮
func (this *heap)shiftUp(i int){
	for len(this.data) > 1 && this.data[i/2] > this.data[i] {
		this.data[i/2], this.data[i] = this.data[i], this.data[i/2]
		i /= 2
	}
}

//下沉
func (this *heap)shiftDown(k int){
	//k用于判断父亲和孩子节点的关系:当前节点为k时,父亲父亲节点为k/2, 左右孩子节点分别为:k*2, k*2+1;
	//这里k为1表示第一个节点,对应数组索引为0, this.data[k-1]

	//判断是否有左孩子
	for k*2 <= len(this.data) {
		j := k*2
		//有右孩子的情况下:比较左右孩子大小
		if j+1 <= len(this.data) && this.data[j-1] > this.data[j]  {
			j++
		}
		//当父亲节点小于相应孩子节点时,直接退出循环
		if this.data[k-1] < this.data[j-1]{
			break
		}
		this.data[k-1], this.data[j-1] = this.data[j-1], this.data[k-1]
		//将更新后的节点作为遍历节点
		k = j
	}
}

func (this *heap)GetTop() int {
	return this.data[0]
}

func (this *heap)Len()int {
	return len(this.data)
}

func (this *heap)IsEmpty() bool {
	return len(this.data) == 0
}

测试一下:

func main() {

	//堆排序
	arr := []int{2,5,17,1,5,10,23,21,4,6,7,8,44}
	minheap := heap{}
	for i := 0; i < len(arr); i++ {
		minheap.insert(arr[i])
	}
	fmt.Println(minheap.data, minheap.Len())
	for i := 0; i < minheap.Len(); i++ {
		fmt.Println(minheap.delete())
	}
}

打印输出:

[1 2 4 5 5 7 23 21 17 6 10 8 44] 13
1
2
4
5
5
6
7

数组索引1为堆顶


type minHeap struct {
	heap []int
}

func (this *minHeap)shiftUP(i int ){
	//上浮
	for i/2 > 0 && this.heap[i] < this.heap[i/2] {
		this.heap[i], this.heap[i/2] = this.heap[i/2], this.heap[i]
		i = i/2
	}
}

func (this *minHeap)shiftDown(i int ){
	//左孩子为前提
	for 2*i <= len(this.heap) {
		j := 2*i
		//右孩子
		if j+1 <= len(this.heap) && this.heap[j] > this.heap[j+1] {
			j++
		}
		if this.heap[i] < this.heap[j] {
			break
		}
		this.heap[i], this.heap[j] = this.heap[j], this.heap[i]
		i = j
	}
}

func (this *minHeap)insert(val int ){
	this.heap = append(this.heap, val)
	this.shiftUP(len(this.heap)-1)
}

func (this *minHeap)delete()int {
	top := this.heap[1]
	this.heap[1] = this.heap[len(this.heap)-1]
	this.heap = this.heap[:len(this.heap)-1]
	this.shiftDown(1)
	return top
}

func (this *minHeap)top()int{
	return this.heap[1]
}

func createMinHeap() minHeap{
	//索引从1开始
	return minHeap{make([]int, 1)}
}

(图片来源:慕课网bobo老师)