python–堆(heap)与堆排序

  • Post author:
  • Post category:python


什么是堆

堆是一种完全二叉树,有最大堆和最小堆两种

1.最大堆:对于每个非叶子节点V, V的值都比它的两个孩子大,称为 最大堆特性(heap order property)最大堆里的根总是存储最大值, 最小的值存储在叶节点

2.最小堆:和最大堆相反,每个非叶子节点V,V的两个孩子的值都比它大

这里写图片描述

关于堆的操作


堆提供了很有限的几个操作:

1.插入新的值。插入比较麻烦的就是需要维持堆的特性。需要sift-up操作,具体在代码中实现

2.获取并移除根节点的值。每次我们都可以获取最大值或最小值。这个时候需要把底层最右边的节点值替换到root节点之后执行sift-down操作

堆的表示

这里用数组实现堆

这里写图片描述

仔细观察下,因为完全二叉树的特性,树不会有间隙。对于数组里的一个下标

i

,我们可以得到它的父亲和孩子的节点对应的下标:

parent = int( (i-1) / 2 ) #取整

left = 2 * i +1

right = 2 * i + 2

超出下标表示没有对应的孩子节点

代码实现

关于add()方法的实现原理

这里写图片描述

关于siftup()递归操作的原理图

这里写图片描述

关于extract()方法的原理图

这里写图片描述


# -*- coding:utf-8 -*-

####################################
    # heap 实现
####################################

class Array(object):
    def __init__(self,size=32):
        self._size = size
        self._items = [None] * size

    def __getitem__(self,index):
        return self._items[index]

    def __setitem__(self,index,value):
        self._items[index] = value

    def __len__(self):
        return self._size

    def clear(self,value=None):
        for i in range(self._items):
            self._items[i] = value

    def __iter__(self):
        for item in self._items:
            yield item


'''
    初始化堆结构
'''
class MaxHeap(object):
    def __init__(self,maxsize=None):
        self.maxsize = maxsize
        self._elements = Array(maxsize)
        self._count = 0

    def __len__(self):
        return self._count

    def add(self,value):
        if self._count >= self.maxsize:
            raise Exception('full')
        #将插入的值value给数组最后一值
        self._elements[self._count] = value
        #堆的容量加一
        self._count += 1
        self._siftup(self._count-1)

    def _siftup(self,ndx):      #递归交换直到满足最大堆特性
        if ndx > 0:
            #获取添加节点的父节点的下标值
            parent = int((ndx-1)/2)
            #如果添加节点的值大于父节点的值
            if self._elements[ndx] > self._elements[parent]:
                self._elements[ndx],self._elements[parent] = self._elements[parent],self._elements[ndx]
                self._siftup(parent)




    def extract(self):
        if self._count <= 0:
            raise Exception('empty')
        #获取根节点的值
        value = self._elements[0]
        #将堆最后一个叶子节点作为root节点
        self._elements[0] = self._elements[self._count]
        self._siftdown(0)
        return value

    def _siftdown(self,ndx):
        #获取左右孩子节点的下标
        left = 2 * ndx + 1
        right = 2 * ndx + 2
        #默认ndx为最大
        largest = ndx

        if(left < self._count and   #有左孩子
            self._elements[left] >= self._elements[largest] and
            self._elements[left] >= self._elements[right]):     #左孩子 > 右孩子
            largest = left

        elif right < self._count and self._elements[right] >= self._elements[largest]:
            largest = right

        if largest != ndx:
            self._elements[ndx],self._elements[largest] = self._elements[largest],self._elements[ndx]
            self._siftdown(largest)

def test_max_heap():
    import random
    n = 5
    h = MaxHeap(n)
    for i in range(n):
        h.add(i)
    for i in reversed(range(n)):
        assert i == h.extract()



'''
    实现堆排序
    上面我们实现了最大堆,每次我们都能extract一个最大的元素了,于是一个倒序排序函数就能很容易写出来了:
'''
def heapsort_reverse(array):
    length = len(array)
    maxheap = MaxHeap(length)
    for i in array:
        maxheap.add(i)
    res = []
    for i in range(length):
        res.append(maxheap.extract())
    return res


def test_heapsort_reverse():
    import random
    l = list(range(10))
    random.shuffle(1)
    assert heapsort_reverse(l) == sorted(l,reverse=True)






关于 python 里的 heapq

python 其实自带了

heapq

模块,用来实现堆的相关操作,原理是类似的,可以阅读相关文档

练习

1.尝试实现一个最小堆

2.我们实现的堆排序是inplace的吗,如果不是,你能改成inplace的吗?

3.这里我们用最大堆实现了一个heapsort_reverse函数,请你实现一个正序排序的函数.似乎不止一种方式



版权声明:本文为qq_39469688原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。