八大排序算法--堆排序

序言

对于堆排序的学习,实际上就是对于 这一种数据结构的学习,把堆学会了,堆排序自然也就学会了。

1、为什么使用堆这种数据结构

优先队列是一种很常用的队列,比如在游戏中,游戏角色在自动模式下,如何在周围一堆小怪中自动攻击某一个小怪?可能是判断这一群小怪哪一个比较近,就攻击哪一个,或者哪一个等级低,就攻击哪一个。总之,是会动态的计算周围小怪的优先级,然后攻击优先级最高的那一个小怪。

堆 这一种数据结构,就是典型的动态优先队列。

另外,如果要从1000000个元素中选出排序前100的元素,如何选出来呢?从N个元素中取出前M个元素?如果用前面介绍到的算法,只能先排序(时间复杂度为NlogN),然后取出前一百元素,如果使用堆排序,那么时间复杂度将降为NlogM. 时间效率将极大提升。

2、堆的定义以及堆的数据模型图

堆的典型数据模型就是一个二叉堆, 如下图,是一个最大二叉堆:

在这里插入图片描述
最大二叉堆的定义:

  • 1、最顶端的肯定是最大的值
  • 2、父节点的值总是大于子节点的值。
  • 3、是一个完全二叉树,它的层高相差不超过1,叶子结点总是从左向右依次填满。

相应的,如果根节点是最小值,就是最小二叉堆。只要满足上面三个条件即可,在上图中,13的层级比17要高一层,这并没有违反规则,是可以的。

3、堆的基本存储

我们使用堆的规则,将数据存储在数组中。

在这里插入图片描述

如上图,是一个堆的示例,在数组中,我们从角标为1的位置开始存放数据,角标0我们并不使用。然后从上往下编号, 最大的数排第一个,然后往下一层从左到右依次排序,我们可以发现,如果父节点的位置是第i个,那么左节点就会是第2i个,右节点是第2i+1个。而子节点如果是第i个,则父节点就是第 i/2 个(如果有父节点)。这个规则很重要,下面写代码将用到。

3.1 数据的添加

我们明白了这个规则,就可以进行数据的插入了。在堆中添加一个元素,相当于在数组的末尾添加了一个元素,这个元素的位置暂时是最后一个,然后判断是否满足最大堆的定义,如果它比父节点要大,则需要把这个数和父节点交换。交换以后,如果在当前位置还要比父节点大,则继续向上交换,直到合适的位置,所以我们需要定义一个向上移动的函数shiftUp();

public void insert(Item item) {
	if(count == capcity) {
		return;//已经填满了,无法再填入数据了
	}
	data[count+1] = item;
	count ++;//记录总共有多少个数据
	ShiftUp(count);//执行向上移动
}

/**
 * 将k这个位置的元素 调整到堆的合适位置,
 * 
 * 最大堆的特点,父节点大于子节点
 * 完全二叉树特点,总是从左到右,依次填满二叉树的子节点
 */
private void ShiftUp(int k) {
	//用数组存储完全二叉堆,如果根节点的序列化声明为1,则左节点的序号都是父节点的二倍,看图理解,右节点是父节点的二倍+1
	//父节点如果小于子节点,就要交换位置, 注意边界问题,所以k>1
	while(k > 1 && data[k/2].compareTo(data[k]) < 0) {
		swap( k, k/2);
		k /= 2;
	}
}

/**
 * 交换数组中两个值的位置
 */
private void swap(int i, int j) {
	Item temp = data[i];
	data[i] = data[j];
	data[j] = temp;
}

3.2 最大数据的取出(数据的删除)

我们刚刚说了,这是一个优先级队列,当需要取出优先级最高的数时,即需要取出二叉堆最顶端的数时,我们通常的操作就是将最顶端(脚标为1的数)和数组中最后一个数交换位置,然后移除左后一个元素即可。但是,此时,就不满足最顶端的数时最大数这个规则了,因此此时需要把顶端这个数向下移动(shiftDown), 它需要和左右两个孩子比较,和最大的孩子进行交换,如果交换位置后,它的子孩子还要大于它,则继续和左右孩子中的最大值进行交换,直到移动到合适位置。

/**
 * 取出最大元素
 */
public Item extractMax() {
	if(count == 0) {
		return null;
	}
	Item item = data[1];//堆中第一个元素就是最大值
	swap(1, count);//将最后一个元素放到第一个位置
	count --;//总的数量减一
	shiftDown(1);//重新调整整个堆,成为一个新的最大二叉堆
	return item;
}


/**
 * 将元素向下移动,直到找到合适的位置
 */
private void shiftDown(int i) {
	while(i*2 <= count) {//说明有左孩子
		int j = i*2;//左孩子的脚标位置
		if(j+1 <= count && data[j+1].compareTo(data[j]) > 0) {
			//如果有右孩子,并且,右孩子比左孩子的值大
			j = j+1;
		}
		if(data[i].compareTo(data[j]) > 0) {
			break;//如果父节点大于 最大的子节点,则已经是新的最大二叉堆
		}
		swap(i, j);//否则,则交换父节点和最大子节点的位置,继续向下比较
		i = j;//更新这个值的最新位置
	}
	
}

如果我们循环调用此函数,依次取出最大值,则就完成了优先级从最高到最低的排序。

3.3 堆化(Heapify)

如果我们传入一个整个数组,数组中有一系列数据,那么我们就可以将这个数组形成一个堆的结构,这个过程称为堆化(Heapify)。
传入整个数组Heapify的算法复杂度比直接一个一个插入数据的效率更高

将n个元素逐个插入到一个空堆中,算法复杂度是O(nlogn)
heapify的过程,算法复杂度为O(n),即在一个已知数组上去进行优先级排序,会更快。 具体的证明可以网上找

就算不证明,想一下也会快一点,用heapify,每次n/2,直接减少一半的数据,所以快很多

在这里插入图片描述

通过观察可以得到,count/2得到的节点为最后一个父节点(非叶子节点), 然后它的角标依次减减, 就得到其他的父节点,依次调整每个父节点的子树为一个完全二叉堆,最后就得到一颗新的完全二叉堆树。

public MaxHeap(Item[] arr) {
	this.capcity = arr.length;
	//warnningValue = (n * 10) / 9;
	data = (Item[]) new Comparable[capcity + 1];
	System.arraycopy(arr, 0, data, 1, arr.length);
	count = arr.length;
	
	for(int i = count/2; i >= 1; i --) {
		shiftDown(i);
	}
}

3.4 时间复杂度比较

使用堆排序和使用普通数组的时间复杂度比较

验证结果输出

The max heap size is: 12
Data in the max heap(注意这不是排序,只是数据在堆中的位置): 
84 65 65 64 54 14 16 10 57 27 25 9 

           84          
      /          \     
     65          65    
   /    \      /    \  
  64    54    14    16 
 / \   / \   / \   / \ 
10 57 27 25 9          
max=84
The max heap size is: 11
Data in the max heap(注意这不是排序,只是数据在堆中的位置): 
65 64 65 57 54 14 16 10 9 27 25 

           65          
      /          \     
     64          65    
   /    \      /    \  
  57    54    14    16 
 / \   / \   / \   / \ 
10  9 27 25            
排序结果: 65  65  64  57  54  27  25  16  14  10  9       

完整代码

功能验证可以使用PrintMaxHeap类,它会在控制台打印输出排序完成后的数组的数据,以及整个堆的结构, 完整功能及测试代码如下:

最大堆 MaxHeap:

import java.util.Arrays;

/**
 * 最大堆, 此处使用了泛型,
 * @author admin
 *
 */
public class MaxHeap<Item extends Comparable> {
	protected Item[] data;
	protected int count;
	private int capcity;
	private int warnningValue;
	private byte[] lock = new byte[0];
	
	public MaxHeap(int capcity){
		
		this.capcity = capcity;
		warnningValue = (capcity * 10) / 9;
		//java不允许直接创建泛型数组,否则编译报错,所以通过强转来通过编译
		//第0个位置不存储,从第一个位置开始存储,所以空一个位置
		data= (Item[]) new Comparable[capcity+1];
		count = 0;
		
	}
	
	public MaxHeap(Item[] arr) {
		this.capcity = arr.length;
//		warnningValue = (n * 10) / 9;
		data = (Item[]) new Comparable[capcity + 1];
		System.arraycopy(arr, 0, data, 1, arr.length);
		count = arr.length;
		
		for(int i = count/2; i >= 1; i --) {
			shiftDown(i);
		}
	}
	
	public int size() {
		return count;
	}
	
	public boolean isEmpty() {
		return count == 0;
	}
	
	public void destory() {
		data = null;
		count = 0;
	}
	

	//此方法可以学习时可以忽略,是insert方法的改良版, 参考了ArrayList插入数据的扩容功能。
	public void insert2(Item item) {
		//如果数量大于警戒值了,就是快要满了,此时扩容,考虑到多线程,没有使用 == capcity来判断
		if(count >= warnningValue) {
			synchronized (lock) {
				if(count >= warnningValue) {
					capcity = capcity * 2;
					warnningValue = (capcity * 10) / 9;
					//第0个位置不存储,从第一个位置开始存储,所以空一个位置
					Item[] temp = (Item[]) new Comparable[capcity+1];
					//方法二: System.arraycopy(src, srcPos, dest, destPos, length)
			    	//src: 源数组
			    	//srcPos: 从源数组复制数据的起始位置
			    	//dest: 目标数组
			    	//destPos: 复制到目标数组的起始位置
					//length:数组的元素个数
					System.arraycopy(data, 0, temp, 0, data.length);
					data = temp;
				}
			}
		}
		data[count+1] = item;
		count ++;
		ShiftUp(count);
	}
	
	public void insert(Item item) {
		if(count == capcity) {
			return;//已经填满了,无法再填入数据了
		}
		data[count+1] = item;
		count ++;
		ShiftUp(count);
	}
	
	/**
	 * 取出最大元素
	 */
	public Item extractMax() {
		if(count == 0) {
			return null;
		}
		Item item = data[1];//堆中第一个元素就是最大值
		swap(1, count);//将最后一个元素放到第一个位置
		count --;//总的数量减一
		shiftDown(1);//重新调整整个堆,成为一个新的最大二叉堆
		return item;
	}
	
	/**
	 * 将元素向下移动,直到找到合适的位置
	 */
	private void shiftDown(int i) {
		while(i*2 <= count) {//说明有左孩子
			int j = i*2;//左孩子的脚标位置
			if(j+1 <= count && data[j+1].compareTo(data[j]) > 0) {
				//如果有右孩子,并且,右孩子比左孩子的值大
				j = j+1;
			}
			if(data[i].compareTo(data[j]) > 0) {
				break;//如果父节点大于 最大的子节点,则已经是新的最大二叉堆
			}
			swap(i, j);//否则,则交换父节点和最大子节点的位置,继续向下比较
			i = j;//更新这个值的最新位置
		}
		
	}

	/**
	 * 将k这个位置的元素 调整到堆的合适位置,
	 * 
	 * 最大堆的特点,父节点大于子节点
	 * 完全二叉树特点,总是从左到右,依次填满二叉树的子节点
	 */
	private void ShiftUp(int k) {
		//用数组存储完全二叉堆,如果根节点的序列化声明为1,则左节点的序号都是父节点的二倍,看图理解,右节点是父节点的二倍+1
		//父节点如果小于子节点,就要交换位置, 注意边界问题,所以k>1
		while(k > 1 && data[k/2].compareTo(data[k]) < 0) {
			swap( k, k/2);
			k /= 2;
		}
	}
	
	/**
	 * 交换数组中两个值的位置
	 */
	private void swap(int i, int j) {
		Item temp = data[i];
		data[i] = data[j];
		data[j] = temp;
	}

}

功能测试类(测试类只关注功能测试即可,打印堆的方法不用去关注,不是本文重点):

public class PrintMaxHeap extends MaxHeap<Comparable<Integer>> {

	public PrintMaxHeap(int capacity) {
		super(capacity);
	}
	
	public PrintMaxHeap(Comparable[] arr) {
		super(arr);
	}
	
	// 测试 PrintableMaxHeap
    public static void main(String[] args) {
    	testMaxHeap1() ;
    	//testMaxHeap2() ;
    }
    
    public static void testMaxHeap1() {

    	PrintMaxHeap maxHeap = new PrintMaxHeap(100);
        int N = 12; // 堆中元素个数
        int M = 90; // 堆中元素取值范围[0, M)
        for( int i = 0 ; i < N ; i ++ )
            maxHeap.insert( new Integer((int)(Math.random() * M)) );
        maxHeap.treePrint();
        Comparable i = maxHeap.extractMax();
        System.out.println("max="+i);
        maxHeap.treePrint();
    }
    public static void testMaxHeap2() {

    	PrintMaxHeap maxHeap = new PrintMaxHeap(randomArray(12));
        maxHeap.treePrint();
        Comparable i = maxHeap.extractMax();
        System.out.println("max="+i);
        maxHeap.treePrint();
    }

	
	// 以树状打印整个堆结构
    public void treePrint(){

        if( size() >= 100 ){
            System.out.println("This print function can only work for less than 100 integer");
            return;
        }

        System.out.println("The max heap size is: " + size());
        System.out.println("Data in the max heap: ");
        for( int i = 1 ; i <= size() ; i ++ ){
            // 我们的print函数要求堆中的所有整数在[0, 100)的范围内
            assert (Integer)data[i] >= 0 && (Integer)data[i] < 100;
            System.out.print(data[i] + " ");
        }
        System.out.println();
        System.out.println();

        int n = size();
        int maxLevel = 0;
        int numberPerLevel = 1;
        while( n > 0 ){
            maxLevel += 1;
            n -= numberPerLevel;
            numberPerLevel *= 2;
        }

        int maxLevelNumber = (int)Math.pow(2, maxLevel-1);
        int curTreeMaxLevelNumber = maxLevelNumber;
        int index = 1;
        for( int level = 0 ; level < maxLevel ; level ++ ){

            String line1 = new String(new char[maxLevelNumber*3-1]).replace('\0', ' ');

            int curLevelNumber = Math.min(count-(int)Math.pow(2,level)+1,(int)Math.pow(2,level));
            boolean isLeft = true;
            for( int indexCurLevel = 0 ; indexCurLevel < curLevelNumber ; index ++ , indexCurLevel ++ ){
                line1 = putNumberInLine( (Integer)data[index] , line1 , indexCurLevel , curTreeMaxLevelNumber*3-1 , isLeft );
                isLeft = !isLeft;
            }
            System.out.println(line1);

            if( level == maxLevel - 1 )
                break;

            String line2 = new String(new char[maxLevelNumber*3-1]).replace('\0', ' ');
            for( int indexCurLevel = 0 ; indexCurLevel < curLevelNumber ; indexCurLevel ++ )
                line2 = putBranchInLine( line2 , indexCurLevel , curTreeMaxLevelNumber*3-1 );
            System.out.println(line2);

            curTreeMaxLevelNumber /= 2;
        }
    }
    
    private String putNumberInLine( Integer num, String line, int indexCurLevel, int curTreeWidth, boolean isLeft){

        int subTreeWidth = (curTreeWidth - 1) / 2;
        int offset = indexCurLevel * (curTreeWidth+1) + subTreeWidth;
        assert offset + 1 < line.length();
        if( num >= 10 )
            line = line.substring(0, offset+0) + num.toString()
                    + line.substring(offset+2);
        else{
            if( isLeft)
                line = line.substring(0, offset+0) + num.toString()
                        + line.substring(offset+1);
            else
                line = line.substring(0, offset+1) + num.toString()
                        + line.substring(offset+2);
        }
        return line;
    }

    private String putBranchInLine( String line, int indexCurLevel, int curTreeWidth){

        int subTreeWidth = (curTreeWidth - 1) / 2;
        int subSubTreeWidth = (subTreeWidth - 1) / 2;
        int offsetLeft = indexCurLevel * (curTreeWidth+1) + subSubTreeWidth;
        assert offsetLeft + 1 < line.length();
        int offsetRight = indexCurLevel * (curTreeWidth+1) + subTreeWidth + 1 + subSubTreeWidth;
        assert offsetRight < line.length();

        line = line.substring(0, offsetLeft+1) + "/" + line.substring(offsetLeft+2);
        line = line.substring(0, offsetRight) + "\\" + line.substring(offsetRight+1);

        return line;
    }
    
	public static Integer[] randomArray(int length) {
		Integer[] arr = new Integer[length];
		Random random = new Random();
		for(int i=0; i<length; i++) {
			arr[i] = random.nextInt(100);
		}
		//自动生成随机数组,先进行一次原始数据打印
		System.out.println(Arrays.toString(arr));
		return arr;
	}

}

http://www.niftyadmin.cn/n/1541348.html

相关文章

字符串的HashCode可能相同

字符串的HashCode可能相同 学习了&#xff1a;http://blog.csdn.net/hl_java/article/details/71511815 转载于:https://www.cnblogs.com/stono/p/8165946.html

八大排序算法--堆排序的优化(原地堆排序、索引堆)

优化一----原地堆排序 前一篇博客我们都需要开辟一个新的数组 来进行堆的存放&#xff0c;下面将讲述原地堆排序。 在前面讲到&#xff0c;堆是存放在一个数组中的&#xff0c;如果我们不想开辟新空间&#xff0c;在原来数组上依然可以实现堆排序&#xff0c;不过索引位置就要…

Shell命令——文件目录

Linux只有一个文件系统树&#xff0c;不同的硬件设备可以挂载在不同目录下。 文件或目录有两种表示方式&#xff1a;  - 绝对路径&#xff1a;从根目录”/”开始  - 相对路径&#xff1a;从工作目录开始&#xff0c;使用”..”指向父目录&#xff0c;”.”指向当前目录。在大…

八大排序算法--基数排序

基数排序定义 基数排序&#xff08;radix sort&#xff09;是一种桶排序(bucket sort), 先把个位相同的数字放到同一个桶里&#xff0c;然后完成对个位数字大小的排序&#xff0c;然后再在前面的基础上对十位 上的数字进行排序&#xff0c;然后依次进行到最高位&#xff0c; 最…

表的连接

一、内连接&#xff08;等价连接&#xff09;&#xff1a;从结果集中删除不满足连接条件的&#xff08;数据&#xff09;元祖。 SELECT * FROM EMP E,DEPT D WHERE E.DEPTNOD.DEPTNO 二、外链接&#xff1a;可以显示特定表中的全部信息 1、左外连接&#xff0c;显示左表的全部和…

浏览器播放rtmp流

我是利用flash插件实现的&#xff0c;需要以下几个文件&#xff1a; flowplayer-3.2.8.min.js flowplayer-3.2.18.swf flowplayer.rtmp-3.2.8.swf flowplayer.controls-3.2.16.swf 下载地址如下&#xff1a; 链接: https://pan.baidu.com/s/1qZsDeTQ 密码: k5ak HTML代码如下&a…

算法与数据结构--并查集

序 两个点是否连接&#xff0c; 在大型网络中&#xff0c;肉眼很难观察出来。 如何判断一个巨大网络中两个点是否连接&#xff0c;这个网络不一定是互联网&#xff0c;也可能是微信中的人际关系网&#xff0c;两个人是否是好友&#xff0c;是否有连接&#xff1f;巨大数据库中…

站立会议-----04

①&#xff1a;昨天我做了 整个项目的整体测试初步完成&#xff0c;和隐藏功能的继续完善和更改收工。 ②&#xff1a;今天我要做 登录页面、注册的链接添加、提示信息的显示&#xff0c;加入样式后功能的实现测试。 ③&#xff1a;暂时没有遇到困难。转载于:https://www.cnblo…