堆排序与取topK java实现

news/2024/5/19 5:47:31 标签: 排序算法, 堆排序, topk

1.堆排序思路

最近趁着有点时间,稍微复习了一下数据结构相关内容,温习了一下堆排序,做一下记录。

首先我们复习一下什么是堆:
堆是具有以下性质的完全二叉树:每个结点的值都大于或等于其左右孩子结点的值,称为大顶堆;或者每个结点的值都小于或等于其左右孩子结点的值,称为小顶堆。

堆排序的基本思想如下:
将待排序序列构造成一个大顶堆,此时,整个序列的最大值就是堆顶的根节点。将其与末尾元素进行交换,此时末尾就为最大值。然后将剩余n-1个元素重新构造成一个堆,这样会得到n个元素的次小值。如此反复执行,便能得到一个有序序列了。

更具体的过程与图示,见参考文献1,不再重新画图。

2.java实现

下面我们用java来实现一下堆排序的过程。

public class HeapSort {

    public static void swap(int[] arr, int i, int j) {
        int tmp = arr[i];
        arr[i] = arr[j];
        arr[j] = tmp;
    }

    public static void adjust(int[] arr, int start, int end) {
        // 左右子节点
        int left = start * 2 + 1;
        int right = start * 2 + 2;
        int largest = start;
        if (left <= end && arr[left] > arr[largest]) largest = left;
        if (right <= end && arr[right] > arr[largest]) largest = right;

        // 交换数据,并继续调整
        if (largest!= start) {
            swap(arr, start, largest);
            adjust(arr, largest, end);
        }
    }

    // 从第一个非叶子结点开始调整,注意顺序是从下往上
    public static void buildHeap(int[] arr) {
        for(int i = arr.length / 2 - 1; i >= 0; i--) {
            adjust(arr, i, arr.length - 1);
        }
    }

    // 先构建堆,此时堆顶为最大元素,交换到此时数组的最后一位。
    public static void heapSort(int[] arr) {
        buildHeap(arr);
        for(int i = arr.length - 1; i > 0; i--) {
            swap(arr, 0, i);
            adjust(arr, 0, i - 1);
        }
    }

    public static void main(String[] args) {
        int[] arr = {1, 3, 5, 6, 2, 4, 6, 9, 8, 10, 7};
        heapSort(arr);
        for(int i = 0; i < arr.length; i++) {
            System.out.print(arr[i] + " ");
        }
    }
}

关键的步骤以及作用,都已经在代码中进行了注释,再结合参考文献1就可以容易理解。

3.求topK

求一个无序序列的topK,是个经典问题。这个经典问题的经典解法,就包括堆排序

    public static void findTopK(int[] arr, int k) {
        PriorityQueue<Integer> pq = new PriorityQueue();
        for (int i = 0; i < k; i++) {
            pq.offer(arr[i]);
        }
        for (int i = k; i < arr.length; i++) {
            int current = pq.peek();
            if (arr[i] > current) {
                pq.poll();
                pq.offer(arr[i]);
            }
        }

        Integer[] ret = pq.toArray(new Integer[k]);
        Arrays.sort(ret, Collections.reverseOrder());

        for(int i = 0; i < k; i++) System.out.print(ret[i] + " ");
    }
    public static void findLastK(int[] arr, int k) {
        PriorityQueue<Integer> pq = new PriorityQueue<Integer>((Integer o1, Integer o2) -> o2 - o1);
        for (int i = 0; i < k; i++) {
            pq.offer(arr[i]);
        }
        for (int i = k; i < arr.length; i++) {
            int current = pq.peek();
            if (arr[i] < current) {
                pq.poll();
                pq.offer(arr[i]);
            }
        }
        Integer[] ret = pq.toArray(new Integer[k]);
        Arrays.sort(ret);
        for(int i = 0; i < k; i++) System.out.print(ret[i] + " ");
    }
    public static void main(String[] args) {
        int[] arr = {1, 3, 5, 10, 8, 6, 7, 9, 2, 4};
        int k = 3;
        findTopK(arr, k);
        System.out.println();
        findLastK(arr, k);
    }

上面的代码,分别找到最大的三个数与最小的三个数。
PriorityQueue 是java中的优先队列,默认就是小顶堆实现。求top3最大值时候,用小顶堆即可。如果求top3最小值,则使用大顶堆。

上面代码运行最后的输出:

10 9 8 
1 2 3 

参考文献

1.https://www.cnblogs.com/chengxiao/p/6129630.html


http://www.niftyadmin.cn/n/328269.html

相关文章

Redis持久化-Redis主从-Redis哨兵-Redis分片集群

主要内容 Redis持久化Redis主从Redis哨兵Redis分片集群 Redis持久化 Redis有两种持久化的方案: RDB持久化AOF持久化 1. RDB持久化 RDB全称Redis Database Backup file&#xff08;Redis数据备份文件&#xff09;&#xff0c;也被叫做Redis数据快照。简单来说就是把内存中的所…

看懂二维码识别OCR:从算法到API 接入代码

引言 二维码识别OCR&#xff08;Optical Character Recognition&#xff09;是结合了图像处理和OCR技术&#xff0c;以识别和提取二维码中的信息的技术&#xff0c;二维码识别OCR 可以实现对图像中的二维码进行自动检测和解码&#xff0c;并将其内容提取为可编辑的文本&#x…

在WINDOWS下使用命令行编译打包APACHE-ATLAS-2.1.0,报错:无法下载win32-x64-72_binding.node文件

错误内容 [INFO] --- frontend-maven-plugin:1.4:npm (npm install) atlas-dashboardv2 --- [INFO] Running npm install in D:\02-▒▒▒▒▒ռ▒\06-▒▒▒▒ռ▒\03-github\atlas-2.1.0-rc3\dashboardv2\target [INFO] [INFO] > node-sass4.13.1 install D:\02-工作空间…

详细讲解如何用爬虫工具批量采集阿里巴巴商品数据

阿里巴巴是全球最大的B2B电子商务平台之一&#xff0c;它提供了海量的商品信息&#xff0c;为采购商和供应商间牵线搭桥。然而&#xff0c;要想在如此庞大的商品库中找到适合自己的商品&#xff0c;需要耗费大量的时间和精力。为了提高工作效率&#xff0c;我们可以使用爬虫工具…

全网火爆,性能测试从0到1分析需求到实战详解,冲出高级测试岗...

目录&#xff1a;导读 前言一、Python编程入门到精通二、接口自动化项目实战三、Web自动化项目实战四、App自动化项目实战五、一线大厂简历六、测试开发DevOps体系七、常用自动化测试工具八、JMeter性能测试九、总结&#xff08;尾部小惊喜&#xff09; 前言 1、制定测试目的 …

一百一十三、DBeaver——从hive同步数据到clickhouse

目标&#xff1a;把hive的DM层结果数据导出到clickhouse数据库&#xff0c;试了kettle、sqoop等多种方法都报错&#xff0c;尤其是kettle&#xff0c;搞了大半天发现还是不行。结果目前就只能用DBeaver同步数据。 准备工作&#xff1a;hive和clickhouse中都建好表 第一步&…

Linux多路转接之poll

文章目录 一、poll的认识二、编写poll方案服务器三、poll方案多路转接的总结 一、poll的认识 多路转接技术是在不断更新进步的&#xff0c;一开始多路转接采用的是select方案&#xff0c;但是select方案存在的缺点比较多&#xff0c;所以在此基础上改进&#xff0c;产生了poll…

Docker入门(一)安装

一:安装Docker 1:前期准备 配置主机名: hostnamectl set-hostname xxx && bash``` 关闭防火墙 systemctl stop firewalld && systemctl disable firewalld 关闭selinux setenforce 0sed -i s/SELINUX=enforcing/SELINUX=disabled/g /etc/selinux/config 注…