堆的应用-----Top k 问题

目录

前言

Topk问题

1.问题描述

2.解决方法

3.代码实现(C/C++) 


前言

在人工智能算法岗位的面试中,TopK是问得最多的几个问题之一:

到底有几种方法?

这些方案里蕴含的优化思路究竟是怎么样的?

为啥TopK这么受欢迎呢?究其原因,还是因为它不仅在AI领域广泛应用,比如max pooling,mAP计算等;还涵盖了算法专业的很多必备知识,比如快速排序,二分查找,分治减治,大小顶堆等;一些适当的变换,还可以考察应聘者的思维灵活度。

下面的文章转自架构师之路,是笔者见过此类文章中总结的最透彻的一篇,为了行文流畅,文章有增删。

        前段时间我们学习过了数据结构堆以及堆排序算法,堆是一种完全二叉树,那今天我们学习堆的应用,解决topk问题,下面就一起来看看吧。

(相关链接:数据结构-----堆(完全二叉树)-CSDN博客)

Topk问题

1.问题描述

从arr[1, n]这n个数中,找出最大的k个数,这就是经典的TopK问题。

看上去是不是非常直白明了呢?那确实是,但是怎么去解决这个问题?当然我们会想到排序去处理,把这个数组进行排序,然后直接就可以找到了。但是排序的话会把一些不必要的数进行排序处理,也就是说时间复杂度会比较大,但是如果我们单单对前k个大的数字进行单独处理,那效果是不是更好呢?下面我们就看一看堆是怎么实现的。

2.解决方法

我们获取到当前的数组的时候,然后就创建一个大堆,如图所示,其特点就是上面的元素比下面的元素要大。创建好大堆之后,我们就可以进行后继处理。当前大堆最大的元素就是在第一个位置,我们把第一个位置(最大元素),与最后一个位置的元素进行位置交换,然后把最后一个位置的元素踢出当前的堆,在前面n-1个元素里面再找最大值即可,依次重复以上的操作,执行k次就完成了问题的解决。

3.代码实现(C/C++) 

#include<stdio.h>
#include<stdlib.h>

//交换数字
void swap(int* a, int* b) {
	int t = *a;
	*a = *b;
	*b = t;
}

//向下调整
void adjust_down(int* arr, int par, int n) {
	int child = par * 2 + 1;
	while (child < n) {
		if (arr[child] < arr[child + 1] && child + 1 < n)
			child++;
		if (arr[par] < arr[child]) {
			swap(&arr[par], &arr[child]);
			par = child;
			child = par * 2 + 1;
		}
		else
			break;
	}
}

//函数接口
void Top_k(int* arr, int n,int k) {
	//先创建这个堆
	for (int i = (n - 1) / 2; i >= 0; i--) {
		adjust_down(arr, i, n);
	}
	//然后就是获取当前堆中的最大值
	int end = n - 1;
	int count = 0;
	while (count < k) {
		//当前最大值下标为0,把最大值的数与最后一个数进行交换
		swap(&arr[end], &arr[0]);
		//end--,把最大值踢出当前堆,然后从剩下的n-1个数字的堆继续找最大值
		adjust_down(arr, 0, end);
		end--;
		count++;
	}
	printf("前%d大的数是:\n", k);
	for (int i = n - 1; i > n - 1 - count; i--) {
		printf("%d ", arr[i]);
	}
}

int main() {
	int arr[] = { 5,1,4,7,8,9,3,4,5,6,7,10,55 };
	int k = 3;
	Top_k(arr, sizeof(arr) / sizeof(int), k);
}

以上就是本期的全部内容了,我们下次见!

分享一张壁纸:


http://www.niftyadmin.cn/n/5173745.html

相关文章

「Verilog学习笔记」4bit超前进位加法器电路

专栏前言 本专栏的内容主要是记录本人学习Verilog过程中的一些知识点&#xff0c;刷题网站用的是牛客网 分析 timescale 1ns/1nsmodule lca_4(input [3:0] A_in ,input [3:0] B_in ,input C_1 ,output wire CO ,output wire [3:0] …

深入理解Java中的OutOfMemoryError(OOM)异常

导言&#xff1a; 在Java开发中&#xff0c;我们经常会遇到程序抛出OutOfMemoryError异常的情况&#xff0c;这意味着程序在运行时无法继续分配所需的内存。这篇博客将深入探讨Java中的OOM异常&#xff0c;包括异常的种类、常见的引起OOM的原因以及如何诊断和处理这些问题。 1…

OpenWRT浅尝 / 基于RAVPower-WD009便携路由文件宝的旁路网关配置

目录 前言需求分析手头的设备家庭网络拓扑图旁路网关配置OpenWRT固件选择OpenWRT固件刷入旁路网关配置流程 旁路网关的使用前置工作日常存储/关键备份内网穿透24小时待命下载器 前言 近期由于个人需求&#xff0c;需要一台OpenWRT设备实现一些功能。所以本文主要还是为了自己后…

详解内部类

一个类的内部又嵌套了另一个类 --> 内部类 1.定义在局部位置&#xff08;方法/代码块&#xff09; 1&#xff09;局部内部类&#xff08;有类名&#xff09; 2&#xff09;匿名内部类&#xff08;无类名&#xff09; 2.定义在成员位置 1&#xff09;成员内部类 2&#xff09…

【Git】Merge/Rebase/Cherriy-Pick的区别

Git Merge/Rebase/Cherriy-Pick的区别 Git merge、Git Rebase、Git Cherry-pick是Git 常用的三个命令,可以用于分支合并、纳入提交等。 那么它们三个的区别以及共同点是什么? 了解这些可以帮我们更好理解Git的工作原理,进而学习它的一些设计思想。 git merge xxx-branch g…

固高GTS800控制卡开发数控系统宏程序心得

在对固高GTS800控制卡做数控系统开发时&#xff0c;经过多年的总结与积累&#xff0c;总算是实现了一个数控系统的基本功能。 基本实现宏程序的译码与执行同时执行&#xff0c;虽然不是实时执行&#xff0c;但在充分利用插补缓存区的基础上&#xff0c;实现了相对的实时性。 …

前后端开发迭代

要创建一个具有登录和注册功能的前端网页&#xff0c;并使用Go语言编写后端来支持它&#xff0c;你需要分两部分来进行&#xff1a;前端开发和后端开发。下面我将提供一个基本的指导方案。 前端开发 前端部分主要涉及HTML、CSS和JavaScript。你可以使用框架如React或Vue来简化…

AI 绘画 | Stable Diffusion WebUI的基本设置和插件扩展

前言 Stable Diffusion WebUI是一个基于Gradio库的浏览器界面&#xff0c;用于配置和生成AI绘画作品&#xff0c;并且进行各种精细地配置。它支持目前主流的开源AI绘画模型&#xff0c;例如NovelAI/Stable Diffusion。 在基本设置方面&#xff0c;Stable Diffusion WebUI的默…