最小的k个数

今天分享一道比较简单的题目,希望大家可以5分钟掌握!

01、题目示例

最小的k个数
输入整数数组 arr ,找出其中最小的 k 个数。例如,输入4、5、1、6、2、7、3、8这8个数字,则最小的4个数字是1、2、3、4。

示例 1:

  1. 输入:arr = [3,2,1], k = 2
  2. 输出:[1,2] 或者 [2,1]

示例 2:

  1. 输入:arr = [0,1,2,1], k = 1
  2. 输出:[0]

限制:

  1. 0 <= k <= arr.length <= 10000
  2. 0 <= arr[i] <= 10000

02、堆和大小顶堆

这道题出自《剑指offer》,是一道非常高频的题目。可以通过排序等多种方法求解。但是这里,我们使用较为经典的大顶堆(大根堆)解法进行求解。因为我知道有很多人可能一脸懵逼,所以,我们先复习一下大顶堆。

首先复习一下,堆(Heap)是计算机科学中一类特殊的数据结构的统称,我们通常是指一个可以被看做一棵完全二叉树的数组对象。如果不记得什么是完全二叉树,可以复习这篇:

二叉树第七讲 - 完全二叉树(222)

堆的特性是父节点的值总是比其两个子节点的值大或小。如果父节点比它的两个子节点的值都要大,我们叫做大顶堆。如果父节点比它的两个子节点的值都要小,我们叫做小顶堆

PNG

我们对堆中的结点按层进行编号,将这种逻辑结构映射到数组中就是下面这个样子。

PNG

大顶堆,满足以下公式:

arr[i] >= arr[2i 1] && arr[i] >= arr[2i 2]

小顶堆也一样:

PNG

小顶堆,满足以下公式:

arr[i] <= arr[2i 1] && arr[i] <= arr[2i 2]

03、题目分析

上面我们学习了大顶堆,现在考虑如何用大根堆进行求解。

首先,我们创建一个大小为k的大顶堆。假如数组为[4,5,1,6,2,7,3,8],k=4。大概是下面这样:

PNG

我想肯定这里有不知道如何建堆的同学。记住:对于一个没有维护过的堆(完全二叉树),我们可以从其最后一个节点的父节点开始进行调整。这个不需要死记硬背,其实就是一个层层调节的过程。


从最后一个节点的父节点调整

PNG

继续向上调整

PNG

继续向上调整

PNG

建堆 调整的代码大概就是这样:(翻Java牌子)

  1. //建堆。对于一个还没维护过的堆,从他的最后一个节点的父节点开始进行调整。
  2. private void buildHeap(int[] nums) {
  3. //最后一个节点
  4. int lastNode = nums.length - 1;
  5. //记住:父节点 = (i - 1) / 2 左节点 = 2 * i 1 右节点 = 2 * i 2;
  6. //最后一个节点的父节点 7
  7. int startHeapify = (lastNode - 1) / 2;
  8. while (startHeapify >= 0) {
  9. //不断调整建堆的过程
  10. heapify(nums, startHeapify--);
  11. }
  12. }
  13. //调整大顶堆的过程
  14. private void heapify(int[] nums, int i) {
  15. //和当前节点的左右节点比较,如果节点中有更大的数,那么交换,并继续对交换后的节点进行维护
  16. int len = nums.length;
  17. if (i >= len)
  18. return;
  19. //左右子节点
  20. int c1 = ((i << 1) 1), c2 = ((i << 1) 2);
  21. //假定当前节点最大
  22. int max = i;
  23. //如果左子节点比较大,更新max = c1;
  24. if (c1 < len && nums[c1] > nums[max]) max = c1;
  25. //如果右子节点比较大,更新max = c2;
  26. if (c2 < len && nums[c2] > nums[max]) max = c2;
  27. //如果最大的数不是节点i的话,那么heapify(nums, max),即调整节点i的子树。
  28. if (max != i) {
  29. swap(nums, max, i);
  30. //递归处理
  31. heapify(nums, max);
  32. }
  33. }
  34. private void swap(int[] nums, int i, int j) {
  35. nums[i] = nums[i] nums[j] - (nums[j] = nums[i]);
  36. }

然后我们从下标 k 继续开始依次遍历数组的剩余元素。如果元素小于堆顶元素,那么取出堆顶元素,将当前元素入堆。在上面的示例中 ,因为2小于堆顶元素6,所以将2入堆。我们发现现在的完全二叉树不满足大顶堆,所以对其进行调整。


调整前

PNG

调整后

PNG

继续重复上述步骤,依次将7,3,8入堆。这里因为7和8都大于堆顶元素5,所以只有3会入堆。


调整前

PNG

调整后

PNG

最后得到的堆,就是我们想要的结果。由于堆的大小是 K,所以这里空间复杂度是O(K),时间复杂度是O(NlogK)。


根据分析,完成代码:

  1. //java
  2. class Solution {
  3. public int[] getLeastNumbers(int[] arr, int k) {
  4. if (k == 0)
  5. return new int[0];
  6. int len = arr.length;
  7. if (k == len)
  8. return arr;
  9. //对arr数组的前k个数建堆
  10. int[] heap = new int[k];
  11. System.arraycopy(arr, 0, heap, 0, k);
  12. buildHeap(heap);
  13. //对后面较小的树建堆
  14. for (int i = k; i < len; i++) {
  15. if (arr[i] < heap[0]) {
  16. heap[0] = arr[i];
  17. heapify(heap, 0);
  18. }
  19. }
  20. //返回这个堆
  21. return heap;
  22. }
  23. private void buildHeap(int[] nums) {
  24. int lastNode = nums.length - 1;
  25. int startHeapify = (lastNode - 1) / 2;
  26. while (startHeapify >= 0) {
  27. heapify(nums, startHeapify--);
  28. }
  29. }
  30. private void heapify(int[] nums, int i) {
  31. int len = nums.length;
  32. if (i >= len)
  33. return;
  34. int c1 = ((i << 1) 1), c2 = ((i << 1) 2);
  35. int max = i;
  36. if (c1 < len && nums[c1] > nums[max]) max = c1;
  37. if (c2 < len && nums[c2] > nums[max]) max = c2;
  38. if (max != i) {
  39. swap(nums, max, i);
  40. heapify(nums, max);
  41. }
  42. }
  43. private void swap(int[] nums, int i, int j) {
  44. nums[i] = nums[i] nums[j] - (nums[j] = nums[i]);
  45. }
  46. }

执行结果:

PNG