前 K 个高频元素

给你一个整数数组 nums 和一个整数 k ,请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。

示例 1:

1
2
输入: nums = [1,1,1,2,2,3], k = 2
输出: [1,2]

示例 2:

1
2
输入: nums = [1], k = 1
输出: [1]

思路

使用map记录每个元素的出现次数,然后根据出现次数排序,找到前K个元素。

优化方法

由于可能有 O(N) 个不同的出现次数(其中 N 为原数组长度),故总的算法复杂度会达到 O(NlogN),因此,维护一个大小为k的小根堆,将map中元素的出现次数和堆顶元素出现次数比较,如果次数更大,那就放入堆中,更小就说明按照出现次数排序,当前遍历元素前面必然有至少k个元素,舍弃。由于堆的大小至多为 k,因此每次堆操作需要 O(logk) 的时间,共需 O(Nlogk) 的时间。

代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
class Solution {
public:
static bool cmp(pair<int, int>& m, pair<int, int>& n) {
return m.second > n.second;
}

vector<int> topKFrequent(vector<int>& nums, int k) {
unordered_map<int, int> occurrences;
for (auto& v : nums) {
occurrences[v]++;
}

// pair 的第一个元素代表数组的值,第二个元素代表了该值出现的次数
priority_queue<pair<int, int>, vector<pair<int, int>>, decltype(&cmp)> q(cmp);

for (auto& [num, count] : occurrences) {
if (q.size() == k) { //堆中已经有k个元素
if (q.top().second < count) { //当前元素出现次数比堆顶大,可能是前k个
q.pop();
q.emplace(num, count);
}
} else {
q.emplace(num, count); //堆中元素还没有k个,直接插入堆
}
}
vector<int> ret;
while (!q.empty()) {
ret.emplace_back(q.top().first);
q.pop();
}
return ret;
}
};

注意

  • 优先队列使用
1
2
3
//decltype(&cmp):指定比较函数的类型(函数指针类型)
//q(cmp):构造函数传入比较函数 cmp 的指针
priority_queue<pair<int, int>, vector<pair<int, int>>, decltype(&cmp)> q(cmp);
  • 如何遍历map
1
for (const auto& pair : map) 

或者

1
for (auto& [num, count] : map)