堆

前 K 个高频元素

给你一个整数数组 nums 和一个整数 k ，请你返回其中出现频率前 k 高的元素。你可以按 任意顺序 返回答案。

示例 1:

1 2	输入: nums = [1,1,1,2,2,3], k = 2 输出: [1,2]

示例 2:

1 2	输入: nums = [1], k = 1 输出: [1]

思路

使用map记录每个元素的出现次数，然后根据出现次数排序，找到前K个元素。

优化方法

由于可能有 O(N) 个不同的出现次数（其中 N 为原数组长度），故总的算法复杂度会达到 O(NlogN)，因此，维护一个大小为k的小根堆，将map中元素的出现次数和堆顶元素出现次数比较，如果次数更大，那就放入堆中，更小就说明按照出现次数排序，当前遍历元素前面必然有至少k个元素，舍弃。由于堆的大小至多为 k，因此每次堆操作需要 O(logk) 的时间，共需 O(Nlogk) 的时间。

代码

class Solution {
public:
    static bool cmp(pair<int, int>& m, pair<int, int>& n) {
        return m.second > n.second;
    }

    vector<int> topKFrequent(vector<int>& nums, int k) {
        unordered_map<int, int> occurrences;
        for (auto& v : nums) {
            occurrences[v]++;
        }

        // pair 的第一个元素代表数组的值，第二个元素代表了该值出现的次数
        priority_queue<pair<int, int>, vector<pair<int, int>>, decltype(&cmp)> q(cmp);
        
        for (auto& [num, count] : occurrences) {
            if (q.size() == k) { //堆中已经有k个元素
                if (q.top().second < count) { //当前元素出现次数比堆顶大，可能是前k个
                    q.pop();
                    q.emplace(num, count);
                }
            } else {
                q.emplace(num, count); //堆中元素还没有k个，直接插入堆
            }
        }
        vector<int> ret;
        while (!q.empty()) {
            ret.emplace_back(q.top().first);
            q.pop();
        }
        return ret;
    }
};

注意

优先队列使用

1
2
3

//decltype(&cmp)：指定比较函数的类型（函数指针类型）
//q(cmp)：构造函数传入比较函数 cmp 的指针
priority_queue<pair<int, int>, vector<pair<int, int>>, decltype(&cmp)> q(cmp);

如何遍历map

1	for (const auto& pair : map)

或者

1	for (auto& [num, count] : map)