题目
题目描述
如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。
例如,
[2,3,4] 的中位数是 3
[2,3] 的中位数是 (2 + 3) / 2 = 2.5
设计一个支持以下两种操作的数据结构:
- void addNum(int num) - 从数据流中添加一个整数到数据结构中。
- double findMedian() - 返回目前所有元素的中位数。
示例1
输入:
[“MedianFinder”,”addNum”,”addNum”,”findMedian”,”addNum”,”findMedian”]
[[],[1],[2],[],[3],[]]
输出: [null,null,null,1.50000,null,2.00000]
示例2
输入:
[“MedianFinder”,”addNum”,”findMedian”,”addNum”,”findMedian”]
[[],[2],[],[3],[]]
输出: [null,null,2.00000,null,2.50000]
题解
堆
维护同样大小的 小顶堆和大顶堆,分别存放较大和较小的一半元素,根据两个堆顶元素得到数据流的中位数。
新元素进堆(允许大值堆/小顶堆比小值堆/大顶堆元素个数多1):
- 当 大值堆不等于小值堆 元素个数时: 即大值堆个数多一个,上一轮中位数为大值堆堆顶元素,则将
新元素插入大值堆
,再将大值堆堆顶元素弹出并插入到小值堆
,此时大值堆与小值堆元素个数相等,由两个堆顶元素共同确定中位数; - 当 大值堆等于小值堆 元素个数时: 将
新元素插入小值堆
,再将小值堆堆顶元素弹出插入到大值堆
,此时大值堆元素个数多1,堆顶元素为中位数;
时间复杂度: O(logn),堆的插入和弹出均为O(logn);
空间复杂度: O(n),大值堆和小值堆共占用额外空间O(n);
class MedianFinder: |
Python 中
heapq
模块是小顶堆。实现 大顶堆 方法: 小顶堆的插入和弹出操作均将元素 取反(负数) 即可。