数据流中的中位数

该博客探讨了如何在数据流中实时计算中位数,提出了几种解题思路,包括数组排序、排序链表、二叉搜索树、AVL树以及大顶堆和小顶堆的方法。对比了它们在插入和查找中位数时的时间复杂度,强调了在效率和退化情况下的优劣。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

题目:

如何得到一个数据流中的中位数?如果从数据流中读出奇数个数值,那么中位数就是所有数值排序之后位于中间的数值。如果从数据流中读出偶数个数值,那么中位数就是所有数值排序之后中间两个数的平均值。


解题思路:

有以下几种解题思路:

  1. 数组插入进去然后再排序,这种情况插入时间效率是O(n),找中位数时间效率是O(1)。
  2. 排序的链表,两种时间复杂度和上面是一样的。
  3. 二叉搜索树,首先说一下平均的时间效率,插入的时间效率是O(logn),找中位数的时间效率是O(logn)。然而当插入的时间顺序是排好序的数组的时候,二叉树就退化成了一个数组,插入时间效率是O(n),找中位数的时间效率是O(n)。
  4. AVL树,插入的时间效率是O(logn),找中位数的时间效率是O(1)。
  5. 大顶堆和小顶堆。插入的时间效率是O(logn),找中位数的时间效率是O(1)。
下面的代码使用一个大顶堆和小顶堆来完成:
PriorityQueue<Integer> min = new PriorityQueue();
PriorityQueue<Integer> max = new PriorityQueue(1000, Collections.reverseOrder());
//当JDK8的时候,可以直接写成,不再需要初始化容量
//PriorityQueue<Integer> max = new PriorityQueue(Collections.reverseOrder());

public void Insert(Integer num) {
    max.offer(num);
    min.offer(max.poll());
    if (max.size() < min.size()) {
        max.offer(min.poll());
    }
}

public Double GetMedian() {
    if (max.size() == min.size()) {
        return (max.peek() + min.peek())/2.0;
    }
    return (double)max.peek();
}


-----------EOF------------

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值