Python实现列表中嵌套字典按照给定key值去重

这篇博客介绍了如何使用Python对数据进行去重操作,提供了一种根据特定字段进行去重的函数实现。示例中展示了按照id、name和tel字段去重的方法,以及通过key和notkey模式控制去重条件,确保只保留唯一的个人信息记录。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

需求:对下列数据按任意字段去重

需要达到的效果:

按照id进行去重,id重复则算重复。重复的取第一个数据。

按照name和tel去重,name和tel都重复则算重复。重复的取第一个数据。

样例:

个人信息数据data如下,名字、年龄、手机号相同,则认为是同一人,去除重复的人员信息,重复的仅保留第一条数据。

data = [{
    "id": 1,
    "name": "张三",
    "age": 16,
    "home": "北京",
    "tel": "12345"
}, {
    "id": 2,
    "name": "李四",
    "age": 16,
    "home": "北京",
    "tel": "123456"
}, {
    "id": 3,
    "name": "张三",
    "age": 16,
    "home": "北京",
    "tel": "12345"
}]

去重功能代码实现:

def duplicate_removal(datas, condition, model="key"):
    """
    :param datas: 准备去重的数据,格式[{},{}...]
    :param condition: 去重参考的键值,需要数据里面有这些key
    :param model: 去重模式,key模式为去重参考的key值;notkey模式为去重不参考的key值。相反关系。
    :return: 去重后的数据,格式[{},{}...]
    """
    def flags(keys, data):
        tmp_dic = {}
        for key in keys:
            tmp_dic.update({key: data.get(key)})
        return tmp_dic

    removal_data = []
    values = []
    if datas:
        if model == "key":
            keys = condition
        elif model == "notkey":
            keys = [key for key in datas[0].keys() if key not in condition]
        else:
            raise ValueError("传入的model值错误,无法匹配")
        for data in datas:
            if flags(keys, data) not in values:
                removal_data.append(data)
                values.append(flags(keys, data))

    return removal_data

执行效果:

给出的数据有id、name、age、home、tel共5个字段。要通过name、age、tel进行去重,有以下两种方式:

方式一:采用key模式

key = ['name', 'age', 'tel']
print(duplicate_removal(data, key, model="key"))

输出结果如下:

[{'id': 1, 'name': '张三', 'age': 16, 'home': '北京', 'tel': '12345'}, {'id': 2, 'name': '李四', 'age': 16, 'home': '北京', 'tel': '123456'}]

方式二:采用notkey模式,则是不用id、home字段

not_key = ['id', 'home']
print(duplicate_removal(data, not_key, model="notkey"))

输出结果如下:

[{'id': 1, 'name': '张三', 'age': 16, 'home': '北京', 'tel': '12345'}, {'id': 2, 'name': '李四', 'age': 16, 'home': '北京', 'tel': '123456'}]

同理:可通过控制传入的key进行操作按照数据中的某个键值进行去重。

### 判断Python列表嵌套字典是否为空 在Python编程环境中,检查一个列表嵌套字典是否为空可以通过多种方式实现。一种简单有效的方式是利用`if not`语句来检测列表是否为空以及列表中的每一个字典是否为空。 当列表本身不包含任何元素时,该列表被认为是空的;如果列表含有至少一个元素,则进一步检查这些元素(即字典)内部是否有对存在。对于列表内的每个字典来说,只要它没有任何对就被认为是一个空字典[^1]。 下面给出一段具体的代码示例用于说明这一过程: ```python list_of_dicts = [{'key': 'value'}, {}] # Check if the entire list is empty or all dictionaries inside are empty. is_empty_list_or_all_dicts_empty = not any(list_of_dicts) print(is_empty_list_or_all_dicts_empty) # Output depends on content of `list_of_dicts` for d in list_of_dicts: # Check each dictionary individually within the list. if not d: print("Found an empty dict.") ``` 上述代码片段展示了两种不同的方法来验证给定条件:一是通过`any()`函数一次性判断整个列表及其成员的状态;二是遍历列表并逐一检验各个字典的内容。这两种策略可以根据实际需求灵活选用。 #### 额外提示 除了直接使用布尔表达式之外,在某些情况下可能还需要更细致地区分不同类型的“空”。例如区分完全空白的数据结构与仅含零个或多个空子项的情况。这时可以考虑编写辅助函数来进行更加复杂的逻辑处理。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值