17.python-爬虫的基础认知,数据结构

 

 Python中的数据结构

这里总结一下Python中的内置数据结构(Built-in Data Structure):列表list、元组tuple、字典dict、集合set,涵盖的仅有部分重点,详细地去介绍每个知识点并未涉及。

列表list

# -*- coding: utf-8 -*-
# @Time    : 2019/1/22 0022 18:40
# @Author  : huangtao
# @Site    : 
# @File    : 列表.py
# @Software: PyCharm
# @Blog    :https://blog.csdn.net/Programmer_huangtao
name = ['xiaoming','xiaohong','xiaoxue']
age = ['11','10','9']
for ren,nian in zip(name,age):
    print(ren,nian)

#使用循环语句构造有规则的url
a = ['www.python.com/page/p{}'.format(i)
for i in range(1,10)]
print(a)
for aa  in a :
    print(aa)

list的显著特征

  • 列表中的每个元素都可变的

    意味着可以对每个元素进行修改和删除

  • 列表是有序的,每个元素的位置是确定的,可以用索引去访问每个元素

  • 列表中的元素可以是Python中的任何对象

    可以为任意对象就意味着元素可以是字符串、整数、元组、也可以是list等Python中的对象。

觉得Python中的list和C语言中的数组蛮像的,只是list中的元素类型可以为Python中的任意对象,C中的数组只能是同种类型。当访问他们中的元素时,都可采用索引。这里需要注意的是,list不仅可以向数组那样正向索引也可以反向索引。

list中的正反索引

 

   

list中的增删查改

list中有很多的方法,这里仅介绍对list中元素进行增删查改的方法。

  1. 利用insert()和分片将元素添加到指定位置 , 利用remove()和关键字del对
    元素进行删除

    需要注意分片[a:b]中的位置不包含位置b,利用[a,a]可以将元素添加至a位置
  2. 利用正反索引对元素进行查找

  3. 对元素修改可以直接赋值替换

  4. 列表中还有其他方法如pop()删除末尾元素,pop(i)删除指定位置i的元素,append()向末尾添加元素

list函数

可以通过list将序列创建为列表

Python中包含6中內建的序列:列表,元组,字符串、Unicode字符串、buffer对象和xrange对象。

其实list为一种类型并非函数,但此处二者并无多大区别。下面的tuple、dict都如此。

元组tuple

  1. 元组可以理解为一个固定的列表,一旦初始化其中的元素便不可修改(认真理解这句话),只能对元素进行查询
  2. 元组是固定的列表,那么元组的意义何在呢?

    因为tuple不可变,所以代码更安全。如果可能,能用tuple代替list就尽量用tuple
    并且需要注意元组中元素的可变性!!

  3. 空的tuple可以记为(),若只有一个元素的tuple记为(1,)

    因为记为(1)的话,这个实际代表的是数字1,此时()是数学公式中的小括号

  4. 因为元组是固定的列表,所以其内置的大多数的方法和列表是差不多的。

  5. 可以通过tuple将序列转换为元组,用法和list一样

字典dict

user = {'name':'huang',
        'age':16,
        'sex':'nan'}
#形式为前面为形式,后面为具体内容的 'key':'value',多用于数据处理

字典这个概念就是基于现实生活中的字典原型,生活中的使用名称-内容对数据进行构建,Python中使用键(key)-值(value)存储,也就是C++中的map。

dict的显著特征

  • 字典中的数据必须以键值对的形式出现

  • 键不可重复,值可重复

    键若重复字典中只会记该键对应的最后一个值

  • 字典中键(key)是不可变的,为不可变对象,不能进行修改;而值(value)是可以修改的,可以是任何对象
    在dict中是根据key来计算value的存储位置,如果每次计算相同的key得出的结果不同,那dict内部就完全混乱了。

dict的增删查改

  1. 可以采用“键值对”的方法和update()方法向字典中添加元素

    删除可以使用关键字del以及pop()方法
  2. 查询采用如查询列表元素的索引方式,使用键作为索引查找值

    若元素不存在会报错,在进行查找前,可以通过以下两种方法判断key是否存在:

    ① 成员资格运算符--in运算符

    ② get()方法(值不存在时返回NULL,也可指定返回的值

对值得修改可以采用直接覆盖原值的方法

dict中的元素是无序的,不可以采用分片。

dict函数

可以使用dict,通过其他映射或者(键,值)对的序列建立字典。

dict也可以使用关键字参数创建字典,也可用映射作为dict参数,dict若不带任何参数,将返回一个空字典

集合set

集合更接近数学上集合的概念。集合中每个元素都是无序的、不重复的任意对象。
可以通过集合去判断数据的从属关系,也可以通过集合把数据结构中重复的元素减掉。集合可做集合运算,可添加和删除元素。

集合的创建

创建集合时需要用list作为输入集合,可通过add()方法增加元素,remove()方法删除元素

集合中重复的元素会被过滤掉

集合运算

Python中的集合也可以进行集合的之间的交、并等运算

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值