本节知识大纲:
一、Set 集合的概念
1. set 集合的性质
- set 集合是一组无序的且不能重复的集合,打印 set 集合时会自动消除重复的元素项;
- set 集合用大括号表示;
- set 集合存储的时候就是无序的,它不支持通过索引的方式进行访问;
- set 集合在初始化时的顺序与打印出来时的顺序是不一样的;
set01 = {11,22,33,44,55}
2. set 集合存储的原理
set 集合在存储的时候,先把元素转为哈希值,哈希值是顺序存储的,哈希算法是用来判断两个对象是否是同一个;
3. 创建 set 集合的方法
(1)创建的时候,直接初始化
# 创建set集合set01 = {11,22,33,44,55,66,77}print(set01)
(2)创建空的 set 集合,然后往里加入值
创建空 set 不能想当然的使用
set{}
,这样创建的是一个空字典,创建空 set 集合应该使用方法
set()
# 创建空setset02 = set()set02.add("Tom")set02.add("Bob")set02.add("Jerry")print(set02)
4.遍历 set 集合的方法
使用 for 循环遍历集合
# 遍历set集合set01 = {11,22,33,44,55,66,77}for i in set01: print(i,end=" ")
二、set 集合常用方法
1. 不可以使用加法运算和乘法运算符
列表可以使用加法运算符将两个列表拼接在一起,set 集合不可以使用;
列表可以使用乘法运算符将指定列表打印指定次数,set 集合不可以使用;
2. 赋值运算符
set01 = {11,22,33}set02 = set01
3. 返回集合中元素的长度
set01 = {11,22,33}print(len(set01))
4. 判断是否包含元素
# 判断是否包含元素set01 = {11,22,33}print("是否包含22:",22 in set01)
5. 排序和反转
直接的排序sort()、reverse() 是不支持的
但是支持临时排序sorted()
# set支持临时排序set01 = {11,2,-1,222,23}print(sorted(set01))
6. 添加元素
使用
add()
方法添加元素
set01 = {11,22,33}set01.add(44)print(set01)
7. 删除元素
删除元素有 discard()、remove()、pop() 方法
discard 删除原先不存在的值,集合不发生变化而且也不会报错
# discard方法删除元素set01 = {11,0,22,-22,99,100,33}print("删除22前",set01)set01.discard(22)print("删除22后",set01)set01.discard(122)print("删除一个不存在的122",set01)
输出结果:
删除22前 {0, 33, 99, 100, -22, 11, 22}删除22后 {0, 33, 99, 100, -22, 11}删除一个不存在的122 {0, 33, 99, 100, -22, 11}
但是如果用remove方法,要删除的值如果不存在,那么程序便会报KeyError 错;
使用pop方法删除,默认删除集合中第一个元素(按照hash值存储的)pop 函数的参数不能指定某一个要删除元素的具体的值。
8. 数值元素计算(max,min,sum)
set03 = {11,2,222,12,1,456,-2}print(min(set03)) # 打印集合中的最小值print(max(set03)) # 打印集合中的最大值print(sum(set03)) # 打印集合中的数值元素的和
9. set 集合逻辑运算
交集、并集、差集、对等差集、是否子集、是否父集,两种表示方法任选一个即可;
# 逻辑运算set01 = {11,22,33,44,55}set02 = {44,55,66,77,88}# 交集print(set01 & set02)print(set01.intersection(set02))# 并集print(set01 | set02)print(set01.union(set02))# 差集print(set01 - set02)print(set01.difference(set02))# 对等差集print(set01 ^ set02)print(set01.symmetric_difference(set02))print((set01-set02) | (set02-set01))# 判断是否是子集set01 = {11,22,33}set02 = {11,22}print(set01.issubset(set02))print(set01 <= set02)print(set01.issuperset(set02))print(set01 >= set02)
10. 类型转换
set 集合可以转化为 list 列表、tuple 元组、str 字符串,可以直接通过类型转换来实现:
# 类型转化set01 = {11,2,2,3,0,1,2}list01 = list(set01) # 转换为列表tuple01 = tuple(set01) # 转换为元组str01 = str(set01) # 转换为字符串
三、set 集合综合案例
案例01
:
生成 0-10 之间 5 个不相等的数
# 生成0-10之间5个不相等的数import randomset01 = set()while len(set01)
案例02
:
十个学生,姓名自行添加,有三门考试:语文、数学、英语,随机为这 10 名学生生成分数【50-100】,要求每一门科目中所有学生分数不能重复
需求
:
【1】统计出每门分数前三名和后三名
【2】统计出总分的前三名和后三名
【3】在【50-100】的数字中,哪些数字没有在三门的分数中出现过
import random# 定义一个生成学科成绩的函数def get_result(result:set): while True: temp = random.randint(50,100) if temp not in result: result.add(temp) break else: continue return resultstudent_name = ["赵一","钱二","孙三","李四","周五","吴六","郑七","王八","冯九","陈十"]subject_list = ["语文","数学","英语"]student_result = []chinese_result = set() # 存储语文的分数math_result = set() # 存储数学的分数english_result = set() # 存储英语的分数# 开始生成分数for i in range(len(student_name)): chinese_result = get_result(chinese_result) math_result = get_result(math_result) english_result = get_result(english_result)# 把三个set集合转为listchinese_result = list(chinese_result)math_result = list(math_result)english_result = list(english_result)# 生成成绩明细for i in range(10): temp_list = [] temp_list.append(chinese_result[i]) temp_list.append(math_result[i]) temp_list.append(english_result[i]) student_result.append(temp_list)# 需求1:统计每门科目的前三名和后三名【包括姓名和具体的分数】chinese_one = max(chinese_result)print("语文第一名:姓名:%s 分数:%d"%(student_name[chinese_result.index(chinese_one)],chinese_one))chinese_two = sorted(chinese_result)[8]print("语文第二名:姓名:%s 分数:%d"%(student_name[chinese_result.index(chinese_two)],chinese_two))chinese_three = sorted(chinese_result)[7]print("语文第三名:姓名:%s 分数:%d"%(student_name[chinese_result.index(chinese_three)],chinese_three))chinese_last_one = sorted(chinese_result)[0]print("语文倒数第一名:姓名:%s 分数:%d"%(student_name[chinese_result.index(chinese_last_one)],chinese_last_one))chinese_last_two = sorted(chinese_result)[1]print("语文倒数第二名:姓名:%s 分数:%d"%(student_name[chinese_result.index(chinese_last_two)],chinese_last_two))chinese_last_three = sorted(chinese_result)[2]print("语文倒数第三名:姓名:%s 分数:%d"%(student_name[chinese_result.index(chinese_last_three)],chinese_last_three))# 【2】统计出总分的前三名和后三名student_total_result = []for i in student_result: student_total_result.append(sum(i))total_one = sorted(student_total_result)[9]print("总分第一名是%s 分数%d"%(student_name[student_total_result.index(total_one)],total_one))total_two = sorted(student_total_result)[8]print("总分第二名是%s 分数%d"%(student_name[student_total_result.index(total_two)],total_two))total_three = sorted(student_total_result)[7]print("总分第三名是%s 分数%d"%(student_name[student_total_result.index(total_three)],total_three))# 【3】在【50-100】的数字中,哪些数字没有在三门的分数中出现过all_num = set()for i in range(50,101): all_num.add(i)had_num = (set(chinese_result) | set(math_result) | set(english_result) )print("未出现的数字有:",all_num - had_num)print(len(all_num - had_num))
输出结果:
语文第一名:姓名:赵一 分数:98语文第二名:姓名:王八 分数:90语文第三名:姓名:周五 分数:86语文倒数第一名:姓名:吴六 分数:54语文倒数第二名:姓名:郑七 分数:56语文倒数第三名:姓名:冯九 分数:60总分第一名是赵一 分数292总分第二名是周五 分数248总分第三名是李四 分数236未出现的数字有: {50, 52, 53, 55, 58, 62, 63, 64, 66, 67, 69, 72, 73, 75, 76, 77, 78, 81, 88, 89, 91, 92, 93, 94, 97, 99, 100}27
四、字典的概念
1. 概念:
字典是一组无序的且不重复的(key-value)数据集合,它是一种特殊的 set 集合;
字典中元素由 key 和 value 组成,比如:95001:“张三”, 冒号前面称为 key,冒号后面称为 value
2. 注意事项:
(1)通过key可以访问value,反之不可以
(2)对字典某个键值对的值进行访问需要使用字典名加中括号来进行访问
dic01 = {95001:"张三",95002:"李四",95004:"王五"}print(dic01[95001])
(3)字典中的元素不能重复,即字典中不允许出现相同的键值对,在字典中 key 不能重复,如果多个键值对有相同的 key 则以最后一个 key 的键值对为准,因为覆盖了全面的键值对。 value 是可以重复的;
(4)字典中的键值对是无序的,不可以用下标进行访问
(5)key 必须要是不可改变的类型:int、float、bool、tuple、str,不可以是列表、集合等可以改变的数据类型
# 字典中使用元组作为键表示地理位置经纬度dic01 = {(32,122):"徐家汇",(31,120):"无锡"}
(6)value 类型可以存储任何类型的 Python 数据类型
五、字典创建和初始化
1. 字典的创建
(1)创建的时候直接初始化
# 字典在创建的时候直接初始化student_result = {"张三": 342,"李四": 334,"王五": 443}print(student_result["张三"])
(2)创建空的后期添加
# 创建一个空的字典,后期一个个添加student_result = {}student_result["张三"] = 344student_result["李四"] = 321student_result["王五"] = 345print(student_result)
2. 删除字典的元素
删除字典的元素有三种方法
(1)pop()方法
参数传入 key,pop(key)可以删除指定键值对
# 使用pop(key)student_result = {"张三": 342,"李四": 334,"王五": 443}print(student_result)student_result.pop("张三") # 删除“张三”print(student_result)
如果传入的 key 不存在,程序会报 keyvalue 异常。
(2)popitem()方法
不需要参数即可删除字典中最后一个元素
# 使用popitem() 删除字典的最后一个student_result = {"张三": 342,"李四": 334,"王五": 443}print(student_result)student_result.popitem()print(student_result)
(3)clear 方法
使用 clear 方法删除整个字典
student_result = {"张三": 342,"李四": 334,"王五": 443}print(student_result)student_result.clear()print(student_result)
六、字典元素的遍历和访问
1. 字典元素的访问
这里我们先假设有一个字典,key 为学生学号,value 为成绩
dict01 = {95001:56,95002:89,95003:77,95004:87}
可以通过 dict01[95001]来访问该学号的,但是如果 key 不存在怎么办呢?有两个解决办法,setdefault()和 get()方法
print(dict01.setdefault(95004,"None")) # 如果key存在正常查找,如果不存在返回定义的"None"print(dict01.get(95001,"None")) # 避免获取每个key不存在出现异常,所设置的初始值
我们前面关于字典元素的删除也可以通过这种方式来避免异常的发生
print(dict01.pop(95001,"None")) # 如果key存在则返回对应的值,否则返回None
2. 字典元素的遍历
(1)标准遍历方式
dict01 = {95001:56,95002:89,95003:77,95004:87}for i in dict01: print(i,":",dict01[i])
(2)使用 items 遍历
dict01 = {95001:56,95002:89,95003:77,95004:87}print(dict01.items()) # 使用items遍历print(list(dict01.items())) # 结果转化为listprint(list(dict01.items())[0]) # 访问list第一个元素,这里是(95001,56)# 遍历list01 = list(dict01.items())for i in list01: print(list(i)[0],list(i)[1])
(3)使用 keys 遍历
keys_list = list(dict01.keys())for i in keys_list: print(i,":",dict01[i])
(4)使用 keys 和 values 遍历
keys_list = list(dict01.keys()) # 把字典转化为keysvalues_list = list(dict01.values()) # 把字典转化为valuesfor i in range(len(keys_list)): print(keys_list[i],":",values_list[i])
七、字典的常用方法
1. 合并与多次打印输出
字典和 set 的存储模式使一样的,乘号和加号是不能用的。
两个字典的合并不能用加号,而是用 update 进行合并;
字典的多次打印输出不能像列表那样直接使用乘号。
dic01 = {95001:88,95002:99,95003:67}dic02 = {95004:89,95005:87,95006:99}# print(dic01 + dic02) # 加号合并输出不支持# print(dic01 * 3) # 乘号多次输出不支持dic01.update(dic02)print(dic01)
2. 复制操作
可以直接使用赋值符号将 dic01 赋给 dic03,如果 dic01 里某个元素发生了改变,dic03 也会发生改变。如果不想让 dic03 元素跟着发生改变则可以使用浅复制方法,把存储的每一个值索引复制一份,改变字典元素的一个元素而另外一个复制的字典值不变。
dic03 = dic01.copy()
3. 其它常用操作
(1)获取字典的长度
使用 len()方法获取字典的长度
dic01 = {95001:88,95002:99,95003:67}print(len(dic01))
(2)判断字典是否包含
使用关键词in判断 key 是否包含
dic01 = {95001:88,95002:99,95003:67}print(95001 in dic01)
(3)排序
按照 key 进行排序
dic01 = {95001:88,95002:99,95003:67}print(sorted(dic01))
打印出来的结果为只有 key 的列表
(4)计算
max、min、sum 都是针对 key 的
dic01 = {95001:88,95002:99,95003:67}print(max(dic01)) # 打印最大的索引print(min(dic01)) # 打印最小的索引print(sum(dic01)) # 打印索引的和
(5)用列表作为索引创建新的字典
如果我们已经有了某个列表,我们可以根据列表创建字典的键,比如已知学号列表 student_no,可以创建一个新的由学号列表为键的成绩字典 student_result。
student_no = [95001,95002,95003,95004] # 学号列表student_result = {}.fromkeys(student_no) # 从学号列表获取keysstudent_result[95001] = 97 # 对字典中的元素进行直接赋值print(student_result)
八、字典的案例演示
案例
:
有10个学生,姓名自行添加。有三门考试:语文、数学、英语,
随机为这 10 名学生生成分数【50-100】
需求
:
打印一张总分倒序的成绩表
# 有10个学生,姓名自行添加。有三门考试:语文、数学、英语,随机为这10名学生生成 分数【50-100】需求:打印一张总分倒序成绩表import random# 初始化学生基本信息dict_student_info = {95001:"赵一",95002:"钱二",95003:"孙三",95004:"李四",95005:"周五", 95006:"吴六",95007:"郑七",95008:"王八",95009:"冯九",95010:"陈十"}# 生成成绩student_result = []for i in range(len(dict_student_info)): temp_result = [] for j in range(3): temp_result.append(random.randint(50,100)) student_result.append(temp_result)# 组合存储结构total_student_result = {}# total_student_result = {}.fromkeys(list(dict_student_info.keys()))# print(total_student_result)# 生成总分的listtotal_result = []for i in student_result: total_result.append(sum(i))# print(total_result)# 把总分倒序排列total_result.sort(reverse = True)# print(total_result)# 获得学生的学号student_sno = list(dict_student_info.keys())# 遍历index = 0for i in student_sno: temp_total = {} temp_total["姓名"] = dict_student_info[i] temp_total["明细"] = student_result[index] temp_total["排名"] = total_result.index(sum((student_result)[index])) + 1 temp_total["总分"] = sum((student_result)[index]) total_student_result[i] = temp_total index += 1# for i in student_sno:# print(i,":",total_student_result[i])# 打印成绩print("################成绩表################")print("=====================================")print("名次 学号 姓名 语文 数学 英语 总分 均分")for i in range(len(total_student_result)): for j in total_student_result: if total_student_result[j]["排名"] == (i+1): print(i+1,end="") print(j,end=" ") print(total_student_result[j]["姓名"],end=" ") print(total_student_result[j]["明细"][0],end=" ") print(total_student_result[j]["明细"][1],end=" ") print(total_student_result[j]["明细"][2],end=" ") print(total_student_result[j]["总分"],end=" ") print("%.2f" % ((total_student_result[j]["总分"])/3)) break else: continueprint("=====================================")
输出结果:
################成绩表################=====================================名次 学号 姓名 语文 数学 英语 总分 均分1 95003 孙三 100 94 65 259 86.332 95006 吴六 53 80 97 230 76.673 95001 赵一 68 69 90 227 75.674 95007 郑七 63 82 74 219 73.005 95004 李四 56 72 85 213 71.007 95010 陈十 63 60 83 206 68.678 95009 冯九 90 56 56 202 67.339 95002 钱二 66 56 76 198 66.0010 95008 王八 58 60 73 191 63.67=====================================