本文共 3163 字,大约阅读时间需要 10 分钟。
学习Python其实也有好一段时间了,之前也做了不少笔记,但是要真正把Python学得很扎实,没有对Python系统的了解是远远不够的,哪怕是最基础的知识点,所以决定好好地回顾整理。
当然,就以《Python核心编程》这本书为纲,希望可以把自己对Python的理解连成系统的一条线。
1.语句和语法
`#`:注释
`\`:换行,如果是闭合操作符如`( )`,`[ ]`,`{ }`等,可以不使用`\`
`:`:分号将代码头和代码体分开
`缩进`:用以区分不同的代码块
`;`:同一行写多个语句,但不建议
`模块`:一个.py脚本文件就是一个模块
2.变量赋值
(1)赋值操作符:=
在Python中,对象是通过引用传递的,赋值时,是将该对象的引用(不是一个值)赋给这个变量。
另外,Python赋值语句没有返回值,但可以使用赋值链:
1 2 3 4 5 6 | >>> a = (a = 3 ) File "<stdin>" , line 1 a = (a = 3 ) ^ SyntaxError: invalid syntax >>> y = x = 3 |
(2)增量赋值
只有类似+=这样的增量赋值,没有自增自减的方法
特性:可变对象(列表,字典等)就修改(无需拷贝引用),不可变对象(数字,元组等)则分配一个新对象
(3)多重赋值
一个对象可被多个变量引用,多个对象也可被多个对象引用
1 | >>> x = y = z = 1 |
(4)多元赋值:元组赋值
1 | >>> (x, y, z) = ( 1 , 2 , 'a string' ) |
不加括号也可以,但建议加上
可用于两值的交换
1 2 3 4 5 6 | >>> x = 3 ; y = 4 >>> print x, y 3 4 >>> x, y = y, x >>> print x, y 4 3 |
3.标识符
关键字标识符:保留字,不能用于其他用途,否则会引起SyntaxError异常
内建(built-in)标识符:是__builtins__模块的成员,在程序开始或交互解释器开始时,由Python解释器自动导入,可以将其作为Python全局变量,可以重新赋值,但不建议
1 2 3 4 | >>> dir <built - in function dir > >>> dir () [ '__builtins__' , '__doc__' , '__name__' , '__package__' ] |
__专用下划线标识符:
__xxx:类中的私有变量名,不能用`from module import *`导入,变量是私有时,建议使用这种方法
__xxx__:系统定义名字,如内建标识符
另外,Pythonn不支持标识符重载,所以任何时刻都只有一个名字绑定。
4.基本风格指南
注释:#号
文档:模块,类声明或函数声明中第一个没有赋值的字符串,可通过obj.__doc__访问
缩进:以空格代替制表符
标识符名称:名字简短有意义
Python风格指南:import this
(1)模块结构和布局
起始行(Unix)
1 | #/usr/bin/env python |
这样仅输入脚本名字就可以执行脚本,无需直接调用解释器。
模块文档
1 | ' 'this is a test module' ' |
可通过obj.__doc__访问
模块导入
变量定义:尽量使用局部变量代替全局变量
类定义
函数定义
主程序
1 2 3 4 | if __name__ = = '__main__' : My_function() #如果模块是被导入,__name__的值为模块名字; #如果模块是被直接执行,__name__的值为'__main__'; |
关于主程序,注意下面几点:
1.绝大部分模块创建的目的是被其它模块导入而不是作为脚本执行,总之只有一个模块,也就是包含主程序的模块会被执行;
2.最高级别的Python语句(没有缩进)在模块被导入时就会被执行;
3.通常只有主程序模块中有大量的顶级可执行代码,所有其他被导入模块只应该有很少的顶级执行代码,所有的功能代码都应该封装在函数或类当中。
对于上面三点,只要联系自己在实际项目开发中的例子就可以很好的理解了。
(2)在主程序中书写测试代码
如果想测试被导入的模块的某个函数的功能,就可以使用主程序的方法,引入并执行该函数,这就是测试功能的使用,当然在大型程序中,更倾向使用unittest。
5.内存管理
变量定义:变量无须事先声明
在Python中无需显式变量声明语句,变量在第一次赋值时自动声明。
动态类型:变量无须指定类型
Python中对象的类型和内存占用都是运行时确定的。
内存分配:不用关心内存管理
Python解释器承担了内在管理的复杂任务。
引用计数:对象回收
(1)增加引用计数
当对象被创建并(将其引用)赋值给变量时,该对象的引用计数就被设置为1
当一个对象(的引用)又被赋值给其他变量时,或作为参数传递给函数,方法或类实例时,或者被赋值为一个窗口对象(列表,字典等)的成员时,该对象新的一个引用会被创建,引用计数加1
1 2 3 4 | >>> x = 3.14 #加1,下面每一步同理 >>> y = x >>> foobar(x) >>> myList = [ 123 , x, 'xyz' ] |
(2)减少引用计数
一个本地引用离开其作用范围
如函数执行完毕后局部变量被销毁。
对象别名被显式销毁
1 | >>> del y |
当变量被赋值给另外一个对象时,原对象的引用计数也会自动减1
1 2 3 | >>> foo = 'xyz' >>> bar = foo >>> foo = 123 |
对象被从一个窗口对象中移除
1 | myList.remove(x) |
窗口对象本身被销毁
1 | del myList |
即执行del y会产生下面两个结果:
1.从现在名称空间中删除y
2.y变量对应的对象的引用计数减1
需要注意的是,如果内存中仍然有在使用该对象,这会增加一个额外的引用,则它还不会被回收。
垃圾收集
解释器跟踪对象的引用计数,垃圾收集器负责释放内存。其实际,垃圾收集器是一块独立代码,用来查找引用计数为0的对象和那些引用计数虽然大于0但也应该被销毁的对象(如循环引用的对象)。
垃圾收集器 = 引用计数器 + 循环垃圾计数器,这在存在循环引用的情况中非常有用:
循环引用:发生在至少两个对象互相引用时,也就是当其它所有对它们的引用都消失时,他们两者所产生的对各自的引用仍然存在,例如两个类中有各自的一个实例
引用计数器作用:当一个对象的引用计数变为0,解释器会暂停,释放掉这个对象和仅有这个对象可访问(可到达的)其它对象(这样的话,其它对象的引用计数必然是1)
循环垃圾计数器作用:作为引用计数器的补充,垃圾收集器也会留心被分配的总量很大的(及未通过引用计数销毁的那些)对象,在这种情况下,解释器也会停下来,试图清理所有未引用的循环
基本可以理解,但具体怎么实现的,就需要看Python的源码分析了。
6.第一个Python程序
主要提及一点:使用局部变量替换模块变量。
例如,你要使用os.linesep,如果你多次使用,那么建议将其定义为一个本模块的全局变量或局部变量,这将会加快查询的速度,因为对于os.linesep,要进行下面两步:
首先要查找os,确认其是一个模块
在这个模块中查找linesep变量
将经常用到的模块属性替换为一个本地引用,可以让程序跑得更快。