大部份内容摘自授课老师的博客http://www.cnblogs.com/Eva-J/
编译python文件
编译python文件是为了提高加载模块的速度,强调强调强调:提高的是加载速度而绝非运行速度。
python解释器会在__pycache__目录下缓存每个模块编译后的版本,格式为:module.version.pyc。通常会包含python的版本号。例如,在CPython3.3版本下,my_module.py模块会被缓存成__pycache__/my_module.cpython-33.pyc。这种命名规范保证了编译后的结果多版本共存。
Python检查源文件的修改时间与编译的版本进行对比,如果过期就需要重新编译。
这是完全自动的过程。并且编译的模块是平台独立的, 所以相同的库可以在不同的架构的系统之间共享,即pyc是一种跨平台的字节码,类似于JAVA和.NET, 是由python虚拟机来执行的,但是pyc的内容跟python的版本相关,不同的版本编译后的pyc文件不同, 2.5编译的pyc文件不能到3.5上执行,并且pyc文件是可以反编译的,因而它的出现仅仅是用来提升模块的加载速度的。python解释器在以下两种情况下不检测缓存。
1 如果是在命令行中被直接导入模块,则按照这种方式,每次导入都会重新编译,
并且不会存储编译后的结果(python3.3以前的版本应该是这样) python -m my_module.py2 如果源文件不存在,那么缓存的结果也不会被使用,
如果想在没有源文件的情况下来使用编译后的结果,则编译后的结果必须在源目录下。提示:
1.模块名区分大小写,foo.py与FOO.py代表的是两个模块; 2.你可以使用-O或者-OO转换python命令来减少编译模块的大小。-O转换会帮你去掉assert语句
-OO转换会帮你去掉assert语句和__doc__文档字符串 由于一些程序可能依赖于assert语句或文档字符串,你应该在在确认需要的情况下使用这些选项。3.在速度上从.pyc文件中读指令来执行不会比从.py文件中读指令执行更快,
只有在模块被加载时,.pyc文件才是更快的。4.只有使用import语句是才将文件自动编译为.pyc文件,
在命令行或标准输入中指定运行脚本则不会生成这类文件, 因而我们可以使用compieall模块为一个目录中的所有模块创建.pyc文件。模块可以作为一个脚本(使用python -m compileall)编译Python源
python -m compileall /module_directory 递归 编译
如果使用python -O -m compileall /module_directory -l则只一层命令行里使用compile()函数时,自动使用python -O -m compileall
详见:补充:dir()函数
内建函数dir是用来查找模块中定义的名字,返回一个有序字符串列表:
import my_module dir(my_module)如果没有参数,dir()列举出当前定义的名字。
dir()不会列举出内建函数或者变量的名字,它们都被定义到了标准模块builtin中,可以列举出它们,
import builtins dir(builtins)包
包是一种通过使用‘.模块名’来组织python模块名称空间的方式。
1. 无论是import形式还是from...import形式,凡是在导入语句中(而不是在使用时)遇到带点的,都要第一时间提高警觉:这是关于包才有的导入语法。2. 包是目录级的(文件夹级),文件夹是用来组成py文件(包的本质就是一个包含__init__.py文件的目录)。3. import导入文件时,产生名称空间中的名字来源于文件,import 包,产生的名称空间的名字同样来源于文件,即包下的__init__.py,导入包本质就是在导入该文件。强调:1. 在python3中,即使包下没有__init__.py文件,import 包仍然不会报错,而在python2中,包下一定要有该文件,否则import 包报错。2. 创建包的目的不是为了运行,而是被导入使用,记住,包只是模块的一种形式而已,包即模块。包A和包B下有同名模块也不会冲突,如A.a与B.a来自俩个命名空间。以下是创建(包)目录的代码(脚本),以后可以在这个基础上扩展出规范的创建脚本,自动省时:import osos.makedirs('glance/api')os.makedirs('glance/cmd')os.makedirs('glance/db')l = []l.append(open('glance/__init__.py','w'))l.append(open('glance/api/__init__.py','w'))l.append(open('glance/api/policy.py','w'))l.append(open('glance/api/versions.py','w'))l.append(open('glance/cmd/__init__.py','w'))l.append(open('glance/cmd/manage.py','w'))l.append(open('glance/db/models.py','w'))map(lambda f:f.close() ,l)目录结构:glance/ #Top-level package├── __init__.py #Initialize the glance package├── api #Subpackage for api│ ├── __init__.py│ ├── policy.py│ └── versions.py├── cmd #Subpackage for cmd│ ├── __init__.py│ └── manage.py└── db #Subpackage for db ├── __init__.py └── models.py文件内容#policy.pydef get(): print('from policy.py')#versions.pydef create_resource(conf): print('from version.py: ',conf)#manage.pydef main(): print('from manage.py')#models.pydef register_models(engine): print('from models.py: ',engine)
注意事项
1.关于包相关的导入语句也分为import和from ... import ...两种,
但是无论哪种,无论在什么位置, 在导入时都必须遵循一个原则:凡是在导入时带点的,点的左边都必须是一个包,否则非法。 可以带有一连串的点,如item.subitem.subsubitem,但都必须遵循这个原则。2.对于导入后,在使用时就没有这种限制了,点的左边可以是包,模块,函数,类(它们都可以用点的方式调用自己的属性)。
3.对比import item 和from item import name的应用场景: 如果我们想直接使用name那必须使用后者。import
我们在与包glance同级别的文件中测试:
import glance.db.models
glance.db.models.register_models('mysql')from ... import ...
需要注意的是from后import导入的模块,
必须是明确的一个不能带点,否则会有语法错误,如:from a import b.c是错误语法我们在与包glance同级别的文件中测试
from glance.db import models models.register_models('mysql')from glance.db.models import register_models
register_models('mysql')__init__.py文件不管是哪种方式,只要是第一次导入包或者是包的任何其他部分,都会依次执行包下的__init__.py文件(我们可以在每个包的文件内都打印一行内容来验证一下),这个文件可以为空,但是也可以存放一些初始化包的代码。from glance.api import *在讲模块时,我们已经讨论过了从一个模块内导入所有*,此处我们研究从一个包导入所有*。此处是想从包api中导入所有,实际上该语句只会导入包api下__init__.py文件中定义的名字,我们可以在这个文件中定义__all___:在__init__.py中定义x=10def func(): print('from api.__init.py')__all__=['x','func','policy']此时我们在于glance同级的文件中执行from glance.api import *就导入__all__中的内容(versions仍然不能导入)。from glance.api import *glance/├── __init__.py ├── api │ ├── __init__.py __all__ = ['policy','versions'] │ ├── policy.py│ └── versions.py├── cmd __all__ = ['manage'] │ ├── __init__.py│ └── manage.py └── db __all__ = ['models'] ├── __init__.py └── models.pyfrom glance.api import *policy.get()
绝对导入和相对导入
我们的最顶级包glance是写给别人用的,然后在glance包内部也会有彼此之间互相导入的需求,
这时候就有绝对导入和相对导入两种方式: 绝对导入:以glance作为起始 相对导入:用.或者..的方式最为起始(只能在一个包中使用,不能用于不同目录内)例如:我们在glance/api/version.py中想要导入glance/cmd/manage.py在glance/api/version.py#绝对导入from glance.cmd import managemanage.main()#相对导入from ..cmd import managemanage.main()测试结果:注意一定要在于glance同级的文件中测试from glance.api import versions
注意:在使用pycharm时,有的情况会为你多做一些事情,这是软件相关的东西,会影响你对模块导入的理解,
因而在测试时,一定要回到命令行去执行,模拟我们生产环境,你总不能拿着pycharm去上线代码吧!!!特别需要注意的是:
可以用import导入内置或者第三方模块(已经在sys.path中),但是要绝对避免使用import来导入自定义包的子模块(没有在sys.path中),应该使用from... import ...的绝对或者相对导入,且包的相对导入只能用from的形式。
单独导入包
单独导入包名称时不会导入包中所有包含的所有子模块,
解决方法是子模块中使用相对路径引入上级(..上一级目录)模块或同级(.当前目录)模块 千万别问:__all__不能解决吗,__all__是用于控制from...import *附:软件规范开发参考目录图
end
2018-4-27