1 模块简介

你一定在很多计算机科学课程上听说过作用域。它很重要,如果你不理解它的工作原理,那么就会出现一些令人困惑的错误。作用域最基本的功能就是告诉编译器一个变量什么时候是可见的。也就是说,作用域定义了你使用变量的时间和范围。当你尝试使用一些不在当前作用域的变量时,你就会得到NameError。

Python有三类作用域:

  • 局部作用域;

  • 全局作用域;

  • 非局部作用域(Python 3 中新增);

2 模块使用

2.1 局部作用域

局部作用域是Python中使用最多的作用域。当你在一段代码块中创建一个变量,它将会在最近的作用域中使用。所有的作用域组成的集合就是代码块环境。也就是说,默认是在局部作用域中处理所有的任务。如果你想要不同的作用域,那么你需要将变量设置为全局作用域或非局部作用域。

现在,我们使用Python的解释器创建一个简单的例子,来展示局部作用域任务。

>>> x = 10>>> def my_func(a,b):...     print(x)...     print(z)... >>> my_func(1,2)10Traceback (most recent call last):  File "
", line 1, in 
  File "
", line 3, in my_funcNameError: global name 'z' is not defined

这里,我们创建了变量x以及一个入参为两个参数的简单函数。它将会打印x和z。请记住,我们还没有定义z,所以当我们调用这个函数时,我们将会获得NameError。这是因为z还没有定义或者它在作用域外部。如果你在调用函数之前定义z,那么就会发现z,你就不会获得NameError。

如果你尝试访问函数内部的变量,那么你也会获得NameError。

>>> def my_func(a,b):...     i = 2...     print(x)... >>> if __name__ == "__main__":...     x = 10...     my_func(1,2)...     print(i)... 10Traceback (most recent call last):  File "
", line 4, in 
NameError: name 'i' is not defined

变量i仅仅在函数内部定义,所以当你运行这段代码时,你将会得到NameError。

我们稍微修改一下上面的代码,将下面的代码存储到文件中,并运行。

def my_func(a,b):    x = 5    print(x)if __name__ == "__main__":    x = 10    my_func(1,2)    print(x)

你认为将会发生什么?10打印两次?实际上并不是。原因就是我们现在有两个x变量。my_func函数中的变量x是局部函数作用域,它将会覆盖函数外部的变量x。当我们调用my_func函数时,我们打印5而非10。当函数返回时,my_func函数中的变量x会被回收,函数外的变量x将会起作用,这就是为什么最后一行语句打印出10。

如果你想了解具体的技巧,你可以在函数中的赋值语句前打印x,如下所示,

>>> def my_func(a,b):...     print(x)...     x = 5...     print(x)... >>> if __name__ == "__main__":...     x = 10...     my_func(1,2)...     print(x)

当你运行这段代码时,你将会得到如下的异常,

Traceback (most recent call last):  File "
", line 3, in 
  File "
", line 2, in my_funcUnboundLocalError: local variable 'x' referenced before assignment

这个异常发生,是因为Python提示你在my_func函数中后赋值给x,由于x还没有定义,因此它抛出异常。

2.2 全局作用域

Python包括global语句。它是Python的一个关键字。global语句定义了这个变量可以在随后的代码块中作为变量使用。虽然你可以在声明全局之前创建一个名称,但这是非常不鼓励的。让我们尝试使用global来修复上一个例子抛出的异常:

def my_func(a,b):    global x    print(x)    x = 5    print(x)if __name__ == "__main__":    x = 10    my_func(1,2)    print(x)

这段代码的输出是,

1055

通过将x定义为全局变量,我们告诉Pyton在函数中第一个打印函数中首先使用第一个定义的x。然后我们给x赋予新值5,在退出函数前再次打印。你将会注意到现在x是全局变量,当我们到达代码块的最后一个输出语句时,x依然是5。

让我们混合使用global和local来做一些有意思的事情,

def my_func(a,b):    global c    b,a = a,b    d = 'Mike'    print(a,b,c,d)a , b , c , d = 1 , 2 , 'c is global' , 4my_func(a,b)print(a , b , c , d)

在这里,我们将变量c设置为全局变量。这个将会导致在函数内部和外部,c都会输出相同的值。我们在函数内部交换变量a和b,可以显示出我们在函数内部对其进行了交换,但是在函数外部,并没有修改二者。这也显示出变量a和b并不是全局变量,你应该可以看到如下的输出结果:

(2, 1, 'c is global', 'Mike')(1, 2, 'c is global', 4)

我在此想提醒你不要在函数内部修改全局变量。这在Python社区中是一个不好的例子,它也会导致调试更加困难。

现在,我们已经理解了局部和全局变量,下面我们将要了解非局部变量。

2.3 非局部作用域

Python 3新增了一个关键词--nonlocal。关键词nonlocal增加了一个作用域用于覆盖内部作用域。你可以阅读PEP 3104。下面一段代码可以很好的解释非局部作用域。最常见的例子就是创建一个自增函数,

def counter():    num = 0    def incrementer():        num += 1        return num    return incrementer

如果你运行这段代码,你将会得到UnboundLocalError这个错误,因为变量num在内部函数中在赋值之前引用。让我们增加局部作用域,

>>> def counter():...     num = 0...     def incrementer():...         nonlocal num...         num += 1...         return num...     return incrementer... >>> >>> c = counter()>>> c
.incrementer at 0x7f67735ffea0>>>> c()1>>> c()2>>> c()3

现在我们定义的自增函数已按照我们期望开始工作。这种类型的函数被称为closure(闭包)。闭包就是一个将非局部变量封装起来的代码块。闭包背后的思想就是你可以在函数外部引用这些变量。

nonlocal允许你将变量分配到作用域外,但不是全局作用域。你不能在counter函数中使用nonlocal,因为它尝试着将其分配到全局作用域。你可以尝试一下,你将会得到SyntaxError。所以你必须在嵌套函数中使用nonlocal。

2.4 总结

在本文中,我们了解了通过Python关键词global和nonlocal来修改变量的引用方式。我们学习了在哪里使用以及为什么。我们也学习了局部作用域。