函数

在 Go 语言中,函数可是一等的(first-class)公民,函数类型也是一等的数据类型。

函数不但可以用于封装代码、分割功能、解耦逻辑,还可以化身为普通的值,在其他函数间传递、赋予变量、做类型判断和转换等等,就像切片和字典的值那样。

更深层次的含义就是:函数值可以由此成为能够被随意传播的独立逻辑组件(或者说功能模块)。

对于函数类型来说,它是一种对一组输入、输出进行模板化的重要工具,它比接口类型更加轻巧、灵活,它的值也借此变成了可被热替换的逻辑组件。

下面是几种函数玩法:

package main

import "fmt"

type Printer func(contents string) (n int, err error)

func printToStd(contents string) (bytesNum int, err error) {
  return fmt.Println(contents)
}

func main() {
  var p Printer
  p = printToStd
  p("something")
}

这里,先声明了一个函数类型,名叫Printer。在类型声明的名称右边的是func关键字,我们由此就可知道这是一个函数类型的声明。

在 func 右边的就是这个函数类型的参数列表和结果列表。其中,参数列表必须由圆括号包裹,而只要结果列表中只有一个结果声明,并且没有为它命名,我们就可以省略掉外围的圆括号。

书写函数签名的方式与函数声明的是一致的。只是紧挨在参数列表左边的不是函数名称,而是关键字func。这里函数名称和func互换了一下位置而已。

函数的签名其实就是函数的参数列表和结果列表的统称,它定义了可用来鉴别不同函数的那些特征,同时也定义了我们与函数交互的方式。

注意,各个参数和结果的名称不能算作函数签名的一部分,甚至对于结果声明来说,没有名称都可以。

只要两个函数的参数列表和结果列表中的元素顺序及其类型是一致的,我们就可以说它们是一样的函数,或者说是实现了同一个函数类型的函数。

严格来说,函数的名称也不能算作函数签名的一部分,它只是我们在调用函数时,需要给定的标识符而已。

声明的函数printToStd的签名与Printer的是一致的,因此前者是后者的一个实现,即使它们的名称以及有的结果名称是不同的。

通过main函数中的代码,我们就可以证实这两者的关系了,我顺利地把printToStd函数赋给了Printer类型的变量p,并且成功地调用了它。

1. 高阶函数

高阶函数需要满足下面的两个条件:

  • 接受其他的函数作为参数传入

  • 把其他的函数作为结果返回

高阶函数用例

通过编写calculate函数来实现两个整数间的加减乘除运算,希望两个整数和具体的操作都由该函数的调用方给出。

首先声明一个函数模型,它有两个参数和一个结果,都是int类型的。

type operate func(x, y int) int

我们编写calculate函数的签名部分。这个函数除了需要两个int类型的参数之外,还应该有一个operate类型的参数。

该函数的结果应该有两个,一个是 int 类型的,代表真正的操作结果,另一个应该是 error 类型的,因为如果那个 operate 类型的参数值为 nil,那么就应该直接返回一个错误。

函数类型属于引用类型,它的值可以为nil,而这种类型的零值恰恰就是nil。

func calculate(x int, y int, op operate) (int, error) {
  if op == nil {
    return 0, errors.New("invalid operation")
  }
  return op(x, y), nil
}

calculate 函数实现起来就很简单了。我们需要先用卫述语句检查一下参数,如果 operate 类型的参数 op 为 nil,那么就直接返回 0 和一个代表了具体错误的 error 类型值。

卫述语句是指被用来检查关键的先决条件的合法性,并在检查未通过的情况下立即终止当前代码块执行的语句。在 Go 语言中,if 语句常被作为卫述语句。如果检查无误,那么就调用 op 并把那两个操作数传给它,最后返回 op 返回的结果和代表没有错误发生的nil。

只要它的签名与 operate 类型的签名一致,并且实现得当就可以了。我们可以像上一个例子那样先声明好一个函数,再把它赋给一个变量,也可以直接编写一个实现了 operate 类型的匿名函数。

op := func(x, y int) int {
  return x + y
}

calculate 函数就是一个高阶函数。但是我们说高阶函数的特点有两个,而该函数只展示了其中一个特点,即:接受其他的函数作为参数传入; 另一个特点,把其他的函数作为结果返回。

/*
type operate func(x, y int) int
type calculateFunc func(x int, y int) (int, error)
func genCalculator(op operate) calculateFunc {
    return func(x int, y int) (int, error) {
        if op == nil {
            return 0, errors.New("invalid operation")
        }
        return op(x, y), nil
    }
}
*/
x, y = 56, 78
op := func(x, y int) int {
        return x + y
}
add := genCalculator(op)
result, err = add(x, y)
fmt.Printf("The result: %d (error: %v)\n", result, err)

2. 闭包的实现

闭包是由函数及其相关的引用环境组合而成的实体 (即:闭包=函数+引用环境)。

可以想象一下,在一个函数中存在对外来标识符的引用。所谓的外来标识符,既不代表当前函数的任何参数或结果,也不是函数内部声明的,它是直接从外边拿过来的,这种变量一般叫自由变量,可见它代表的肯定是个变量。实际上,如果它是个常量,那也就形成不了闭包了,因为常量是不可变的程序实体,而闭包体现的却是由“不确定”变为“确定”的一个过程。

闭包函数就是因为引用了自由变量,而呈现出了一种“不确定”的状态,也叫“开放”状态。它的内部逻辑并不是完整的,有一部分逻辑需要这个自由变量参与完成,而后者到底代表了什么在闭包函数被定义的时候却是未知的。

genCalculator 函数内部,实际上就实现了一个闭包,而 genCalculator 函数也是一个高阶函数,它定义一个匿名的、calculateFunc 类型的函数并把它作为结果值返回。

type calculateFunc func(x int, y int) (int, error)

func genCalculator(op operate) calculateFunc {
  return func(x int, y int) (int, error) {
    if op == nil {
      return 0, errors.New("invalid operation")
    }
    return op(x, y), nil
  }
}

这个匿名的函数就是一个闭包函数,它里面使用的变量 op 既不代表它的任何参数或结果也不是它自己声明的,而是定义它的 genCalculator 函数的参数,所以是一个自由变量。

这个自由变量究竟代表了什么,这一点并不是在定义这个闭包函数的时候确定的,而是在 genCalculator 函数被调用的时候确定的。只有给定了该函数的参数 op,我们才能知道它返回给我们的闭包函数可以用于什么运算。

if op == nil { 那一行了吗?Go 语言编译器读到这里时会试图去寻找 op 所代表的东西,它会发现 op 代表的是 genCalculator 函数的参数,然后,它会把这两者联系起来。这时可以说,自由变量 op 被“捕获”了。

当程序运行到这里的时候,op就是那个参数值了。如此一来,这个闭包函数的状态就由“不确定”变为了“确定”,或者说转到了“闭合”状态,至此也就真正地形成了一个闭包。因此在用高阶函数实现闭包。这也是高阶函数的一大功用。

这种闭包的意义,表面上看,我们只是延迟实现了一部分程序逻辑或功能而已,但实际上,我们是在动态地生成那部分程序逻辑。可以借此在程序运行的过程中,根据需要生成功能不同的函数,继而影响后续的程序行为。这与 GoF 设计模式中的“模板方法”模式有着异曲同工之妙。

3. 传入参数

既不要把你程序的细节暴露给外界,也尽量不要让外界的变动影响到你的程序。

先看一个示例:

package main

import "fmt"

func main() {
  array1 := [3]string{"a", "b", "c"}
  fmt.Printf("The array: %v\n", array1)
  array2 := modifyArray(array1)
  fmt.Printf("The modified array: %v\n", array2)
  fmt.Printf("The original array: %v\n", array1)
}

func modifyArray(a [3]string) [3]string {
  a[1] = "x"
  return a
}

由于数组所有传给函数的参数值都会被复制,函数在其内部使用的并不是参数值的原值,而是它的副本。由于数组是值类型,所以每一次复制都会拷贝它,以及它的所有元素值。我在modify函数中修改的只是原数组的副本而已,并不会对原数组造成任何影响。

注意,对于引用类型,比如:切片、字典、通道,像上面那样复制它们的值,只会拷贝它们本身而已,并不会拷贝它们引用的底层数据。也就是说,这时只是浅表复制,而不是深层复制。

以切片值为例,如此复制的时候,只是拷贝了它指向底层数组中某一个元素的指针,以及它的长度值和容量值,而它的底层数组并不会被拷贝。

传入函数的是一个值类型的参数值,但如果这个参数值中的某个元素是引用类型的,那么我们仍然要小心。比如下面这种:

complexArray1 := [3][]string{
  []string{"d", "e", "f"},
  []string{"g", "h", "i"},
  []string{"j", "k", "l"},
}

虽然它是一个数组,但是其中的每个元素又都是一个切片。

最后更新于