高阶函数(higher-order function)就是指可以操作函数的函数,即函数可以作为参数,也可以作为返回结果。有了这两个特性,haskell可以实现许多神奇的效果。
柯里化(Currying)
在haskell中所有的算术运算符都是函数(包括大小于等于关系符等),而它们的快捷方式都可以省略操作数(参数)。
(+) 1 2 -- (+) 是需要两个操作数的函数 |
haskell中的函数默认都是前缀模式的,也就是:函数名 参数1 参数2 … 。但几乎所有拥有两个参数的函数都有中缀模式,只需要将函数名反引号包起来就可以了:参数1 `函数名` 参数2。因为在某些情况下中缀函数可读性更好,更符合人们的理解习惯。
5 `div` 3 -- 求余数 |
本质上,Haskell 的所有函数都只有一个参数,那么我们多个参数的函数又是怎么回事? 那是因为所有多个参数的函数都是 Curried functions。其实从上面的算术运算函数例子,我们大概就能猜出来了。接着用实例来进验证一下:
moreThen4 = max 4 -- 最小为4的函数 |
通过查看函数的类型可发现,两个参数的 max 函数其实可以写成 (max x) y 。moreThen4 其实就是 max 函数以不全的参数调用后,再创建了一个新的返回函数,该函数是单个参数形式的。
这和 JavaScript 里用 闭包 的特性返回函数来实现 柯里化 是一样一样的。但在函数式语言当中,函数本来就是一等公民,这事情简直就是和吃饭睡觉一样地自然而然。
我们看起来很怪的函数类型描述 Num a => a -> a -> a ,这下也能理解通了。它表示的是函数取一个数字参数a后,会返回一个需要a类型参数的函数 (Num a) => a -> a ,最后的这个函数再取一个参数a后 ,最终就会回传a类型的结果。
利用柯里化去掉多余参数后的函数更加简洁:
sum' xs = foldl (+) 0 xs |
Lambda表达式
lambda 已经不是什么新鲜事物了, 早在 .NET 4.0时代 C# 就已经引入了 lambda,JavaScript 也在 ES6 中引入。
编写匿名的函数,这样就不需要费力的创建命名函数。因为匿名函数从 lambda 演算而来,所以匿名函数通常也被称为 lambda 函数。
在 Haskell 中,匿名函数以反斜杠符号 \ 开始,后跟函数的参数(可以包含模式),而函数体定义在 -> 符号之后。lambda 函数的定义只能有一条语句,同时无法为一个参数设置多个模式,如 [] 和 (x:xs)。
plusOne = \x -> x+1 |
折叠函数
遍历列表是一个非常普遍的需求,用折叠函数代替显式递归进行遍历明显更加易于理解和实现。其中 foldl 是左结合,foldr 是右结合,一般右折叠效率比较高,同时 foldr 也可以用于无限列表,所以应尽量使用 foldr。
折叠函数调用格式: fold 处理函数 初始值(累加值) 需要折叠的列表
另外还提供了和 foldl/foldr 相似的 foldl1/foldr1,它们默认使用列表第一项为初始值,所以可以省略初始值。
map' :: Foldable t1 => (t2 -> a) -> t1 t2 -> [a] |
与 foldl 和 foldr 相似的scanl 和 scanr,它们会记录下累加值的所有状态到一个 List。
也有 scanl1 和 scanr1。
scanl (+) 0 [3,5,2,1] |
还有 foldl’ 和 foldl1’ 是它们各自惰性实现的严格版本。在用 fold 处理较大的 List 时,经常会遇到堆栈溢出的问题。而这罪魁祸首就是 fold 的惰性: 在执行 fold 时,累加器的值并不会被立即更新,而是做一个”在必要时会取得所需的结果”的承诺。每过一遍累加器,这一行为就重复一次。而所有的这堆”承诺”最终就会塞满你的堆栈。严格的 fold 就不会有这一问题,它们不会作”承诺”,而是直接计算中间值的结果并继续执行下去。如果用惰性 fold 时经常遇到溢出错误,就应换用它们的严格版。
函数组合
($) 叫作函数呼叫符,它的优先级最低。
f $ g x => f (g x) |
(.) 函数复合运算符,它可以组合函数,并产生新函数,然后传递给其它函数。当然我们可以用 lambda 实现,但大多数情况下,使用函数组合无疑更清楚。
(f . g) x => f(g x) |
这两个运算符是消除括号的神器,有了它们,代码的可读性大大提高。
我们再利用haskell强大的模式匹配能力,改变函数运行方向,改造后的效果类似于unix/linux的管道,把上面两个表达式重写。现在连 ($) (.) 都不需要了,吊炸天了,有木有😊
-- 让参数和结果首尾相连,就是这么简单 |