我偶然发现了一些令人讨厌的东西。我知道haskell可用于弱头正常形式(WHNF),而且我知道这是什么。将以下代码键入ghci(据我所知,我正在使用命令:sprint,将表达式简化为WHNF):

let intlist = [[1,2],[2,3]]
:sprint intlist

intlist = _这对我来说完全有意义。
let stringlist = ["hi","there"]
:sprint stringlist

给出stringlist = [_,_]这已经使我感到困惑。但是之后:
let charlist = [['h','i'], ['t','h','e','r','e']]
:sprint charlist

令人惊讶地给出charlist = ["hi","there"]
据我了解,Haskell,字符串不过是字符列表,这似乎可以通过检查"hi" :: [Char]['h','i'] :: [Char]类型来确认。

我很困惑,因为根据我的理解,以上所有三个示例大致相同(列表列表),因此应简化为相同的WHNF,即_。我想念什么?

谢谢

最佳答案

请注意,:sprint不会而不是将表达式简化为WHNF。如果确实如此,则以下内容将给出4而不是_:

Prelude> let four = 2 + 2 :: Int
Prelude> :sprint four
four = _

相反,:sprint使用绑定(bind)​​的名称,遍历绑定(bind)值的内部表示,并显示已“评估的部分”(即构成构造的部分),同时将_用作未评估的thunk(即悬挂的)的占位符。懒函数调用)。如果该值未完全评估,则不会进行评估,甚至不会对WHNF进行评估。 (而且,如果对值进行了完全评估,您将得到结果,而不仅仅是WHNF。)

您在实验中观察到的是多态与单态数字类型的组合,字符串文字的不同内部表示形式与字符的显式列表等的组合。基本上,您在观察如何将不同的文字表达式编译为字节码方面存在技术差异。因此,将这些实现细节解释为与WHNF有关系将使您毫无希望地感到困惑。通常,您应该仅将:sprint用作调试工具,而不应将其用作了解WHNF和Haskell评估语义的方式。

如果您真的想了解:sprint在做什么,则可以在GHCi中打开一些标志来查看表达式的实际处理方式,并最终将其编译为字节码:
> :set -ddump-simpl -dsuppress-all -dsuppress-uniques

之后,我们可以看到您的intlist提供_的原因:
> let intlist = [[1,2],[2,3]]
==================== Simplified expression ====================
returnIO
  (: ((\ @ a $dNum ->
         : (: (fromInteger $dNum 1) (: (fromInteger $dNum 2) []))
           (: (: (fromInteger $dNum 2) (: (fromInteger $dNum 3) [])) []))
      `cast` <Co:10>)
     [])

您可以忽略returnIO和外部:调用,而专注于以((\ @ a $dNum -> ...开头的部分

这里$dNumNum约束的字典。这意味着生成的代码尚未解析a类型中的实际类型Num a => [[a]],因此整个表达式仍表示为一个函数调用,该函数调用采用适当的Num类型(作为字典)。换句话说,这是一个未经评估的重击,我们得到:
> :sprint intlist
_

另一方面,将类型指定为Int,并且代码完全不同:
> let intlist = [[1::Int,2],[2,3]]
==================== Simplified expression ====================
returnIO
  (: ((: (: (I# 1#) (: (I# 2#) []))
         (: (: (I# 2#) (: (I# 3#) [])) []))
      `cast` <Co:6>)
     [])
:sprint输出也是如此:
> :sprint intlist
intlist = [[1,2],[2,3]]

同样,文字字符串和显式字符列表具有完全不同的表示形式:
> let stringlist = ["hi", "there"]
==================== Simplified expression ====================
returnIO
  (: ((: (unpackCString# "hi"#) (: (unpackCString# "there"#) []))
      `cast` <Co:6>)
     [])

> let charlist = [['h','i'], ['t','h','e','r','e']]
==================== Simplified expression ====================
returnIO
  (: ((: (: (C# 'h'#) (: (C# 'i'#) []))
         (: (: (C# 't'#)
               (: (C# 'h'#) (: (C# 'e'#) (: (C# 'r'#) (: (C# 'e'#) [])))))
            []))
      `cast` <Co:6>)
     [])

并且:sprint输出中的差异代表了工件的伪影,其中GHCi认为表达式的哪些部分被评估(显式的:构造函数)与未评估的部分(unpackCString#杂项)。

09-25 15:31