更多的集合

Scala 提供了一套很好的集合实现,提供了一些集合类型的抽象。这让你的代码可以与 Foo 的集合交互,而无需担心该集合是是一个 List,还是 Set,或是任何你有的类型。

这里提供了一个很好的页面来查看各种集合的默认实现,并链接到他们的 scala 在线文档。

基础知识

表 List

标准的链表。

scala> List(1, 2, 3)
res0: List[Int] = List(1, 2, 3)

你可以用函数式语言的方式连接它们。

scala> 1 :: 2 :: 3 :: Nil
res1: List[Int] = List(1, 2, 3)

参考 API文档

集 Set

集没有重复

scala> Set(1, 1, 2)
res2: scala.collection.immutable.Set[Int] = Set(1, 2)

参考 API文档

序列 Seq

序列有一个给定的顺序。

scala> Seq(1, 1, 2)
res3: Seq[Int] = List(1, 1, 2)

(请注意返回的是一个列表。因为 Seq 是一个特质;而列表是序列的很好实现。如你所见,Seq 也是一个工厂单例对象,可以用来创建列表。)

参考 API文档

映射 Map

映射是键值容器。

scala> Map('a' -> 1, 'b' -> 2)
res4: scala.collection.immutable.Map[Char,Int] = Map((a,1), (b,2))

参考 API文档

层次结构

下面介绍的都是特质,它们在可变的(mutable)和不可变的(immutable)的包中都有特定实现。

Traversable

所有集合都可以被遍历。这个特质定义了标准函数组合子。 这些组合子根据 foreach 来写,所有集合必须实现。

参考 API文档

Iterable

iterator() 方法返回一个 Iterator 来迭代元素。

参考 API文档

Seq 序列

有顺序的对象序列。

参考 API文档

Set 集

没有重复的对象集合。

参考 API文档

Map

键值对。

参考 API文档

方法

Traversable

下面所有方法在子类中都是可用的。参数和返回值的类型可能会因为子类的覆盖而看起来不同。

def head : A
def tail : Traversable[A]

这里是函数组合子定义的地方。

def map [B] (f: (A) => B) : CC[B]

返回每个元素都被 f 转化的集合

def foreach[U](f: Elem => U): Unit

在集合中的每个元素上执行 f 。

def find (p: (A) => Boolean) : Option[A]

返回匹配谓词函数的第一个元素

def filter (p: (A) => Boolean) : Traversable[A]

返回所有匹配谓词函数的元素集合

划分:

def partition (p: (A) ⇒ Boolean) : (Traversable[A], Traversable[A])

按照谓词函数把一个集合分割成两部分

def groupBy [K] (f: (A) => K) : Map[K, Traversable[A]]

转换:

有趣的是,你可以转换集合类型。

def toArray : Array[A]
def toArray [B >: A] (implicit arg0: ClassManifest[B]) : Array[B]
def toBuffer [B >: A] : Buffer[B]
def toIndexedSeq [B >: A] : IndexedSeq[B]
def toIterable : Iterable[A]
def toIterator : Iterator[A]
def toList : List[A]
def toMap [T, U] (implicit ev: <:<[A, (T, U)]) : Map[T, U]
def toSeq : Seq[A]
def toSet [B >: A] : Set[B]
def toStream : Stream[A]
def toString () : String
def toTraversable : Traversable[A]

把映射转换为一个数组,您会得到一个键值对的数组。

scala> Map(1 -> 2).toArray
res41: Array[(Int, Int)] = Array((1,2))

Iterable

添加一个迭代器的访问。

  def iterator: Iterator[A]

一个迭代器能给你提供什么?

def hasNext(): Boolean
def next(): A

这是非常 Java 式的。你通常不会看到在 Scala 中使用迭代器,通常更容易出现的是函数组合器或 for 循环的使用。

Set

  def contains(key: A): Boolean
  def +(elem: A): Set[A]
  def -(elem: A): Set[A]

Map

通过键查找的键值对的序列。

可以像这样将一个键值对列表传入 apply()

scala> Map("a" -> 1, "b" -> 2)
res0: scala.collection.immutable.Map[java.lang.String,Int] = Map((a,1), (b,2))

或者像这样:

scala> Map(("a", 2), ("b", 2))
res0: scala.collection.immutable.Map[java.lang.String,Int] = Map((a,2), (b,2))

题外话

什么是->?这不是特殊的语法,这是一个返回元组的方法。

scala> "a" -> 2

res0: (java.lang.String, Int) = (a,2)

请记住,这仅仅是下面代码的语法糖

scala> "a".->(2)

res1: (java.lang.String, Int) = (a,2)

您也可以使用++操作符构建

scala> Map.empty ++ List(("a", 1), ("b", 2), ("c", 3))
res0: scala.collection.immutable.Map[java.lang.String,Int] = Map((a,1), (b,2), (c,3))

常用的子类

HashSet 和 HashMap 的快速查找,这些集合的最常用的形式。 HashSet API, HashMap API

TreeMap 是 SortedMap 的一个子类,它可以让你进行有序访问。 [TreeMap API]()

Vector 快速随机选择和快速更新。 Vector API

scala> IndexedSeq(1, 2, 3)
res0: IndexedSeq[Int] = Vector(1, 2, 3)

Range 等间隔的 Int 有序序列。你经常会在 for 循环看到。 Range API

scala> for (i <- 1 to 3) { println(i) }
1
2
3

Ranges 支持标准的函数组合子。

scala> (1 to 3).map { i => i }
res0: scala.collection.immutable.IndexedSeq[Int] = Vector(1, 2, 3)

默认实现

使用特质的 apply 方法会给你默认实现的实例,例如,Iterable(1, 2)会返回一个列表作为其默认实现。

scala> Iterable(1, 2)

res0: Iterable[Int] = List(1, 2)

序列 Seq 也是一样的,正如我们前面所看到的

scala> Seq(1, 2)
res3: Seq[Int] = List(1, 2)

scala> Iterable(1, 2)
res1: Iterable[Int] = List(1, 2)

scala> Sequence(1, 2)
warning: there were deprecation warnings; re-run with -deprecation for details
res2: Seq[Int] = List(1, 2)

Set

scala> Set(1, 2)
res31: scala.collection.immutable.Set[Int] = Set(1, 2)

一些描述性的特质

IndexedSeq 快速随机访问元素和一个快速的长度操作。"API 文档":http://www.scala-lang.org/api/current/scala/collection/IndexedSeq.html

LinearSeq 通过 head 快速访问第一个元素,也有一个快速的 tail 操作。 API 文档

可变 vs 不可变

不可变

优点

  • 在多线程中不会改变

缺点

  • 一点也不能改变

Scala 允许我们是务实的,它鼓励不变性,但不惩罚我们需要的可变性。这和 var vs. val 非常相似。我们总是先从 val 开始并在必要时回退为 var。

我们赞成使用不可改变的版本的集合,但如果性能使然,也可以切换到可变的。使用不可变集合意味着你在多线程不会意外地改变事物。

可变集合

前面讨论的所有类都是不可变的。让我们来讨论常用的可变集合。

HashMap 定义了 getOrElseUpdate, += HashMap API

scala> val numbers = collection.mutable.Map(1 -> 2)
numbers: scala.collection.mutable.Map[Int,Int] = Map((1,2))

scala> numbers.get(1)
res0: Option[Int] = Some(2)

scala> numbers.getOrElseUpdate(2, 3)
res54: Int = 3

scala> numbers
res55: scala.collection.mutable.Map[Int,Int] = Map((2,3), (1,2))

scala> numbers += (4 -> 1)
res56: numbers.type = Map((2,3), (4,1), (1,2))

与 Java 生活

您可以通过 JavaConverters package 轻松地在 Java 和 Scala 的集合类型之间转换。它用 asScala 装饰常用的 Java 集合以和用 asJava 方法装饰 Scala 集合。

   import scala.collection.JavaConverters._
   val sl = new scala.collection.mutable.ListBuffer[Int]
   val jl : java.util.List[Int] = sl.asJava
   val sl2 : scala.collection.mutable.Buffer[Int] = jl.asScala
   assert(sl eq sl2)

双向转换:

scala.collection.Iterable <=> java.lang.Iterable
scala.collection.Iterable <=> java.util.Collection
scala.collection.Iterator <=> java.util.{ Iterator, Enumeration }
scala.collection.mutable.Buffer <=> java.util.List
scala.collection.mutable.Set <=> java.util.Set
scala.collection.mutable.Map <=> java.util.{ Map, Dictionary }
scala.collection.mutable.ConcurrentMap <=> java.util.concurrent.ConcurrentMap

此外,也提供了以下单向转换

scala.collection.Seq => java.util.List
scala.collection.mutable.Seq => java.util.List
scala.collection.Set => java.util.Set
scala.collection.Map => java.util.Map
07-05 11:01