为了账号安全,请及时绑定邮箱和手机立即绑定

大数据开发技术Scala 中 10 个超赞的集合操作函数

当我处理 Scala 集合时,我会进行两类操作:转换操作和聚合操作。第一种操作类型将集合转换为另一个集合,第二种操作类型返回某些类型的值。

本文我将集中介绍几个日常工作必备的 Scala 集合函数,如转换函数和聚合函数。文章最后,我会展示如何结合这些函数以解决具体问题。

1

最大值和最小值

我们先从动作函数开始。

在序列中查找最大或最小值是一个极常见的需求,较常用于面试问题和算法。还记得 Java 中的代码行吗?如下:

https://img1.sycdn.imooc.com//5e15426400016af304310113.jpg

问题:怎么在 List 中找到最大/最小值呢?

Scala 推荐了一个很赞的解决方案:

https://img1.sycdn.imooc.com//5e1542650001dfff03860067.jpg

但实际操作的数据更加复杂。下面我们介绍一个更高级的例子,其中包含一个书的序列(查看源代码案例)。

https://img1.sycdn.imooc.com//5e1542650001377204650156.jpg

如上所示,minBy & maxBy 方法解决了复杂数据的问题。你只需选择决定数据最大或最小的属性。

2

过滤

你过滤过集合吗?比如,筛选价格大于10美元的条目,或挑选年龄在24岁以下员工等,所有这些操作属于过滤。

让我们举例说明:过滤一个数字 List,只获取奇数的元素。

https://img1.sycdn.imooc.com//5e154265000179c504930032.jpg

然后加大难度,我想获取页数大于120页的书。

https://img1.sycdn.imooc.com//5e1542650001ec2704220097.jpg

实际上,过滤是一个转换类型的方法,但是比运用 min 和 max 方法简单。

还有一个与 filter 类似的方法是 filterNot。它的名字就体现了它的作用。如果你还是不了解它的实际用途,你可以在一个示例中,用 filterNot 替换 filter 方法。

3

Flatten O_o

我想大多数朋友都没听说过这个功能。其实它很好理解,我们来举例说明:

https://img1.sycdn.imooc.com//5e1542660001d18104920208.jpg

当有一个集合的集合,然后你想对这些集合的所有元素进行操作时,就会用到 flatten。

4

Euler Diagram 函数

[译者注:Euler Diagram 可以翻译为欧拉图,但请注意与 Euler Graph 的区别。Euler Diagram 用于描述集合及集合间的关系,而 Euler Graph 描述的是一种“图”这样的数据结构]

不要紧张!接下来的操作大家都熟知:差集、交集和并集。以下示例能很好地解释 Euler Diagram 函数:

https://img1.sycdn.imooc.com//5e1542660001cd9e04410148.jpg

上述示例中的 union 保留了重复的元素。如果我们不需要重复怎么办?这时可以使用 distinct 函数:

https://img1.sycdn.imooc.com//5e1542660001e6ed04050049.jpg

下面是上述功能的图示:

https://img1.sycdn.imooc.com//5e15426700016a3406400531.jpg

5

map(映射)列表元素

map 是 Scala 集合最常用的一个函数。它的功能十分强大:

https://img1.sycdn.imooc.com//5e154267000130de03850113.jpg

map 函数的逻辑是遍历集合中的元素并对每个元素调用函数。你也可以不调用任何函数,保持返回元素本身,但这样 map 无法发挥作用,因为你在映射过后得到的是同样的集合。

6

flatMap

我很难具体说明 flatMap 的使用场合,因为很多不同的情况下都会用到 flatMap。如果大家仔细观察,就会发现 flatMap 是由下列这两个函数组成的:

map & flatten

现在,假设我们想知道字母表中的大写字母和小写字母的排列情况:

https://img1.sycdn.imooc.com//5e1542790001118a03910068.jpg

因为这篇文章是关于集合功能的介绍,所以此处略过 Future 和 Option 的示例。

7

对整个集合进行条件检查

有一个场景大家都知道,即确保集合中所有元素都要符合某些要求,如果有哪怕一个元素不符合条件,就需要进行一些处理:

https://img1.sycdn.imooc.com//5e15427a0001cbbb03940069.jpg

而 forall 函数就是为处理这类需求而创建的。

8

集合进行分组

你是否尝试过将一个集合按一定的规则拆分成两个新的集合?比如,我们把某个集合拆分成偶数集和奇数集,partition 函数可以帮我们做到这一点:

https://img1.sycdn.imooc.com//5e15427a00015b6303790067.jpg

9

Fold

另一个流行的操作是 fold。 在 Scala 的上下文中,通常可以考虑 foldLeft 和 foldRight。他们是从不同的方面做同样的工作: 

https://img1.sycdn.imooc.com//5e15427a0001e94b04160051.jpg

在第一对括号中,我们放一个起始值。 在第二对括号中,我们定义需要对数字序列的每个元素执行的操作。 第一步,n = 0,然后它根据序列元素变化。

另一个关于 foldLeft 的例子,计算字符数:

https://img1.sycdn.imooc.com//5e15427a0001a13405220052.jpg

10

你最喜欢的函数

举了那么多 Scala 集合函数的例子,有没有哪项是你最喜欢的呢?如果你有更好的示例,也可以与大家一起分享。

函数整合

按照文章开头的承诺,我将提供一个函数整合的例子。 最近,我在进行一个编译测试,其中一个任务是:给定字符串 S,你必须找到同时包含大写和小写字符但不包含数字的最长子字符串。

例如: dP4knqw1QAp

结果: QAp

然后我们使用 Scala 集合函数来处理这个任务:

https://img1.sycdn.imooc.com//5e15427a0001e24b03780081.jpg

如上所示,如果输入字符串不包含任何合适的子字符串,则会抛出 UnsupportedOperationException 异常。

总结

Scala 有一个强大的集合 API,可以应用到很多地方。 从 Euler 函数的示例就能看出,同一事物可以通过不同的方式进行处理。如果你想较好地掌握如此丰富的集合 API,那就需要花些时间学习和演练。


点击查看更多内容
TA 点赞

若觉得本文不错,就分享一下吧!

评论

作者其他优质文章

正在加载中
  • 推荐
  • 评论
  • 收藏
  • 共同学习,写下你的评论
感谢您的支持,我会继续努力的~
扫码打赏,你说多少就多少
赞赏金额会直接到老师账户
支付方式
打开微信扫一扫,即可进行扫码打赏哦
今天注册有机会得

100积分直接送

付费专栏免费学

大额优惠券免费领

立即参与 放弃机会
意见反馈 帮助中心 APP下载
官方微信

举报

0/150
提交
取消