博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
向Java开发者介绍Scala
阅读量:6275 次
发布时间:2019-06-22

本文共 10175 字,大约阅读时间需要 33 分钟。

Scala结合了面向对象编程与函数编程思想,使用一种能够完全兼容Java、可以运行在Java虚拟机上的、简洁的语法。对于函数编程风格的支持,尤其是对于Lambda表达式的支持,能够有助于减少必须要编写的逻辑无关固定代码,也许让它可以更简单的关注要面对的任务本身,而相对的Java中对Lamdba表达式的支持要到预定于2012年发布的JavaSE8才会实现。本文就是对于Scala介绍。

相关厂商内容

作为第一步,先安装好最新的Scala发布包,打开命令行窗口,键入“scala”:这会启动REPL(读入-运算 输出 循环)交互式编码环境。然后你就可以写下你的第一行Scala代码:

scala> val columbus : Int = 1492
columbus: Int = 1492

我们刚刚声明了一个类型为Int的变量,初始值为1492,就像我们在Java里用语句Int columbus = 1492;所做的一样。除了把类型放在变量之后这样一种反向的声明方式之外,Scala在这里所表现出的不同是使用“val”来显性地把变量声明为不可变。如果我们想要修改这个变量:

scala> columbus = 1500 
:8: error: reassignment to val   columbus = 1500          ^

请注意错误消息精确地指出了错误位于行的哪个位置。再尝试声明这个变量,但这一次用“var”,让其可变更。这样编译器拥有足够的智能来推断出1492是一个整数,你也就不需要指定类型了:

scala> var columbus = 1492 columbus: Int = 1492scala> columbus = 1500  columbus: Int = 1500

接下来,我们来定义一个类:

scala> case class Employee( name:String="guest", age:Int=30, company:String =  "DevCode" ) defined class Employee

我们定义了一个类,名为Employee,有三个不可变更的字段:name、age和company,各自有自己的缺省值。关键字“case”相当于Java里的switch语句,只不过要更为灵活。它说明该类具有模式匹配的额外机制,以及其他一些特性,包括用来创建实例的工厂方法(不需要使用“new”关键字来构造),同样的也不需要创建缺省的getter方法。与Java中不同的是,变量缺省下的访问控制是public(而不是protected),而Scala为公开变量创建一个getter方法,并命名为变量名。如果你愿意,你也可以把字段定义成可变且/或私有(private)的,只需要在参数之前使用“var”(例如:case class Person(private var name:String))。

我们再来用不同方式创建一些实例,看看其他的特性,像是命名参数和缺省参数(从Scala2.8开始引入):

scala> val guest = Employee() guest: Employee = Employee(guest,30,DevCode)scala> val guestAge = guest.age // (age变量的缺省getter方法)  guestAge: Int = 300scala> val anna = Employee("Anna")  anna: Employee = Employee(Anna,30,DevCode)scala> val thomas = Employee("Thomas",41)  thomas: Employee = Employee(Thomas,41,DevCode)scala> val luke = Employee("Luke", company="LucasArt")  luke: Employee = Employee(Luke,30,LucasArt)scala> val yoda = luke.copy("Yoda", age=800)  yoda: Employee = Employee(Yoda,800,LucasArt)

不过,下面的写法

scala> val darth = Employee("Darth", "DevCode") 
:9: error: type mismatch; found : java.lang.String("DevCode") required: Int Error occurred in an application involving default arguments.     val darth = Employee("Darth", "DevCode")                     ^

是行不通的(可不是因为Darth不是DevCode的雇员!),这是由于构造函数在这个位置需要age作为参数,因为函数参数没有显性地进行命名。

现在我们再来看集合,这才是真正让人兴奋的地方。

有了泛型(Java5以上),Java可以遍历一个——比方说整数型列表,用下面这样的代码:

List
numbers = new arrayList
(); numbers.add(1); numbers.add(2); numbers.add(3); for(Integer n:numbers) { System.out.println("Number "+n);}

运行的结果是

Number 1

Number 2
Number 3

Scala对于可变集合和不可变集合进行了系统性地区别处理,不过鼓励使用不可变集合,也因此在缺省情况下创建不可变集合。这些集合是通过模拟的方式实现添加、更新和删除操作,在这些操作中,不是修改集合,而是返回新的集合。

与前面的Java代码等价的Scala代码可能像下面这样:

scala> val numbers = List(1,2,3) numbers: List[Int] = List(1, 2, 3)scala> for (n <- numbers) println("Number "+n)  Number 1  Number 2  Number 3

这里的“for”循环语法结构非常接近于Java的命令式编程风格。在Scala(以及Java虚拟机上其他很多语言如:Groovy、JRuby或JPython)里还有另外一种方式来实现上面的逻辑。这种方式使用一种更加偏向函数编程的风格,引入了Lambda表达式(有时也称为闭包——closure)。简单地说,Lambda表达式就是你可以拿来当作参数传递的函数。这些函数使用参数作为输入(在我们的例子中就是“n”整型变量),返回语句作为函数体的最终语句。他们的形式如下

functionName { input =>    body}scala> numbers.foreach { n:Int =>     // 按回车键继续下一行     | println("Number "+n)      | }  Number 1  Number 2  Number 3

上面的例子中,函数体只有一条语句(println……),返回的是单位(Unit,也就是“空结果”),也就是大致相当于Java中的void,不过有一点不同的是——void是不返回任何结果的。

除了只打印出我们的数值列表以外,应该说我们更想做的是处理和变换这些元素,这时我们需要调用方法来生成结果列表,以便后面接着使用。让我们尝试一些例子:

scala> val reversedList = numbers.reverse reversedList: List[Int] = List(3, 2, 1)scala> val numbersLessThan3 = numbers.filter { n => n < 3 }  numbersLessThan3: List[Int] = List(1, 2)scala> val oddNumbers = numbers.filterNot { n => n % 2 == 0 }  oddNumbers: List[Int] = List(1, 3)scala> val higherNumbers = numbers.map { n => n + 10 }  higherNumbers: List[Int] = List(11, 12, 13)

最后的这一个变换“map”非常有用,它对列表的每一个元素应用闭包,结果是一个同样大小的、包含了每个变换后元素的列表。

我们在这里还想介绍最后的一个方法,就是“foldLeft”方法,它把状态从一个元素传播到另一个元素。比如说,要算出一个列表里所有元素的和,你需要累加它们,并在切换元素的时候保存中间的计数:

scala> val sumOfNumbers = numbers.foldLeft(0) { (total,element) =>    | total + element    | } sumOfNumbers: Int = 6

作为第一个变量传递给foldLeft的值0是初始值(也就是说在把函数用到第一个列表元素的时候total=0)。(total,element)代表了一个Tuple2,在Scala里这是一个二元组(就像要表示三维空间坐标,经常要用到Tuple3(x,y,z)等等)。注意在合计时,Scala的编程接口实际上提供了一个“sum”方法,这样上一条语句就可以写成:

scala> val sumOfNumbers = numbers.sum sumOfNumbers: Int = 6

还有许多其他的类似的集合变换方法,你可以参照。你也可以把这些方法组合起来(例如:numbers.reverse.filter……),让代码更加简洁,不过这样会影响可读性。

最后,{ n => n + 10 }还可以简单地写成(_ + 10),也就是说如果输入参数只是用于你调用的方法,则不需要声明它;在我们的例子里,“n”被称为匿名变量,因为你可以把它用任何形式来代替,比如说“x”或者“number”,而下划线则表示一处需要用你的列表的每个元素来填补的空白。(与“_”的功能类似,Groovy保留了关键字“it”,而Python则使用的是“self”)。

scala> val higherNumbers = numbers.map(_+10) higherNumbers: List[Int] = List(11, 12, 13)

在介绍了对整数的基本处理后,我们可以迈入下一个阶段,看看复杂对象集合的变换,例如使用我们上面所定义的Employee类:

scala> val allEmployees = List(luke,anna,guest,yoda,thomas) allEmployees: List[Employee] = List(Employee(Luke,30,LucasArt),  Employee(Anna,30,DevCode), Employee(guest,30,DevCode),  Employee(Yoda,800,LucasArt), Employee(Thomas,41,DevCode))

从这个五个元素的列表里,我们可以应用一个条件来过滤出应用匿名方法后返回值为True的雇员,这样就得到了——比方说属于DevCode的雇员:

scala> val devcodeEmployees = allEmployees.filter { _.company == "DevCode" } devcodeEmployees: List[Employee] = List(Employee(Anna,30,DevCode),  Employee(guest,30,DevCode), Employee(Thomas,41,DevCode))scala> val oldEmployees = allEmployees.filter(_.age > 100).map(_.name)  oldEmployees: List[String] = List(Yoda)

假设我们手头的allEmployees集合是我们使用SQL查询获得的结果集,查询语句可能类似于“SELECT * FROM employees WHERE company = ‘DevCode’ ”。现在我们可以把List[Employee]变换到以company名称作为键、属于该公司的所有员工的列表作为值的Map类型,这样就可以把雇员按company来排序:

scala> val sortedEmployees = allEmployees.groupBy(_.company) sortedEmployees: scala.collection.immutable.Map[String,List[Employee]] = Map(DevCode - > List(Employee(Anna,30,DevCode), Employee(guest,30,DevCode),  Employee(Thomas,41,DevCode)), LucasArt -> List(Employee(Luke,30,LucasArt),  Employee(Yoda,800,LucasArt)))

每一个列表已经作为一个值存入了(键——值)哈希表,为了示范如何进一步处理这些列表,可以设想我们需要计算每个公司的雇员平均年龄。

这具体意味着我们必须要计算每个列表的每个雇员的的“age”字段的和,然后除以该列表中雇员的数量。让我们先计算一下DevCode:

scala> devcodeEmployees res4: List[Employee] = List(Employee(Anna,30,DevCode), Employee(guest,30,DevCode),  Employee(Thomas,41,DevCode))scala> val devcodeAges = devcodeEmployees.map(_.age)  devcodeAges: List[Int] = List(30, 30, 41)scala> val devcodeAverageAge = devcodeAges.sum / devcodeAges.size  devcodeAverageAge: Int = 33

回到我们的Map (key:String ->value:List[Employee]),下面是个更加一般性的例子。我们现在可以归并并计算每个公司的平均年龄,要做的只是写几行代码:

scala> val averageAgeByCompany = sortedEmployees.map{ case(key,value)=>    | value(0).copy(name="average",age=(value.map(_.age).sum)/value.size)} averageAgeByCompany: scala.collection.immutable.Iterable[Employee] =  List(Employee(average,33,DevCode), Employee(average,415,LucasArt))

这里的“case(key,value)”说明了Scala提供的模式匹配机制是多么强大。请参考Scala的文档来获取更多的信息。

到这里我们的任务就完成了。我们实现的是一个简单的Map-Reduce算法。由于每个公司雇员的归并是完全独立于其他公司,这个算法非常直观地实现了并行计算。

在后面的附录里给出了此算法的等价的实现,分为Java版本和Scala版本。

参考

附录

Map Reduce: Java

public class Employee {    final String name;    final Integer age;    final String company;    public Employee(String name, Integer age, String company) {        this.name = name == null ? "guest" : name;        this.age = age == null ? 30 : age;        this.company = company == null ? "DevCode" : company;    }    public String getName() {        return name;    }    public int getAge() {        return age;    }    public String getCompany() {        return company;    }    @Override    public String toString() {        return "Employee [name=" + name + ", age=" + age + ",               company="               + company + "]";    }}class Builder {    String name, company;    Integer age;    Builder(String name) {        this.name = name;    }    Employee build() {        return new Employee(name, age, company);    }    Builder age(Integer age) {        this.age = age;        return this;    }    Builder company(String company) {        this.company = company;        return this;    }}import java.util.ArrayList;import java.util.Collection;import java.util.List;import com.google.common.base.Function;import com.google.common.collect.ImmutableListMultimap;import com.google.common.collect.ImmutableSet;import com.google.common.collect.Multimaps;public class MapReduce {    public static final void main(String[] args) {        Employee guest = new Builder("Guest").build();        Employee anna = new Builder("Anna").build();        Employee thomas = new Builder("Thomas").age(41).build();        Employee luke = new            Builder("Luke").company("LucasArt").build();        Employee yoda = new            Builder("Yoda").age(800).company("LucasArt").build();        Collection
employees = new ArrayList
(); employees.add(guest); employees.add(anna); employees.add(thomas); employees.add(luke); employees.add(yoda); ImmutableListMultimap
personsGroupByCompany = Multimaps.index(employees, new Function
() { public String apply(Employee person) { return person.getCompany(); } }); ImmutableSet
companyNamesFromMap = personsGroupByCompany.keySet(); List
averageAgeByCompany = new ArrayList
(); for(String company: companyNamesFromMap) { List
employeesForThisCompany = personsGroupByCompany.get(company); int sum = 0; for(Employee employee: employeesForThisCompany) { sum+= employee.getAge(); } averageAgeByCompany.add(new Employee("average",sum/employeesForThisCompany.size(),company)); } System.out.println("Result: "+averageAgeByCompany); }}

MapReduce.scala:

case class Employee(name: String = "guest", age: Int = 30, company: String = "DevCode")    object MapReduce {        def main(args: Array[String]): Unit = {        val guest = Employee()        val anna = Employee("Anna")        val thomas = Employee("Thomas", 41)        val luke = Employee("Luke", company = "LucasArt")        val yoda = luke.copy("Yoda", age = 800)        val allEmployees = List(luke, anna, guest, yoda, thomas)        val sortedEmployees = allEmployees.groupBy(_.company)        val averageAgeByCompany = sortedEmployees.map { case (key, value) =>            value(0).copy(name = "average", age = (value.map(_.age).sum) / value.size)      }        println("Result: "+averageAgeByCompany)    }}

转载地址:http://ctwva.baihongyu.com/

你可能感兴趣的文章
QCon演讲速递:异步处理在分布式系统中的优化作用
查看>>
Javascript 中的 Array 操作
查看>>
YARN的AsyncDispatcher原理
查看>>
java中包容易出现的错误及权限问题
查看>>
AngularJS之初级Route【一】(六)
查看>>
服务器硬件问题整理的一点总结
查看>>
SAP S/4HANA Cloud: Revolutionizing the Next Generation of Cloud ERP
查看>>
Mellanox公司计划利用系统芯片提升存储产品速度
查看>>
白帽子守护网络安全,高薪酬成大学生就业首选!
查看>>
AMD 16核心Zen处理器首曝:四通道DDR4
查看>>
阿里大数据打假:实时分析数据每秒1亿次
查看>>
如何入手 dubbo
查看>>
英国网络安全公司Darktrace获6400万美元C轮融资
查看>>
CYQ.Data+EasyUI开发:几个相关的问题CheckBox、Tree、TreeGrid
查看>>
Extjs分页使用Java实现数据库数据查询
查看>>
BayWa收购光伏分销商Solarmatrix进军澳大利亚市场
查看>>
股东致函雅虎董事会要求别再烧钱 雅虎反呛
查看>>
移动OA的魅力--大众点评的“企业号”运用法则
查看>>
芯片进口额远超原油 中国芯待发力
查看>>
ARM想将芯片装进人类大脑 降低能耗是一大挑战
查看>>