3. 自由的Fortran
返回页首
灵活性一直是Fortran语言的一个弱项。早期的Fortran甚至不支持内存的动态分配。Fortran 90引入了指针的概念,全面支持数据的动态存取,同时也引入了泛型过程(Generic Procedure)的机制,以支持与C++的函数重载类似的功能。在此基础上,Fortran 2003通过参数化派生类型、覆盖、多态型等机制,进一步增强了Fortran语言的灵活性。例如:
TYPE point(k, n)
INTEGER, KIND :: k = KIND(0.0D0)
INTEGER, LEN :: n
REAL(KIND=k) :: x, y
CHARACTER(LEN=n) :: name
END TYPE
基于上面这样的参数化派生类型(Parameterized Derived Type),我们可以在定义对象时,根据需要指定对象的具体类型参数,也可以在程序运行期间,动态指定可分配内存对象的类型参数(Deferred Type Parameter)。
除了Fortran 90已经实现的重载(Overloading)机制以外,Fortran 2003还允许扩展类型覆盖(Overriding)基类型中的类型绑定过程。更重要的是,Fortran 2003通过抽象类型(Abstract Type)、延迟绑定(Deferred Binding)、多态实体(Polymorphic Entity)、类型选择结构(SELECT TYPE)等要素完整地实现了面向对象语言必备的多态机制。举例来说,我们可以声明下面这样的抽象类型:
TYPE, ABSTRACT :: point
REAL :: x, y
CONTAINS
PROCEDURE(testif), DEFERRED :: test
END TYPE
ABSTRACT INTERFACE
SUBROUTINE testif(p)
CLASS(point), INTENT(in) :: p
END SUBROUTINE
END INTERFACE
上述代码相当于在C++或Java语言中声明了一个抽象类,其中的test过程相当于C++语言中的一个纯虚函数,只有接口声明,而没有实现代码。在此基础上,我们可以从抽象类型point扩展出具体的子类型。
当某个对象的具体类型在运行时才能确定时,我们可以用CLASS关键字(这里的CLASS指的是一组有继承关系的类型,与C++中的class并不等同)定义一个具有多态功能的指针或可分配对象:
CLASS(point), POINTER :: p
现在,指针p可以指向任何由point扩展的具体类型的对象,这种使用方式已经和我们在C++中用基类指针引用派生类对象的做法一模一样了。使用这种具有多态性特征的实体时,我们还可以用Fortran 2003提供的内部过程SAME_TYPE_AS和EXTENDS_TYPE_OF来判定对象的类型,这是一种简单的运行时类型识别(RTTI)机制,其功能和C++语言中的typeid关键字相仿。
更有趣的是,Fortran 2003允许代码根据多态实体的实际类型,在运行时执行特定的程序流程:
CLASS(point), POINTER :: p
p => a
SELECT TYPE ( pp => p )
TYPE IS (point_3d)
PRINT *, pp%z
TYPE IS (point_2d)
PRINT *, pp%x
END SELECT
这种语法在程序设计语言中比较少见。在Java或C#等具备较强的RTTI和Reflection功能的语言中,我们可以用switch语句结合类型标识实现类似的功能,如下面的C#代码:
void foo(Point p) {
switch(p.GetType().FullName) {
case "Science.Point2D":
MessageBox.Show("2D point");
break;
case "Science.Point3D":
MessageBox.Show("3D point");
break;
}
}
但在Fortran这样不依赖于虚拟机和中间代码的纯编译型语言中,能够拥有如此方便的SELECT TYPE语句,实在是Fortran用户的一大幸事。
其他一些较小的语法功能扩充也能反映出Fortran 2003制定者对语言灵活性的追求。比方说,ASSOCIATE语句可以让Fortran用户体验到比C语言的宏定义更为便捷的复杂表达式替换功能:
ASSOCIATE ( Z => EXP(-(X**2+Y**2)) * COS(THETA) )
PRINT *, A+Z, A-Z
END ASSOCIATE
再比方说,在Fortran 2003中,可以拥有ALLOCATABLE属性的变量已不再限于数组对象,参数化派生类型的对象也可以在定义时省略参数,而在动态分配时指明:
TYPE(point(KIND(0.0D0), n=20)) :: a
TYPE(point(KIND(0.0D0), n=:)),ALLOCATABLE :: b
ALLOCATE(b,SOURCE=a)
对于科学计算语言中最重要的数组(矩阵)操作,Fortran 2003也提供了更多的新功能。例如,为可动态分配的数组变量赋值时,目标数组的形状可以根据源数组的形状自动调整,并自动完成内存空间的重新分配,用户也可以使用新增的MOVE_ALLOC内部过程强制改变某个数组的形状:
REAL, ALLOCATABLE :: a(:), temp(:)
ALLOCATE(a(-n:n)
ALLOCATE(temp(-2*n:2*n))
temp(::2) = a
CALL MOVE_ALLOC(TO=a, FROM=temp)
Fortran 2003允许我们为指针类型的参数增加INTENT属性,这为那些与动态数据结构(如链表)相关的算法程序提供了更多的选择空间。Fortran 2003引入了IMPORT语句,允许接口声明中引用接口所在模块内的相关定义。Fortran 2003还允许我们在USE语句中,改变被引用模块内自定义运算符的名称。
总之,借助Fortran 2003提供的更加灵活的语法特性,我们能更容易地编写出可以适应不同数据类型、不同应用环境的可复用代码。对于Fortran语言拓展应用领域、发掘潜在用户的目标而言,这些灵活性都是至关重要和不可或缺的。
4. 高性能的Fortran
返回页首
与其他科学计算语言或工具相比,Fortran语言在性能上历来是出类拔萃的。因为语言本身专门针对数值计算、矩阵处理等功能进行了优化,大多数Fortran编译器产生的可执行代码在效率上甚至会超过以高效著称的C或C++语言。为了在高性能的并行处理系统(如IBM的“深蓝”和我国的“曙光”)上获得更出色的执行效率,Fortran 95还特意吸收了HPF语言的优点,为Fortran语言增添了若干支持并行计算的语法特征(比如著名的FORALL语句和PURE过程)。
继续改进Fortran语言的计算性能当然也是Fortran 2003的任务之一。一个最明显的例子是,Fortran 2003引入了VOLATILE属性。这个属性类似于C语言或Java语言中的volatile关键字。编写过并发或实时应用的程序员都知道这个含义为“易变”的关键字的价值:在并发系统中,如果没有这个关键字的帮助,我们就必须时刻警惕共享数据的取值是否已被正确刷新。
不过,相对而言,Fortran语言本身的并行计算机制仍不算十分健全。编写并发或实时程序时,Ada语言中的任务(Task)管理和同步(Synchronization)机制,或是Java语言中的多线程同步特性都可以为程序员提供更有力的支持。
实际上,Fortran 95和Fortran 2003陆续引入并行语法的目的之一是消除标准Fortran语言与已经存在并得到广泛应用的各种Fortran语言变种之间的隔阂,允许同一份Fortran代码在不同的语言环境间移植。至少到Fortran 2003为止,标准Fortran语言还没有能力完全替代以HPF为代表的“高性能”Fortran语言变种。仅就适应高性能并行计算环境的能力而言, HPF等Fortran变种也仍有足够的理由继续存在和发展,直到未来某一个大而全的Fortran标准把它们真正统一起来为止。
为了适应现代CPU的时钟精度,Fortran 2003扩展了内部过程SYSTEM_CLOCK的功能,允许其COUNT_RATE参数为INTEGER或REAL类型。
对IEEE浮点数标准(IEEE 754)的完全支持是Fortran 2003在提高计算精确度和规范性方面的又一个努力。在Fortran 2003中,IEEE标准中描述的下溢(Underflow)可以被正确识别和处理,内部模块IEEE_ARITHMETIC中也为此增加了IEEE_SUPPORT_UNDERFLOW_CONTROL、IEEE_GET_UNDERFLOW_MODE、IEEE_SET_UNDERFLOW_MODE等几个相关的内部过程。
另一个可以大幅提升程序执行效率的改进是Fortran 2003新增加的异步I/O机制。也就是说,执行比较耗时的I/O操作时,程序不必阻塞在I/O语句上,可以继续执行后续的指令。这种机制类似于我们用WIN32函数操作磁盘文件时,可以借助FILE_FLAG_OVERLAPPED标记指明I/O操作应异步进行。
基于Fortran 2003,当我们在外部文件的OPEN语句中指明ASYNCHRONOUS=’YES’时,后续拥有ASYNCHRONOUS=’YES’属性的READ或WRITE语句即以异步方式执行。此后,我们可以继续执行其他语句,或使用WAIT语句等待异步I/O执行完毕。
异步I/O是高性能应用软件必备的特性之一。在Fortran 90/95的时代里,为了实现异步I/O功能,不同的开发商总会在自己的Fortran编译器或程序库中以各自不同的方式,增加对异步I/O的支持。Fortran 2003统一异步I/O语法的做法显然有助于Fortran应用的移植和推广。
5. 开放的Fortran
返回页首
传统意义上的Fortran语言看上去并不那么开放,这恐怕和Fortran语言向来只注重科学计算,而忽视语言通用性的习惯有关。中国的Fortran用户最常抱怨的两件事情是:不同的Fortran编译器连接外部程序(如C语言程序或Matlab程序)的方法不尽相同,不同的Fortran编译器对中文的支持能力也强弱有别。人们迫切希望制定Fortran标准的专家们能体谅到最终用户的苦衷,尽早将Fortran纳入开放、规范的发展轨道。
在开放性方面,Fortran 2003为我们带来的第一个福音是,新标准终于规范了Fortran语言与C语言的连接方式。Fortran 2003提供了一个名为ISO_C_BINDING的内部模块,该模块定义了Fortran与C语言连接时必需的类型常量。引用了ISO_C_BINDING模块后,我们就可以将Fortran变量定义成与C语言数据结构兼容的数据类型:
REAL(C_FLOAT), DIMENSION(100) :: ALPHA
或者利用C_PTR、C_FUNPTR类型与C语言中的指针或函数指针交互操作:
TYPE(C_PTR) :: BETA
IF (.NOT. C_ASSOCIATED(BETA)) THEN
BETA = C_LOC(ALPHA)
END IF
对于下面这样的C语言函数:
int foo(void* buf, int count, int *ret)
它对应的Fortran函数接口是:
INTERFACE
INTEGER (C_INT) FUNCTION foo &
(buf, count, ret), BIND(C, NAME='foo')
USE ISO_C_BINDING
TYPE (C_PTR), VALUE :: buf
INTEGER (C_INT), VALUE :: count
TYPE (C_PTR), VALUE :: ret
END FUNCTION
END INTERFACE
这样,C语言和Fortran语言就可以通过上述接口相互调用。当Fortran语言和C语言之间拥有了统一的连接方式后,Fortran语言与其他语言之间的连接也就不再是困难重重的事了。借助ISO_C_BINDING模块,Fortran语言可以直接(在二进制层面连接)或间接(以C语言为媒介)地与Delphi、C++、Ada、Java、C#等我们常见的通用编程语言交流、沟通。
在国际化方面,Fortran 90已经为Fortran引入了不少国际化支持功能。Fortran 2003则全面支持ISO 10646标准,可以正确处理双字节或四字节的国际字符集。Fortran 2003程序可以通过SELECTED_CHAR_KIND内部过程指明字符数据的编码方式;打开文件时,可以在OPEN语句内利用ENCODING=’UTF-8’或类似的方式指明文件内字符的编码;可以在读写文件时完成ASCII、ISO 10646、UTF-8之间的转换;Fortran 2003代码本身的字符集,以及标识符和字符串常量的长度范围也有所扩充。
另一个和开放性相关的新特性是Fortran 2003对流I/O(Stream Access Input/Output)的支持。作为一种以科学计算为目的的语言,传统的Fortran只提供了读写以记录为单位的外部文件的语法。在单纯的科学计算任务里,这种简单的I/O功能也许可以满足文件读写的需要,但当我们希望Fortran程序和外部应用交换数据的时候,有时就不得不面对如何读取没有固定记录结构的字节流数据的问题了。在Fortran 2003发布以前,我们只能通过编译器提供的扩展功能解决问题。现在,我们可以用标准的方式,在Fortran语言中随机访问外部文件的字节数据。应当说,直到Fortran 2003,Fortran语言才拥有了与C语言的I/O库大致相仿的I/O功能,才在I/O领域具备了通用语言的基本特征。
当我们在C语言中通过main函数的argc和argv参数获取命令行参数的时候,也许我们不会想到,在传统的Fortran语言中,要完成类似的任务,Fortran用户也必须求助于编译器提供的扩展功能。Fortran 2003显著增强了Fortran语言与外部环境的沟通能力。新引入的内部模块ISO_FORTRAN_ENV拥有INPUT_UNIT、OUTPUT_UNIT、ERROR_UNIT这一组对应于标准输入输出的常量(相当于C语言里的stdin、stdout和stderr),拥有GET_COMMAND、GET_COMMAND_ARGUMENT等获取命令行指令,以及GET_ENVIRONMENT_VARIABLE等访问环境变量或系统参数的内部过程。这些都是Fortran语言走向开放的重要标志。
|