Friday, February 22, 2013

一门程序语言的功能可以看作是一个"功能空间",语言只需拥有一组数量合适的正交特性(这些特性各自提供了互相独立的基本功能)便可以通过组合它们来实现"功能空间"中的任何功能。

程序设计语言正交特性的一点思考 

校友会信息发布--严济慈校长的一句话和我的二十年计算机生涯

alumni.ustc.edu.cn/view_notice.php?msg_id=436頁庫存檔 - 轉為繁體網頁
在此基础上1982年底又完成了ALGOL-60语言“正交试验设计”程序第一稿。1982年我参加了“Y8飞机全机载荷谱”课题预研,我的“数理统计软件包”中又多了游程分布、       
分类: 精选文章126人阅读评论(0)收藏举报
在《程序员》2003年第12期的一篇访谈录中,Ruby的发明人Matz较详细地阐述了Ruby的设计思想及遵循的原则,其中大部分我都深以为然,特别是他高度重视语言设计过程中人的因素则更是让人激赏。不过他对正交特性的看法却让我颇为迷惑。
正交(orthogonal)本来是一个几何概念,表示的是垂直相交,后来又被扩展到线性代数中,表示内积为零的两个向量之间的关系。线性空间中一组两两正交的非零向量被称为正交向量组,而在n维线性空间中,n个向量组成的正交向量组一定线性无关,因而也就一定是该空间的基。这意味着什么呢?这意味着该空间中的任意向量都可以由这一组正交向量经线性组合(linear combination)得出,因此我们可以通过这n个向量表达整个线性空间。
在计算机科学领域,正交这个词通常表示基本元素之间互相独立与良好隔离,并且它们具备组合出一个完整"空间"的能力,而缺少其中任何一个都会丧失这种能力。如果把全面的逻辑运算想象成一种"运算空间"的话,那么not、and、or就是三个互不影响、互相不可替代的正交操作。由它们出发可以完成任意复杂的逻辑运算,但是无论少了谁,我们都会遇到某些无法完成的逻辑任务。再比如unix/linux系统提供了许多基本工具,其中每种工具都只专注于完成一种基本任务,并且基本任务也不互相重叠,所以工具的接口之间是正交关系,而用户则能通过管道等机制组合使用这些工具以完成各种复杂的任务。
一门程序语言的功能可以看作是一个"功能空间",语言只需拥有一组数量合适的正交特性(这些特性各自提供了互相独立的基本功能)便可以通过组合它们来实现"功能空间"中的任何功能。很明显,这种设计是在不损失语言能力的前提下的最简方案。不过最简是否意味着最优则仁者见仁智者见智了。在这点上Matz认为:正交性是设计的工具,而不是设计的主要目标。但是接下来Matz用来证明他观点的例子则似乎有些问题。
Matz举的例子是C++的缺省参数和函数重载。他认为这两种特性是正交的,可以同时使用,但是混合使用有时却会导致问题,这就需要人脑去猜测编译器的处理规则,而这种规则往往并不显然,所以这是一个有关正交性的反例。我同意同时提供缺省参数和函数重载并不是个好主意,尤其对初学者来说。比如下面的代码就会产生一个有些晦涩的编译错误:
void foo(int a = 2005)
{
//do something using a
...
}

void foo()
{
// do something
...
}

int main()
{
foo(3); //OK
foo(); //compile error:

//ambiguous call to overloaded function
return 0;
}

但是这两个特性是正交特性吗?实际上缺省参数功能可以非常容易地由函数重载特性来实现:
void foo(int a)
{
// do something using a ...
}

void foo()
{
foo(2005);
}


int main()
{
foo(3); //OK
foo(); //OK,就好象调用一个缺省参数值为2005的foo函数

return 0;
}

由此可以看出,缺省参数这个特性在功能上是冗余的,与函数重载不可能是正交关系。这个例子恰恰演示了某些不遵循正交性的设计会带来什么样的不良后果。不过能够做一样事情和能方便地做一样事情是有区别的,人们常常会为了现实的好处而牺牲理论的优美,个人认为这也是为什么C++会提供缺省参数这么一种语法糖衣(syntactic sugar)。
Matz用一个错误的例子来证明自己的观点,给我留下了很大的问号。希望下次能看到他用真正有说服力的论据来阐明对正交性的看法。

No comments:

Post a Comment