成语大全网 - 成语解释 - 汉语程序设计语言的编译原理

汉语程序设计语言的编译原理

汉编系统是一个交互式的程序设计环境,最初是为程序员在小型和微型计算机上开发应用程序而设计的。主要应用于科学计算和工业控制,比如仪器、机器人、过程控制、图形和图像处理、人工智能和商业应用。 汉编语言的主要优点是软件开发快速、交互式、计算机硬件的高效使用等。

汉编语言与传统语言最大的不同是它的可扩展性。 汉编语言的编程过程就是定义新的词,词实际上就是语言的新命令。词可以用一系列以前定义的词来定义,这个过程与教育孩子的过程相似:我们总是用孩子们以前理解的概念来教给孩子们新的概念,而这些词被称为“高级定义”。同样,新的词也可以用汇编代码定义。

可扩展性的结果是我们在开发一个应用的同时,也间接地开发了一个特殊的、针对这一类应用的“面向应用的模块,它可以用于或者经过修改之后被用于相似的应用。

汉编语言的可扩展性并不仅仅是为语言自身增加新的命令,所以不要把定义词与传统高级语言定义函数、过程等同。汉编系统还能对定义词(建词)进行扩展,创建一个可以定义其它词的词,这种词被称为“定义词”。在创建这样一个定义词的时候,程序员能够指定它所创建的词在编译时间、运行时间或者这两种状态下的特殊行为。这个能力允许我们定义特殊的数据类型,并对其行为和结构实施完全的控制。又由于这种词的运行时行为可以用高级语言或者汇编语言来定义,所以由定义词创建的词将具有与其它汉编词一样的性能。系统也允许我们增加一个新的“编译指示符”以实现特殊类型的循环或者其它的控制结构。 比如,汉语言定义一个程序变量的 词:给,其代码大概如下:

编 给 ( 32位数 -<变量名>- ) \ 编译时

( --- 32位数 ) \ 运行时

建词 可用地址 4 字节空出 写

动作 读

定义变量时

5 给 变量一

则 5 被自动写入 变量一的实体域中

运行“变量一”时

变量一

则 变量一 实体域中的数字 5 被自动读取,放到数摞上 汉编词可以使用以前定义的词或者汇编代码来定义,它们与其它语言的子程序相似,也与其它语言的命令等效。 汉编系统允许我们在键盘上打入一条指令的词名,这个词将被立即执行。然而,如果我们把功能的词名放到定义中,将编译成对于这个词的引用。

高级词是由其它词的集合来定义的,我们可以把这个过程想象成是其它语言的宏。新的词被加入到它们可以使用的存储器中,其定义被加入到词典中。在一个汉编词的命名规则中,只有很少的几个字符不能作为词名使用。

当遇到一个词的时候, 汉编系统就通过词典搜索希望找到这个词的定义,如果找到这个词定义的功能,或者被立即执行,或者作为引用而被编译到新的定义中。然而,如果在词典中没有找到这个词,系统就试着把它转换成一个数。如果转换成功,就把它放在数摞上。如果不能转换成数字,就显示这个未定义的词名并打印出一个错误的信息来报告这个词是系统所不知道的。

汉编词的执行流程大概可以用一个词来模拟如下:

编 查词测试

 { \词名串 -- }

 255个字节空给 词名串

词名串 255填0

词名串 字串传送

词名串 (查词)

 0=

计字节

串>数

否则

字串未定义词名串 字串+传送

词名串 计字节

回车 印字串

全复位

然后

否则

执行

然后

。 ★

字串 看数摞 查词测试 数摞已空! ★

字串 123456 查词测试 ★.

看数摞 [1] 123456 ★.

显 123456 ★

字串 看方法 查词测试

看方法未定义

汉编系统编译流程如右图(流程图来源:汉编新浪博客)所示。

汉编语言坚持“结构化程序设计”原理:

· 词必须在引用之前被定义;

· 逻辑流限制只有顺序、条件和循环,有专门的词用于实现常用的程序控制结构;

· 程序员使用许多小的、独立的模块(词)来实现最大的可测试性和可靠性;

这种方法有两个明显的优点

· 新的词总是用以前定义和测试过的词来构造,所以调试更容易。模块可以单独执行以测试它的功能;

· 固有的模块性使汉编语言成为一个“设计性语言”,允许自顶向下的设计同时保持自底向上的测试。一个词可以在不同的程序中使用,但是它的功能只需要定义一次;

这些都保证了汉编软件能够快速和有效地被开发,同时,如果管理得当,也可以作为自身文档的基础。

汉编语言的5个主要元素决定了它的特点:

· 一个词典;

· 两个数摞,一个是参数摞,另一个是用于嵌套的返回摞;

· 键盘(输入流)解释器;

· 一个编译器;

· 虚拟存储; 词典是汉编定义词的数据和代码存储空间,也为编译建立了词的索引。词典中的词包括汉编程序代码词、常数定义词、变量定义词、不定量定义词,面向对象部分还有模板、对象、对象事件、消息。

汉编代码存储在词典中。词典占据了系统存储器的很大部分,它由一个串线链接的可变长度的项目组成,每个项目定义了一个词。每个定义的内容根据词的类型(数据项、常数、操作序列等)而有所不同,词典是可扩展的。

词是由“定义词”加入词典的,最常用的定义词是“ 编 。”当“编”执行的时候,马上就把后面的词名扫描,建立一个词典项,然后进入“编译”模式。有许多不同的编译方法,最常用的是“串线编码”,这种方法把定义编译成一系列以前定义词的地址引用。词的定义由“。”(句号)结束。下面就是一个词的定义:

编 平方 ( -- ) ♂ * 显 。

当一个词名项被编译到词典中的时候(称为定义的首部),它包含一个指向词典中前一个首部的指针。新词的词名加入词典(这里就是 平方 ),接着一个指向词名为“( 编 )”子程序调用的指针编译到词典中作为定义的第一部分,这个指针指向一段在解释定义体时需要执行的代码。当然,这里所说的不是唯一的编译技术,但它的应用最为普遍,这种技术称为间接串线编码,因为定义中的第一个项目是一段代码的引用,这段代码知道如何解释定义的其它部分。

定义的其它部分称为这个定义的体。在编译模式下,系统将依次寻找每个词的首部。每个首部地址依次放到定义体中,这样就产生了一个地址列表。最后在到达“。”时,词名为“。”的子程序地址被编译进词典。“ 。” 子程序用来将控制返回到调用词,就像一个子程序返回一样。