2 Grammars as a generating device

2.1 Languages as infinite sets

语法是为解释语言服务的。

2.1.1 Language

  • 对于一个formal-linguist来说,语言是由一个句子的集合构成的,每个句子是一个符号的序列。没有意义,没有结构。一个句子要么属于一门语言要么不属于。
  • 对于一个计算机科学家来说,一门语言是句子的无限集合。每一个句子由许多token组成并且是由结构的。tokens和结构共同解释了句子的语义。结构和语义可以是新的,不同的。这门语言有责任去提供与控制他们。
  • 对于一个linguist来说,一门语言是由无限的可能有内在关联的句子构成。每个句子都由一些在现实世界当中具有意义的单词构成。单词同样拥有结构并且由字母组成。对语义的强调,与现实世界的联系,句子/单词、单词/字母这两个级别的综合,是linguist的主场(domain)。

    2.1.2 Grammars

  • formal-linguist的观点是唯心的。(雾

  • 计算机科学家与linguist的观点是相近的,类似于菜单。给出recipe,一定可以构造成属于这门语言的每一个句子。计算机科学家有额外的要求,就是recipe必须揭示一个句子是如何被生成的。

生词回顾:

FirstSecondThird
parlance:说法correspondence:对应terminology:术语
demarcate:标定discourse:讨论,谈论foremost:most important
vibration:振动script:手稿underestimate:低估
readily: 不迟疑地,迅速地,轻易地abstracted:出神的,分心的token:A basic,grammatically indivisible unit of a language such as a keyword,operator or identifier.
telescope:这里有发现的意思blithely:愉快地;快活地Practitioner:实践者,实习生
henceforth:今后property:属性shuffle:拖拽
duplicate:重复 {set}notational:记法的implication:意义
compact:紧凑的semantic:语义manipulate:操纵
concede:承认integration:集成,综合ambiguous:有歧义的
grip:掌握,支配,控制seemingly:表面上,外观上,看起来chaotic:混乱的,无秩序的
syntax:语法规则fuzziness:模糊,不清晰platonic:唯心的
stretch:延伸

2.1.3 Problems

这样对于语言的定义产生了两个问题: + 有限的指令(菜单)如何产生无限的句子? + 如果一个句子没有结构,又如果一个句子的意义是产生自它的结构的,我们如何知道一个句子的含义?

2.1.3.1 Infinite sets from finite description

所有的语言是无法被有限的描述所描述的

2.1.3.2 Descriptions can be enumerated
  • 描述是可以被列举并且标号的
  • 给每一种描述一个字典序

    2.1.3.3 Languages are infinite bit-strings

    这里提出了一种很数学的表达方式。

假设一个语言是一个集合{a,b,aa,ab,ba,bb,aaa,aab,aba,abb,baa,bab,bba,bbb,aaaa…},这个是全集,所有的元素只含有$a$和$b$两个字母。从这个集合产生一门新的语言,定义为$a$的数量比$b$的数量多的句子,那么如果用0和1来表示某一个句子在这门语言当中是否存在,那么新的语言就可以表示为一个01字符串。相同的,所有从全集衍生的语言都可以用一个01字符串表示。

2.1.3.4 Diagonalization

用反证法(对角线法?)来证明了许多语言是不存在于全集产生的子集当中的。就是对第一个字符串的第一位取反,对第二个字符串的第二位取反,对第三个字符串的第三位取反。。。

2.1.3.5 Conclusions
  • 以上的陈述让我们对语言有了更准确而深入的理解
  • 我们只能对语言的很小的一部分子集进行描述
  • 描述的集合小于语言的集合

生词回顾:

FirstSecondThird
assess:评估,估计disquieting:焦虑的,忧虑的rephrase:重新表达
lead-up:之前的trivial:不重要的immaterial:不重要的
remarkable:值得注意的,卓越的scarce:不常见的,难以得到的in the same vein:以同样的方式
yield: 产生exhaustively:彻底地,全面地demonstration:表达
outline:轮廓amplification:增强substantiation:证明,证据
insight:准确而深入的理解fraction:一小部分