咖啡属什么五行?
“咖啡”的英文名是“Coffee”,其原意是指“一种植物及其所生产的饮料”,这正和中文中“茶”的字义相近;而现代英语中对 “coffee”的定义则更为宽泛,除指“咖啡树(Coffea)”外,还包括用咖啡豆制作的饮料( beverages made from the roasted and ground seeds of the coffee plant) 。英语国家的人喝咖啡并不像中国人喝茶那样讲究,只要是有刺激作用的饮料都称为“coffee".“coffee”这个词是一个相当含糊的概念。 从上面定义可以看出,“咖啡”这一术语的外延大小取决于对其内涵和外延的理解,而这正是语言哲学中的两个重要概念——“语言游戏”( linguistic games) 和 “语域”( register) 。因此我们可以通过调整语言游戏中参数的取值范围以及语域的分布情况来使得对一个语言项的概念理解趋近于我们期望的程度。
假设我们将要了解一个语言项目中某个词语或语法项目的含义,而且已经掌握了这项语言的基本用法,那么此时我们可以将这个项目放入到相应的“语言游戏”之中并观察其在其中的表现,以此来推导该项目最有可能包含的意思;然后再选取另一项语言项目与之一一对应,并根据上述方法推导出该项目的意思……如此重复进行,直到全部的项目均被标注上意义标签为止。这就是计算机能够读懂自然语言的基础——文本分类( text categorization) 。
但是计算机在解读文字时也会遇到无法解决的问题,比如文字顺序问题。如果我们要让计算机根据“先主谓宾”的顺序给一个句子标注主语和动词,显然这需要对语言项目的内部结构有非常精确的设定,否则就会出错。然而人类母语者对单词和短语的顺序识别并不是按照严格的语法规则进行的,如英汉两种语言就有大量的倒装句。这就使得计算机对于语言项目的先后顺序划分产生了难以逾越的障碍。
为了避开这个问题,计算机只能将整个句子作为整体输入,然后从中抽取特征词( feature words) 并构建词典,再通过其他手段区分主谓宾等语法成分。当然这种办法只是应对策略,并不能彻底解决文字顺序问题。计算机除了会遇到文字顺序问题还会导致“词汇缺失”的问题。例如当词典中有“苹果”而没有“菠萝”时,计算机在识别“我喜欢吃水果”中“水果”一词时就会出现词汇缺失。虽然人类的母语者在表达时会忽略这种缺乏同形异义词的情况,但计算机却不能。为了避免这种情况,计算机需要能够根据上下文推断未登录词汇的意思。