简介:数据挖掘技术能够帮助我们从规模庞大、内容纷繁的文本数据中准确、高效地提炼出研究者难以通过遍览有效捕捉的隐含信息或趋势。其中,词频统计帮助我们获取分析对象的词汇总量、高频词汇以及词汇构成等信息,并据此对文体特征进行较为准确的判断。词表比对揭示了对象文本的叙事方式、所含关键人物、场所和物品等。词语共现网络使我们能够直观地观察到文本中的高频人物、组织等,并揭示这些热词之间的潜在联系,从而快速构建热点事件的基本框架。而通过计算共现强度,我们可以轻松、准确地挖掘出与特定关键词关系密切的共现词,从而有效捕捉与之相关的热点话题和媒体动向。
简介:在汉语作为第二语言教学这一学科的发展历程中,一直存在着认识论与本体论上的问题,譬如关于学科性质、学科归属、基本教学单位的不同看法。基本教学单位的主要分歧反映在一元论与二元论之间的对立。前者坚持词是唯一的基本语言教学单位,后者则主张汉语既有词也有字这两个基本语言教学单位。笔者认为,当前汉语二语教学发展中潜伏着各种危机的一个主要原因在于该学科在上述根本问题上尚存在认识论障碍。与其他学科不同,汉语二语教学在学科本体问题上各方有着截然不同的立场。这种对峙也体现在中外汉语教材上:中国本土出版的汉语二语教材基本上都是一元论的拥护者,而国外最近几十年颇有影响力的教材则力挺二元论。
简介:本文认为语用的动念是相对的。它既有动态多样性的一面,也有静态规律性的一向,因此既可进行动态分析,也可进行静态分析。汉语的主题和述题的语序规则是主题存述题之前,这是常规的、静态的;但是具体句子中的主题既有住述题之前的,也有在述题之后的,这是动态的。句类是从具体的、动态的句子所具有的表达用途方面抽象出来的类别,所以是静态的;但是句类的具体应用或对具体句类的具体分析是动态的。常规焦点是脱离语境的、从动态的具体句子中抽象出来的静态焦点;对比焦点是语境句中与现实相联系的具体句子的动态焦点,它体现着焦点的变化性和多样性。在指称问题上,从静态角度观察,人称代词、专有名间、“这/那+(量词)+名词”是有定的,“数词+(量词)+名词”、“一+(量词)+名词”、“量词+名词”是无定的;但是在特定语境中。静态的有定性或无定性词语在动态的句子里并非固定不变,确定汉语中一个词语所表现的指称成分在具体句子里是有定的还是无定的,决定因素是要看语境。