论文部分内容阅读
由自然语言和形式化语言表达的学术论文是人类保存和传播知识的最重要的工具。然而,现今学术领域有不少劣质甚至伪造的学术论文滥竽充数,占用学术发表资源,污染人类的知识体系。这些人工产生或是用算法自动生成的劣质或者伪论文有一个共同特点——语法与规范上均无问题,然而,语义上却是晦涩难懂乃至根本无意义。这些劣质或者伪学术论文,应该与严肃认真的、有学术价值的高水平学术论文有本质的区别。发现这个本质区别,并利用其对学术论文进行初步甄别,是本文的主要研究内容。通过此研究,可以更深入地了解主要由自然语言表达的人类知识体