论文部分内容阅读
摘要:本文旨在為英语学习者,特别是准备参加托福和雅思等语言能力测试的高中生和大学生提供了一个智能训练助手,以帮助他们进行口语练习。该助手提供一个接近学生正常生活的话题开始训练,并识别各种可能的回答。助手会从基本语法、连贯性和语调三个方面来衡量回答的质量,为学生提供详细的建议。
中图分类号:G4 文献标识码:A
英语学习者的智能口语培训助手
英语学习者在没有人类导师的情况下很难正确练习他们的英语口语。当学生准备英语能力考试时,他们必须花大量的时间与人类导师练习,导师负责指出他们的问题并给予建议。对学生来说,与人类导师一起学习有时会很昂贵和不方便。引入智能助手可以解决部分问题。
利用自然语言处理技术设计一个智能口语训练助手,当学生使用时,它首先会随机给出一个熟悉的话题,如 "你喜欢给朋友发邮件还是打电话?",让学生回答。然后,声音记录将被ASR引擎转化为文本,训练助手将能够听到他们的回答记录并编辑识别结果。训练助手将使用语法检查和前景评估方面的模型,并计算出平均停顿时间,以评估学生的表现并给学生提供建议。
自动语音识别
在这个口语训练助手中,引入语音识别技术的目标是识别学生说了什么。对于英语学习者来说,其核心能力是 "将思想转化为语言的能力,而不是将文字转化为语音的能力"。(Two Methods for Assessing Oral Reading Prosody)因此,口语训练助手不是提供一个固定的文本给学生阅读,而是每次显示一个问题,并接受所有可能的答案。使用Sphinx-II语音识别器(Huang et al,1993),口语训练助手将把声音记录变成文本。
然而,任何语音识别算法的准确性都不是百分百可靠的,特别是对于非母语的人来说。为了在接下来的步骤中使用更好的文本材料,口语训练助手设计了一个过程,说话者可以看到语音识别的结果,并将文本编辑成说话者实际说的内容。在这一过程中,口语训练助手提高了对具有某种母语的说话者的识别精度。
语法纠正
学生的第一语言会高度影响他们的语言习惯。因此,语法纠正是口语训练中的一个关键部分。
使用编辑过的语音识别结果文本,助手将纠正说话者的语法错误。它将识别并标记所有单词的语音部分,然后检查是否有任何部分被遗漏或处于错误位置。其次,通过使用n-gram模型,文本将与语料库进行比较,以发现是否有错误的单词组合或更好的表达方式。助手将突出显示这些变化。
语调评价
与针对母语者的口语训练不同,在口语训练中,语调评价的目的是评估学生是否理解阅读材料,对于学生来说,引入语调评价是为了清楚地知道自己在说什么的情况下,帮助提高说话的表现力。学生很可能有不恰当的语调表达,包括强烈的口音,错误的或没有的单词连接和错误的停顿时间。
使用《Two Methods for Assessing Oral Reading Prosody》(MINH DUONG, JACK MOSTOW, SUNAYANA SITARAM)中的通用模型,它将能够 “将文本映射到音节,并使用它们来评估音节”。
数据挖掘
当学生使用这个助手时,有两种数据值得在教育方面收集。
1.具有相同母语的学生在发音评价率和语法错误方面的相似性,以及他们在使用助手练习时得到改善的相似程度。这可以帮助老师了解他们的学生可能会遇到什么问题,以及在培训过程中应该优先加强什么。
2.同一个学生在讲两个不同的话题时,其语调评价率和犹豫时间的差异。这将显示说话者知识的不平衡性,学生可以了解到他们应该具体练习什么样的话题。
评价
为了评价训练助手的效果,可以用量化方法来衡量学生在较长时间内使用助手时的变化和改进。
犯简单语法错误的平均比率、用于犹豫不决的平均时间、以及前景和单词连接的评价比率,都可以进行长期的比较。当助手再次向学生提供相同的话题时,可以挑选上述比率并与前几次提供的相同话题中收集的数据进行比较。
此外,可以通过比较两个在固定时间内使用和不使用助手进行训练的人,来评估助手的效果。可以比较两个人在回答一系列相同问题时犯简单语法错误的平均比率、用于犹豫不决的平均时间、以及评价的语调和单词连接的比率,并显示是否存在明显的差异。
嵌入式实验
为了测试各种方法之间的有效性差异,可以在应用程序中设计一个嵌入式实验。
我们可以控制是否在学生说之前或之后给他们提供有关演讲主题的关键词和表达方式的参考清单。给予关键词和表达方式的样本可以帮助他们造句,并在他们回答时给他们以灵感,但在他们发言前给予参考可能会导致依赖性。我们可以将用户随机分为四组:在学生发言前给他们提供表达样本;在学生发言后给他们提供表达样本;不给他们提供表达样本。然后,我们可以评估说话题目中的平均表现,以及三组中的说话者在相对较长的时间内的平均进步。
参考文献
Huang, Xuedong, et al. “The SPHINX-II speech recognition system: an overview.” Computer Speech & Language 7.2 (1993): 137-148.
Mostow, Jack, and Gregory Aist. “Giving help and praise in a reading tutor with imperfect listening—because automated speech recognition means never being able to say you’re certain.” CALICO journal (1999): 407-424.
Duong, Minh, Jack Mostow, and Sunayana Sitaram. “Two methods for assessing oral reading prosody.” ACM Transactions on Speech and Language Processing (TSLP) 7.4 (2011): 1-22.
中图分类号:G4 文献标识码:A
英语学习者的智能口语培训助手
英语学习者在没有人类导师的情况下很难正确练习他们的英语口语。当学生准备英语能力考试时,他们必须花大量的时间与人类导师练习,导师负责指出他们的问题并给予建议。对学生来说,与人类导师一起学习有时会很昂贵和不方便。引入智能助手可以解决部分问题。
利用自然语言处理技术设计一个智能口语训练助手,当学生使用时,它首先会随机给出一个熟悉的话题,如 "你喜欢给朋友发邮件还是打电话?",让学生回答。然后,声音记录将被ASR引擎转化为文本,训练助手将能够听到他们的回答记录并编辑识别结果。训练助手将使用语法检查和前景评估方面的模型,并计算出平均停顿时间,以评估学生的表现并给学生提供建议。
自动语音识别
在这个口语训练助手中,引入语音识别技术的目标是识别学生说了什么。对于英语学习者来说,其核心能力是 "将思想转化为语言的能力,而不是将文字转化为语音的能力"。(Two Methods for Assessing Oral Reading Prosody)因此,口语训练助手不是提供一个固定的文本给学生阅读,而是每次显示一个问题,并接受所有可能的答案。使用Sphinx-II语音识别器(Huang et al,1993),口语训练助手将把声音记录变成文本。
然而,任何语音识别算法的准确性都不是百分百可靠的,特别是对于非母语的人来说。为了在接下来的步骤中使用更好的文本材料,口语训练助手设计了一个过程,说话者可以看到语音识别的结果,并将文本编辑成说话者实际说的内容。在这一过程中,口语训练助手提高了对具有某种母语的说话者的识别精度。
语法纠正
学生的第一语言会高度影响他们的语言习惯。因此,语法纠正是口语训练中的一个关键部分。
使用编辑过的语音识别结果文本,助手将纠正说话者的语法错误。它将识别并标记所有单词的语音部分,然后检查是否有任何部分被遗漏或处于错误位置。其次,通过使用n-gram模型,文本将与语料库进行比较,以发现是否有错误的单词组合或更好的表达方式。助手将突出显示这些变化。
语调评价
与针对母语者的口语训练不同,在口语训练中,语调评价的目的是评估学生是否理解阅读材料,对于学生来说,引入语调评价是为了清楚地知道自己在说什么的情况下,帮助提高说话的表现力。学生很可能有不恰当的语调表达,包括强烈的口音,错误的或没有的单词连接和错误的停顿时间。
使用《Two Methods for Assessing Oral Reading Prosody》(MINH DUONG, JACK MOSTOW, SUNAYANA SITARAM)中的通用模型,它将能够 “将文本映射到音节,并使用它们来评估音节”。
数据挖掘
当学生使用这个助手时,有两种数据值得在教育方面收集。
1.具有相同母语的学生在发音评价率和语法错误方面的相似性,以及他们在使用助手练习时得到改善的相似程度。这可以帮助老师了解他们的学生可能会遇到什么问题,以及在培训过程中应该优先加强什么。
2.同一个学生在讲两个不同的话题时,其语调评价率和犹豫时间的差异。这将显示说话者知识的不平衡性,学生可以了解到他们应该具体练习什么样的话题。
评价
为了评价训练助手的效果,可以用量化方法来衡量学生在较长时间内使用助手时的变化和改进。
犯简单语法错误的平均比率、用于犹豫不决的平均时间、以及前景和单词连接的评价比率,都可以进行长期的比较。当助手再次向学生提供相同的话题时,可以挑选上述比率并与前几次提供的相同话题中收集的数据进行比较。
此外,可以通过比较两个在固定时间内使用和不使用助手进行训练的人,来评估助手的效果。可以比较两个人在回答一系列相同问题时犯简单语法错误的平均比率、用于犹豫不决的平均时间、以及评价的语调和单词连接的比率,并显示是否存在明显的差异。
嵌入式实验
为了测试各种方法之间的有效性差异,可以在应用程序中设计一个嵌入式实验。
我们可以控制是否在学生说之前或之后给他们提供有关演讲主题的关键词和表达方式的参考清单。给予关键词和表达方式的样本可以帮助他们造句,并在他们回答时给他们以灵感,但在他们发言前给予参考可能会导致依赖性。我们可以将用户随机分为四组:在学生发言前给他们提供表达样本;在学生发言后给他们提供表达样本;不给他们提供表达样本。然后,我们可以评估说话题目中的平均表现,以及三组中的说话者在相对较长的时间内的平均进步。
参考文献
Huang, Xuedong, et al. “The SPHINX-II speech recognition system: an overview.” Computer Speech & Language 7.2 (1993): 137-148.
Mostow, Jack, and Gregory Aist. “Giving help and praise in a reading tutor with imperfect listening—because automated speech recognition means never being able to say you’re certain.” CALICO journal (1999): 407-424.
Duong, Minh, Jack Mostow, and Sunayana Sitaram. “Two methods for assessing oral reading prosody.” ACM Transactions on Speech and Language Processing (TSLP) 7.4 (2011): 1-22.