本文主要是介绍CommonLit Readability Prize,希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
CommonLit Readability Prize
Overview
机器学习能否识别一段文本的适当阅读水平,并有助于激发学习?阅读是学业成功的基本技能。当学生能够接触到提供适当挑战的引人入胜的段落时,他们自然会发展阅读技巧。
目前,大多数教育文本都使用传统的可读性方法或市售公式与读者匹配。但是,每个都有其问题。Flesch-Kincaid Grade Level 等工具基于文本解码(即每个单词的字符或音节)和句法复杂性(即每个句子的数量或单词)的弱代理。因此,它们缺乏结构和理论的有效性。与此同时,Lexile 等市售配方可能成本过高,缺乏适当的验证研究,并且当配方的功能不公开时会遇到透明度问题。
CommonLit, Inc. 是一家非营利性教育技术组织,为超过 2000 万教师和学生提供免费的 3-12 年级数字阅读和写作课程。他们与亚特兰大的 R1 公立研究型大学佐治亚州立大学一起,向 Kagglers 发起挑战,以改进可读性评级方法。
在本次比赛中,您将构建算法来评估 3-12 年级课堂使用的阅读段落的复杂性。为此,您需要将您的机器学习技能与一个数据集相结合,该数据集包括来自各种年龄组的读者以及来自各个领域的大量文本。获胜的模型肯定会结合文本内聚和语义。
如果成功,您将帮助管理员、教师和学生。扫盲课程开发人员和选择段落的教师将能够快速准确地评估课堂作业。此外,这些公式将变得更容易为所有人使用。也许最重要的是,学生将受益于关于他们工作的复杂性和可读性的反馈,从而更容易提高基本的阅读技能。
Data
- id - 摘录的唯一 ID
- url_legal - URL - 这在测试集中是空白的。
- license - 源许可 - 这在测试集中是空白的。
- excerpt - 预测阅读难易程度的文字
- target - 阅读轻松
- standard_error- 衡量每个摘录的多个评分者之间的分数分布。不包括测试数据。
Evaluation
这篇关于CommonLit Readability Prize的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!