欢迎来到进口食品商务网!

德克萨斯州正在用人工智能取代数千名人类考试评分员

2024-04-12 10:52 来源:得道网

本周,德克萨斯州参加州规定考试的学生被用作一种新的人工智能评分系统的小白鼠,该系统将取代该地区大多数人工评分员。

据《德克萨斯论坛报》报道,德克萨斯教育局(TEA)正在推出一款“自动评分引擎”,该引擎利用自然语言处理技术,使OpenAI的ChatGPT等聊天机器人能够理解并与用户交流。该引擎将为德克萨斯州学术准备评估(STAAR)考试中的开放式问题打分。该机构预计,通过减少对临时人工评分员的需求,该系统每年将节省1500万至2000万美元。与2023年所需的6000名评分员相比,该系统计划今年招聘不到2000名评分员。

“我们希望尽可能多地保留构建的开放式回答,但它们需要花费大量的时间来评分。”

STAAR考试是测试三年级到八年级学生对核心课程的理解程度,去年进行了重新设计,减少了多项选择题。现在,它包含了多达七倍的开放式问题,TEA学生评估主任何塞里奥斯说,该机构“希望尽可能多地保留构建的开放式问题,但它们需要花费大量的时间来评分。”

根据TEA网站上的一个幻灯片显示,新的评分系统是根据3000份已经接受过两轮人工评分的试卷进行训练的。一些安全网络也已经实施——例如,四分之一的计算机评分结果将由人类重新检索,混淆人工智能系统的答案(包括使用俚语或非英语回答)也将由人类检索。

虽然TEA乐观地认为人工智能将使其节省大量资金,但一些教育工作者并不热衷于看到它的实施。刘易斯维尔独立学区负责人洛里·拉普说,当2023年12月在有限的基础上使用自动评分系统时,她所在的学区看到了零分的构造回答“急剧增加”。拉普说:“目前,我们无法确定是考题出了问题,还是新的自动评分系统出了问题。”

人工智能作文评分引擎并不是什么新鲜事物。Motherboard 2019年的一份报告发现,它们至少在21个州使用,取得了不同程度的成功,尽管TEA似乎决心避免同样的名声。TEA幻灯片上的小字还强调,它的新评分引擎是一个封闭的系统,与人工智能本质上是不同的,因为“人工智能是一台使用渐进式学习算法进行适应的计算机,允许数据进行编程,本质上是自学。”

试图在两者之间划清界限并不奇怪——网上不乏老师对人工智能服务如何被用来在作业和家庭作业中作弊感到绝望。被这种新的评分系统打分的学生可能很难接受他们认为“规则是为你而不是为我”的做法。

 

中国进口商网声明:未经许可,不得转载。
热门产品招商