评估人工智能检测工具:指导教师

人工智能检测工具旨在识别人工智能生成的文字。 他们分析模式、词汇选择和结构特征,以估计内容是否是人工智能制作的。 一些平台,如Turnitin,已经集成了人工智能检测功能。 然而,在太阳城娱乐官网,我们不建议使用人工智能探测器作为学术不诚实的明确证据。 这些工具通常缺乏可靠性,并可能导致错误识别。

了解这些工具的工作原理并认识到它们的局限性对于明智的决策至关重要。 下面,我们将探讨人工智能检测器的功能、它们的缺点,以及解决人工智能生成的学生作业问题的替代策略。

人工智能检测工具如何发挥作用 

人工智能检测工具本身就是由人工智能驱动的。 他们根据特定的指标来评估书面作业,比如重复的措辞、句子结构和词汇模式。 These tools typically generate a percentage score, such as “73% human-generated,” indicating the likelihood of the content being written by a person.

然而,对于什么是“可接受的”百分比,缺乏明确的标准提出了重大挑战。 此外,检测工具可以产生:

  • 假阳性: 人工编写的工作被错误地标记为人工智能生成。
  • 假阴性: 人工智能生成的作品被误认为是人类写的。

人工智能检测工具的(非)可靠性

人工智能探测器远非万无一失。 研究表明,许多工具的准确率低于70%,有些甚至低至38%。 即使是评分最高的工具(准确率高达90%),也有十分之一的提交内容被错误识别。 这些错误会对学生和教师造成严重的后果。

关键问题

  • 错误的指控: 在没有确凿证据的情况下被指控学术不端的学生可能会面临严重的后果。
  • 检测偏差: 研究表明,人工智能检测器更有可能将非英语母语者的工作错误地归类为人工智能生成的,这引发了对公平和公平的担忧。

人工智能检测工具会被愚弄吗?

是的,学生可以很容易地欺骗人工智能探测器:

  • 使用Quillbot等工具改写ai生成的文本。
  • 替换几个词以避免被发现。
  • Using tools designed to “humanize” AI writing, making it undetectable.

这些策略破坏了检测工具的可靠性,并突出了它们作为确保学术诚信的方法的局限性。

示例场景

示例作业

在我的在线心理学导论课程中,学生们根据每周的主题完成每周的反思作业。 反思包括两个问题:

  1. What concept from this week’s topic do you feel most confident about? 用你自己的话解释。
  2. 你觉得哪个概念最具挑战性或最不清晰? 你还有什么问题要问吗?

这项作业旨在帮助学生参与材料,评估他们的理解,并为他们提供寻求澄清的机会。 这周的主题是认知发展理论。

Here is one student’s submission:

认知发展背后的复杂过程既迷人又深刻。 对皮亚杰认知发展阶段的探索揭示了个体是如何获取知识并适应环境的。 观察到同化和适应等看似简单的机制如何推动了人类认知的进化,这是令人惊讶的。 然而,文化和社会影响对认知发展的相互作用还有很多有待研究,因为这些层次揭示了人类发展和行为的细微差别。”

当我读到这篇文章时,我立即怀疑它是由AI生成的,因为:

  1. 它不直接回答作业中提出的问题。
  2. 语言过于正式,使用了不必要的复杂措辞,目的是作为一个随意的,反思的练习。

为了证实我的怀疑,我在两个不同的场合使用了AI检测工具。 结果不一致:

image is a screenshot of results from an ai detection website showing two passes of the same content. the first pass shows 100% human generation from all seven checks. The second pass shows 100% human generation on five checks, but only 50% human generation on two checks.关键的外卖

这个例子突出了人工智能检测工具的不可靠性,以及它们在识别人工智能生成的内容时所面临的挑战。 Instead of relying solely on detectors, I compared this response to the student’s previous submissions and noticed a significant difference in tone and complexity. 然后,我与学生讨论作业,以更好地了解他们的学习过程,并澄清对未来反思的期望。

取而代之的是什么?

考虑到人工智能检测工具的局限性,以下是解决学生作业中人工智能使用问题的替代方法:

  1. Compare Submissions to Previous Work: Look for inconsistencies in writing style or quality that deviate significantly from a student’s typical submissions.
  2. 关注标题:评估工作是否符合分配标准,不管它是如何产生的。
  3. 对话:与学生讨论作业,了解他们的过程和学习成果。
  4. 调整你的评估:考虑设计不使用人工智能工具或包含人工智能工具的作业,鼓励学生批判性地参与他们的工作。

展望未来

虽然目前的检测工具不可靠,但未来技术的进步可能会提高它们的准确性。 在此之前,促进与学生的公开交流,修改评估,强调学术诚信仍然是最有效的策略。


特别感谢Cassie Mallette,太阳城娱乐官网大学奥马哈分校人工智能学习实验室的项目经理和高级教学设计师,抽出时间与我们的团队会面,并与我们公开分享UNO团队的资源和生活经验。 非常感谢您对这个项目和伙伴关系的贡献!