生成AI、ChatGPTとテスト作成への示唆

教室に立つ女性教師が、ノートパソコンを持って机に座る生徒たちに微笑みかける。

チャットGPTは教育界に旋風を巻き起こし、教育関係者は管理することに躍起になっています。 浮気症を生成AIを使用しています。生徒がこのプログラムを使って、人間のようなエッセイや短い組み立てられた回答を生成し、場合によっては分析的思考を行うことを心配し、教師たちはこのプログラムを広く非難するようになりました。しかし、Chat GPTに対する世論が一段落した今、Chat GPTには利点があり、今後も継続されることが明らかになりました。

ジェネレーティブAIのようなツールは、教育の状況を変える力を持ち、教育者と生徒にとって同様に資産となることが証明されるかもしれません。レベル分けされた読書の作成、ライティングのプロンプトの開発、さらには評価問題の生成にジェネレーティブAIを使用すれば、教育者の生活が楽になる一方で、学生の学習成果も向上する可能性があります。 

AIツールはアセスメントでどのように活用できるのか?

Chat GPTのようなAIツールは、アセスメントの特定のニーズに応じて、アセスメント作成者が様々な方法で使用することができます。ここでは、いくつかの例を紹介します:

テスト問題を生成するChat GPTや他のジェネレーティブAIソフトウェアは、様々なテーマや難易度のテスト問題を生成するために使用することができます。アセスメント作成者は、プロンプトやトピックを入力し、Chat GPTは言語生成機能を使用して、学生の理解や知識を評価する問題を生成することができます。

回答を採点する:AIは、学生からの自由形式の回答を採点するために使用することができます。人間の採点者がすでに採点した回答のセットでAIを訓練することで、AIは訓練セットとの類似性に基づいて新しい回答にスコアを割り当てることを学習することができます。

アダプティブアセスメントの問題を作成するChat GPTは、学生の回答に基づいて問題の難易度を調整するアダプティブ・アセスメント・エクスペリエンスを作成するために使用することができます。生徒の反応をリアルタイムで分析することで、各生徒にとって適切な難易度の問題を生成することができます。

フィードバックを提供するChat GPTは、生徒の回答に対するフィードバックをより迅速に行うために使用されます。学生の回答の内容や構造を分析することで、具体的で有益、かつ実用的なフィードバックを提供することができます。

評価問題作成におけるジェネレーティブAIの価値

試験問題の作成は、教育関係者にとって時間がかかり、退屈な作業です。生徒をテストするのに十分な問題を作成することは困難であり、試験用に引き出す問題のバンクを作成することは、計画、生徒とのつながり、質の高いコンテンツの開発など、他のタスクから時間を奪うことになります。生成AIを使用して評価問題を作成することは、教育者やテスト作成者が時間を節約し、より効率的にするために使用できるオプションです。 

評価問題を作成する際に、生成AIが重宝される方法として、次のようなものがあります: 

膨大な量のコンテンツを簡単に作成できる 

Chat GPTで評価問題を作成する最大のメリットは、大量の問題をスピーディーに作成できることでしょう。教育者として、あなたはChat GPTに、あなたが取り組んでいる何かのコピーを渡すことができます。 質問を生成してもらう トピックについて説明します。また、何問の問題をどのレベルで作成するかも指定できます。これによって、先生やテスト制作者は、通常であれば時間や労力、費用がかかる数百の問題を数分で開発することができます。

生成AIは完璧ではなく、テスト作成者が望んでいたものとは違う問題もあるかもしれません。Chat GPTを使用して評価問題を生成する場合、人間が目を通し、適合しない問題を編集することが必要です。しかし、問題を編集するプロセスは、通常、ゼロから問題を生成するよりも短時間で完了します。 

テスト問題のランダム化

テスト問題のランダム化とは、テストを作成する際に、問題集や複数の問題集からランダムに抽出することです。従来、このプロセスは手作業で行われ、教師は問題を移動させることで2つまたは3つのバージョンのテストを作成していました。これには膨大な時間がかかりますが、しかし、以下のような最新のテストソフトを使えば、そのようなことはありません。 TAOテストデジタルテストプラットフォームでは、教育関係者がシームレスに問題を挿入したり、テストの出題順をランダム化することができます。デジタルテストプラットフォームは、問題のランダム化に加えて、解答の選択もランダム化することができます。

これらはすべて、テストの妥当性と信頼性を向上させ、不正行為を減らし、テスト全体の整合性を向上させるために役立ちます。Chat GPTでは、さまざまな形式のテストを作成することができますが、それでも、さまざまなテストバージョンをコピー、ペースト、印刷するためには、個人の労力が必要です。TAO testingのようなテストプラットフォームを使用することで、テスト開発から採点までの全プロセスを1か所に集約し、スピードアップを図ることができます。 

質問タイプの例

Chat GPTでは、以下のような様々な評価やニーズに合わせて問題を作成することができます: 

  • ファクトベースの質問事実に基づいた質問。例えば、"太陽系で一番大きな惑星は何ですか?"など。
  • 概念的な質問:概念や原理の理解に関連する質問。例えば、"天気と気候の違いは何ですか?"など。
  • 分析的な質問:情報を分析・解釈するための質問。例えば、"現在の気候変動危機の原因として考えられるものは何か?"など。
  • クリティカルシンキングの質問です:情報を評価し、判断するための質問。例えば、"あなたは、ソーシャルメディアが社会に与える影響は、プラスとマイナスのどちらだと思いますか?あなたの答えを説明してください。"
  • クリエイティブな質問:ユニークで革新的なアイデアを生み出すように設計された質問。例えば、"海のプラスチックゴミを減らすために、どのような解決策が考えられるか?"など。
  • シナリオに基づく質問:仮想的なシナリオを提示し、学生に回答を求める質問です。例えば、「あなたは非倫理的な行為で非難されている会社のCEOです。あなたならこの状況にどう対処しますか?"

サイコメトリクスを考える:チャットGPTによる妥当性・信頼性

サイコメトリーは、すべての受験者にとって信頼性が高く、有効で、公平な問題を設計することが必要であるため、効果的な評価問題を作成するために不可欠な側面です。AIが作成した問題は、必要な基準を満たしているかどうかを確認するために、心理測定の原則に照らして評価する必要があります。

AIが生成したコンテンツとサイコメトリーを調和させる一つの方法は、人間のレビューと品質管理を評価プロセスに組み込むことです。関連分野の専門家や心理測定士が、作成された問題の妥当性、信頼性、公平性を評価することができます。また、問題が意図された学習成果に合致しているか、意図された対象者に適切かどうかも確認できます。

AIが生成するコンテンツの品質を確保するもう一つの方法は、項目応答理論(IRT)モデルのような、心理測定特性を最適化するために特別に設計された機械学習アルゴリズムを使用することです。これらのモデルは、難しすぎる項目や簡単すぎる項目を特定するのに役立ち、受験者の回答に基づいて項目の難易度を調整し、スコアが受験者の能力を正確に反映するようにすることができる。

ボトムライン

Chat GPTは、テストアイテムバンクの生成にAIを使用することで、テスト作成者の時間、費用、労力を節約できる計り知れない可能性を持っています。教室でテストを開発するために生成的なAIを使用することは、教育者がさまざまな問題を何時間もかけて作り直すことなく、さまざまなレベルのテストを作成することを支援する方法です。 

のようなオンラインテストプラットフォームと組み合わせると、より効果的です。 TAOテスト問題のランダム化によりテストの完全性を向上させながら、個々の学習者のニーズに合わせてテスト開発を高度にカスタマイズすることができます。この結果、アセスメントが目的とする、生徒の現状、次に取るべき措置、生徒の学習成果を向上させる方法について教育関係者に情報を提供する、という核心に迫るテスト体験ができるようになります。