試験内容の妥当性を向上させる4つの方法

試験の妥当性を保証する評価を受けている研究室のコンピューターにいる生徒の特集画像

教育者であれ雇用者であれ、正しいスキルと成果を倫理的、正確かつ有意義な方法で測定し、テストしていることを確認することは非常に重要です。学生に知識と準備を身につけさせたい場合、あるいは潜在的な従業員やスタッフが特定の業務を遂行できることを確認したい場合、正しい試験や評価の内容を提供する必要があります。

試験や評価が偏りなく正確にその目的を果たすためには、測るべきものを客観的に測る必要があります。言い換えれば、試験は有効で信頼できるものでなければなりません。

試験の妥当性とは?

アセスメントの妥当性は、試験結果の正確性と信頼性を知らせます。自信を持って倫理的に結果を利用できるようにするためには、以下の点を確認する必要があります。 妥当性と信頼性を確保する必要があります。

妥当性とは、テストが測定すべきものを測定しており、偏った、非倫理的な、または無関係な質問を含んでいないことを意味します。妥当性は、特にテストの内容や何を測定するように設計されているかに関連しています。 

しかし、信頼性とは、テストがどれだけ安定した結果を出すことができるかということに関係しています。例えば、ある学生グループがデジタルリテラシーを測定するためのテストを受けたとします。 デジタルリテラシーを測定する例えば、デジタルリテラシーを測定するためのテストを受け、結果は習得を示したが、再度テストをして不合格だった場合、テストの質問に矛盾がある可能性があります。その評価は、信頼できない結果を生み出しているのです。言い換えれば、テスト結果は再現可能で一貫性がなければなりません。つまり、グループまたは個人を2回テストして、同じまたはそれに近い結果を得ることができるはずです。

アセスメントの妥当性と信頼性を向上させる4つの方法

幸いなことに、正確で有効、かつ信頼性の高いテスト内容を設計する方法があります。4つの重要なステップに進む際に、これらの基本要素を覚えておいてください。

  • 内容の妥当性- 何を測定したいのかを把握し、テストがそこから外れないようにすること。
  • 基準の妥当性- は、あなたのテストがどの程度内容を測定しているかを評価します。
  • 構成的妥当性- テストが実際に正しい内容を測定しているのか、それとも何か別のものを測定しているのかを確認します。
  • 信頼性- テストが再現可能で、同じグループや人が短期間に再度テストを行った場合に、一貫した結果を得られることを確認します。

以下のヒントは、試験やアセスメントを作成する際に、有効で信頼できる内容を確保するための指針になります。

1.SMARTゴール設定によるテスト目的の明確化 

テストの問題作成を始める前に、試験または評価の目的と目標を明確に定義する必要があります。そのためには SMARTゴールを設定する.SMARTとは、次のような意味です。

  • 具体的には
  • 測定可能であること。
  • 達成できる。
  • 関連性がある。
  • 時間的制約がある。

このように、SMARTゴールには、テストの有効性の重要な要素である「測定可能性」と「関連性」が含まれています。測定可能で関連性のある結果を含むSMARTテスト目標を作成すれば、テスト結果の再現性を確保することができます。これは、テスト問題を作成する際の指針になります。

その過程で、あなたが考え出した質問が有効でない、あるいは信頼できないことがわかるかもしれません。SMARTゴールに立ち返ることで、これらの質問を区別することができます。これには、テストの内容や基準など、何を測定したいのか、具体的に明らかにすることが含まれます。 

テストは誰のために行うのか、また、特定の言語をどのように受け止めるかを念頭に置いてください。また、回答者を圧倒することなく、最も正確な結果を得るために、いくつの質問を含めるか、どのくらいの長さのテストを行うかを決めておきます。これらのことを事前に確立し、目標を明確に定義することで、より有効なテストを作成することができます。

2.正しいスキルを測定する

新しいテストを設計する場合、状況に応じて、どのようなスキルや能力をテストする必要があるかを確認することも重要です。たとえば、コンピュータリテラシーのクラスを教える場合、生徒がデジタルリテラシーとみなされるために必要なスキルを学んだかどうかを判断するための適切な質問を試験に盛り込むようにしたいものです。

あるいは、IT部門の管理職として採用する場合、その人がその仕事に適した ハード・ソフト両面のスキルを備えているかどうか.アセスメントでは、職務の中核的要件以外のスキルを正確にテストする質問を用意する必要があります。コミュニケーション能力、共感力、自己管理能力などを評価する質問をいくつか盛り込みましょう。同様に、あなたが試験を提供する教育者である場合、試験がそれらのスキルを正確にテストすることを確実にするために、コースが何を対象としているか、学生が学ぶべきスキルは何かを慎重に検討する必要があります。

3.アクセシビリティ、公平性、客観性を優先する

アセスメントを提供する場合、テスト内容にできるだけ偏りがないようにすることも重要です。つまり、アクセスしやすく、公平でなければならないのです。たとえば、ある人がコンピュータプログラマーになるのに適したスキルを持っているかどうかをテストする場合、その人の人種、居住地、身体障害の有無に関する質問を含めると、テスト結果が偏り、差別的になる可能性が出てきます。その結果、間違った、あるいは違法な理由で、誰かが排除されたり、不合格になったりする可能性があります。例えば、有色人種や車椅子を使用している人がいたとしても、その人が優れたコンピュータプログラマーであるかどうかとは何の関係もないのです。 

また、意図せず排除してしまうようなテスト内容にならないよう、気を配ることも重要です。例えば、高等教育における真の 高等教育における客観的な評価は、アコモデーションが必要な学生や学習スタイルが異なる学生を考慮する必要があります。障害のある学生を考慮せずにテストを作成することは、公平ではありません。 障害のある学生の約3分の1しか大学に知らせていないのですから。.テストを受ける人が障害を持たずに生活していると仮定するのではなく、各問題が誰にとっても利用しやすいものになるように努力してください。包括的な言葉、該当する場合は平易な言葉、スクリーンリーダーへの対応など、誰もが平等に試験にアクセスし、受験できるようにするために思いつくことは何でも使ってください。

4.テストの分析・見直しの実施

最後に、テストを作成したら、学生や内定者に配布する前に、レビューと分析を行う必要があります。レビューには、同僚や他の専門家にあなたのテストを見てもらうことができます。他の人にテストを見てもらうことで、自分では気づかないような問題を発見することができます。

また、テストを実行し、問題が妥当で信頼できるものであることを確認するために、問題を分析するプログラムもあります。もし、問題が適切でない、または無関係である場合、プログラムはその問題を削除する必要があると判断し、あるいは、より適切な問題になるように言い換えることができます。

より有効で信頼性の高い試験や評価の作成は、学生の成長にも社会人の成長にも欠かせません。正しいことを正確にテストしなければ、会社や従業員に悪影響を与えたり、学生の教育的成長を妨げたりする可能性があるからです。また、ニーズの変化に応じて定期的にテストを見直し、更新することや、テスト後のフィードバックなど、サポートすることも重要です。

試験の妥当性と信頼性を確保するためのTAOの活用について詳しく見る