総括的評価とは何か?教育者と管理者のためのベストプラクティス

講義室でノートパソコンに座って総括評価を受けている大学生の男性。

総括的評価は、伝統的に教育者の評価戦略において重要な役割を担ってきたが、異なるクラスや能力レベルに合わせることが難しい場合がある。その結果、教師や管理者は、ソフトウェアを管理し、すべての生徒が評価にアクセスできるようにするのに苦労することが多い。 

しかし、教育者がより個別化された、形成的なテストへのアプローチにシフトしている現在、多くの教育者が、単元、学期、または年度の終わりに生徒の進歩を効果的に測定するためのデジタルツールを使用するためのベストプラクティスを開発しています。これには、ソフトウェア管理を簡素化し、生徒のエンゲージメントを向上させ、学習の障壁を取り除く具体的な手順が含まれる。 

この記事では、総括的評価とは何かを説明し、ベストプラクティスを共有し、教師や管理者が評定を自動化し標準に合わせるために使用している新しいEdTechツールの例をいくつか紹介します。 

キーテイクアウツ

  • 総括的評価は学習期間の終わりに実施され、形成的評価は学習期間中に実施される。
  • 総括的評価は、生徒の達成度を示す重要な指標であるが、尺度作成、採点、実施が難しく、コストもかかる。
  • アクセシビリティと生徒の参加に関するベストプラクティスに従うことで、教育者と管理者は総括的評価の効果を最大限に高めることができます。
  • 先進的なEdTechツールは、高次の思考スキルを客観的に測定するための総括的評価に利用されている。 

総括的評価とは何か? 

総括的評価または査定は、単元、学期、またはプログラムの終わりに行われるテストです。コース中の学生の進歩について教育者に洞察を与える形成的評価とは異なり、総括的評価は最後に成果を測定します。 

総括的評価には、多肢選択式テストやコンピュータ適応型テストなど、さまざまな形式がある。 コンピュータ適応テスト小論文、口頭試問などです。また、総括的アセスメントは学校と関連しているかもしれないが、民間企業、専門能力開発プロバイダー、政府機関でも頼りにされている。

総括的評価の目的

よく実施された総括的評価は、一貫性のある、基準に沿った、利用しやすい方法で生徒の達成度を測定します。教育者や管理者は、その結果に基づいてカリキュラムを微調整し、今後の授業計画に反映させることができます。 

総括的評価は、教育機関が学生の成果に対する説明責任を果たすためにも頻繁に利用される。さらに、アドバンスト・プレースメント(AP)、国際バカロレア(IB)、SAT、ACTの試験の場合、総括的評価は、大学進学を決定する上で極めて重要である。 

教育者は、厳密な総括的評価に加え、より頻繁に、形成的評価と呼ばれる非公式な評価を行っている。 形成的評価と呼ばれる非公式な評価を頻繁に行い、生徒の上達度を測ります。採点を自動化し、没入型体験を組み込んだテストソフトウェアを使用することで、教師は生徒のニーズをリアルタイムで把握することができる。これは、次のことに利用される。 一般的な問題点を解決するために授業を適応させるそして、総括的評価で生徒が成功するように設定します。

全体として、強固な形成的評価と総括的評価の組み合わせにより、教育者、管理者、生徒、保護者は、より良い学習成果を支援するために必要な情報を得ることができる。 

総括的評価の例 

以下は、現在広く実施されている総括的評価の例である。

標準テスト

最もよく知られている総括的評価は、幼稚園からSATやACTのような大学入試まで使われる標準テストである。標準テストは通常、学年度の終わりに生徒の知識を総合的に評価することを目的としている。全員が全く同じテストを受け、同じ基準で採点されるため、これらのテストは生徒の成績を客観的に測ることができる。

評価選択ボード

教師は高度な学習ツールを使って、提供する総括的評価を多様化している。例えば 評価選択ボードは、生徒に評価の形式を選択させることで、より深く学習するよう促します。エッセイを書くことを選ぶ生徒もいれば、多肢選択式テストや没入型評価に参加することを好む生徒もいるでしょう。

本格的な評価

オーセンティック・アセスメントは、生徒が知識を想起し、応用する能力を測定する動的なテストです。一般的に、このようなテストは実社会の状況をシミュレートしたり、学習者にケーススタディを提示したりします。生徒が自分の足で考えることを試すことで、本格的な評価はクリティカルシンキングのスキルを評価する素晴らしい方法となります。

最終プロジェクト

最終プロジェクトは、教育者が高次の思考スキルをテストするもう一つの方法である。最終プロジェクトは、プレゼンテーションの形をとることもあれば、次のような仮想学習環境で完成させる課題もある。 マルチユーザー仮想学習環境(MUVE).プロジェクトは、物理的な環境でもオンライン環境でも、ペンと紙によるテストに代わる魅力的な方法となる。

総括的評価を実施するためのベストプラクティス

革新的なEdTechソリューションの活用を通じて、教育者や管理者は総括的評価を実施するためのベストプラクティスを数多く開発してきました。以下はその例である:

スコアリングの自動化

テストの採点は、特に100人以上の生徒がいるクラスでは、時間がかかり、ミスが起こりやすいプロセスです。採点を自動化することで、EdTechツールは教師の時間を節約し、人的ミスをなくします。また、自動採点が高度な分析とリンクしている場合、教育者は生徒のどこに的を絞った介入が必要かを即座に把握することができます。

手動採点を有効にする

総括的な評価にはさまざまな形式があるため、教育者は以下のことができるようにすることが重要です。 手動採点は不可欠です。TAOのようなEdTechプラットフォームでは、ソフトウェアを追加することなく、教師が自由回答の点数を手動で入力することができます。

チームベースの採点で偏りをなくす

非同期チーム採点を可能にする評価ソフトウェア(異なる教師がそれぞれの時間に異なる試験や試験の一部を採点する)により、管理者は以下のような影響を簡単に減らすことができます。 教育者から生徒へのバイアス.採点者チームにランダムに回答を割り当てることで、管理者は採点者に生徒の名前を知らせず、最終評点が生徒の達成度を正直に反映するようにすることができます。

評価スケーリングの解除

テストの一貫性と公平性を保ちながら、総括的評価の規模を拡大することは困難です。この課題を解決するために、学校システムは、大規模なテスト管理のためのすぐに使えるソリューションとして、EdTechツールを利用しています。また、先進的なテストプラットフォームはクラウドベースであるため、生徒のプライバシーを守りつつ、学問的な整合性を確保する最新のセキュリティ保護が施されています。

ルーブリック採点を適用する

評価活動が自動採点に適さない場合、教師はルーブリックを使用して、学生のパフォーマンスを判断する客観的な基準を示すことができます。また、採点者に評価の採点方法について詳細なガイダンスを与えることで、採点スケジュールを大幅に短縮することができます。TAOのインターフェイスは、教育者が簡単にパフォーマンスを評価できるように、採点ルーブリックを指先で操作できるようにします。

評価者を評価する

学生のパフォーマンスを採点することに加えて、優れた総括的評価戦略には評価者を評価する方法を含めるべきです。多くの場合、一部の採点者は同僚よりも常に高得点または低得点をつけます。優れたEdTechプラットフォームは、管理者に採点者の行動を把握させ、採点者が自己修正・改善できるようにします。

相互運用性の確保

教育者が教室で使用するデジタルツールの数は増えていますが、これは学校システムにとって技術面でも運用面でも課題となります。テクノロジーがサイロ化したままでは、学校管理者は貴重なリソースをカスタム統合の開発に割く必要がある。そうでなければ、教育者は異なる機能を評価するために、異なるソフトウェアシステムを切り替えなければなりません。 

相互運用性は、学校システムが教育者と生徒にオールインワンのデジタル評価ソリューションを提供できるよう、総括的評価ツールのベストプラクティスです。例えば、TAOは、学習管理システムとのシームレスな統合とデータの合理化を可能にするために、Learning Tools Interoperability (LTI)のようなオープンスタンダードを使用しています。

学生を巻き込む

総括的評価には、次のような魅力的なデジタル体験を含めることができます。 テクノロジー強化項目(TEI)と呼ばれる魅力的なデジタル体験を含めることができるようになりました。例えば、TEIは、生徒が仮想生態系と相互作用し、理論的な知識を実世界の状況に適用する能力を測定する科学実験を行うことを課題とするかもしれない。

生徒をTEIに参加させることで、教師はテストへの不安を和らげることができ、生徒の達成度をより正確に測定することができる。さらに、TEIはバーチャルな環境で知識を応用させるため、高次の思考スキルを簡単に測定することができます。 

アクセシブルなテストの実施

すべての生徒の将来は、総括的評価での成績に大きく左右されるため、アクセシビリティが鍵となります。例えば、目の不自由な生徒や弱視の生徒には、問題を読み上げたり点字で表示したりするオプションがあるべきです。 

WCAG2.1AAA基準やセクション508ガイドラインのようなアクセシビリティ基準に沿ったEdTechツールを選ぶことで WCAG 2.1 AAA基準やセクション508ガイドラインのようなアクセシビリティ基準に沿ったEdTechツールを選択することで、教育者は生徒が学習の障害に直面しないようにすることができます。

結論

総括的評価は、今後数十年間、生徒の達成度を測る上で不可欠な役割を果たすと思われる。しっかりとした形成的評価戦略によって補完されれば、教師、管理者、生徒、保護者は、生徒の進歩、達成度、問題点に関する詳細な洞察を得ることができる。しかし、総括的評価を最大限に活用するためには、教育者は、時間のかかる採点プロセスやバイアスの可能性といった落とし穴を避ける必要がある。

生徒と保護者の信頼を勝ち取るために、教育者は客観的で公正な評価方法を確立すべきである。ベストプラクティスに従うことで、教育者と管理者は、実施する評価が一貫性があり、採点が簡単で、多様な生徒集団に適用できることを保証することができます。 

総括的評価の可能性についてもっと知りたい方は、TAOブログの以下の記事をご覧ください:

よくある質問

形成的評価と総括的評価の違いは何ですか?

形成的評価が学習期間中に実施され、生徒の進歩状況を把握するのに対し、総括的評価は学習期間の終了時に実施され、生徒の達成度を測定します。

総括的評価にはどのような例がありますか?

最もよく知られている総括的評価の種類は、標準化されたテストである。その他の種類には、本格的な評価や小論文がある。 

総括的評価のベストプラクティスにはどのようなものがありますか?

総括的評価のベストプラクティスには、ランダムなスコアと生徒のマッチングによるバイアスの排除、アクセシビリティ基準との整合、自動採点などがある。

 

今日の学習者と共に進化する。TAOのオンライン・アセスメント・ソリューションが、総括的評価から形成的評価、適応的評価まで、どのような評価形式にも対応できるよう、ゼロからアクセシビリティを考慮して設計されているのか、詳しくはお問い合わせください。