Lý thuyết kiểm tra cổ điển

Thử nghiệm là một công cụ khoa học ở mức độ mà nó đo lường những gì nó dự định, tức là nó hợp lệ, và nó đo lường tốt, tức là nó chính xác hoặc đáng tin cậy. Nếu chúng tôi tìm thấy một thiết bị mà chúng tôi không thể tin tưởng vào các phép đo mà họ cung cấp, vì chúng thay đổi theo thời gian khi chúng tôi đo cùng một đối tượng, thì chúng tôi sẽ nói rằng nó không đáng tin cậy. Một dụng cụ, để đo một cái gì đó chính xác, phải chính xác, bởi vì nếu không, đo những gì nó đo, nó sẽ đo sai. Vì vậy, chính xác là điều kiện cần nhưng chưa đủ. Ngoài ra, nó phải hợp lệ, tức là những gì nó đo lường chính xác sẽ là những gì nó được dự định đo lường, và không có gì khác.

Bạn cũng có thể quan tâm: Lý thuyết đáp ứng vật phẩm - Ứng dụng và thử nghiệm

Độ tin cậy:

Độ tin cậy tuyệt đối và tương đối: Chúng ta có thể tiếp cận vấn đề độ tin cậy của một bài kiểm tra theo hai cách khác nhau, mặc dù về cơ bản chúng trùng hợp nhau.

Độ tin cậy và độ chính xác của các phép đo: Khi một đối tượng trả lời một bài kiểm tra, anh ta sẽ nhận được điểm thực nghiệm, điểm này bị ảnh hưởng bởi một sai số. Nếu không có sai sót, đối tượng sẽ nhận được điểm thực sự của mình. Bài kiểm tra không chính xác vì điểm thực nghiệm không khớp với điểm thực thực sự. Sự khác biệt giữa hai điểm số này là sai số lấy mẫu, sai số đo lường. Sai số đo chuẩn sẽ là độ lệch chuẩn của các sai số đo. Các sai số đo điển hình cho thấy độ chính xác tuyệt đối của bài thi, vì nó cho phép lập dự toán phần chênh lệch giữa đo lường được và một trong đó sẽ có được nếu không có lỗi.

Độ tin cậy và tính ổn định của phép đo: Một phép thử sẽ đáng tin cậy hơn khi kết quả nó cung cấp được duy trì liên tục hoặc ổn định hơn khi lặp lại. Kết quả càng ổn định trong hai dịp thì mối tương quan giữa chúng càng lớn. Mối tương quan này được gọi là hệ số tin cậy. Điều này cho chúng ta biết, không phải số lượng lỗi, mà là tính nhất quán của thử nghiệm với chính nó và tính nhất quán của thông tin mà nó cung cấp. Các hệ số độ tin cậy thể hiện độ tin cậy tương đối của các thử nghiệm.

Hệ số độ tin cậy và chỉ số độ tin cậy: - Hệ số độ tin cậy của một phép thử là mối tương quan của phép thử với chính nó, được lấy ví dụ theo hai cách song song: rxx. - Chỉ số chính xác là mối tương quan giữa điểm thực nghiệm của bài kiểm tra và điểm thực của nó: rxv Chỉ số chính xác sẽ luôn lớn hơn hệ số tin cậy. Để tìm ra hệ số tin cậy, ba phương pháp cổ điển sau đây đáng được làm nổi bật:

Tìm mối tương quan giữa bài kiểm tra và sự lặp lại của nó: Phương pháp lặp lại hoặc phương pháp kiểm tra lại: Nó bao gồm việc áp dụng cùng một bài kiểm tra cho cùng một nhóm vào hai lần và tính toán mối tương quan giữa hai chuỗi điểm. Mối tương quan này là hệ số tin cậy. Phương pháp này thường cho hệ số tin cậy cao hơn so với hệ số thu được bằng các quy trình khác và có thể bị nhiễm bẩn bởi các yếu tố gây nhiễu.
Tìm mối tương quan giữa hai dạng song song của bài kiểm tra: Phương pháp song song: Hai dạng song song của cùng một bài kiểm tra được soạn sẵn, tức là hai dạng tương đương đưa ra cùng một thông tin, áp dụng cho cùng một nhóm đối tượng. Mối tương quan giữa hai hình thức là hệ số tin cậy. Với phương pháp này, bằng cách không lặp lại cùng một thử nghiệm, tránh được các nguồn gây nhiễu về độ tin cậy của thử nghiệm lại.
Tìm mối tương quan giữa hai nửa phép thử song song: Phương pháp hai nửa phép thử: Bài kiểm tra được chia thành hai nửa tương đương và tìm mối tương quan giữa chúng. Đây là phương pháp được ưa chuộng vì nó đơn giản và tránh được những hạn chế của các thủ tục trước đây. Bạn có thể chọn các phần tử lẻ của phép thử, để tạo thành một nửa và các phần tử chẵn để tạo thành phần còn lại.

Hệ số tin cậy và mối tương quan giữa các thử nghiệm song song

Các hệ số độ tin cậy của một bài kiểm tra cho thấy tỷ lệ rằng sự thay đổi thật sự là của phương sai thực nghiệm: graph33 hệ số độ tin cậy của một thử nghiệm khác nhau giữa 0 và 1. Ví dụ: nếu mối tương quan giữa hai thử nghiệm song song là rxx '= 0'80, điều đó có nghĩa là 80% phương sai của thử nghiệm là do số đo thực và phần còn lại, tức là 20% phương sai của thử nghiệm là do lỗi. Các chỉ số độ tin cậy của một bài kiểm tra là mối tương quan giữa điểm thực nghiệm của nó và độ tin cậy chỉ số điểm thật sự của nó = Chỉ số độ tin cậy tương đương với căn bậc hai của hệ số độ tin cậy

Khi hai hình thức kiểm tra song song đã được phát triển, quy trình phân tích phương sai được áp dụng để kiểm tra tính đồng nhất của các phương sai và sự khác biệt giữa các số đo. Nếu các phương sai là đồng nhất, sự khác biệt giữa các phương tiện không đáng kể và hai hình thức được xây dựng với số lượng yếu tố cùng loại và nội dung tâm lý như nhau thì có thể khẳng định rằng chúng song song với nhau. Nếu không, bạn phải cải tổ chúng cho đến khi chúng đúng như vậy. Sự thiếu tin cậy được xác định với giá trị rxx´ = 0 4.- Sai số đo điển hình: Chênh lệch giữa điểm thực nghiệm và điểm thực là sai số ngẫu nhiên, được gọi là sai số đo. Độ lệch chuẩn của các sai số đo được gọi là sai số đo chuẩn. Sai số tiêu chuẩn của phép đo Nó cho phép ước tính độ tin cậy tuyệt đối của bài kiểm tra, tức là ước tính mức độ ảnh hưởng của sai số đo lường đến điểm số.

Độ tin cậy và độ dài: Độ dài của bài kiểm tra đề cập đến số lượng các phần tử của nó. Độ tin cậy của nó phụ thuộc vào độ dài này. Nếu một bài kiểm tra bao gồm ba yếu tố, một môn học có thể đạt điểm 1 trong một lần và điểm 1 cho lần khác, hoặc theo một cách song song.

Từ dịp này sang dịp khác, điểm số đã khác nhau một điểm; một trong ba điểm là mức biến thiên 33%, mức độ biến động cao. Nếu các đối tượng nhận được các biến thể ngẫu nhiên kiểu này, thì mối tương quan của bài kiểm tra với chính nó hoặc của hai dạng song song của bài kiểm tra sẽ bị hạ thấp rất nhiều và không thể cao được. Nếu bài kiểm tra dài hơn nhiều, ví dụ, nếu nó có 100 yếu tố, một đối tượng có thể đạt 70 điểm trong một lần và 67 điểm trong một cách song song. Từ lần này sang lần khác, nó đã thay đổi 3 điểm; nó là một phương sai tương đối nhỏ so với tổng thử nghiệm, cụ thể là 3%. Những thay đổi ngẫu nhiên nhỏ về mức độ này, xảy ra trong điểm số của các môn học, khi chuyển từ dạng này sang dạng song song, tương đối không quan trọng và sẽ không làm giảm mối tương quan giữa hai dạng này nhiều như trước.

Hệ số tin cậy sẽ cao hơn nhiều so với trường hợp trước. Phương trình Spearman-Brown thể hiện mối quan hệ giữa độ tin cậy và độ dài. Độ chính xác của thử nghiệm là null khi độ dài bằng 0 và nó tăng khi độ dài tăng lên. Mặc dù mức tăng tương đối ít hơn khi chiều dài của phần lớn hơn. Điều này có nghĩa là độ chính xác tăng lên rất nhiều lúc đầu và tương đối ít hơn sau đó. Khi chiều dài có xu hướng đến vô cùng, hệ số tin cậy có xu hướng

Khi độ dài của một bài kiểm tra tăng lên, độ chính xác của nó tăng lên vì phương sai thực sự tăng với tỷ lệ cao hơn phương sai lỗi. Điều này giả định rằng độ chính xác của phép thử tăng lên vì tỷ lệ phương sai do sai số giảm xuống. Công thức Rulon, cũng như công thức Flanagan và Guttman, đặc biệt có thể áp dụng khi tính toán hệ số tin cậy bằng phương pháp hai nửa. Đây là những công thức dùng để tính hệ số tin cậy.

Độ tin cậy và tính nhất quán: Hệ số độ tin cậy còn có thể được tìm thấy theo một cách khác, nó được gọi là hệ số alpha hay hệ số tổng quát hoặc tính đại diện (Cronbach). Hệ số alpha này cho biết độ chính xác mà một số mục đo lường một khía cạnh của tính cách hoặc hành vi. Nó có thể được hiểu là: Một ước tính về mối tương quan trung bình của tất cả các mục có thể có ở một khía cạnh nào đó. Thước đo độ chính xác của phép thử như một hàm số của tính nhất quán hoặc tính nhất quán bên trong của nó (tương quan giữa các phần tử của nó; các phần tử của phép thử đều đo cùng một thứ ở mức độ nào) và độ dài của nó. Cho biết tính đại diện của phép thử, nghĩa là số lượng mẫu vật phẩm tạo nên nó đại diện cho tổng thể các vật phẩm có thể có cùng loại và nội dung tâm lý. Các hệ số alpha Nó chủ yếu phản ánh hai khái niệm cơ bản về độ chính xác của một bài kiểm tra: 1. Mối tương quan giữa các yếu tố của nó: mức độ mà tất cả chúng đều đo lường tốt cùng một thứ.

Độ dài của bài kiểm tra: bằng cách tăng số trường hợp trong một mẫu và nếu loại bỏ các lỗi hệ thống, thì mẫu đại diện tốt hơn cho tổng thể mà từ đó nó được rút ra và ít có khả năng bị lỗi ngẫu nhiên hơn. Nếu các mục kiểm tra là lưỡng phân, (có hoặc không, 1 hoặc 0, đồng ý hoặc không đồng ý, v.v.), phương trình của hệ số alpha được đơn giản hóa, dẫn đến phương trình Kuder-Richardson (KR20 và KR21). Với một số mục nhất định, một bài kiểm tra sẽ càng đáng tin cậy, càng đồng nhất. Hệ số alpha chỉ ra độ tin cậy trong chừng mực nó thể hiện tính đồng nhất và tính liên kết hoặc tính nhất quán bên trong của các yếu tố của một bài kiểm tra.

Tiêu chuẩn và tiêu chí độ tin cậy

Theo mô hình không gian mẫu các mục, mục tiêu của thử nghiệm là ước tính số đo sẽ đạt được nếu tất cả các mục trong không gian mẫu được sử dụng. Phép đo này sẽ là điểm thực, gần với các phép đo thực tế. Tùy thuộc vào mức độ mà một mẫu mục tương quan với điểm số thực, bài kiểm tra đáng tin cậy hơn hoặc ít hơn. Trọng tâm của mô hình này là ma trận mối tương quan giữa tất cả các mục trong không gian mẫu. Mô hình mẫu này nhấn mạnh trực tiếp hơn vào tính nhất quán bên trong và trong phạm vi mà nó đạt được, nó gián tiếp đảm bảo tính ổn định.

Mô hình tuyến tính của các bài kiểm tra song song nhấn mạnh nhiều hơn vào tính ổn định của điểm số, và ở mức độ mà nó đạt được sự ổn định, nó gián tiếp ủng hộ tính nhất quán bên trong. Nếu chúng tôi áp dụng một thử nghiệm để thiết lập các chẩn đoán và tiên lượng riêng lẻ, hệ số tin cậy phải từ 0,90 trở lên. Trong các dự báo và phân loại tập thể, yêu cầu không quá lớn, mặc dù không thuận tiện để đi lạc xa từ 0,90 đến 0,80.

Đôi khi trong một số loại bài kiểm tra, chẳng hạn như bài kiểm tra tính cách, rất khó để đạt được hệ số lớn hơn 0,70. Nếu các hình dạng song song, hoặc các nửa song song, được áp dụng sau một khoảng thời gian lớn hơn hoặc ít hơn, thì các lỗi cơ hội có thể nhiều hơn các lỗi ảnh hưởng đến hệ số alpha. Điều này là như vậy bởi vì điều làm giảm mối tương quan không chỉ là các lỗi ngẫu nhiên nội tại của thử nghiệm và trong một trường hợp duy nhất, là những sai số được tính đến bởi hệ số alpha, mà còn là tất cả các lỗi có thể đến từ hai tình huống khác nhau., có thể khác nhau về nhiều chi tiết. Do đó, hệ số alpha thường cao hơn các hệ số khác.

Ngoại trừ hệ số được tìm thấy bằng cách lặp lại cùng một thử nghiệm, vì các lỗi ngẫu nhiên của ứng dụng đầu tiên có nhiều khả năng được lặp lại trong ứng dụng thứ hai và thay vì làm giảm mối tương quan giữa hai lần, chúng sẽ làm tăng nó. Cần phải cẩn thận để đảm bảo rằng ứng dụng thứ hai hoàn toàn độc lập với ứng dụng đầu tiên. Nếu chúng ta đạt được điều này, đây sẽ là phương pháp dễ nhất, rẻ nhất và được khuyến khích nhất khi cố gắng đánh giá sự ổn định của điểm số, đặc biệt là trong thời gian dài và với các bài kiểm tra phức tạp. > Tiếp theo: Tính hợp lệ của các bài kiểm tra

Bài viết này chỉ mang tính chất cung cấp thông tin, trong Tâm lý học-Trực tuyến, chúng tôi không có quyền đưa ra chẩn đoán hoặc đề xuất phương pháp điều trị. Mời bạn đến gặp chuyên gia tâm lý để điều trị trường hợp cụ thể của mình.

Nếu bạn muốn đọc thêm các bài viết tương tự như Lý thuyết Thử nghiệm Cổ điển, chúng tôi khuyên bạn nên vào danh mục Tâm lý học Thực nghiệm của chúng tôi.

Lý thuyết kiểm tra cổ điển

Mục lục:

Độ tin cậy:

Tiêu chuẩn và tiêu chí độ tin cậy

Lựa chọn của người biên tập