Lý thuyết phản hồi mặt hàng

Đánh giá: 4 (1 bình chọn) 1 bình luận

Trong lĩnh vực của Lý thuyết Kiểm tra Tâm lý học, các mệnh giá khác nhau đã xuất hiện mà hiện nay lấy tên là "Lý thuyết Phản ứng Vật phẩm" (FM Lord, 1980). Hệ phái này thể hiện một số khác biệt so với mô hình cổ điển: 1.- Mối quan hệ giữa giá trị kỳ vọng của điểm số của đối tượng và đặc điểm (đặc điểm chịu trách nhiệm về giá trị) thường không tuyến tính. 2.- Nó nhằm mục đích đưa ra các dự đoán riêng lẻ mà không cần phải tham khảo các đặc điểm của nhóm quy phạm.

Có thể bạn cũng quan tâm: Chỉ số lý thuyết trắc nghiệm cổ điển

Lý thuyết về phản ứng đối với mặt hàng hoặc các mô hình về đặc điểm tiềm ẩn trong lý thuyết kiểm tra
Mô hình lý thuyết phản hồi mặt hàng (tri)
Ước lượng tham số
Thử nghiệm xây dựng
Các ứng dụng của lý thuyết phản ứng vật phẩm
Giải thích điểm số

Lý thuyết về phản ứng đối với mặt hàng hoặc các mô hình về đặc điểm tiềm ẩn trong lý thuyết kiểm tra

Do đó, chúng tôi thấy rằng Lý thuyết đáp ứng mặt hàng này cung cấp khả năng mô tả riêng biệt cả mặt hàng và cá nhân; Nó cũng coi rằng phản ứng mà đối tượng đưa ra phụ thuộc vào mức độ khả năng của anh ta trong phạm vi được xem xét. Nguồn gốc của những mô hình này là do Lazarsfeld, năm 1950, người đã đưa ra thuật ngữ "đặc điểm tiềm ẩn".

Từ đây người ta coi mỗi cá nhân có một tham số riêng chịu trách nhiệm về các đặc điểm của đối tượng, còn được gọi là "đặc điểm". Đặc điểm này không thể đo lường trực tiếp, do đó tham số riêng lẻ được gọi là biến tiềm ẩn. Tại thời điểm áp dụng các bài kiểm tra, có thể nhận được hai điều khác nhau, điểm thực sự và thang điểm năng khiếu; Điều này đạt được nếu chúng ta vượt qua hai bài kiểm tra về cùng một năng khiếu cho cùng một nhóm.

Trong Lý thuyết đặc điểm tiềm ẩn hoặc Lý thuyết phản ứng vật phẩm, điểm thực là giá trị kỳ vọng của điểm quan sát. Theo Lord, điểm số thực sự và thể lực là cùng một thứ nhưng được thể hiện trên các thang đo khác nhau.

Mô hình lý thuyết phản hồi mặt hàng (tri)

Mô hình lỗi nhị thức: chúng được giới thiệu bởi Lord (1965), giả định rằng điểm số quan sát được tương ứng với số câu trả lời đúng thu được trong bài kiểm tra (mà các mục đều có cùng độ khó và có tính độc lập cục bộ, tức là xác suất trả lời đúng cho một mục không bị ảnh hưởng bởi các câu trả lời cho các mục khác).

Mô hình Poisson: những mô hình này thích hợp cho những bài kiểm tra có số lượng mục lớn và trong đó xác suất câu trả lời đúng hoặc sai là nhỏ. Trong nhóm này, lần lượt, chúng tôi có các mô hình khác nhau:

Mô hình Poissonian của Rasch, có giả thuyết là: mỗi bài kiểm tra có một số lượng lớn các mục nhị phân độc lập cục bộ. xác suất sai sót trong mỗi mặt hàng là nhỏ. xác suất mà đối tượng mắc lỗi phụ thuộc vào hai điều, độ khó của đề thi và khả năng của đối tượng. Sự cộng gộp của các khó khăn, được hiểu là kết quả của việc trộn hai phép thử tương đương trong một phép thử duy nhất mà độ khó của nó là tổng các độ khó của hai phép thử ban đầu.
Mô hình Poisson để đánh giá tốc độ: Mô hình này cũng do Rasch đề xuất và có đặc điểm là tốc độ được tính đến khi thực hiện bài kiểm tra. Mô hình có thể được xem xét theo hai nghĩa: đếm số lần mắc lỗi và các từ được đọc trong một đơn vị thời gian. đếm số lỗi mắc phải và thời gian hoàn thành việc đọc văn bản. Xác suất thực hiện một số từ nhất định của một bài kiểm tra (i) bởi một đối tượng (j), trong một thời gian (t)
Mô hình đầu đạn bình thường: là mô hình do Lord (1968) đề xuất, được sử dụng trong các thử nghiệm với các hạng mục phân đôi và với một biến chung duy nhất. Đồ thị của nó sẽ như sau: Các giả định cơ bản đặc trưng cho mô hình này là:

không gian của biến thể tiềm ẩn là một chiều (k = 1).
sự độc lập cục bộ giữa các intem.
số liệu cho biến tiềm ẩn có thể được chọn sao cho đường cong cho mỗi mục là đầu đạn thông thường.

Mô hình Logistics; Nó là một mô hình rất giống với mô hình trước đó, nhưng nó cũng có nhiều lợi thế hơn về xử lý toán học của nó. Hàm logistic có dạng sau: Có nhiều mô hình logistic khác nhau tùy thuộc vào số lượng tham số mà chúng có:

Mô hình logistic 2 tham số, Birnbaum 1968, trong số các đặc điểm của nó, chúng tôi đề cập đến nó là một chiều, có tính độc lập cục bộ, các hạng mục là lưỡng phân, v.v.
Mô hình logistic 3 tham số, Lord, có đặc điểm là xác suất đoán đúng là một yếu tố sẽ ảnh hưởng đến hiệu suất của bài kiểm tra. 4.3. Mô hình logistic 4 tham số: mô hình do McDonald 1967 và Barton-Lord đề xuất năm 1981, mục đích là giải thích những trường hợp đối tượng có mức độ thể lực cao không phản ứng chính xác với vật phẩm.
Mô hình hậu cần Rasch: mô hình này là mô hình tạo ra số lượng việc làm lớn nhất mặc dù có một nhược điểm, đó là việc điều chỉnh dữ liệu thực của nó khó hơn, nhưng ngược lại với điều này thì ưu điểm khiến nó được sử dụng rộng rãi là Nó không yêu cầu kích thước mẫu lớn để điều chỉnh.

Ước lượng tham số

Phương pháp được sử dụng nhiều nhất là Khả năng tối đa, cùng với phương pháp này các thủ tục xấp xỉ số như Newton-Raphson và Cho điểm (Rao) được sử dụng. Phương pháp Khả năng Tối đa dựa trên nguyên tắc thu được các bộ ước lượng của các tham số chưa biết để tối đa hóa xác suất lấy được các mẫu đó. Ngoài Khả năng xảy ra tối đa, Ước tính Bayes cũng được sử dụng, dựa trên Định lý Bayes, bao gồm việc kết hợp tất cả các thông tin đã biết, tiên nghiệm, có liên quan đến quá trình đưa ra các suy luận. Một nghiên cứu sâu hơn về phương pháp Bayes để ước tính các thông số thể chất được thực hiện bởi Birnbaum (1996) và Owen (1975).

CÁC CHỨC NĂNG THÔNG TIN

Thử nghiệm tốt nhất có thể được xây dựng là thử nghiệm cung cấp lượng thông tin lớn nhất về đặc điểm tiềm ẩn. Việc định lượng thông tin này được thực hiện thông qua các "chức năng thông tin". Công thức cho hàm thông tin, Birnbaum 1968, như sau: Cần phải lưu ý rằng thông tin thu được trong một bài kiểm tra là tổng thông tin của từng mục, ngoài ra đóng góp của từng mục không phụ thuộc vào các mục còn lại. tạo nên bài kiểm tra. Nói chung, chúng tôi có thể nói rằng thông tin, trong tất cả các mô hình:

thay đổi theo mức độ tập thể dục.
độ dốc của đường cong càng lớn thì thông tin càng nhiều.
nó phụ thuộc vào phương sai của điểm số, càng cao thì càng ít thông tin.

Thử nghiệm xây dựng

Nhiệm vụ đầu tiên và là một trong những quan trọng nhất khi xây dựng một bài kiểm tra là lựa chọn các hạng mục, thỏa thuận trước các giả định lý thuyết để xác định đặc điểm mà bài kiểm tra dự định đo lường. Khái niệm "Phân tích mục" đề cập đến tập hợp các thủ tục chính thức được thực hiện để chọn những mục cuối cùng sẽ hình thành bài kiểm tra. Thông tin được coi là có liên quan nhất về các mặt hàng là:

Độ khó của mục, tỷ lệ cá nhân làm đúng.
Sự phân biệt, tương quan của từng mục với tổng điểm trong bài thi.
Các yếu tố phân biệt hoặc phân tích lỗi, ảnh hưởng của chúng có liên quan, ảnh hưởng đến độ khó của mục và khiến các giá trị phân biệt bị đánh giá thấp.

Khi thiết lập các chỉ báo của các chỉ số khác nhau, một số thống kê hoặc chỉ số thường được sử dụng, sau đây được sử dụng nhiều nhất:

Chỉ số độ khó Chỉ số phân biệt Chỉ số độ tin cậy Chỉ số tính hợp lệ Biết được các chỉ số cần phải tính đến để lựa chọn các mục sẽ hình thành bài kiểm tra, chúng ta sẽ xem các bước cần thiết để xây dựng một bài kiểm tra:

Đặc tả của vấn đề.
Liệt kê một tập hợp lớn các mục và gỡ lỗi chúng.
Sự lựa chọn của mô hình.
Kiểm tra các mục đã chọn trước.
Chọn các mục lý tưởng.
Nghiên cứu các phẩm chất của bài kiểm tra
Thiết lập các quy tắc giải thích của thử nghiệm cuối cùng thu được.

Từ các điểm trước đó, cần lưu ý rằng việc lựa chọn mô hình, điểm 3, sẽ phụ thuộc vào các mục tiêu mà bài kiểm tra theo đuổi, các đặc điểm và chất lượng của dữ liệu, và các nguồn lực sẵn có. Khi một mô hình được chọn, các điều kiện lý thuyết mà nó có thể được áp dụng đã được đưa ra, tuy nhiên các ưu điểm của nó phải được phân tích trong từng trường hợp và hoàn cảnh cụ thể. Các thuộc tính quy cho những mô hình tích hợp Lý thuyết đáp ứng vật phẩm (TRI), có thể bị ảnh hưởng bởi:

kích thước của thử nghiệm tính sẵn có khan hiếm của mẫu thiếu tài nguyên máy tính Có một số ưu tiên khi sử dụng một hoặc các mô hình khác, hãy xem chúng: các mô hình đầu đạn bình thường thường không được sử dụng trong các ứng dụng, giá trị của chúng là lý thuyết.
Rasch: thích hợp để so sánh theo chiều ngang (các bài kiểm tra so sánh ở mức độ khó với các phân phối năng khiếu tương tự). để có các dạng khác nhau của cùng một bài kiểm tra. * Thông số 2 và 3: chúng là những tham số phù hợp nhất với nhiều vấn đề.
để phát hiện các mẫu phản hồi sai. để so sánh các bài kiểm tra theo chiều dọc (so sánh các bài kiểm tra với các mức độ khó khác nhau và sự phân bổ khác nhau cho năng khiếu).

1 và 2 tham số:

phù hợp để xây dựng một thang đo duy nhất để bạn có thể so sánh các kỹ năng ở các cấp độ khác nhau.

Việc lựa chọn mô hình, ngoài mục tiêu theo đuổi, có thể bị ảnh hưởng bởi kích thước của mẫu; Trong trường hợp mẫu lớn và mang tính đại diện, sẽ không có vấn đề gì, có thể là mô hình đặc điểm cổ điển hoặc tiềm ẩn. Nhưng trong IRT (lý thuyết đáp ứng vật phẩm), một lượng mẫu nhỏ buộc phải chọn các mô hình có số lượng tham số nhỏ, thậm chí là mô hình đơn tham số.

Các ứng dụng của lý thuyết phản ứng vật phẩm

Chúng ta sẽ xem những ứng dụng nào phổ biến nhất: a) Đối sánh bài kiểm tra, đôi khi cần phải liên hệ điểm số đạt được trong các bài kiểm tra khác nhau, với hai mục đích có thể:

Cân bằng ngang: nó tìm cách thu được các dạng khác nhau của cùng một bài kiểm tra.
Vertical Equalization: mục đích là xây dựng một thang năng khiếu duy nhất với các mức độ khó khác nhau. Về việc cân bằng các bài kiểm tra, Lord (1980) đưa ra khái niệm "công bằng", ngụ ý rằng đối với mỗi môn học, hai bài kiểm tra có thể hoán đổi cho nhau vì nó được áp dụng rằng cái này hay cái kia sẽ không thay đổi mức độ năng khiếu đã được ước tính. cho chủ thể.

Nghiên cứu về sự thiên vị mặt hàng, một mặt hàng bị thiên lệch khi trung bình, nó cho điểm số khác nhau đáng kể trong các nhóm cụ thể được giả định là một phần của cùng một tập hợp.

Các bài kiểm tra thích ứng hoặc trung bình, thông qua các bài kiểm tra cá nhân hóa IRT có thể được xây dựng để cho phép suy ra giá trị thực của đặc điểm được đề cập theo cách chính xác hơn. Các mục sẽ được thực hiện tuần tự, cách trình bày của mục này hay mục khác sẽ phụ thuộc vào các câu trả lời được đưa ra trước đó. Có nhiều loại bài kiểm tra thích ứng khác nhau, chúng tôi chỉ ra những điều sau:

thủ tục hai giai đoạn, Lord 1971; Bertz và Weiss 1973 - 1974. Bài kiểm tra tương tự được thông qua lần đầu tiên và bài kiểm tra thứ hai được thực hiện tùy thuộc vào kết quả.
Quy trình theo nhiều giai đoạn, nó giống như giai đoạn trước, chỉ khác là quy trình bao gồm nhiều giai đoạn hơn.
Mô hình phân nhánh cố định, Lord 1970, 1971, 1974; Mussio 1973. Tất cả các đối tượng giải quyết cùng một mục, theo câu trả lời, một tập hợp các mục được giải quyết.
Mô hình phân nhánh biến đổi dựa trên sự độc lập giữa các mục và dựa trên các thuộc tính của các bộ ước lượng khả năng xảy ra tối đa.

Ngân hàng mục, có một tập hợp lớn các mục là điều gì đó sẽ cải thiện chất lượng của bài kiểm tra, nhưng đối với điều này, trước tiên các mục phải trải qua quá trình gỡ lỗi. Để phân loại các mặt hàng, cần phải tính đến đặc điểm mà phép thử của mặt hàng này sẽ là một phần nhằm đo lường là gì.

Giải thích điểm số

Cân: mục đích của chúng là cung cấp một sự liên tục để có thể sắp xếp, phân loại hoặc biết mức độ tương đối của đặc điểm được đánh giá là bao nhiêu; Điều này sẽ cho phép chúng tôi thiết lập sự khác biệt và tương đồng ở mọi người về đặc điểm đó. Các thang đo được sử dụng trong Tâm lý học là: danh nghĩa, thứ tự, khoảng và tỷ lệ; Các thang đo này được xây dựng từ kết quả của các bài kiểm tra, kết quả được gọi là "điểm trực tiếp".

Typify: đánh máy một bài kiểm tra là chuyển đổi điểm số trực tiếp thành những điểm khác mà bạn có thể dễ dàng hiểu được vì điểm số được đánh máy sẽ tiết lộ vị trí của đối tượng so với nhóm và sẽ cho phép chúng tôi thực hiện so sánh nội bộ và giữa các môn học. Có hai hình thức gõ:

Tuyến tính, chúng bảo toàn hình dạng của phân bố và không sửa đổi kích thước của các mối tương quan.
Phi tuyến tính, chúng không bảo toàn sự phân bố hoặc kích thước của các mối tương quan.

Thang đo APTITUDE Trong IRT, thang đo được xây dựng là thang đo tương ứng với các mức năng khiếu; Thang điểm này có đặc điểm là các ước tính và tham chiếu được thực hiện trực tiếp liên quan đến năng khiếu và thang điểm của nó. Hơn nữa, khả năng ước tính này chỉ phụ thuộc vào hình dạng của đường cong đặc trưng của các mặt hàng. Trong số các thang đo khả thi, chúng tôi chỉ ra hai:

Thang đo, được đề xuất bởi Woodcock (1978) và được xác định theo công thức sau:
Thang đo WITS, do Wright (1977) đề xuất, thang đo này là sự sửa đổi của thang đo trước đó và được đưa ra bởi mối quan hệ sau:

Bài viết này chỉ mang tính chất cung cấp thông tin, trong Tâm lý học-Trực tuyến, chúng tôi không có quyền đưa ra chẩn đoán hoặc đề xuất phương pháp điều trị. Mời bạn đến gặp chuyên gia tâm lý để điều trị trường hợp cụ thể của mình.

Nếu bạn muốn đọc thêm các bài viết tương tự như Lý thuyết đáp ứng vật phẩm - Ứng dụng và Kiểm tra, chúng tôi khuyên bạn nên nhập danh mục Tâm lý học Thực nghiệm của chúng tôi.