--

17 (2) 2022

Nâng cao tính hợp lệ của các bài kiểm tra thành tích Tiếng Anh cơ bản ở trường HUFLIT


Tác giả - Nơi làm việc:
Nguyễn Thị Kim Tuyến - Trường Đại học Mở Thành phố Hồ Chí Minh, Thành phố Hồ Chí Minh , Việt Nam
Tác giả liên hệ, Email: Nguyễn Thị Kim Tuyến - tuyenntk.208t@ou.edu.vn
Ngày nộp: 19-09-2022
Ngày duyệt đăng: 11-10-2022
Ngày xuất bản: 01-11-2022

Tóm tắt
Bài viết nói lên tầm quan trọng của tính hợp lệ và nêu một số cách để nâng cao tính hợp lệ của nội dung bài kiểm tra thành tích (Achievement Test, AT). Trong nghiên cứu này, tác giả nghiên cứu nội dung của một bài kiểm tra thành tích (bài kiểm tra giữa kỳ) bằng nghiên cứu định lượng. Nội dung giáo trình English in action 3, 3rd edition được thiết kế để phát triển một bài kiểm tra phù hợp với lợi ích được miêu tả trong chương trình học, và điều đó có thể quyết định thành tích của sinh viên. Để đáp ứng mục đích này, một bài kiểm tra trắc nghiệm gồm 40 câu hỏi được thiết kế theo nội dung chương trình đào tạo. Bài kiểm tra, trong đó tính hợp lệ về nội dung được đánh giá và đảm bảo bởi 04 giảng viên, được áp dụng cho 240 sinh viên năm nhất ở trường Đại học Ngoại ngữ Tin học Thành phố Hồ Chí Minh (HUFLIT). Việc phân tích các mục của bài kiểm tra được thực hiện và 02 mục có độ phân biệt dưới 0.2 bị loại khỏi bài kiểm tra. Theo kết quả phân tích mục, độ khó trung bình của các mục được ước tính là 0.38 và có thể thấy rằng mức độ khó của chúng là trung bình. Tương tự như vậy, mức độ phân biệt trung bình của các mục được ước tính là 0.38 và người ta thấy rằng mức độ phân biệt của các mục là tốt. Kết quả của nghiên cứu, một bài kiểm tra thành tích hiệu quả và đáng tin cậy bao gồm 38 câu hỏi với độ khó trung bình và độ mạnh phân biệt tốt được tạo ra cho giáo trình English in action 3, được đưa vào giáo dục khoa học.

Từ khóa
bài kiểm tra thành tích; đánh giá; độ giá trị; tính hợp lệ

Toàn văn:
PDF

Tài liệu tham khảo

Afolabi, E. R. I. (2012). Tests and measurement: A tale bearer or true witness? (Inaugural lecture series 253). Ile-Ife, Nigeria: Obafemi Awolowo University.


Alnasraween, M, S., Almughrabi, A. M., Ammari, R., & Alkaramneh, M. (2021). Validity and reliability of eightgrade digital culture test in light of item response theory. Cypriot Journal of Educational Science, 16(4), 1816-1835. doi:10.18844/cjes.v16i4.6034


Baykul, Y. (2000). Eğitimde ve Psikolojide Ölçme: Klasik ve Test Teorisi ve Uygulaması. Ankara: ÖSYM Yayınları.


Brown, H., & Abeywickrama, P. (2010). Language assessment: Principles and classroom practices (2nd ed.). New York, NY: Pearson Longman.


Chew, L. C. (1997). Validity of computerised adaptive tests for biology achievement testing. In ERA conference (pp. 24-26). Singapore: Educational Research Association of Singapore (ERAS).


Faleye, B. A., & Afolabi, E. R. I. (2005). The predictive validity of the osun state junior secondary certificate examination. Electronic Journal of Research in Educational Psychology, 3(1), 131-144.


Fulcher, G. (2010) Practical language testing. London, UK: Hodder Education.


Fulcher, G., & Davidson, F. (2012) The routledge handbook of language testing. London, UK: Routledge.


Gergely, D. (2007). Investigating the performance of alternative types of grammar items [Electronic version]. Language Testing, 24(1), 65-97.


İşman, A., & Eskicumalı, A. (2003). Eğitimde Planlama ve Değerlendirme. İstanbul: Değişim Yayınları.


Mert, M. U., Eryiğit, D., Tunç, E. B., & Parlak, S. (2021). Validity and reliability of the solidarity in pandemics scale. International Journal of Psychology and Educational Studies, 8(3), 230-241.


Messick, S. (1993). Validity. In R. L. Linn (Ed.), Educational measurement. Oryx Press, NY: American Council on Education.


Mistiani, W., Istiyono, E., & Syamsudin, A. (2022). Construction of the character assessment instrument for 21st century students in high schools. European Journal of Educational Research, 11(2), 935-947. doi:10.12973/eu-jer.11.2.935


Özçelik, D. A. (1997). Test hazırlama kılavuzu (3rd ed.). Ankara: ÖSYM Yayınları.


Schultz, K. S., & Whitney, D. J. (2005). Measurement theory in action. Thousand Oaks, CA: Sage.


Shogbesan, Y. O. (2017). Effect of test facets on the construct validity of economics achievement tests in osun state secondary schools (Unpublished master’s thesis). Faculty of Education, Obafemi Awolowo University, Ile-Ife, Nigeria.


Tekin, H. (2000). Eğitimde Ölçme ve Değerlendirme (14th ed.). Ankara: Yargı Yayınevi.


Timur, S., Önder, E. Y., Timur, B., & Ekici, M. (2020). Development of science achievement test including the units of “States of matter and heat” and “Electricity in our life”. International Journal of Progressive Education, 16(1).


To, T. T. H. (2000). Investigating the predictive validity of IELTS among Vietnamese students (Unpublished doctoral dissertation). La Trobe University, Australia.


Tran, L. T., & Nguyen, S. T. (2021). Motivation and mathematics achievement: A Vietnamese case study. Journal on Mathematics Education, 12(3), 449-468.


Trochim, W. M. K. (2001). The research methods knowledge base (2nd ed.). Cincinnati, OH: Atomic Dog Publishing.


Turgut, M. F. (1997). Eğitimde Ölçme ve Değerlendirme (10th ed.). Ankara: Yargı Yayınevi.


Veneziano, L., & Hooper, J. (1997). A method for quantifying content validity of health-related questionnaires. American Journal of Health Behaviour, 21(1), 67-70.


Waltz, C. F., Strickland, O. L., & Lenz, E. R. (2005). Measurement in nursing and health research (3rd ed.). New York, NY: Springer.


Yurdagül, H. (2005). Ölçek geliştirme çalışmalarında kapsam geçerliliği için kapsam geçerlilik indeksinin kullanılması. Ulusal Eğitim Bilimleri Kongresinde Sunulmuş Bildiri, Denizli.



Creative Commons License
This work is licensed under a Creative Commons Attribution-NonCommercial 4.0 International License.