Konumuz bir kere daha ölçme-değerlendirme. Nedeni malum, haziran ayı MEB ve ÖSYM’nin, ortaokul ve lise son sınıf öğrencilerini ölçüp biçtiği bir ay; temmuzsa bunun sarsıntıları! “Değerlendirme”ye hiç girmeyelim; ama ölçmeyi bir kez daha yazalım son olur umuduyla! Son olur umuduyla; çünkü sınav odaklı bir sisteme alternatifler üretebilecek niyete ve donanıma sahip bir Milli Eğitim Bakanımız var artık!
Her yıl bu aylarda, liseye geçiş ve üniversiteye giriş sınavları yapılıp sonuçlar ilan edilince, ortalığı bir gürültü kaplar ki, kulakları sağır etmecesine! Mikrofonlar önce “sınav mağdurlarına” uzatılır: Nasıl geçti? Kimisi ağlamaklıdır, “Türkçe kolaydı, hepsini yaptım; matematik çok zordu, battım!” Kimisi daha özgüvenli, “Sorular kolaydı, sıkıntı yok!”
Sıkıntı yoktur; çünkü teknoloji, bilgiyi hâlâ sınav öncesi içilecek hap haline getiremedi; ama şükürler olsun ki ulema, sınavda başarı için, bilgiyi unutmaya karşı, sınava girmeden hemen önce, salona girince ve sınav başlayınca okunacak duaları keşfetti! “Allahü Teâlâ’dan yaptığımız işin hayırlı olmasını istemenin en doğru yolu olan dualar, hayatın her noktasında verdiğimiz sınavlar gibi eğitim hayatımızdaki sınavlarda da önemli rol almaktadır.” Şaka yaptığımı sananlar sabah.com.tr ve daha nicesinde yer alan “Sınav Duaları” başlığına bakabilirler.

Adaylar henüz evlerine varmadan çoğunun, sınavda kilitlenen yaratıcılıkları kanatlanmış, sınav yorumları sosyal medyaya ulaşmıştır bile:
#Türkçe sorularının şıkları aynen böyleydi! Görselde bir futbolcunun aynı resminden yan yana dört tane!
#Bugünkü deneme güzeldi; ama sınava daha 1 yıl var, bakalım, iyi hazırlanacağız!
#Türkçeyi yapan matematiği, matematiği yapan Türkçeyi yetiştirememiştir, ikisini de yetiştiren FETÖ’cüdür!
#ÖSYM manipülasyon yapıyor, sınav ikinci tura kalacak, sakın kaybettik diye sınav salonlarını terk etmeyin!
#Babama sürem yetmedi diyorum, keşke bir saat önce gelseydik diyor!
#Felsefe ile din soruları birbirine öyle karıştı ki, bir ara Mekkeli müşrikler filozoflara saldıracak sandım! (…)
Sıra eğitim uzmanlarındadır; özel okulların öğretmen ve rehberleri reklamlar eşliğinde, dersleri tek tek “değerlendirirler”: “Türkçede okuduğunu anlamaya ve yorumlamaya ağırlık verilmiş, beklenen de buydu zaten!” der Türkçe öğretmeni. “Dersleri takip eden, verilen ödevlerini yapan, zamanında ve yeteri kadar çalışan öğrenciler için bir sorun yok.”tur matematik testinde matematikçiye göre. “Fen ve biyoloji sorularında derslerin sözel kısmı öne çıkarılmış”tır; ama onlar “işlem odaklı bir hazırlık süreci” kurgulamışlardır okullarında her ihtimale karşı! “Tam da bizim öğrencilerimize çözdürdüğümüz türden sorular sorulmuş”tur okul olmayan temel lisenin fizik öğretmenine göre. “Toplamda bakıldığında sorular iyi hazırlanmış”tır ve “müfredata uygun”dur!

Bir süre sonra sonuçlar açıklanır ve basılı, görsel, dijital medya vardır sırada: “41 bin öğrenci sıfır çekmiş”tir! “Bu ne rezalet”tir böyle! “Eğitim yöneticilerimiz derhal istifa etmelidirler!” “Sorumlulardan hesap sorulmalıdır!” O kadar ki makul ve sakin bilge, mimarlık tarihçimiz Doğan Kuban bile çileden çıkmıştır: “Sınava giren 2 milyona yakın öğrencinin sınavlarda gösterdikleri performans utanç ve acı verici.”dir. “Sevgili okurlar, bu bir öğretim iflasıdır, suç ancak öğretimdedir.” (HBT, 17 Ağustos 2018)
Evet, her yılın temmuz, ağustos aylarının eğitim tablosu aşağı yukarı budur ve şimdi dilimizin döndüğünce bu tabloyu bir kere daha anlamlandırmaya çalışalım:
Eğitim sistemimizin sınav merkezli yapısına, müfredat içeriklerine, bilimden koparılıp İslamileştirilmesine, kamudan alınıp özel sektöre devredilmesine, öğretmen yetiştirme ve kadrolaşma gibi sorunlarına yönelik eleştirilerimizi saklı tutarak bu yazıyı, onun sadece bir parçası olan “ölçme”ye odaklamamız gerekiyor. Çünkü yukarıdaki tablodan yükselen feryatların önemli bir kısmı bununla ilgilidir.
İskoç kökenli İngiliz fizikçi, matematikçi ve mucit William Thompson, “(Bir şeyi) ölçebiliyor ve sayısal olarak ifade edebiliyorsanız,” diyor. “(o şey hakkında) bir şeyler biliyorsunuz demektir.” Bu nedenle insanlar, var olduklarından beri önceleri dünyayı bilme güdüsü ve sonraları da ek olarak adalet duygusuyla ölçüyorlar. Kuşkusuz arşından metreye, okkadan kiloya, gölge uzunluğundan saate geçiş, az toplumsal çabayla ve az zamanda olmadı.
Bugün ulaştığımız uygarlık düzeyinde ölçmenin yaşamımıza ne kadar çok girdiğine sayısız örnek yazabiliriz: Bileğinize takacağınız yüz liralık akıllı bileklik, gün içinde attığınız adımlarınızı sayıyor; yürüdüğünüz mesafeyi km cinsinden hesaplıyor; yaktığınız kaloriyi izliyor; tansiyonunuzu ve nabzınızı ölçüyor; uyku kalitenizi, ne kadar uyuduğunuzu, bunun ne kadarının derin, ne kadarının hafif uyku olduğunu ve yatakta ne kadar uyanık kaldığınızı kaydediyor; hareketsiz kaldığınız zaman uzarsa, sizi uyarıyor… Bilekliğiniz, bu ölçümlerin sonuçlarını birleştirip istatistikler oluşturuyor; eş zamanlı olarak tablet, PC ve telefonlarınızda görebileceğiniz raporlar hazırlıyor. Siz de bu sayede kendiniz için sağlıklı bir yaşam programlayabiliyorsunuz…

Teknolojinin ulaştığı bu aşamaya karşın, ne yazık ki eğitimde ölçme sorununu hâlâ bilimsel bir temelde çözebilmiş değiliz. Çözmekten geçtik, konuşamıyoruz bile! Ayşe Teyze çorbaya “bir tutam tuz” ilave edebilir; ama gastronomide diyetisyen bunu “5 gram sodyum klorür” biçimde ifade etmelidir. Biz eğitimciler de bir sıralama sınavının sonuçlarına bakarak “41 bin öğrenci sıfır çekti!” dersek, soruna pedagojiden değil, sokaktan bakmış oluruz!
Bilinmeyen bir niceliğin aynı türden ama bilinen bir nicelikle kıyaslanması demek olan ölçme, belli bir kurala göre herhangi bir niceliğe sayısal bir değer atama işidir. Atanacak değerin kıyaslanacak sabit ve somut bir karşılığı olmazsa, ölçü birimi evrensel ve bilimsel bir nitelik kazanamaz. Gram bu niteliğini 1 cm3 saf suyun ağırlığına, metre dünyanın çevresinin 40 milyonda birinin uzunluğuna ve saniye 1 günlük sürenin 86 400’de birinin süresine eşitliğiyle kazanmıştır.
Toplumsal işbölümünün kapitalizm öncesinde aile bağları ya da cemaat aidiyetine göre yapılması karşısında, bugün sınavların belli bir liyakati sağlamak gibi olumlu bir işlevinden söz edebiliriz. Ancak sınavların, öğrencilerin toplumdaki hiyerarşik yapıya göre sınıflandırılmalarını kolaylaştırıp toplumsal sistemin bütün adaletsizliklerine, eşitsizliklerine ve haksızlıklarına alıştırılarak sistemin sürdürülebilmesini güvence altına alan bir işleve sahip olmasını da göz ardı edemeyiz.
Şimdilik bunu bir yana koyarak kademeler arası geçiş sınavlarımızla sınırlı kalalım. Sınav sonuçlarının açıklanmasıyla birlikte yükselen itirazların, esas olarak “akademik başarısızlığa” dönük olduğu ortada: Sıfır çekenler, barajı geçemeyenler, boş kontenjanlar, açıkta kalanlar… Ama sistemin bütün yaraları bir yana, hiç değilse sınavların ve ölçmenin ne kadar “bilimsel” olduğuna, eğitim fakültelerimiz olsun, dönüp bakıyor mu acaba?

Önceki yılların sınavlarında da biz bu konuya biraz çalıştık. Örneğin 2016’da yapılan TEOG sınavında matematikten 20 000, Türkçeden 36 000, fenden 44 000 “ful çeken” öğrenci sayısı, 2017’de matematikte 76 000’e, Türkçede 117 000’e, fende 112 000’e yükselince ölçmenin bilimsel standartlara uygunluğunu araştırmıştık.
Şunu bulmuştuk: Çoktan seçmeli test sınavlarında bir maddenin (sorunun) zorluk derecesi, o maddeyi doğru yanıtlayan öğrenci sayısının toplam öğrenci sayısına bölünmesiyle hesaplanıyor. İşlemin sonucu 0,00 ile 0,40 arasında ise madde zor; 0,40 ile 0,60 arasında ise orta; 0,60 ile 1,00 arasında ise kolay oluyor. Öte yandan bir sınavın sağlıklı ve bilimsel ölçme yapabilmesi için, ilgili herkes bilir ki, soruların ortalama zorluk derecesi, %10’u çok kolay, %20’si kolay, %40’ı orta, %20’si zor ve %10’u çok zor olmalıdır. Oysa MEB’in kendi verilerinde TEOG sorularının tümü kolay kategorisindedir! Önceki yıllarda yapılan birçok nitelikli lise sınavlarında ise matematik ve fen testlerinin güçlük derecesi “zor”; ayırt edicilik katsayısı ise “düşük”tür!
Bir de ÖSYM’nin örneğin iki yıl önce yapılan Alan Yeterlik Testi’ne bakalım. Testlerin zorluk dereceleri şöyle: Türk Dili ve Edebiyatı 0,27, Tarih1 0,25, Tarih2 0,20, Coğrafya1 0,45, Coğrafya2 0,32, Felsefe 0,23, Din Kültürü ve Ahlak Bilgisi 0,40, Matematik 0,14, Fizik 0,09, Kimya 0,12, Biyoloji 0, 18, İngilizce 0,41. Görüldüğü gibi 12 dersin tümünde maddelerin ortalama zorluk derecesi “zor” kategorisindedir. Dolayısıyla öğrencinin akademik başarısını ölçmekte kullanılabilecek bir sınav değildir.

Kaldı ki LGS, TYT, AYT gibi sıralama sınavları akademik başarı hakkında fazla bir şey söylemez. Sadece adayların başarı düzeylerine göre sırasını gösterir. Ortalamanın üstündekiler başarılı, altındakiler başarısızdır. Buradaki sorun, MEB ve ÖSYM’nin nitelikli ve bilimsel bir ölçme “de” yapamamış olmasıdır; bu nedenle merkezi sınav sonuçlarıyla ilgili itirazlar, öncelikle buraya yönelmelidir!
Eğitimin ölçme-değerlendirme maddesinde asıl sorun, çoktan seçmeli ve sonuç odaklı ölçmedir. Sınav odaklı bir eğitimden nasıl çıkabiliriz? Bu daha belli bir süre mümkün değilse, eğitim sürecinin doğru planlanması için geri bildirim amaçlı bir süreç ölçmenin mekanizmalarını nasıl kurabiliriz, buna çalışmalıyız.
Ölçme konusunda W. Thompson haklıysa, Leibnitz doğru söylüyor demektir: “Tartışmayı bırakalım da hesap yapalım!”