Kayıt ol  |  Giriş
NotOku'yu +1'le
Ders: İstatistik      Ünite 2      15 Nisan 2012 Ara     

İstatistik Seri Türleri

Amaç 1

Gözlem değerlerinden hareketle istatistik serileri oluşturabileceksiniz.

Değişik ölçütler temel alınarak istatistik serileriyle ilgili farklı sınıflandırmalar yapmak mümkündür. Ancak bu ünitede, zaman serileri ayrı bir ünitede ele alınacağından, zaman ve mekân serilerine kısaca değinilecek, dağılma serileri de yeterli ayrıntıyla ele alınacaktır.

Zaman ve Mekân Serileri

Eğer gözlem sonuçları yıl, ay, hafta, gün ya da saat gibi bir zaman değişkeninin şıklarına göre sıralanırsa, oluşturulan seriye “zaman serisi” adı verilir. Yıllara göre ülke nüfusları ve belirli bir noktada günün saatlerine göre trafik yoğunluğu, bu tür serilere örnek olarak gösterilebilir. Aşağıdaki tabloda, zaman serilerine örnek olarak, Eskişehir ilindeki aylara göre ortalama sıcaklıklar verilmiştir:

Eskişehir ilindeki aylara göre ortalama sıcaklıklar

Eğer gözlem sonuçları ülke, bölge, şehir ya da köy gibi bir mekân (yer) değişkeninin şıklarına göre sıralanırsa, elde edilen seriye “mekân serisi” adı verilir. Şehirlere göre elektrik tüketimi, bölgelere göre tahıl üretimi bu tür serilere örnek olarak gösterilebilir.

Aşağıdaki tabloda, mekân serisine örnek olarak, bazı illerin denizden yükseklikleri verilmiştir:

Bazı illerin denizden yükseklikleri

Dağılma Serileri

Gözlem sonuçlarının maddesel bir değişkenin şıklarına göre sıralanmasıyla oluşturulan serilere, “dağılma serileri” adı verilir. Dağılma serileri ana çizgileriyle nicel ve nitel dağılma serileri olmak üzere ikiye ayrılır. Ancak bu ünitede, işlemlere elverişli olması nedeniyle sadece nicel dağılma serileri ele alınacaktır. Nicel dağılma serileri de basit seriler (diziler), frekans serileri ve sınıflandırılmış (gruplandırılmış) seriler olmak üzere üç alt başlık altında incelenebilir.

Eğer derlenen veriler ilgilenilen konunun dışında başka bir yönde, örneğin; gözlem sırasına göre sıralanmışsa, bu sıralamaya “liste” adı verilir. Açıktır ki, derlenen verilerden ihtiyaç duyulan bilgilerin bir liste yardımıyla elde edilmesi veri sayısı arttıkça giderek zorlaşır. Çünkü her aşamada listedeki sonuçların tekrar tekrar gözden geçirilmesi gerekir.

Konunun kolaylıkla anlaşılabilmesi için, derlenen verilerden hareketle sırasıyla basit, frekans ve sınıflandırılmış serilerin elde edilmeleri aşağıdaki örnek temel alınarak gösterilecektir.

Örnek

Tablo 2. 3’de bir doğum evinde doğan 100 bebeğin ağırlıkları, doğum sırasına göre verilmiştir:

Bebek ağırlıkları (kg)

Tablo 2. 3’de doğan bebeklerin ağırlıkları doğum sırasına göre kaydedildiğinden, oluşturulan tablo bir liste niteliğindedir. Şimdi bu listeden yararlanarak, 3.2 kg’ın üzerinde kaç bebeğin doğduğu araştırılsın.

Çözüm

Verilen listenin incelenmesiyle gözlem (doğum) sırasına göre, 017, 019, 021, 028, 029 ve 031’inci sırada doğan bebeklerin 3.2 kg’ın üzerinde olduğu görülür. Ancak bu sonuca ulaşabilmek için, listenin en az bir kez baştan sona kadar gözden geçirilmesi gerekir.

Eğer liste belirlenen amaçlar doğrultusunda düzenlenirse, başka bir anlatımla bir frekans dağılımı oluşturulursa, istenilen sonuçlara daha kısa zamanda ulaşılabilir. Örneğin 3.2 kg’dan daha ağır doğan bebek sayısına, tüm veriler gözden geçirilmeden kolaylıkla ulaşılabilir. Böyle bir sıralama sonucu elde edilen istatistik serisine “basit seri” adı verilir.

100 bebeğin ağırlıkları hafiften ağıra doğru sıralanarak oluşturulan basit seri aşağıda Tablo 2. 4’de verilmiştir.

Bebek ağırlıkları (basit seri)

Tablo 2. 4 yardımıyla, yapılan gözlemler çerçevesinde en ağır doğan bebeklerin sayısının 4 olduğu bir bakışta kolaylıkla görülebilir.

Eğer en ağır doğan bebekler değil de örneğin 2.5 kg doğan bebeklerin sayısıyla ilgilenilirse, 2.5 kg doğan bebek sayısı tablodan tek tek sayılarak elde edilebilecektir. Açıkça görülebileceği gibi gözlem sayısı arttıkça, istenilen bilgilere ulaşmak da giderek zorlaşacaktır.

Tablo 2.4 incelendiğinde, gözlem değerlerindeki tekrarlar dikkat çekecektir. Verilerin daha kolay kavranması açısından, gözlem değerlerinin yanına gözlem değerinin kaç kez tekrarlandığı kaydedilerek oluşturulan seriye “frekans serisi”, tekrarlara da “frekans” adı verilir. Tüm bu sözü edilenler doğrultusunda oluşturulan frekans serisi aşağıda verilmiştir:

Bebek ağırlıklarının frekans serisi

Yukarıdaki frekans serisinden, örneğin 2. 5 kg doğan bebeklerin sayısının 14 olduğu bir bakışta görülebilmektedir.

Frekans serilerinin basit serilere göre kavranmaları daha kolay olmakla birlikte, yine de ayrıntılıdır. Açıktır ki, gözlem sayısı arttıkça bu tür serilerinde kavranmaları giderek zorlaşır.

Deney ya da gözlem sayıları çok iken, deney ya da gözlem sonuçlarının belirli aralıklar (sınıflar) içinde kalan şıklara göre düzenlenmesiyle oluşturulan istatistik serisine sınıflandırılmış ya da gruplandırılmış seri adı verilir. Örneğin bir doğum evinde dünyaya gelen 100 bebeğin ağırlıkları için farklı büyüklükteki sınıflara göre, aşağıdaki gibi frekans dağılımları oluşturulabilir:

Bebek ağırlıklarının frekans dağılımı

Sınıflandırılmış seriler oluşturulurken dikkat edilmesi gereken önemli bir nokta, eğer sürekli bir değişkene ilişkin gözlem değerleri sınıflandırılıyorsa, her sınıfın üst sınırıyla onu izleyen sınıfın alt sınırı arasındaki farkın sonsuz küçük olacak şekilde oluşturulması gereğidir. Örneğin yukarıdaki sınıflandırılmış serilerin ilkinde 2.50 – 2.75 sınıfı göz önüne alınsın. 2.50 dâhil olmak üzere 2.75’den küçük tüm gözlem değerleri bu sınıf içinde, 2.75 dâhil olmak üzere 3.00’den küçük tüm gözlem değerleri de izleyen sınıf içinde yer almalıdır.

Eğer gözlem değerleri sürekli olmayan (kesikli) bir değişkene ilişkinse, örneğin 100 öğrencinin istatistik dersinden aldığı notlar aşağıdaki gibi sınıflandırılabilir:

İstatistik dersi frekans tablosu

Bir sınıfın alt ve üst sınırları arasındaki farka, “sınıf aralığı” ya da “sınıf büyüklüğü” adı verilir ve h ile gösterilir. Yukarıdaki not dağılımı örneğinde sınıf büyüklüğü 15 puandır. Dikkat edilirse aynı seride son sınıf, 96 ve daha çok olarak yer almıştır. Bu durum en büyük puanın 100 olmasından kaynaklanmıştır. Eğer sınıflandırmaya aynı sistematikle devam edilmiş olsaydı, son sınıfın 96 -111 biçiminde olması gerekirdi. Başlangıç ve bitiş sınırları belirtilmeyen bu tür sınıflara “açık sınıflar” denir. Açık sınıfların kullanılmaları halinde, en küçük ya da en büyük değer bilinemeyeceğinden bazı hesaplamalarda ve grafik çizimlerinde güçlüklerle karşılaşılacaktır. Herhangi bir zorunluluk olmadıkça, açık sınıfların kullanılmasından kaçınılmalıdır.

Kuramda sınıfların oluşturulmasına ilişkin kesin bir kural yoktur. Sınıf sayısını doğrudan araştırmacı belirler. Ancak sınıf sayısının, karşılaşılan özel problemin yapısına ve araştırmanın amaçlarına uygun bir biçimde belirlenmesi gerekir.

Eğer sınıflama yapılırken sınıf aralığı dar seçilirse, sınıf sayısı artar ve frekans dağılımının kavranması giderek zorlaşır. Aksi durumdaysa, sınıf sayısı azalır. Ancak dağılıma ilişkin bazı ayrıntılar gizli kalır. Uygulamalarda bir frekans dağılımına ilişkin sınıf sayısının 7 – 20 ya da 10 – 30 arasında olmasının uygun sonuçlar verdiği görülmüştür.

Gerçekte verilerin sınıflandırılması çok sayıdaki verinin kavranmasını büyük ölçüde kolaylaştırırken, bazı bilgi kayıplarına da neden olur. Örneğin 100 bebeğin ağırlıklarına ilişkin frekans serisinden 2.6 kg doğan bebek sayısının doğrudan 10 bebek olduğu görülebilir. Buna karşın aynı veri sınıflandırıldığında, sınıflandırılmış seride doğrudan kaç bebeğin 2.6 kg olarak doğduğu görülemez. İlgili veriye ilişkin ilk sınıflandırılmış seri göz önüne alındığında 2.6 kg, 2.50 – 2.75 sınıfının içinde yer almakta ve bu sınıfın frekansı da 35 olarak görülmektedir. Gerçekte 2.50 – 2.75 sınıfında, 2.50 ve 2.7499. . . kg doğan tüm bebekler yer almaktadır.

Sınıflandırılmış serilerde sınıfları temsil edebilecek değişken değerinin ne olacağı da bir sorun olarak ortaya çıkar. Uygulamada gözlem değerlerinin ilgili sınıf içinde düzgün dağıldığı varsayılarak sınıf orta noktaları, ilgili sınıfa ilişkin değişken değeri olarak kabul edilir.

Konuyla ilgili olarak aşağıdaki örneği dikkatlice gözden geçiriniz.

Örnek

Aşağıda verilen frekans dağılımında, ilgili sınıflara karşı gelen değişken değerlerini belirleyiniz.

Sınıf frekansları

Çözüm

Sınıf orta noktaları ilgili sınıflara ilişkin değişken değeri olacağından, her sınıfın orta noktası ilgili sınıfa değişken değeri olarak atanır.

Sınıf orta noktaları

Birikimli Seriler

Bir frekans dağılımında, her sınıfın frekansına bir önceki sınıfın frekansı eklenerek oluşturulan seriye “birikimli seri”, bu tür oluşturulan frekanslara da “birikimli frekanslar” adı verilir.

Birikimli seriler, küçükten büyüğe ya da büyükten küçüğe doğru oluşturulabilirler. Eğer birikimli seriler küçükten büyüğe doğru oluşturulmuşsa “-den az”, büyükten küçüğe doğru oluşturulmuşsa “-den çok” olarak isimlendirilirler.

Örnek

Bir doğum evinde doğan 100 bebeğe ilişkin sınıflandırılmış seriyi ele alarak küçükten büyüğe ve büyükten küçüğe doğru birikimli serileri oluşturunuz.

Çözüm

Bebeklere ait birikimli seri tablosu

Birikimli seriler, uygulamada, genellikle gözlem değerlerinin büyüklüklerine göre kaçıncı sırada yer aldıklarının belirlenmesinde kullanılır. Yukarıdaki örnekte bebeklerin ağırlık sınıfları göz önüne alınırsa -den az serisi yardımıyla, 66 bebeğin ağırlıklarının 2.75 kg’dan daha az olduğu bir bakışta görülebilir. Ayrıca den çok serisi yardımıyla da 34 bebeğin 2.75 kg’dan daha ağır doğduğu doğrudan görülebilir.

Konuyu yeterince pekiştirebilmek için aşağıdaki örneği dikkatlice gözden geçiriniz.

Örnek

0-35 seri tablosu

serisi verilmiştir.

a. Serideki toplam gözlem sayısını belirleyiniz.
b. Sayısal değeri 25’den küçük gözlem sayısını belirleyiniz.
c. Sayısal değeri 15 ve 15’den büyük, 30’dan küçük gözlem sayısını belirleyiniz.

Çözüm

a. Verilen seriye göre sayısal değeri 35’den küçük olan gözlem sayısı 70 olduğundan, toplam gözlem sayısı 70’dir.
b. Sayısal değeri 25’den küçük gözlem sayısı 51’dir.
c. Sayısal değeri 30’dan küçük gözlem sayısı 63 ve sayısal değeri 15’den küçük gözlem sayısı 16 olduğundan, sayısal değerleri 15 ile 30 arasındaki gözlem sayısı 63 – 16 = 47 olarak elde edilir. -den az ve -den çok serileri, frekans serileri için de oluşturulabilir.

Örnek

Aşağıda verilen frekans serisi için -den az ve -den çok serilerini oluşturunuz.

5-30 frekans serisi tablosu

Çözüm

5-30 için den az, den çok serisi

Bileşik Seriler

Birimlerin birden fazla değişkene göre dağılımlarını bir arada gösteren serilere “bileşik seri” adı verilir. Bir bileşik seri oluşturulurken, ilk sütunda bir değişkenin gözlem değerleri büyüklük sırasına göre yazılırken, diğer sütunlarda da ilgili değişkenlerin ilk değişkene göre durumları yer alır.

Örnek

Bir sınıftan rasgele seçilen 5 öğrencinin boy uzunlukları ve ağırlıkları aşağıdaki gibidir:

5 öğrencinin boy uzunlukları

İlgili frekans dağılımını oluşturunuz.

Çözüm

Verilen problemde birim öğrencidir. Boy uzunluğu ve ağırlık ise aynı birim üzerinde tanımlanmış iki farklı değişkendir. Bu duruma göre ilgili frekans dağılımı, bir bileşik seri biçiminde oluşturulmalıdır.

Uzunluk bağımsız, ağırlık da bağımlı değişken olarak alındığında, istenilen frekans dağılımı aşağıdaki gibi olmalıdır.

5 öğrencinin uzunluk-ağırlık tablosu

Eğer ağırlık bağımsız, uzunluk da bağımlı değişken olarak alınırsa, aynı veriye ilişkin bileşik seri;

5 öğrencinin ağırlık-uzunluk tablosu

biçiminde oluşturulur.

Sıra Sizde

1. Frekans dağılımı kavramını açıklayınız.
2. Bir radar tarafından geliş sırasına göre 50 arabanın hızı (km/saat) aşağıdaki gibi ölçülmüştür:

50 arabanın hızı tablosu

Yukarıdaki veri kümesini kullanarak sınıf büyüklüğü 5 km/saat ve ilk sınıf da 80 – 85 olacak biçimde bir frekans dağılımı oluşturunuz (NOT: Hızın sürekli bir değişken olduğuna dikkat ediniz).

3. Bir X değişkenine ilişkin 50 gözlem değeri gözlem sırasına göre aşağıda verilmiştir:

X değişkenine ilişkin 50 gözlem değeri

Yukarıdaki veri kümesini kullanarak ve ilk sınıf 2 – 6 olacak şekilde bir frekans dağılımı oluşturunuz (NOT: X değişkeninin kesikli bir değişken olduğuna dikkat ediniz).