İstatistiğin amacı, geometri ya da fizikte olduğu gibi, gerçek bir olguyu tanımlamaktır. Gerçek dünyanın nesneleri, sağlam bir kuramın temelini oluşturabilecek tam ve kesin bir biçimde asla tanımlanamaz. Yerlerine, açık ya da örtülü bir aksiyomlar sistemiyle tanımlanmış kimi idealleştirilmiş nesneleri koymak zorundayız. Örneğin, geometride, “noktayı”, “doğru parçasını”, ve “düzlem”i, örtük olarak bir aksiyomlar sistemiyle tanımlarız. Onlar, doğru tanımlarıyla tam uyuşmayan olgusal noktaların, doğru parçalarının ve düzlemlerin yerini alır. Kuramı gerçeğe uygulamak için, kuramın idealleştirdiği nesnelerle gerçek dünyanın nesneleri arasındaki bağlantıyı kurmada bir takım kurallara gereksinim duyarız. Bu kurallar her zaman biraz karanlık kalır ve kuramın kendisinin bir bölümünü asla oluşturamaz.
İstatistiğin amacı, yığın olgusunun ve yinelenen olayların belirli yönlerini betimlemektir. Kullanılan ana fikir, “olasılık”tır. Kuramsal tanımı, açık ya da örtük, bir aksiyomlar dizgesiyle yapılır. Örneğin, Mises, bir olayın olasılığını, belirli koşulları sağlayan sonsuz bir denemeler dizisinde bu olaya ilişkin göreli sıklıkların erimi olarak tanımlar.[10],[11] Bu olasılığın açık bir tanımıdır. Kolmogoroff olasılığı, belirli bir aksiyomlar dizgesini sağlayan bir küme işlevi olarak tanımlar.[9] “\(E= 1\) olayının olasılığı \(p\)’dir.” önermesini, “\(E = 1\) olayının, uzun bir denemeler dizisindeki göreli sıklığı, yaklaşık olarak \(p\)’dir.” önermesine dönüştüren bu idealleştirilmiş matematiksel tanımlar, kuramın uygulanmasına ilişkindir. Böyle bir kuramsal önermeyi olgusal bir önermeye dönüştürme, “uzun” ve “yaklaşık” sözcüklerinin anlamları üzerine bir şey söylenmediğinden, oldukça üstü kapalıdır. Ancak, kuramın gerçek olguya uygulanmasında, her zaman böyle bir belirsizlik bulunur.
“Olasılık” sözcüğünün yukarıdaki dönüştürmesi yerine, daha kolay anlaşılabilecek, “\(E\)’nin bire yakın bir olasılığı vardır” önermesini, “tek bir denemede \(E\)’nin gerçekleşeceği hemen hemen kesindir “ önermesine dönüşümünü kullanmanın yeterli olacağı söylenebilir . Gerçekten, eğer bir olayın olasılığı \(p\) ise, Bernoulli’nin bir teoremine göre, yeterince uzun bir deneme dizisindeki E’nin göreli sıklığının, \(p\)’nin küçük bir komşuluğunda olma olasılığı, 1’e olabildiğince yakındır. Eğer “1’e yakın olasılığı”, “hemen hemen kesin”e çevirirsek, “uzun bir deneme dizisindeki \(E\)’nin göreli sıklığının, \(p\)’nin küçük bir komşuluğunda olacağı hemen hemen kesindir.” ifadesini elde ederiz.
Her zaman istatistikte, belli gerçek olguları betimlemekte yeterli olduğuna inandığımız olasılık yapıları kurarız. Örneğin, madeni bir parayı atmada olası sonuçlara ilişkin durumları, uzun bir deneme dizisi içindeki toplam atışların yaklaşık yarısının tura gelmesini bekliyorsak, tek bir atışta tura gelme olasılığının 1/2 olduğunu söyleyerek tanımlarız. Ya da, bir çubuğun uzunluğunu bir aygıtla ölçüyorsak, bazen sonucun normal dağılımlı rasgele değişgen olduğunu varsayarız. Rassal değişgen ve dağılım işlevi şöyle tanımlanır: eğer \(\Phi (x)\), gerçek bir \(X\) değişgeninin, \(x\)’ten küçük olma olasılığını veren bir işlevse, \(X\) bir rassal değişgen ve \(\Phi (x)\) de, \(X\)’in olasılık dağılımıdır. Eğer \(\Phi (x)\),
\[\begin{array}{*{20}{c}}
{\Phi (x) = \frac{1}{{\sqrt {2\pi } \sigma }}\int\limits_{ – \infty }^x {{e^{ – \frac{1}{2}{{\left( {\frac{{y – \mu }}{\sigma }} \right)}^2}}}dy} }&{}&{\begin{array}{*{20}{c}}
{\begin{array}{*{20}{c}}
{}&{}&{}
\end{array}}&{}&{}&{}
\end{array}}&{\begin{array}{*{20}{c}}
{}&{}&{}
\end{array}(1)}
\end{array}\]
ise, \(X\)’in normal dağılımlı olduğu söylenir. \(\mu \) ve \(\sigma \) nicelikleri gerçek ölçümötelerdir. Böylece, eğer bir çubuğun uzunluğunun ölçülmesinde ölçüm sonuçlarının normal dağılımlı rassal bir değişgen olduğunu varsayarsak, ölçümün, \(x\)’in verilen bir değerinden daha küçük olma olasılığını (1)’le ifade edebiliriz.
\({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\), \(n\) tane rassal değişgen, ve \({{x}_{1}},{{x}_{2}},{{x}_{3}},…,{{x}_{n}}\), gerçek sayıların her hangi bir kümesi ise, \(\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},…,{{x}_{n}} \right)\) de eşanlı \({{X}_{1}}<{{x}_{1}},\text{ }{{X}_{2}}<{{x}_{2}},\text{ }{{X}_{3}}<{{x}_{3}},…,\text{ }{{X}_{n}}<{{x}_{n}}\) bileşik olayının olasılığı olur. Bu işlev, \(n\) tane rassal değişgenin ortak olasılık dağılımı olarak adlandırılır. Eğer \(\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},…,{{x}_{n}} \right)\) işlevi, ilki yalnızca \({{x}_{1}}\)’in, ikincisi yalnızca \({{x}_{2}}\)’nin, …., sonuncusu yalnızca \(x_n\)’in işlevi olmak üzere, \(n\) tane işlevin,
\[\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},…,{{x}_{n}} \right)={{\phi }_{1}}({{x}_{1}}).{{\phi }_{2}}({{x}_{2}}).{{\phi }_{3}}({{x}_{3}})….{{\phi }_{n}}({{x}_{n}})\]
biçiminde çarpımıysa, \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\) rassal değişgenlerinin bağımsız dağılımlı olduğu söylenir. Örneğin, bir çubuğun \(n\) kere \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\) ölçümleri birbirinden bağımsız ve aynı normal dağılımlı ise,
\[\begin{array}{*{20}{c}}
{{\rm{\Phi }}\left( {{x_1},{x_2},{x_3}, \cdots ,{x_n}} \right) = \frac{1}{{{{\left( {2\pi } \right)}^{n/2\;}}{\sigma ^2}}}\mathop \smallint \limits_{ – \infty }^{{x_1}} {e^{ – \frac{1}{2}{{\left( {\frac{{y – \mu }}{\sigma }} \right)}^2}}}dy\mathop \smallint \limits_{ – \infty }^{{x_2}} {e^{ – \frac{1}{2}{{\left( {\frac{{y – \mu }}{\sigma }} \right)}^2}}}dy \cdots \mathop \smallint \limits_{ – \infty }^{{x_n}} {e^{ – \frac{1}{2}{{\left( {\frac{{y – \mu }}{\sigma }} \right)}^2}}}dy}&{}&{(2)}
\end{array}\]
olur. Bir aygıtla çubuk uzunluğunun \(n\) kere ölçülmesinde, olasılık yapısı olarak genellikle, (2)’de verilen \(n\) tane ölçüm sonucunun ortak olasılık dağılımını kabul ederiz.
İstatistiksel çıkarımın temel sorunlarından biri, istatistiksel savların sınanması sorunudur. İstatistik kuramında ele almak zorunda oduğumuz istatistiksel bir savın en genel biçimi, şöyle ifade edilebilir:
\({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\), rassal değişgenlerin sonlu bir kümesi ve \(\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},\cdots ,{{x}_{n}} \right)\) de ortak olasılık dağılım işlevi olsun. O zaman, istatistiksel sav, “bilinmeyen dağılım işlevi \(\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},\cdots ,{{x}_{n}} \right)\), dağılım işlevlerinin belirli bir sınıfı \(\omega \)’nın bir bireyidir” önermesidir. Örneğin, çubuğun uzunluğuna ilişkin ardışık ölçümler \({{x}_{1}},{{x}_{2}},{{x}_{3}},…,{{x}_{n}}\) ise, \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\)’in birbirinden bağımsız aynı normal dağılımlı olduğu savını ele alalım. Burada \(\omega \), \(\sigma\) her hangi pozitif bir sayı ve \(\mu\) her hangi gerçek bir sayı olmak üzere, (2)’de verilen iki ölçümöteli bir ailenin bireyidir.
Eğer, \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\)’nin sıfır ortalamalı (\(\mu =0\)) ve birim değişkeli (\({{\sigma }^{2}}=1\)) birbirinden bağımsız normal dağılımlı olduğu savını ele alırsak, o zaman \(\omega \) tek bireyli olur. \(\omega \) tek bireyli olduğunda söz konusu savın yalın bir sav, aksi durumda ise bileşik bir sav olduğu söylenir.
Bir savın sınanması, \({{X}_{i=1(1)n}}\) rassal değişgeninin gözlenen değeri \({{x}_{i=1(1)n}}\) olmak üzere, \({{x}_{1}},{{x}_{2}},{{x}_{3}},…,{{x}_{n}}\) gibi \(n\) tane gözleme dayalı olarak, bilinmeyen dağılım işlevi \(\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},\cdots ,{{x}_{n}} \right)\)’nin, \(\omega \) sınıfından olduğu \({{S}_{\omega }}\) savının red ya da kabul edilmesidir. \(n\) gözlemlik küme, örnek uzayı olarak adlandırılan \(n\) -boyutlu Kartezgil uzayda \(E\) gibi bir noktayla gösterilebilir. \({{S}_{\omega }}\) savını \(n\) tane gözleme dayalı olarak sınamak, örnek uzayının \(R\) gibi bir alt kümesini seçerek, \(E\) noktasının \(R\) kümesinin bir bireyi olması durumunda \({{S}_{\omega }}\)’yi red; aksi durumda ise \({{S}_{\omega }}\)’yi kabul etmektir. Açıktır ki buradaki sorun, kritik bölge olarak adlandırılan \(R\) alt kümesinin seçimidir. Bu sorunun çözümü, bir ölçüde bilinmeyen \(\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},\cdots ,{{x}_{n}} \right)\) işlevine ilişkin olarak sahip olabileceğimiz her hangi bir öncül bilgiye bağlıdır. En sık yapılan ve çok önemli olan öncül varsayımlardan biri, her biri aynı dağılıma sahip \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\) rassal değişgenlerinin bağımsız dağılımlı olduğudur. Böylece, \(\Phi \) işlevinin, tüm \(i\), \(j\)’ler için \({{\varphi }_{i}}={{\varphi }_{j}}\) olmak üzere,
\[\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},\cdots ,{{x}_{n}} \right)=\prod\limits_{i=1}^{n}{{{\phi }_{i}}({{x}_{i}})}\text{ }\]
biçiminde olduğunu varsaymış oluruz.
Bilinmeyen dağılıma ilişkin böyle öncül bir bilgi, \(\Phi \left( {{x}_{1}},{{x}_{2}},{{x}_{3}},\cdots ,{{x}_{n}} \right)\) işlevinin, dağılım işlevlerinin belli bir sınıfı \(\Omega \)’nın bireyi olduğu söylenerek her zaman ifade edilebilir. Buna göre, ilgilendiğimiz \(\omega \), her zaman \(\Omega \)’nın bir alt sınıfıdır. Göreceğiz ki, \({{S}_{\omega }}\) savının sınanması için kritik bölge \(R\)’nin seçimi, \(\Omega \) öncül bilgisine dayanır.
Şimdi anlaşılıyor ki, sav sınama sorunu, bilinmeyen \(\Phi \) dağılım işlevi \(\Omega \) sınıfının bir bireyi ise, \(\Phi \)’nin, \(\Omega \)’nın belli bir alt sınıfı \(\omega \)’ya ait olup olmadığına karar vermektir. Çözülmesi gereken sorun, örnek uzayında kritik bölgenin nasıl seçileceğidir.
Örneğin, \(\Omega \), \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\)’lerin birbirinden bağımsız ve aynı normal dağılımlı olarak tanımlanabilir, ve \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\)’lerin beklenen değerlerinin sıfır olduğu bir altsınıfı \(\omega \) olabilir. Bu durumda, ileride tartışacağımız belli kurallara göre, uygun kritik bölge; \(\bar{x}=\frac{1}{n}\sum\limits_{i=1}^{n}{{{x}_{i}}}\) , \({{s}^{2}}=\frac{1}{n-1}\sum\limits_{i=1}^{n}{{{\left( {{x}_{i}}-\bar{x} \right)}^{2}}}\) ve c belli bir sabit olmak üzere,
\[\left| \frac{\bar{x}\sqrt{n}}{s} \right|\ge c\]
eşitsizliğiyle belirlenebilir. Ancak, her biri aynı dağılıma sahip \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\)’lerin birbirinden bağımsız dağılımlı olduğu \(\Omega \), çok daha geniş bir sınıf olduğundan, \({{S}_{\omega }}\)’nın sınanmasında yukarıdaki kritik bölge uygun değildir ve bir başka kritik bölge seçilmelidir.
Daha fazla ilerlemeden, birkaç matematiksel terimin istatistiksel anlamlarını, aşağıdaki çizelge biçiminde vermek yararlı olabilir.
Matematiksel Terim | İstatistiksel Anlamı |
\(n\) -boyutlu uzay, \(E_n\) (örnek uzayı) | \(n\) gözlemin olası sonuçları |
\(\Omega \), \(E_n\) üzerinde işlev sınıfı | Olasılık dağılımlarının olası sınıfı |
\(\omega \), \(\Omega \)’nın bir alt sınıfı | İstatistiksel sav. Gerçek dağılım \(\omega \)’nın bir üyesi. |
\(R\), (kritik bölge), \(E_n\)’nin alt bir kümesi | “Gerçek dağılım \(\omega \)’nın bir üyesidir” savını red etme kıstası. |
\(R\)’nin, \(\Omega \) ve \(\omega \), birlikteliği | Savın sınanması için kritik bölgenin seçimi |
Savların sınanması sorunu, istatistiksel çıkarım sorunlarının yalnızca birisidir. Diğeri, tahmin sorunudur. Bilinmeyen dağılım işlevinin dağılım işlevlerinin belli bir \(\Omega \) sınıfına ait olduğu verilmişken, \(E_n\)’nin her \(E \) noktasında tanımlı, değeri her zaman \(\Omega \)’nın üyesi ve bilinmeyen dağılım işlevi \(\Phi \)’nin “iyi” bir tahmini olan, bir \(\phi \left( E \right)\) işlevini nasıl seçebiliriz? \(\phi \left( E \right)\)’nin \(\Phi \)’nin yakın bir komşuluğunda olma olasılığı olabildiğince yüksekse, \(\phi \left( E \right)\)’nin \(\Phi \)’nin iyi bir istatistiksel tahmini olduğunu söyleyebiliriz. Bu ilkeyi Bölüm III’de daha ince bir biçimde belirleyeceğiz.
Örneğin, \(\Omega \), \({{X}_{1}},{{X}_{2}},{{X}_{3}},…,{{X}_{n}}\)’lerin birbirinden bağımsız ve aynı ortalama ve birim değişkeli normal dağıldığını ifade ediyorsa, o zaman \(\Omega \) dağılım işlevlerini tek ölçümöteli bir ailesidir ve bilinmeyen \(\mu \)’nün değeri belirlenerek \(\Omega \)’nın bir üyesi tümüyle belirlenebilir. Dolayısıyla, bilinmeyen dağılım işlevi \(\Phi \)’yi tahmin etmekle, bilinmeyen \(\mu \)’yü tahmin etmek aynı şeydir. Buna göre tahmin sorunu, örnek uzayının her noktasında tanımlı gerçek bir \(\phi \left( E \right)\) bulmaktır; öyle ki, \(\phi \left( E \right)\) bilinmeyen ortalama \(\mu \)’nün istatistiksel bir tahmini olsun. Sorunun bu özel durumundaki klasik çözüm,
\[\phi \left( E \right)=\frac{1}{n}\sum\limits_{\dot{I}=1}^{n}{{{x}_{i}}}\]
olarak verilir. Şimdiye kadar değinilen istatistiksel çıkarımın iki türü, karşılaşılabilecek tüm sorunları kapsamaz.1 Örneğin, dağılım işlevleri sınıfı \(\Omega \), \({{\omega }_{1}},{{\omega }_{2}},{{\omega }_{3}}\) gibi üç alt-sınıfın toplamı, ve bilinmeyen dağılım \(\Phi \)’nin \({{\omega }_{i}}\)’nin bir üyesi olduğunu öne süren sav \({{S}_{{{\omega }_{i}}}}\) ise; \(n\) gözleme dayalı olarak bu üç savdan hangisinin seçileceğine karar vermek, ne bir sav sınama, ne de bir tahmin sorunudur. Örneğin, ürünün ölçülebilir ve gerçek bir sayıyla belirlenebilir niteliğini iki erim arasında tutmak zorunda olan ve niteliğin gerçekten bu erimler arasında mı; alt erimden düşük mü; ya da, üst erimden yüksek mi olduğunu, örneklemeyle sınamak isteyen bir üreticinin durumunda, böyle bir sorun ortaya çıkabilir.
Böyle bir “üçlem”in, bir sav sınama ya da tahmin sorunundan farklı oluşunun nedenleri ancak burada gösterilebilir. Her çıkarım sorununa bir çok yaklaşımın olduğu ve kuramın, belli yaklaşımların diğer yaklaşımlardan “daha iyi” olduğuna karar vererek aralarında seçim yapma araçlarını sağladığı görülecektir. Şimdi, yukarıdaki “üçlemin”, diyelim ki, bilinmeyen dağılım işlevi \(\Phi \) tahmin edilerek ve \(\Phi \)’nin tahminini içeren alt-sınıfa ilişkin savın kabul edilmesi biçiminde, bir tahmin sorununa indirgenmesi öngörülebilir. Bu, “üçlem”e bir yanıt olabilir; ancak bu yanıt, gelişmiş kurallara göre hiç bir biçimde “en iyi” yanıt değildir.
İstatistiksel çıkarım sorununun en genel biçimi şudur: Dağılım işlevleri sınıfı \(\Omega \)’nın alt-sınıflarının bir dizgesi \(D\) olsun. \(D\)’nin her \(d\) üyesi için, bilinmeyen dağılım \(\Phi \)’nin, \(d\)’nin bir üyesi olduğunu öne süren sav \({{S}_{d}}\), ve tüm böyle savların dizgesi \({{S}_{D}}\) ise, bir örnek yardımıyla, \({{S}_{D}}\)’nin hangi üyesi kabul edilmelidir?
Daha önce sıralanan sorunlar bu genel sorunun özel durumlarıdır. Biri \(\Omega \)’nın bir alt-sınıfı \(\omega \) ve diğeri onun \(\Omega \)’daki tümleyeni olmak üzere, \(D\) yalnızca iki üyeden oluşuyorsa, sorun, \(\Phi \)’nin gerçek dağılımının, \(\omega \)’nın bir üyesi olduğu savının sınanması sorunuyla aynıdır. \(D\), \(\Omega \)’nın tüm üyelerinin bir dizgesiyse, sorun, bir tahmin sorunu; ve \(D\), toplamları \(\Omega \) olan \({{\omega }_{1}},{{\omega }_{2}},{{\omega }_{3}}\) gibi üç alt-sınıf ise, “üçlem”dir.
______________
1 Bu bağlamda [16: ss.299-300]’e bakınız.