Poisson Dağılım - Poisson Dağılım Hakkında - Poisson Dağılımı Konu Anlatım Poisson dağılımı, (okunuşu: puason dağılımı) olasılık kuramı ve istatistik bilim kollarında bir ayrık olasılık dağılımı olup belli bir sabit zaman birim aralığında meydana gelme sayısının olasığını ifade eder. Bu zaman aralığında ortalama olay meydana gelme sayısının bilindiği ve herhangi bir olayla onu hemen takip eden olay arasındaki zaman farkının, önceki zaman farklarından bağımsız oluştuğu kabul edilir.
Poisson dağılımı çok kere belirli sabit zaman aralığı birimleri bulunan problemlere uygulanmakla beraber, diğer birimsel aralıklı problemlere de (yani birim uzaklık, alan veya hacim içeren problemlere de) başarı ile uygulanabilir.
- Yatay eksen indeks k . Fonksiyon yalnızca k'nın tamsayı değerleri için geçerlidir. Noktaları bağlayan çizgiler süreklilik göstermez; kullanıcıya yardımcı olmak üzere çizilmişlerdir.
- Yığmalı dağılım fonksiyonu
Örnekler
Poisson dağılımı Poisson süreci ile birlikte ortaya çıkar. Poisson süreci aralıklı karakterde olan (yani 0, 1, 2, 3 .. kere meydana çıkan) bazı olgularin bir birim zaman, alan, mekân veya hacimde sabit bir olasılıkla oluşması şekilini alır. Bu çeşit olaylara ve Poisson dağılımının uygulanmasına örnekler şunlardır:
Prusya süvari birliklerinde her bir yıl at ve katır tepmeleri ile ölen asker sayısı: Bu klasik örnek 1868'de Ladislaus Josephovich Bortkiewicz tarafından bir kitapta yayınlanmış ve çok tanınmış bir örnek olarak yıllarca askeri ve sivil yüksek okul öğrencilerine verilmiştir.
Bir saat aralığında belli bir Internet sitesine gelen bağlantılar sayısı;
Yarım saat içinde bir nakliyat deposuna yükleme-boşatılma için gelen kamyon sayısı;
Her bir beş dakika içinde bir telefon cevap merkezine gelen telefonlar sayısı;
Belli bir trafik kavşağından 1 dakika içinde geçen otomobil sayısı;
Belli bir zaman aralığında bir büyük binada yanıp çalışması duran florasan lambalarının sayısı;
Bir mucit kişinin çalışma hayatı boyunca patentini aldığı keşifler sayısı;
[Not: Birbirini takip eden Poisson tipi olaylar arasındaki aralık karşılıklı ilişkili olarak bir üstel dağılım olur. Örneğin, bir florans ampülünun çalışma süresi veya otobüslerin gelmesi arasındaki bekleme zamanı.]
Tarihçe
Bu dağılım ilk defa Siméon-Denis Poisson (1781–1840) tarafından diğer olasılık hakkındaki yazıları ile birlikte 1838'de yayınlanan Recherches sur la probabilité des jugements en matières criminelles et matière civile ("Ceza hukuku ve medeni hukuk alanlarındaki hükümlerin olasılığı üzerinde araştırmalar") adındaki eserinde ortaya atılmıştır.
Nadir olaylar için Poisson dağılımı
Poisson dağılımının genel odaklandığı rassal değişken bir sayılabilen olaydır; bu olay belli bir sabit uzunlukta olan (genellikle zaman) aralıkta ayrık olarak ortaya çıkar ve bu aralıkta gözlenen olayların sayısı Poisson dağılım için rassal değişkendir. Bu sabit aralıkta ortaya çıkan olaylar sayısının beklenen değeri (ortaya çıkmanın ortalama sayısı) λ olarak sabittir ve bu ortalama değer aralık uzunluğuna orantılıdır. Eğer her 4 dakikalık zaman aralığı içinde ortalama 5 olay meydana geliyorsa, sabit 8 dakikalık aralıkta ortalama 10 (=8x5/4) olay ortaya çıkar. Herhangi bir negatif olmayan bir tamsayı olan k sayıda (k = 0, 1, 2, 3...) olay ortaya çıkma olasılığı şöyle ifade edilir:
burada
e, doğal logaritmanın tabanı (e = 2.71828...);
k, olasılığı fonksiyon ile verilmekte olan olayın ortaya çıkma sayısı;
k!, k için faktoriyel
λ verilen sabit aralıkta ortaya çıkma sayısının beklenen değeri; bir pozitif gerçel sayı.
Bu k'nin fonksiyonu Poisson dağılım için olasılık kütle fonksiyonu olur.
Poisson dağılımı için λ parametresi yalnızca beklenen değer, yani ortaya çıkan \scriptstyle\langle k \rangle sayıda olay için bir ortalama, değildir. Aynı zamanda
yani varyans da olur. Böylece gözlenen olay meydan çıkış sayısı bir ortalama değer λ ile bir standart sapması \scriptstyle\sigma_{k}\, =\, \sqrt{\lambda} olması niteliklerini taşiyan bir olasılık dağılımı, Poisson dağılımı, göstermektedir.
Genellikle bir Poisson dağılımı büyük sayıda olay ortaya çıkabilmesi mümkün olduğu, ama bu ortaya çıkması mümkün olayların nadir olduğu kabul edilen, sistemlerde uygulanabilir. Bilimsel alanlarda klasik örnekler atomların nükleer parçalanması; verilen bir DNA zincirinde ortaya çıkan mutasyon sayısı vb. Bu örneklerle ve diğer birçok örneğin için, ortaya çıkan nadir olay sayısı ayrık denemelerin sonucudur ve daha kesinlikle bir binom dağılım kullanılarak model haline getirebilinirler. Fakat n ve λ/n parametreli bir binom dağılımı (yani her deneme için λ/n başarı olasılığı olan n sayıda deneme için belirli bir başarı sayısı için olasılık dağılımı), deneme sayısı n büyüyüp limitte sonsuzluğa yaklaştıkça, beklenen değeri λ olan bir Poisson dağılıma yakınsalaşır. Bu limit bazan nadir olaylar kuralı olarak anılmaktadır. Bu ifade bir bakıma yanıltıcıdır; çünkü birçok Poisson dağılımı ile modellenebilen olaylar arasında birçoğu (örneğin bir otobüs durağına yarım saat aralığında gelen otobüs sayısı; bir mobil telefona bir saat aralığında gelen çağrı sayısı gibi) hiç de nadir olmayan olaylar bulunur. Ancak binom dağılımının büyük sayılar için hesaplanması faktöriyel sayılar kullanılmasi gerektirdiği için, bu uzun hesaplama biraz sıkıcı görülebilmekte ve bu nedenle Poisson dağılımı yaklaşık olarak binom dağılım yerine kullanılmaktadır.
Binom dağılımından limitte Poisson dağılım olasılık kütle fonksiyonunun çıkartılmasınin matemetiksel kanıtı şöyle yapılır:
Önce, değişkenler hesabı (calculus) içinde kullanılan limitin şöyle ifade edildiğı hatırlanır:
p = λ/n eşitliği bu ifade içine konulursa, şu genel denkleme varılır:
Şimdi bu son ifade biraz daha açılır ve şu elde edilir:
Limitte, ilk parantez içindeki ifade 1 e yakınsama gösterir (yani n ∞'a yaklaştıkça, ilk parantezdeki ifade 1'e yakınsar ) ve ikinci parantez içindeki ifade, ifade içinde n olmaması nedeniyle, sabit kalır; üçüncü parantez içindeki ifade e−λ değerine yakınsar ve son olarak da dördüncü parantezdeki ifade, 1 e yakınsar. Sonuçta, limitte şu ortaya çıkar:
Daha genel olarak, n ve pn parametreleri olan binom rassal değişkenler için bir sıra Binom ifadesi
olursa, bu seri dağılımda ortalaması λ olan bir Poisson rassal değişkeni için serilere yakınlaşır
Özellikler
Poisson dağılımı gösteren rassal bir değişken için beklenen değer ve varyans değeri de λdır. Poisson dağılımının yüksek momentleri λ terimleri ile oluşan (matematiksel kombinatorik kuramında anlamlı olan katsayıları bulunan) Touchard polinomlarıdır. Eğer Poisson dağılımı için beklenen değer 1 ise, o zaman Dobinski'nin formülüne göre ninci moment n büyüklüğünde olan set bölünümlerinin sayısına eşittir.
Tam sayılı olmayan bir λ lambda parametreli Poisson dağılımı gösteren bir rassal değişkenin mod değeri, λ 'dan küçük olan en büyük pozitif tamsayıya, yani \scriptstyle\lfloor \lambda \rfloor 'ya, eşittir.
Poisson dağılımı gösteren rassal değişkenlerin toplamı:
Eğer ifadesi λi parametresi ile Poisson dağılımı gösteriyor ve Xi terimleri bağımsız iseler, o halde ifadesi de parametresi toplama katılan parametre toplamlarından olan bir Poisson dağılımı gösterir.
- Beklenen değeri λ olan Poisson dağılımınin moment üreten fonksiyonu şu ifade ile verilir:
Poisson dağılımı ile üretilen rassal değişkenlerin simulasyonu
Poisson dağılımlı rassal sayıları üretmek için en basit yollardan birisi Knuth tarafından aşağıdaki gibi bir bilgisayar algoritmasıyla verilmiştir
algoritma poisson rassal sayı üretimi (Knuth):
init:
Let L ← e−λ, k ← 0 and p ← 1.
do:
k ← k + 1.
[0,1] aralığı içinde birörnek dağılımlı rassal sayı u üret ve let p ← p × u.
while p ≥ L.
return k − 1.
Basit olmakla beraber, karmaşıklık λ ile doğrusal olarak oranlıdır. Bu sorun etkisini azaltmak için çeşitli diğer algoritmalar geliştirilmiştir.
İlişkili dağılımlar
- Eğer ve ise, o halde Y = X1 − X2 farkı bir Skellam dağılımı gösterir.
- Eğer ve
bağımsızlarsa ve Y = X1 + X2 ise, o zaman Y = yya koşullu X1 dağılımı, bir binom dağılımı olur. Özellikle,
olur. Daha genel olarak, eğer X1, X2,...,Xn rassal değişkenleri, parametreleri
λ1, λ2,..., λn olan Poisson dağılımı gösteriyorlarsa, o zaman .
- Eğer denemeler sayısı limitte sonsuza doğru yaklaşır ve başarı sayısının beklenen değeri sabit kalırsa, bu binom dağılım limitte Poisson dağılıma yaklaşacağı isbat edilmiştir. Bu nedenle Poisson dağılım, eğer n yeterce büyük ve p yeterce küçük ise, bir binom dağılım yerine yaklaşım olarak kullanılabilir. Alışılagelen bir kurala göre, eğer n en aşağı 20 ise ve p 0,05e eşit veya daha küçük ise, Poisson dağılımı binom dağılımının iyi bir yaklaşımı olacaktır. Bu kurala göre eğer n ≥ 100 ve np ≤ 10 ise, bu yaklaşım mükemmel olur.
- Yeter derecede yüksek λ değeri (diyelim λ>1000) için, ortalaması λ ve varyansı λ olan bir normal dağılım, Poisson dağılım için çok iyi bir yaklaşım olur. Eğer λ 10dan biraz büyük ise, bu halde normal dağılım ancak uygun bir süreklilik doğrulaması kullanılırsa uygun bir yaklaşım olabilir. Başka bir deyim ile, eğer P(X ≤ x) ifadeleri P(X ≤ x + 0.5) ile değiştirilirse
olur. Eğer bir sabit zaman aralığı içinde bir hizmet alanına gelenler sayısı, ortalaması λ olan bir Poisson dağılımına uygun ise, o halde gelişler-arası zaman aralıkları, oran parametresi 1 / λ olan, bir üstel dağılım gösterir.
Parametre tahmini
Maksimum olabilirlik
ki için n tane ölçülmüş değer kapsayan bir örneklem alınsın. Bu örneklemin kökenindeki Poisson dağılım gösteren anakütle için Poisson parametresi olan λ için bir uygun bir kestirim değeri bulunması hesaplama hedefidir.
Bu kestirimi maksimum değişebilirlik yöntemi ile bulmak için önce bir log-değişebilirlilik fonksiyonu şöyle biçimlendirilir:
λ ile L fonksiyonunun türevi alınıp bu türev sıfıra eşitlenirse
ifadesi ortaya çıkar. λ için çözüm yapılırsa λ için maksimum-olabilirlilik kestirimini(MOK) şöyle buluruz:
Her gözlem için ortalama λ olduğu için bu ifadenin beklenen değeri de λ olur. Bu nedenle bu kestirim λ için bir yansiz kestirim olur. Bunun kestirim varyans değeri Cramer-Rao alt sınırına ulaşıp geçtigi için, bu kestirim bir etkin kestirim de olur.
Bayes tipi çıkarımsal analiz
Bayes tipi çıkarımsal analiz için Poisson dağılımının oran parametresi olan λ için eşlenik öncel bir gamma dağılımı gösterir. Şu ifadeye göre
λnin bir Gamma olasılık yoğunluk fonksiyonuna göre dağılım gösterdiğini; gnin bir şekil parametresi olan α ile bir ters ölçek parametresi olan β ile parametrelenmiş oldugunu, şöyle gösterilsin:
O zaman, daha önce olduğu gibi n sayıda ölçülmüş değerden oluşan örneklem ki ve bir Gamma(α, β) dağılımlı önsel verilmiş ise, sonsal dağılım şu olur:
Sonsal ortalama olan E[λ] limitte doğru gittikçe maksimum olabilirlik kestirimi olan ifadesine yaklaşır.
Eklecek verilerin sonsal kestirimci dağılımı bir Gamma-Poisson dağılım yani bir negatif binom dağılımı olur.
Küçük sayılar kuralı
Kural sözcüğü istatistik bilimi içinde olasılık dağılımı kavramı ile eşanlamlı olarak kullanılmaktadır. Kurala göre yakınsama kavramı dağılımda yakınsama ile aynı anlamda kullanılmaktadır. Buna dayanarak Poisson dağılımı bazan küçük sayılar kuralı olarak anılmaktadır. Buna neden bu dağılımın, nadir olacağı kabul edilmekle beraber, bir çok fırsatta ortaya çıkabilen bir olayın ortaya çıkma sayısını açıklayan olasılık dağılımı olmasıdır. 1898de Ladisladus Bortkiewicz'in Poisson dağılımı hakkında yayınladığı kitabın adı Küçük Sayılar Kuralıdır. Bazı matematik tarihçileri buna ithafen Poisson dağılımının adının da Bortkiewicz dağılımı olmasını istemişlerdir.