موقع د. عزيز الجعيد
  • الرئـيـسـية

  • الأقسام

    • علم البيانات والذكاء الإصطناعي

    • ذكاء الأعمال

    • لغة البرمجة بايثون

    • مقالات متنوعـة

    • لغة البرمجة آر R

    • الإحــــــصــــــاء

    • البيانات المفتوحة

  • عـنــي

  • تواصل معي

علم البيانات والذكاء الاصطناعي

  • الرئـيـسـية

  • الأقسام

    • علم البيانات والذكاء الإصطناعي

    • ذكاء الأعمال

    • لغة البرمجة بايثون

    • مقالات متنوعـة

    • لغة البرمجة آر R

    • الإحــــــصــــــاء

    • البيانات المفتوحة

  • عـنــي

  • تواصل معي

الإحصاءات الكافية (sufficient statistics)

16/04/2017 | الإحــــــصــــــاء | شارك بتعليقك

عالم الأحياء والإحصاء رونالد فيشر

يقال في الإحصاء، عن إحصائية إنها كافية (sufficient statistics) بالنسبة لنموذج إحصائي ما والمعلمة (parameter) غير المعروفه المرتبطة به إذا لم يكن هناك أي إحصائية أخرى يمكن حسابها من نفس العينة ويمكن أن توفر أي معلومات إضافية عن قيمة هذه المعلمة. بالنسبة لمجموعة $ X $ من البيانات المستقلة التي تتبع توزيعاً مشروطاً على المعلمة غير المعروفه $\theta $، إذا كانت  الدالة $T (X)$ هي إحصائية كافية تحوي كل المعلومات اللازمة لحساب أي تقدير للمعلمة $\theta $، فإنه إعتماداً على نظرية تحليل العوامل ( factorization theorem) ، يمكن كتابة التوزيع المشترك لإحصاء كاف كما يلي:

\[
p(X;\theta)=h(X )g(\theta ,T(X)),
\]

مثال: توزيع برنولي (Bernoulli distribution)

بأخذ عينة عشوائية $x_{1},x_{2},…,x_{n}$ من توزيع برنولي، فإن دالة الكثافة الإحتمالية ( probability density function ) يمكن كتابتها كما يلي:

\[
f\left( x_{i};p\right) =p^{x_{i}}\left( 1-p\right) ^{1-x_{i}}
\]

بالتالي دالة الإحتمال ( likelihood function ) يمكن أن تكتب كما يلي:

\begin{eqnarray*}
L\left( \mathbf{x}|p\right) &=&\prod\limits_{i=1}^{n}p^{x_{i}}\left(
1-p\right) ^{1-x_{i}} \\
&=&p^{\sum\nolimits_{i=1}^{n}x_{i}}\left( 1-p\right)
^{n-\sum\nolimits_{i=1}^{n}x_{i}} \\
&=&\left( \frac{p}{1-p}\right) ^{\sum\nolimits_{i=1}^{n}x_{i}}\left(
1-p\right) ^{n} \\
&=&\left( \frac{p}{1-p}\right) ^{t}\left( 1-p\right) ^{n}
\end{eqnarray*}

حيث $t=\sum\nolimits_{i=1}^{n}x_{i}$ . الآن نستطيع أن نقول أن دالة الإحتمل المشتركة يمكن كتابتها على الشكل:

\[
L\left( \mathbf{x}|p\right) =g(p,t)h(x)
\]

حيث $h(x)=1$ وكذلك $g(p,t)=\left( \frac{p}{1-p}\right) ^{t}\left( 1-p\right) ^{n}$. وفقاً لنظرية فيشر لتحليل العوامل، نستطيع القول أن

\[
T(X)=\sum\nolimits_{i=1}^{n}x_{i}
\]

إحصائية كافية للمعلمة $p$.

 

جميع الحقوق الفكرية لهذا المقال محفوظة © موقع د. عزيز، يمنع إعادة نشره في موقع آخر

مقالات ذات صلة:

  • المتغيرات العشوائية

    المتغير العشوائي (random variable) هو متغير يمثل النتائج العددية لظاهرة عشوائية. يجب أن يكون المتغير العشوائي قابل... المتغيرات العشوائية
    اقرأ المزيد
  • الدالة المولدة للعزوم

    مثال(1): الدالة المولدة للعزوم للتوزيع الأسي نفرض أن $X$ يتبع التوزيع الأسي (Exponential distribution)، حيث أن دالة... الدالة المولدة للعزوم
    اقرأ المزيد
  • التوقع والتباين (Expectation and Variance)

    نفرض أن $X$ متغير عشوائي يتبع التوزيع الطبيعي (Normal distribution) بمتوسط $\mu$ وتباين $\sigma^{2}$ \begin{equation*}... التوقع والتباين (Expectation and Variance)
    اقرأ المزيد

شارك بتعليقك

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *


The reCAPTCHA verification period has expired. Please reload the page.

د. عزيز عوض الله الجعيد
دكتوراه في الإحصاء، عالم بيانات، مبرمج، مهتم في التحليل المتقدم، والبيانات الضخمة والذكاء الاصطناعي، لمزيد من المعلومات أضغط هنا

  • YouTube
جميع الحقوق محفوظة © موقع د. عزيز