البيانات الخارجية هي بيانات المراقبة التي تختلف بشكل كبير عدديًا عن الملاحظات الأخرى في العينة. يستخدم المصطلح في الدراسات الإحصائية ويمكن أن يشير إلى تشوهات في مجموعة البيانات أو أخطاء في القياس المنجز. تعد معرفة كيفية حساب القيم المتطرفة أمرًا مهمًا لضمان الفهم الصحيح للبيانات وسيؤدي إلى استنتاجات أكثر دقة من الدراسة. هناك عملية بسيطة للغاية لحسابها لمجموعة معينة من الملاحظات.
خطوات
الخطوة الأولى. تعلم كيفية التعرف على الخارج المحتمل
قبل حساب ما إذا كانت بيانات المراقبة تمثل استثناءً أم لا ، من المفيد دائمًا فحص مجموعة البيانات والتعرف على القيم المتطرفة المحتملة. على سبيل المثال ، ضع في اعتبارك مجموعة بيانات تمثل درجة حرارة 12 عنصرًا مختلفًا في الغرفة. إذا كانت درجة حرارة 11 جسمًا تبلغ حوالي 21 درجة مئوية ، ولكن درجة حرارة الثاني عشر (ربما فرنًا) تبلغ 150 درجة مئوية ، فقد يشير الفحص السريع إلى أن الفرن خارج.
الخطوة 2. تنظيم بيانات الرصد من الأصغر إلى الأكبر
متابعة للمثال أعلاه ، ضع في اعتبارك مجموعة البيانات التالية التي تمثل درجات حرارة كائنات مختلفة: {22 ، 21 ، 24 ، 21 ، 21 ، 20 ، 21 ، 23 ، 22 ، 150 ، 22 ، 20}. يجب توزيع هذه المجموعة على النحو التالي: {20 ، 20 ، 21 ، 21 ، 21 ، 21 ، 22 ، 22 ، 22 ، 23 ، 24 ، 150}.
الخطوة 3. احسب متوسط مجموعة البيانات
الوسيط هو بيانات المراقبة الواقعة فوق النصف السفلي من البيانات وتحت النصف العلوي. إذا كانت مجموعة البيانات تحتوي على عدد زوجي من الملاحظات ، فيجب أخذ الحدين الأوسطين في الاعتبار. في المثال أعلاه ، الحد الأوسطان هما 21 و 22 ، لذا فإن الوسيط هو ((21 + 22) / 2) ، أو 21 ، 5.
الخطوة 4. احسب الربع السفلي
هذه النقطة ، المسماة Q1 ، هي بيانات رصد تقع تحت 25٪ من الملاحظات. في المثال أعلاه ، يجب أن يتم تحليل المصطلحين مرة أخرى ، هذه المرة 21 و 21. سيكون متوسط المصطلحين ((21 + 21) / 2) ، أو 21.
الخطوة 5. احسب الربع الأعلى
هذه النقطة ، المسماة Q3 ، هي بيانات الرصد الموجودة فوق 25٪ من الملاحظات. استمرارًا لمثالنا ، فإن أخذ متوسط حجري النرد 22 و 23 يؤدي إلى Q3 ، وهو 22 ، 5.
الخطوة 6. ابحث عن "الحواجز الداخلية" لمجموعة البيانات
تتمثل الخطوة الأولى في مضاعفة الفرق بين Q1 و Q3 (يسمى النطاق الربيعي) في 1.5. في المثال أعلاه ، النطاق الربيعي هو (22 ، 5 - 21) ، أي 1 ، 5. اضرب هذه القيمة في 1 ، 5 تعطي 2 ، 25. أضف هذا الرقم إلى Q3 واطرح من Q1 لبناء الحواجز. في هذا المثال ، ستكون الحواجز الداخلية العلوية والسفلية هي 24 و 75 و 18 و 75.
تعتبر جميع بيانات المراقبة خارج هذا النطاق قيمًا متطرفة معتدلة. في مجموعة البيانات لهذا المثال ، تعتبر درجة حرارة الفرن فقط (150 درجة مئوية) درجة معتدلة
الخطوة 7. ابحث عن "الحواجز الخارجية" لمجموعة البيانات
يتم ذلك بنفس الطريقة المتبعة مع الحواجز الداخلية ، باستثناء أن النطاق الربيعي مضروب في 3 بدلاً من 1.5. بضرب النطاق الرباعي أعلاه في 3 ، نحصل على (1 ، 5 * 3) ، أو 4 ، 5. وبالتالي ، فإن الحواجز الخارجية العلوية والسفلية هي 27 و 16 ، 5.