Στατιστική εκτίμηση και οι ιδιότητές της. Σημειακή εκτίμηση παραμέτρων κατανομής

Στατιστικές εκτιμήσεις των παραμέτρων του γενικού πληθυσμού. Στατιστικές υποθέσεις

ΔΙΑΛΕΞΗ 16

Ας απαιτείται να μελετηθεί το ποσοτικό πρόσημο του γενικού πληθυσμού. Ας υποθέσουμε ότι, από θεωρητικές εκτιμήσεις, ήταν δυνατό να καθοριστεί ποια διανομή έχει ένα χαρακτηριστικό. Αυτό δημιουργεί το πρόβλημα της εκτίμησης των παραμέτρων που καθορίζουν αυτήν την κατανομή. Για παράδειγμα, εάν είναι γνωστό ότι το υπό μελέτη χαρακτηριστικό κατανέμεται στον γενικό πληθυσμό σύμφωνα με τον κανονικό νόμο, τότε είναι απαραίτητο να εκτιμηθεί (περίπου να βρεθεί) η μαθηματική προσδοκία και η τυπική απόκλιση, καθώς αυτές οι δύο παράμετροι καθορίζουν πλήρως την κανονική κατανομή . Εάν υπάρχουν λόγοι να πιστεύουμε ότι το χαρακτηριστικό έχει κατανομή Poisson, τότε είναι απαραίτητο να εκτιμηθεί η παράμετρος , η οποία καθορίζει αυτήν την κατανομή.

Συνήθως, στην κατανομή, ο ερευνητής έχει μόνο δείγματα δεδομένων, για παράδειγμα, τις τιμές ενός ποσοτικού χαρακτηριστικού που λαμβάνεται ως αποτέλεσμα παρατηρήσεων (εφεξής, οι παρατηρήσεις θεωρούνται ανεξάρτητες). Μέσα από αυτά τα δεδομένα και εκφράστε την εκτιμώμενη παράμετρο.

Θεωρώντας ως τιμές ανεξάρτητων τυχαίων μεταβλητών , μπορούμε να πούμε ότι για να βρούμε μια στατιστική εκτίμηση μιας άγνωστης παραμέτρου μιας θεωρητικής κατανομής σημαίνει να βρούμε μια συνάρτηση των παρατηρούμενων τυχαίων μεταβλητών, η οποία δίνει μια κατά προσέγγιση τιμή της εκτιμώμενης παραμέτρου. Για παράδειγμα, όπως θα φανεί παρακάτω, η συνάρτηση (αριθμητικός μέσος όρος των παρατηρούμενων τιμών του χαρακτηριστικού) χρησιμοποιείται για την εκτίμηση της μαθηματικής προσδοκίας μιας κανονικής κατανομής:

.

Ετσι, στατιστική αξιολόγησηάγνωστη παράμετρος της θεωρητικής κατανομής ονομάζεται συνάρτηση των παρατηρούμενων τυχαίων μεταβλητών. Η στατιστική εκτίμηση μιας άγνωστης παραμέτρου του γενικού πληθυσμού, που γράφεται ως ενιαίος αριθμός, ονομάζεται σημείο. Εξετάστε τις ακόλουθες εκτιμήσεις σημείων: μεροληπτικές και αμερόληπτες, αποτελεσματικές και συνεπείς.

Ωστε να στατιστικές εκτιμήσειςέδωσε "καλές" προσεγγίσεις των εκτιμώμενων παραμέτρων, πρέπει να ικανοποιούν ορισμένες απαιτήσεις. Ας προσδιορίσουμε αυτές τις απαιτήσεις.

Έστω να υπάρχει μια στατιστική εκτίμηση της άγνωστης παραμέτρου της θεωρητικής κατανομής. Ας υποθέσουμε ότι κατά τη δειγματοληψία του όγκου, βρίσκεται μια εκτίμηση. Ας επαναλάβουμε το πείραμα, δηλαδή θα εξαγάγουμε ένα άλλο δείγμα ίδιου μεγέθους από τον γενικό πληθυσμό και χρησιμοποιώντας τα δεδομένα του θα βρούμε μια εκτίμηση κ.λπ. Επαναλαμβάνοντας το πείραμα πολλές φορές, παίρνουμε τους αριθμούς , τα οποία, σε γενικές γραμμές, θα διαφέρουν μεταξύ τους. Έτσι, η εκτίμηση μπορεί να θεωρηθεί ως τυχαία μεταβλητή και οι αριθμοί ως πιθανές αξίες.

Είναι σαφές ότι εάν η εκτίμηση δίνει μια κατά προσέγγιση τιμή με υπέρβαση, τότε κάθε αριθμός που θα βρεθεί από τα δεδομένα των δειγμάτων θα είναι μεγαλύτερος από την πραγματική τιμή του . Επομένως, σε αυτήν την περίπτωση, η μαθηματική (μέση τιμή) της τυχαίας μεταβλητής θα είναι μεγαλύτερη από , δηλαδή, . Προφανώς, αν δίνει μια κατά προσέγγιση τιμή με ένα μειονέκτημα, τότε .


Επομένως, η χρήση μιας στατιστικής εκτίμησης, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο, οδηγεί σε συστηματικά (ένα σημάδι) σφάλματα. Για το λόγο αυτό, είναι φυσικό να απαιτείται η μαθηματική προσδοκία της εκτίμησης να είναι ίση με την εκτιμώμενη παράμετρο. Αν και η συμμόρφωση με αυτήν την απαίτηση δεν θα εξαλείψει γενικά τα σφάλματα (ορισμένες τιμές είναι μεγαλύτερες από και άλλες μικρότερες από ), σφάλματα διαφορετικών ενδείξεων θα συμβαίνουν εξίσου συχνά. Ωστόσο, η συμμόρφωση με την απαίτηση εγγυάται την αδυναμία λήψης συστηματικών σφαλμάτων, δηλαδή εξαλείφει τα συστηματικά σφάλματα.

αμερόληπτοςονομάζεται στατιστική εκτίμηση (σφάλμα), η μαθηματική προσδοκία της οποίας είναι ίση με την εκτιμώμενη παράμετρο για οποιοδήποτε μέγεθος δείγματος, δηλαδή .

Εκτοπισμένοςονομάζεται στατιστική εκτίμηση, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο για οποιοδήποτε μέγεθος δείγματος, δηλαδή.

Ωστόσο, θα ήταν λάθος να υποθέσουμε ότι μια αμερόληπτη εκτίμηση δίνει πάντα μια καλή προσέγγιση της εκτιμώμενης παραμέτρου. Πράγματι, οι πιθανές τιμές μπορεί να είναι πολύ διασκορπισμένες γύρω από τον μέσο όρο τους, δηλαδή η απόκλιση μπορεί να είναι σημαντική. Σε αυτήν την περίπτωση, η εκτίμηση που βρέθηκε από τα δεδομένα ενός δείγματος, για παράδειγμα, μπορεί να αποδειχθεί πολύ απομακρυσμένη από τη μέση τιμή , και επομένως από την ίδια την εκτιμώμενη παράμετρο. Έτσι, λαμβάνοντας ως κατά προσέγγιση τιμή, θα κάνουμε ένα μεγάλο λάθος. Εάν, ωστόσο, απαιτείται η απόκλιση να είναι μικρή, τότε θα αποκλειστεί η πιθανότητα να γίνει μεγάλο σφάλμα. Για το λόγο αυτό επιβάλλεται η απαίτηση της αποτελεσματικότητας στη στατιστική αξιολόγηση.

αποτελεσματικόςονομάζεται στατιστική εκτίμηση, η οποία (για ένα δεδομένο μέγεθος δείγματος ) έχει τη μικρότερη δυνατή διακύμανση.

Πλούσιοςονομάζεται στατιστική εκτίμηση, η οποία τείνει κατά πιθανότητα στην εκτιμώμενη παράμετρο, δηλαδή η ισότητα είναι αληθής:

.

Για παράδειγμα, εάν η διακύμανση του αμερόληπτου εκτιμητή στο τείνει στο μηδέν, τότε ένας τέτοιος εκτιμητής αποδεικνύεται επίσης συνεπής.

Εξετάστε το ερώτημα ποια χαρακτηριστικά δείγματος εκτιμούν καλύτερα τον γενικό μέσο όρο και τη διακύμανση όσον αφορά την αμερόληπτη, την αποτελεσματικότητα και τη συνέπεια.

Ας μελετηθεί ένας διακριτός γενικός πληθυσμός σε σχέση με κάποιο ποσοτικό χαρακτηριστικό.

Γενική δευτεροβάθμιαονομάζεται αριθμητικός μέσος όρος των τιμών του χαρακτηριστικού του γενικού πληθυσμού. Υπολογίζεται με τον τύπο:

§ - εάν όλες οι τιμές του πρόσημου του γενικού πληθυσμού όγκου είναι διαφορετικές.

§ – εάν οι τιμές του πρόσημου του γενικού πληθυσμού έχουν συχνότητες, αντίστοιχα, και . Δηλαδή, ο γενικός μέσος όρος είναι ο σταθμισμένος μέσος όρος των τιμών των χαρακτηριστικών με βάρη ίσα με τις αντίστοιχες συχνότητες.

Σχόλιο: αφήστε τον πληθυσμό του τόμου να περιέχει αντικείμενα με διαφορετικές τιμές του χαρακτηριστικού . Φανταστείτε ότι ένα αντικείμενο επιλέγεται τυχαία από αυτήν τη συλλογή. Η πιθανότητα να ανακτηθεί ένα αντικείμενο με τιμή χαρακτηριστικού, για παράδειγμα, είναι προφανώς ίση με . Οποιοδήποτε άλλο αντικείμενο μπορεί να εξαχθεί με την ίδια πιθανότητα. Έτσι, η τιμή ενός χαρακτηριστικού μπορεί να θεωρηθεί ως μια τυχαία μεταβλητή, οι πιθανές τιμές της οποίας έχουν τις ίδιες πιθανότητες ίσες με . Δεν είναι δύσκολο, σε αυτή την περίπτωση, να βρεθεί η μαθηματική προσδοκία:

Έτσι, εάν θεωρήσουμε το εξεταζόμενο χαρακτηριστικό του γενικού πληθυσμού ως τυχαία μεταβλητή, τότε η μαθηματική προσδοκία του χαρακτηριστικού είναι ίση με τον γενικό μέσο όρο αυτού του χαρακτηριστικού: . Καταλήξαμε σε αυτό το συμπέρασμα υποθέτοντας ότι όλα τα αντικείμενα του γενικού πληθυσμού έχουν διάφορες έννοιεςσημάδι. Το ίδιο αποτέλεσμα θα ληφθεί αν υποθέσουμε ότι ο γενικός πληθυσμός περιέχει πολλά αντικείμενα με την ίδια τιμή χαρακτηριστικού.

Γενικεύοντας το αποτέλεσμα που προκύπτει στον γενικό πληθυσμό με μια συνεχή κατανομή του χαρακτηριστικού , ορίζουμε τον γενικό μέσο όρο ως τη μαθηματική προσδοκία του χαρακτηριστικού: .

Αφήστε ένα δείγμα όγκου να εξαχθεί για να μελετηθεί ο γενικός πληθυσμός σε σχέση με ένα ποσοτικό χαρακτηριστικό.

Δείγμα μέσου όρουονομάζεται αριθμητικός μέσος όρος των τιμών του χαρακτηριστικού του πληθυσμού του δείγματος. Υπολογίζεται με τον τύπο:

§ - εάν όλες οι τιμές του πρόσημου του δείγματος πληθυσμού όγκου είναι διαφορετικές.

§ – εάν οι τιμές των χαρακτηριστικών του συνόλου δειγματοληψίας έχουν, αντίστοιχα, συχνότητες και . Δηλαδή, ο μέσος όρος του δείγματος είναι ο σταθμισμένος μέσος όρος των τιμών των χαρακτηριστικών με βάρη ίσα με τις αντίστοιχες συχνότητες.

Σχόλιο: ο μέσος όρος του δείγματος που βρέθηκε από τα δεδομένα ενός δείγματος είναι προφανώς ένας συγκεκριμένος αριθμός. Εάν εξαγάγουμε άλλα δείγματα ίδιου μεγέθους από τον ίδιο γενικό πληθυσμό, τότε ο μέσος όρος του δείγματος θα αλλάξει από δείγμα σε δείγμα. Έτσι, ο μέσος όρος του δείγματος μπορεί να θεωρηθεί ως τυχαία μεταβλητή, και επομένως, μπορούμε να μιλήσουμε για τις κατανομές (θεωρητικές και εμπειρικές) του μέσου όρου του δείγματος και τα αριθμητικά χαρακτηριστικά αυτής της κατανομής, ειδικότερα, τον μέσο όρο και τη διακύμανση της κατανομής του δείγματος .

Επιπλέον, εάν ο γενικός μέσος όρος είναι άγνωστος και απαιτείται να εκτιμηθεί από τα δεδομένα του δείγματος, τότε ο μέσος όρος του δείγματος λαμβάνεται ως εκτίμηση του γενικού μέσου όρου, ο οποίος είναι μια αμερόληπτη και συνεπής εκτίμηση (προτείνουμε να αποδείξουμε αυτή τη δήλωση στο το δικό). Από τα προηγούμενα προκύπτει ότι εάν χρησιμοποιούνται πολλά δείγματα επαρκώς μεγάλου όγκου από τον ίδιο γενικό πληθυσμό για την εύρεση μέσων δειγμάτων, τότε θα είναι περίπου ίσα μεταξύ τους. Αυτό είναι το ακίνητο σταθερότητα των μέσων δείγματος.

Σημειώστε ότι εάν οι διακυμάνσεις δύο πληθυσμών είναι ίδιες, τότε η εγγύτητα του μέσου όρου του δείγματος με τους γενικούς δεν εξαρτάται από την αναλογία του μεγέθους του δείγματος προς το μέγεθος του γενικού πληθυσμού. Εξαρτάται από το μέγεθος του δείγματος: όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο λιγότερο ο μέσος όρος του δείγματος διαφέρει από τον γενικό. Για παράδειγμα, εάν το 1% των αντικειμένων επιλέγεται από ένα σύνολο και το 4% των αντικειμένων επιλέγεται από ένα άλλο σύνολο και ο όγκος του πρώτου δείγματος αποδεικνύεται μεγαλύτερος από το δεύτερο, τότε ο μέσος όρος του πρώτου δείγματος θα διαφέρει λιγότερο από ο αντίστοιχος γενικός μέσος όρος από τον δεύτερο.

Τα ερωτήματα της στατιστικής αξιολόγησης συνδέουν σε ένα ενιαίο σύνολο τέτοιες προβληματικές πτυχές της μαθηματικής στατιστικής όπως επιστημονική μεθοδολογία, τυχαίες μεταβλητές, στατιστικές κατανομές κ.λπ. Για οποιοδήποτε δείγμα, τα σφάλματα είναι εγγενή λόγω ελλιπούς κάλυψης μονάδων, σφαλμάτων μέτρησης και παρόμοιων λόγων. Τέτοια λάθη σε πραγματική ζωήδίνουν σε κάθε υπόθεση (ιδίως, που διατυπώνεται με βάση οικονομικά συμπεράσματα) έναν τυχαίο, στοχαστικό χαρακτήρα. Ανεξάρτητα από τον αριθμό των μεταβλητών που παρέχονται από τις θεωρητικές υποθέσεις, θεωρείται ότι η επιρροή διάφορα είδηΤα σφάλματα μπορούν να περιγραφούν με ακρίβεια χρησιμοποιώντας μόνο ένα στοιχείο. Τέτοιος μεθοδολογική προσέγγισημας επιτρέπει να περιοριστούμε σε μια μονοδιάστατη κατανομή πιθανοτήτων με ταυτόχρονη εκτίμηση πολλών παραμέτρων.

Στατιστική αξιολόγησηείναι ένας από τους δύο τύπους στατιστικής κρίσης (ο δεύτερος τύπος είναι ο έλεγχος υποθέσεων). Είναι ένα ειδικό είδος μεθόδου για την κρίση των αριθμητικών τιμών των χαρακτηριστικών (παραμέτρων) της κατανομής του γενικού πληθυσμού σύμφωνα με τα δειγματοληπτικά δεδομένα από αυτόν τον πληθυσμό. Δηλαδή, έχοντας τα αποτελέσματα της επιλεκτικής παρατήρησης, προσπαθούμε να εκτιμήσουμε (με τη μεγαλύτερη ακρίβεια) τις τιμές ορισμένων παραμέτρων από τις οποίες εξαρτάται η κατανομή του χαρακτηριστικού (αντικαταστάσιμου) που μας ενδιαφέρει στον γενικό πληθυσμό. Δεδομένου ότι το δείγμα περιλαμβάνει μόνο ένα υποσύνολο του πληθυσμού (μερικές φορές πολύ μικρό αριθμό), υπάρχει κίνδυνος λάθους. Παρά τη μείωση αυτού του κινδύνου με αύξηση του αριθμού των μονάδων παρατήρησης, εξακολουθεί να λαμβάνει χώρα κατά την επιλεκτική παρατήρηση. Ως εκ τούτου, η απόφαση που λαμβάνεται με βάση τα αποτελέσματα του δείγματος παρέχεται με πιθανολογικό χαρακτήρα. Αλλά θα ήταν λάθος να εξετάζουμε τις στατιστικές κρίσεις μόνο ως προς τις πιθανότητες. Μια τέτοια προσέγγιση δεν είναι πάντα επαρκής για την κατασκευή σωστών θεωρητικών υποθέσεων σχετικά με τις παραμέτρους του γενικού πληθυσμού. Συχνά απαιτούνται ορισμένες πρόσθετες κρίσεις για να δοθεί μια βαθύτερη αιτιολόγηση. Για παράδειγμα, είναι απαραίτητο να εκτιμηθεί, όσο το δυνατόν πλησιέστερα, ο μέσος αριθμός ειδικευμένων εργαζομένων στις επιχειρήσεις της περιοχής. Σε αυτή την περίπτωση, υπολογίζεται ο αριθμητικός μέσος όρος της μεταβλητής x από τον γενικό πληθυσμό, που έχει κανονική κατανομή. Έχοντας λάβει ένα δείγμα για αυτό το χαρακτηριστικό στο ποσό Πμονάδες, είναι απαραίτητο να λυθεί το ερώτημα: ποια τιμή, σύμφωνα με τα δεδομένα του δείγματος, πρέπει να ληφθεί ως η πλησιέστερη στον μέσο όρο του γενικού πληθυσμού; Υπάρχουν πολλές τέτοιες τιμές, η μαθηματική προσδοκία των οποίων είναι ίση με την επιθυμητή παράμετρο (ή κοντά σε αυτήν): α) αριθμητικός μέσος όρος. β) μόδα? γ) διάμεσος· δ) μέσος όρος, υπολογιζόμενος από το εύρος διακύμανσης κ.λπ.

Από πιθανολογική άποψη, καθεμία από τις παραπάνω ποσότητες μπορεί να θεωρηθεί ότι δίνει την καλύτερη προσέγγιση στην επιθυμητή παράμετρο πληθυσμού (x), αφού η μαθηματική προσδοκία καθεμιάς από αυτές τις συναρτήσεις (ειδικά για μεγάλα δείγματα) είναι ίση με τον γενικό μέσο όρο . Αυτή η υπόθεση οφείλεται στο γεγονός ότι με επαναλαμβανόμενη επανάληψη του δείγματος από τον ίδιο γενικό πληθυσμό, θα προκύψει ένα «κατά μέσο όρο» σωστό αποτέλεσμα.

Η ορθότητα "κατά μέσο όρο" εξηγείται από την ισότητα των επαναλήψεων των θετικών και αρνητικών αποκλίσεων των αναδυόμενων σφαλμάτων στην εκτίμηση του γενικού μέσου όρου, δηλαδή, το μέσο σφάλμα εκτίμησης θα είναι μηδέν.

ΣΤΟ πρακτικές συνθήκες, κατά κανόνα, οργανώνουν ένα δείγμα, επομένως ο ερευνητής ενδιαφέρεται για το ερώτημα μιας πιο ακριβούς εκτίμησης της επιθυμητής παραμέτρου με βάση τα αποτελέσματα ενός συγκεκριμένου δείγματος. Για την επίλυση ενός τέτοιου προβλήματος, εκτός από τα συμπεράσματα που προκύπτουν άμεσα από τον αφηρημένο υπολογισμό των πιθανοτήτων, χρειάζονται πρόσθετοι κανόνες για την καλύτερη προσέγγιση της εκτίμησης στην επιθυμητή παράμετρο του γενικού πληθυσμού.

Υπάρχει επαρκής αριθμός τρόπων εκτίμησης σταθερών από παρατηρήσεις δειγμάτων. Ποια από αυτά είναι τα καλύτερα στην επίλυση συγκεκριμένων ερευνητικών προβλημάτων - ασχολείται με τη θεωρία της στατιστικής εκτίμησης. Διερευνά τις συνθήκες που πρέπει να υπακούει αυτή ή η άλλη αξιολόγηση, εστιάζει σε αξιολογήσεις που είναι προτιμότερες υπό τις δεδομένες συνθήκες. Η θεωρία αξιολόγησης υποδεικνύει την υπεροχή μιας αξιολόγησης έναντι μιας άλλης.

Όπως γνωρίζετε, οι πληροφορίες που λαμβάνονται με βάση το δείγμα δεν είναι κατηγορηματικές στο συμπέρασμα. Εάν, για παράδειγμα, 99 από τα 100 ζώα που μελετήθηκαν ήταν υγιή λόγω των ασθενειών τους, τότε υπάρχει πιθανότητα ένα ζώο που παρέμεινε ανεξέταστο να φέρει τον ιό της υποτιθέμενης ασθένειας. Εφόσον αυτό είναι απίθανο, συνάγεται το συμπέρασμα ότι δεν υπάρχει αυτή η ασθένεια. Στις περισσότερες περιπτώσεις, αυτό το συμπέρασμα είναι απολύτως δικαιολογημένο.

Με βάση παρόμοια ευρήματα, πρακτικές δραστηριότητες, ο πειραματιστής (ερευνητής) δεν βασίζεται στην αξιοπιστία της πληροφορίας, αλλά μόνο στην πιθανότητα της.

Η άλλη πλευρά της παρατήρησης του δείγματος, όπως έχει ήδη σημειωθεί, επιλύει το πρόβλημα του προσδιορισμού του βαθμού αξιοπιστίας των ληφθέντων εκτιμήσεων του δείγματος όσο το δυνατόν πιο αντικειμενικά. Η λύση αυτού του προβλήματος προσπαθεί να παράσχει την πιο ακριβή πιθανολογική έκφραση, δηλαδή, μιλάμε για τον προσδιορισμό του βαθμού ακρίβειας της εκτίμησης. Εδώ, ο ερευνητής καθορίζει τα όρια της πιθανής ασυμφωνίας μεταξύ της εκτίμησης που λαμβάνεται στο δείγμα και της πραγματικής αξίας της αξίας του στο γενικό πληθυσμό.

Η ακρίβεια της εκτίμησης οφείλεται στη μέθοδο υπολογισμού της σύμφωνα με τα δεδομένα του δείγματος και στη μέθοδο επιλογής μονάδων στο δείγμα.

Η μέθοδος λήψης εκτιμήσεων περιλαμβάνει οποιαδήποτε υπολογιστική διαδικασία (μέθοδος, κανόνας, αλγεβρικός τύπος). Αυτή είναι η προτεραιότητα της θεωρίας της στατιστικής εκτίμησης. Οι μέθοδοι επιλογής οδηγούν σε ερωτήματα τεχνικής για τη διεξαγωγή δειγματοληπτικής έρευνας.

Τα παραπάνω μας επιτρέπουν να ορίσουμε την έννοια της «στατιστικής αξιολόγησης».

Στατιστική αξιολόγηση- αυτή είναι μια κατά προσέγγιση τιμή της επιθυμητής παραμέτρου του γενικού πληθυσμού, η οποία λαμβάνεται από τα αποτελέσματα του δείγματος και παρέχει τη δυνατότητα λήψης τεκμηριωμένων αποφάσεων σχετικά με τις άγνωστες παραμέτρους του γενικού πληθυσμού.

Ας υποθέσουμε ότι το ^ "είναι μια στατιστική εκτίμηση της άγνωστης παραμέτρου ^ της θεωρητικής κατανομής. Επαναλαμβάνοντας το ίδιο

Το μέγεθος του δείγματος από τον πληθυσμό που βρέθηκαν εκτιμήσεις και 2 ^ ""n,

έχοντας διαφορετικές έννοιες. Επομένως, η εκτίμηση ^ ", μπορεί να θεωρηθεί ως

τυχαία μεταβλητή και +17 δύο, 3 ~ "n - ως πιθανές τιμές της. Ως τυχαία τιμή, χαρακτηρίζεται από μια ορισμένη συνάρτηση πυκνότητας πιθανότητας. Εφόσον αυτή η συνάρτηση οφείλεται στο αποτέλεσμα επιλεκτικής παρατήρησης (πείραμα), καλείται επιλεκτική διανομή.Μια τέτοια συνάρτηση περιγράφει την πυκνότητα πιθανότητας για κάθε μία από τις εκτιμήσεις, χρησιμοποιώντας έναν ορισμένο αριθμό δείγματος

παρατηρήσεις. Αν υποθέσουμε ότι, η στατιστική εκτίμηση ^ ", είναι μια αλγεβρική συνάρτηση ενός συγκεκριμένου συνόλου δεδομένων και ένα τέτοιο σύνολο θα ληφθεί κατά την επιλεκτική παρατήρηση, τότε σε

Γενικά, η εκτίμηση θα λάβει την έκφραση: ® n = f (Xl.X2, ^ 3, ... X t).

Στο τέλος της δειγματοληπτικής έρευνας, αυτή η συνάρτηση δεν είναι πλέον μια γενική αξιολόγηση, αλλά παίρνει μια συγκεκριμένη τιμή, γίνεται δηλαδή ποσοτική αξιολόγηση (αριθμός). Με άλλα λόγια, από την παραπάνω έκφραση της συνάρτησης προκύπτει ότι οποιοσδήποτε από τους δείκτες που χαρακτηρίζουν τα αποτελέσματα μιας δειγματοληπτικής παρατήρησης μπορεί να θεωρηθεί εκτίμηση. Ο μέσος όρος του δείγματος είναι μια εκτίμηση του μέσου όρου του πληθυσμού. Η διακύμανση που υπολογίζεται από το δείγμα ή η τιμή της τυπικής απόκλισης που υπολογίζεται από αυτό είναι εκτιμήσεις των αντίστοιχων χαρακτηριστικών του γενικού πληθυσμού κ.λπ.

Όπως έχει ήδη σημειωθεί, ο υπολογισμός των στατιστικών εκτιμήσεων δεν εγγυάται την εξάλειψη των σφαλμάτων. Η ουσία είναι ότι το τελευταίο δεν πρέπει να είναι συστηματικό. Η παρουσία τους θα πρέπει να είναι τυχαία. Ας εξετάσουμε τη μεθοδολογική πλευρά αυτής της διάταξης.

Ας υποθέσουμε ότι η εκτίμηση ^ " δίνει μια ανακριβή τιμή της εκτίμησης ^ του πληθυσμού με ένα μειονέκτημα. Σε αυτήν την περίπτωση, κάθε υπολογισμένη τιμή = 1,2,3, ..., n) θα είναι μικρότερη από την πραγματική τιμή του αξία $.

Για το λόγο αυτό, η μαθηματική προσδοκία (μέση τιμή) της τυχαίας μεταβλητής in θα είναι μικρότερη από την in, δηλαδή, (M (^ n. Και, αντιστρόφως, εάν δίνει υπερβάλλουσα εκτίμηση, τότε η μαθηματική προσδοκία

τυχαία ^" θα γίνει μεγαλύτερη από $.

Από αυτό προκύπτει ότι η χρήση στατιστικής εκτίμησης, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο, οδηγεί σε συστηματικά σφάλματα, δηλαδή σε μη τυχαία σφάλματα που παραμορφώνουν τα αποτελέσματα της μέτρησης προς μία κατεύθυνση.

Προκύπτει μια φυσική απαίτηση: η μαθηματική προσδοκία της εκτίμησης ^ "πρέπει να είναι ίση με την εκτιμώμενη παράμετρο. Η συμμόρφωση με αυτήν την απαίτηση δεν εξαλείφει τα σφάλματα γενικά, καθώς οι τιμές δείγματος της εκτίμησης μπορεί να είναι μεγαλύτερες ή μικρότερες από την πραγματική τιμή της εκτίμησης του γενικού πληθυσμού. Όμως σφάλματα στη μία και στην άλλη κατεύθυνση από τις τιμές ^ θα συμβούν (σύμφωνα με τη θεωρία πιθανοτήτων) με την ίδια συχνότητα. Κατά συνέπεια, η συμμόρφωση με αυτή την απαίτηση, η μαθηματική προσδοκία της εκτίμησης του δείγματος πρέπει να είναι ίση με την εκτιμώμενη παράμετρο, εξαλείφει τη λήψη συστηματικών (μη τυχαίων) σφαλμάτων, δηλαδή

Μ (σε) = 6.

Η επιλογή μιας στατιστικής εκτίμησης που δίνει την καλύτερη προσέγγιση της εκτιμώμενης παραμέτρου είναι ένα σημαντικό πρόβλημα στη θεωρία εκτίμησης. Εάν είναι γνωστό ότι η κατανομή της υπό μελέτη τυχαίας μεταβλητής στον γενικό πληθυσμό αντιστοιχεί στον νόμο της κανονικής κατανομής, τότε είναι απαραίτητο να εκτιμηθεί η μαθηματική προσδοκία και η τυπική απόκλιση από τα δεδομένα του δείγματος. Αυτό εξηγείται από το γεγονός ότι αυτά τα δύο χαρακτηριστικά καθορίζουν πλήρως τα θεμέλια πάνω στα οποία χτίζεται η κανονική κατανομή. Εάν η υπό μελέτη τυχαία μεταβλητή κατανέμεται σύμφωνα με το νόμο Poisson, η παράμετρος ^ αξιολογείται, καθώς καθορίζει αυτήν την κατανομή.

Η μαθηματική στατιστική διακρίνει τέτοιες μεθόδους για τη λήψη στατιστικών εκτιμήσεων από δεδομένα δείγματος: τη μέθοδο των ροπών, τη μέθοδο της μέγιστης πιθανότητας.

Κατά τη λήψη εκτιμήσεων με τη μέθοδο των ροπών, οι ροπές του γενικού πληθυσμού αντικαθίστανται από τις ροπές του πληθυσμού του δείγματος (αντί για πιθανότητες με βάρος, χρησιμοποιούνται συχνότητες).

Προκειμένου μια στατιστική εκτίμηση να δώσει μια «καλύτερη προσέγγιση» σε ένα γενικό χαρακτηριστικό, πρέπει να έχει μια σειρά από ιδιότητες. Θα συζητηθούν παρακάτω.

Η δυνατότητα επιλογής της καλύτερης εκτίμησης οφείλεται στη γνώση των βασικών ιδιοτήτων τους και στην ικανότητα ταξινόμησης εκτιμήσεων σύμφωνα με αυτές τις ιδιότητες. Στη μαθηματική βιβλιογραφία, οι "ιδιότητες των εκτιμήσεων" ονομάζονται μερικές φορές "απαιτήσεις για εκτιμήσεις" ή "κριτήρια για εκτιμήσεις". Οι κύριες ιδιότητες των στατιστικών εκτιμήσεων περιλαμβάνουν: Αμερόληπτη, αποτελεσματικότητα, ικανότητα, επάρκεια.

Αν υποθέσουμε ότι ο μέσος όρος του δείγματος (~) και η διακύμανση του δείγματος

(Sv) είναι εκτιμήσεις των αντίστοιχων γενικών χαρακτηριστικών (^), δηλαδή η μαθηματική προσδοκία τους, λαμβάνουμε υπόψη ότι με μεγάλο αριθμό

Οι μονάδες δειγματοληψίας που ονομάζονται χαρακτηριστικά (~) θα προσεγγιστούν με τις μαθηματικές προσδοκίες τους. Εάν ο αριθμός των δειγματοληπτικών μονάδων είναι μικρός, αυτά τα χαρακτηριστικά μπορεί να διαφέρουν σημαντικά από τις αντίστοιχες μαθηματικές προσδοκίες.

Εάν η μέση τιμή των χαρακτηριστικών του δείγματος που επιλέχθηκαν ως εκτίμηση αντιστοιχεί στην τιμή του γενικού χαρακτηριστικού, η εκτίμηση ονομάζεται αμερόληπτη. Η απόδειξη ότι η προσδοκία του μέσου όρου του δείγματος είναι ίση με τον γενικό μέσο όρο (m (x) = x), δείχνει ότι η τιμή ~ είναι μια αμερόληπτη γενική

μέση τιμή. Η κατάσταση είναι διαφορετική με την επιλεκτική διασπορά (ο). αυτήν

M (ST 2) \u003d - o-2. .

μαθηματική προσδοκία n, όχι ίση με τη γενική

διασπορά. Άρα, το a h είναι ένας προκατειλημμένος εκτιμητής του a ". Για να εξαλειφθεί το συστηματικό σφάλμα και να ληφθεί ένας αμερόληπτος εκτιμητής, το δείγμα

η διακύμανση πολλαπλασιάζεται με τη διόρθωση n - 1 (αυτό προκύπτει από τον σχηματισμό

σε 2 _ 2 π Π -1 "n -1

την παραπάνω εξίσωση: n).

Έτσι, με ένα μικρό δείγμα, η διακύμανση είναι:

2 Κεφ., - ~) 2 Πμι (x και - ~) 2

cg in= x - = -.

p p - 1 p -1

Κλάσμα - 1) ονομάζεται διόρθωση Bessel. Ο μαθηματικός του Bessel ήταν ο πρώτος που διαπίστωσε ότι η διακύμανση του δείγματος είναι μια μεροληπτική εκτίμηση της γενικής διακύμανσης και εφάρμοσε την καθορισμένη διόρθωση για να διορθώσει

ακροαματικότητα. Για μικρά δείγματα, η διόρθωση (n - 1) διαφέρει σημαντικά από 1. Με την αύξηση του αριθμού των μονάδων παρατήρησης, πλησιάζει γρήγορα το 1. Στο n<>50 η διαφορά μεταξύ των βαθμολογιών εξαφανίζεται, δηλ.

° ~ "- . Από τα προηγούμενα, ακολουθούν οι ακόλουθοι ορισμοί των απαιτήσεων της αμερόληπτης.

αμερόληπτοςονομάζεται στατιστική εκτίμηση, η μαθηματική προσδοκία της οποίας, για οποιοδήποτε μέγεθος δείγματος, είναι ίση με την τιμή

παράμετρος του γενικού πληθυσμού, δηλαδή m (^) = 9; m(x) = x.

Η κατηγορία «μαθηματική προσδοκία» μελετάται στο μάθημα της θεωρίας πιθανοτήτων. Αυτό είναι ένα αριθμητικό χαρακτηριστικό μιας τυχαίας μεταβλητής. Η μαθηματική προσδοκία είναι περίπου ίση με τη μέση τιμή μιας τυχαίας μεταβλητής. Μαθηματική προσδοκία μιας διακριτής τυχαίας μεταβλητήςείναι το άθροισμα των γινομένων όλων των πιθανών τιμών και των πιθανοτήτων τους. Ας υποθέσουμε ότι έχουν πραγματοποιηθεί n μελέτες στις οποίες η τυχαία μεταβλητή Χπήρε w 1 φορά την τιμή του w 2 φορές την τιμή του W και φορές την τιμή του X k. Στην περίπτωση αυτή, W 1 + W 2 + W 3 + ... + W k \u003d n. Στη συνέχεια, το άθροισμα όλων τιμές που λαμβάνονται Το x είναι ίσο με

x 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k

Ο αριθμητικός μέσος όρος αυτών των τιμών θα είναι:

X 1 w 1 + x 2 w 2 + x 3 w 3 + ... + x k w k - w 1^ w 2 ^ w 3 ^ ^ w k

Πή 1 p 2 p 3 p 1 p.

Επειδή το n είναι η τιμή ^ σχετικής συχνότητας Χ ^ Π- τη σχετική συχνότητα της τιμής x 2, κ.λπ., η παραπάνω εξίσωση θα έχει τη μορφή:

X = X 1 No. 1 + X 2 No. 2 + X 3 No. 3 + ... + X έως N> σε

Με μεγάλο αριθμό δειγματοληπτικών παρατηρήσεων, η σχετική συχνότητα είναι περίπου ίση με την πιθανότητα να συμβεί ένα γεγονός, δηλαδή

u> 1 = L; ^ 2 \u003d W \u003d ™ k \u003d Pk και επομένως x 2 x 1 p 1 + x 2 p 2 + X 3 g. 3 + ... + X KRK. Τότε

x~ Μ(x) η πιθανολογική σημασία του αποτελέσματος των υπολογισμών είναι ότι η μαθηματική προσδοκία είναι περίπου ίση (όσο πιο ακριβής, τόσο μεγαλύτερο είναι το δείγμα) με τον αριθμητικό μέσο όρο των παρατηρούμενων τιμών της τυχαίας μεταβλητής [M (x -) = ~ 1.

Το κριτήριο της αμερόληπτης εγγυάται την απουσία συστηματικών σφαλμάτων στην εκτίμηση των παραμέτρων του γενικού πληθυσμού.

Σημειώστε ότι η εκτίμηση του δείγματος (^) είναι μια τυχαία μεταβλητή, η τιμή της οποίας μπορεί να αλλάξει από το ένα δείγμα στο άλλο. Το μέτρο της διακύμανσής του (σκέδαση) γύρω από τη μαθηματική προσδοκία της παραμέτρου του γενικού πληθυσμού # χαρακτηρίζει τη διακύμανση c2 (t).

Ας είναι σε καιAT -- δύο αμερόληπτες εκτιμήσεις της παραμέτρου ^, δηλ. Μ (σε") \u003d 6 και M (d,) \u003d γ. Οι διακυμάνσεις τους σε 1 (σε -) και σεσολφά -). Από δύο 0 έως Artaud, προτιμήστε αυτό που έχει τη μικρότερη διασπορά γύρω από την εκτιμώμενη παράμετρο. Εάν η διακύμανση βαθμολογίας ^ "είναι μικρότερη από τη διακύμανση

εκτιμήσεις Sp, τότε η πρώτη εκτίμηση λαμβάνεται ως &, δηλαδή, ^ ".

Ένας αμερόληπτος εκτιμητής t, ο οποίος έχει τη μικρότερη απόκλιση μεταξύ όλων των πιθανών αμερόληπτων εκτιμητών της παραμέτρου t που υπολογίζεται από δείγματα του ίδιου μεγέθους, ονομάζεται αποτελεσματικός εκτιμητής. Αυτή είναι η δεύτερη ιδιότητα (απαίτηση) των στατιστικών εκτιμήσεων των παραμέτρων του γενικού πληθυσμού. Πρέπει να θυμόμαστε ότι η αποτελεσματική εκτίμηση της παραμέτρου του γενικού πληθυσμού, με την επιφύλαξη ενός συγκεκριμένου νόμου κατανομής, δεν συμπίπτει με την πραγματική εκτίμηση της παραμέτρου του δεύτερου τμήματος.

Όταν εξετάζουμε μεγάλα δείγματα, οι στατιστικές εκτιμήσεις θα πρέπει να έχουν μια ιδιότητα ικανότητας. Η εκτίμηση είναι ικανή (χρησιμοποιείται επίσης ο όρος "ταιριάζουν" ή "συνεπής") σημαίνει ότι όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο πιο πιθανό είναι το σφάλμα εκτίμησης να μην υπερβαίνει ένα αυθαίρετα μικρό θετικό

αριθμός Ε. Η εκτίμηση 6 της παραμέτρου ^ ονομάζεται συνεπής εάν υπακούει στο νόμο των μεγάλων αριθμών, δηλαδή ισχύει η ακόλουθη ισότητα:

/ σσς | σολ in-in <Е} = 1.

Όπως μπορείτε να δείτε, μια τέτοια στατιστική εκτίμηση ονομάζεται ικανή, η οποία, για n, προσεγγίζει την εκτιμώμενη παράμετρο κατά πιθανότητα. Με άλλα λόγια, αυτή είναι η τιμή του δείκτη που λαμβάνεται από το δείγμα και πλησιάζει (συμπίπτει κατά πιθανότητα) λόγω του νόμου των μεγάλων αριθμών με αύξηση του μεγέθους του δείγματος στις μαθηματικές προσδοκίες του. Για παράδειγμα, εάν η διακύμανση μιας αμερόληπτης εκτίμησης τείνει στο μηδέν ως n, τότε μια τέτοια εκτίμηση αποδεικνύεται επίσης συνεπής, καθώς έχει τη μικρότερη δυνατή διακύμανση (για ένα δεδομένο μέγεθος δείγματος).

Οι δυνατές εκτιμήσεις είναι:

1) το μερίδιο του χαρακτηριστικού στο δείγμα, δηλαδή η συχνότητα ως εκτίμηση του μεριδίου του χαρακτηριστικού στο γενικό πληθυσμό·

2) ο μέσος όρος του δείγματος ως εκτίμηση του γενικού μέσου όρου.

3) Διακύμανση δείγματος ως εκτίμηση της γενικής διακύμανσης.

4) δείγματα συντελεστών ασυμμετρίας και κύρτωσης ως εκτίμηση των γενικών συντελεστών.

Στη βιβλιογραφία για τις μαθηματικές στατιστικές, για κάποιο λόγο, δεν είναι πάντα δυνατό να βρεθεί μια περιγραφή της τέταρτης ιδιότητας των στατιστικών εκτιμήσεων - επάρκεια. Βαθμός επαρκής(ή εξαντλητική) είναι μια εκτίμηση που προκύπτει (εξασφαλίζει) την πληρότητα της κάλυψης όλων των δειγματοληπτικών πληροφοριών σχετικά με μια άγνωστη παράμετρο του γενικού πληθυσμού. Έτσι, μια επαρκής εκτίμηση περιλαμβάνει όλες τις πληροφορίες που περιέχονται στο δείγμα για τα μελετημένα στατιστικά χαρακτηριστικά του γενικού πληθυσμού. Καμία από τις τρεις εκτιμήσεις που εξετάστηκαν προηγουμένως δεν μπορεί να παρέχει τις απαραίτητες πρόσθετες πληροφορίες σχετικά με την υπό μελέτη παράμετρο, ως επαρκή στατιστική εκτίμηση.

Επομένως, ο αριθμητικός μέσος όρος του δείγματος ~ είναι μια αμερόληπτη εκτίμηση του αριθμητικού μέσου όρου του πληθυσμού x. Ο παράγοντας μη μεροληψίας αυτής της εκτίμησης δείχνει: εάν ληφθεί μεγάλος αριθμός τυχαίων δειγμάτων από τον γενικό πληθυσμό, τότε οι μέσοι όροι τους *<отличались бы от генеральной средней в большую и меньшую сторону одинаково, то есть, свойство несмещенности хорошей оценки также показывает, что среднее значение бесконечно большого числа выборочных средних равно значению генеральной средней.

Στις σειρές συμμετρικής κατανομής, η διάμεσος είναι μια αμερόληπτη εκτίμηση του συνολικού μέσου όρου. Και με την προϋπόθεση ότι το μέγεθος του δείγματος είναι κοντά στον γενικό πληθυσμό (P ~ * N), η διάμεσος μπορεί να είναι σε τέτοιες σειρές και μια συνεπής εκτίμηση του γενικού μέσου όρου. μεγάλος όγκος, το τυπικό σφάλμα της διάμεσης τιμής (Stme) είναι 1,2533 του τυπικού σφάλματος του μέσου όρου του δείγματος

). Δηλαδή Stme *. Επομένως, η διάμεσος δεν μπορεί να είναι μια αποτελεσματική εκτίμηση του αριθμητικού μέσου όρου του πληθυσμού, καθώς το μέσο τετράγωνο σφάλμα του είναι μεγαλύτερο από το μέσο τετραγωνικό σφάλμα του μέσου αριθμητικού δείγματος. Επιπλέον, ο αριθμητικός μέσος όρος ικανοποιεί τις συνθήκες αμερόληπτης και ικανότητας και, ως εκ τούτου, είναι η καλύτερη εκτίμηση.

Μια τέτοια ρύθμιση είναι επίσης δυνατή. Μπορεί ο αριθμητικός μέσος όρος του δείγματος να είναι μια αμερόληπτη εκτίμηση της διάμεσης τιμής σε συμμετρικές κατανομές πληθυσμών για τις οποίες ο μέσος όρος και ο διάμεσος είναι ο ίδιος; Και ο μέσος όρος του δείγματος θα είναι μια συνεπής εκτίμηση του μέσου όρου του πληθυσμού; Και στις δύο περιπτώσεις, η απάντηση θα είναι θετική. Για τη διάμεσο του πληθυσμού (με συμμετρική κατανομή), ο αριθμητικός μέσος όρος του δείγματος είναι μια αμερόληπτη και συνεπής εκτίμηση.

Έχοντας υπόψη ότι Cme ~ 1,2533 ο, καταλήγουμε στο συμπέρασμα: ο αριθμητικός μέσος όρος του δείγματος, και όχι ο διάμεσος, είναι μια πιο αποτελεσματική εκτίμηση της διάμεσης τιμής του υπό μελέτη γενικού πληθυσμού.

Κάθε χαρακτηριστικό του δείγματος δεν είναι απαραίτητα η καλύτερη εκτίμηση του αντίστοιχου χαρακτηριστικού του πληθυσμού. Η γνώση των ιδιοτήτων των εκτιμήσεων μας επιτρέπει να λύσουμε το πρόβλημα όχι μόνο της επιλογής εκτιμήσεων, αλλά και της βελτίωσής τους. Ως παράδειγμα, εξετάστε την περίπτωση όπου οι υπολογισμοί δείχνουν ότι οι τιμές των τυπικών αποκλίσεων πολλών δειγμάτων από τον ίδιο γενικό πληθυσμό σε όλες τις περιπτώσεις είναι μικρότερες από την τυπική απόκλιση του γενικού πληθυσμού και το μέγεθος της διαφοράς οφείλεται το μέγεθος του δείγματος. Πολλαπλασιάζοντας την τιμή της τυπικής απόκλισης του δείγματος με τον συντελεστή διόρθωσης, λαμβάνουμε μια βελτιωμένη εκτίμηση της τυπικής απόκλισης του πληθυσμού. Για έναν τέτοιο συντελεστή διόρθωσης, χρησιμοποιείται η διόρθωση Bessel

Πένα Ι Π

(P - 1), δηλαδή, για την εξάλειψη της μεροληψίας, λαμβάνονται εκτιμήσεις - 1. Μια τέτοια αριθμητική έκφραση δείχνει ότι η τυπική απόκλιση του δείγματος, που χρησιμοποιείται ως εκτίμηση, δίνει μια υποεκτιμημένη τιμή της παραμέτρου πληθυσμού.

Όπως γνωρίζετε, τα στατιστικά χαρακτηριστικά του πληθυσμού του δείγματος είναι μια πρόχειρη εκτίμηση των άγνωστων παραμέτρων του πληθυσμού. Η ίδια η βαθμολογία μπορεί να έχει τη μορφή ενός μόνο αριθμού ή κάποιου συγκεκριμένου σημείου. Μια εκτίμηση που καθορίζεται από έναν μόνο αριθμό ονομάζεται εκτίμηση σημείου. Έτσι, ο μέσος όρος του δείγματος (~) είναι η αμερόληπτη και πιο αποτελεσματική σημειακή εκτίμηση του γενικού μέσου όρου (x) και η διακύμανση του δείγματος είναι μια προκατειλημμένη σημειακή εκτίμηση του γενικού

διακύμανση ().Αν υποδηλώσουμε το μέσο σφάλμα του μέσου όρου του δείγματος t <>τότε η σημειακή εκτίμηση του γενικού μέσου όρου μπορεί να γραφτεί ως x ± m °. Αυτό σημαίνει ότι το ~ είναι μια εκτίμηση του γενικού μέσου x με σφάλμα ίσο με m". Είναι σαφές ότι οι σημειακές στατιστικές εκτιμήσεις των x και o δεν πρέπει να έχουν συστηματικό σφάλμα στο

οοο~~ο<в 2

την κατεύθυνση υπερεκτίμησης ή υποεκτίμησης των εκτιμώμενων παραμέτρων x και. Όπως αναφέρθηκε προηγουμένως, οι εκτιμητές που ικανοποιούν μια τέτοια συνθήκη καλούνται

αμερόληπτος. Ποιο είναι το σφάλμα της παραμέτρου m "; Αυτός είναι ο μέσος όρος πολλών συγκεκριμένων σφαλμάτων:

Η σημειακή εκτίμηση της παραμέτρου του γενικού πληθυσμού συνίσταται στο γεγονός ότι από διαφορετικές πιθανές δειγματοληπτικές εκτιμήσεις, αρχικά επιλέγεται αυτή που έχει τις βέλτιστες ιδιότητες και στη συνέχεια υπολογίζεται η τιμή αυτής της εκτίμησης. Η προκύπτουσα υπολογισμένη τιμή της τελευταίας θεωρείται ως η καλύτερη προσέγγιση στην άγνωστη πραγματική τιμή της παραμέτρου πληθυσμού. Οι πρόσθετοι υπολογισμοί που σχετίζονται με τον προσδιορισμό ενός πιθανού σφάλματος εκτίμησης δεν είναι πάντα υποχρεωτικοί (ανάλογα με τη διακύμανση των εργασιών εκτίμησης), αλλά, κατά κανόνα, πραγματοποιούνται σχεδόν πάντα.

Ας εξετάσουμε παραδείγματα προσδιορισμού μιας σημειακής εκτίμησης για τον μέσο όρο των χαρακτηριστικών που μελετώνται και για το μερίδιό τους στον γενικό πληθυσμό.

Παράδειγμα.Οι καλλιέργειες σιτηρών της περιοχής είναι 20.000 εκτάρια. Με μια δειγματοληπτική έρευνα 10% των αγρών, προέκυψαν τα ακόλουθα χαρακτηριστικά δείγματος: μέση απόδοση - 30 εκατοστά ανά εκτάριο, διασπορά απόδοσης - 4, περιοχή καλλιεργειών υψηλής απόδοσης - 1200 εκτάρια.

Τι πρέπει να γνωρίζετε για την τιμή του δείκτη της μέσης απόδοσης των καλλιεργειών σιτηρών στην περιοχή και ποια είναι η αριθμητική τιμή του δείκτη του μεριδίου (ειδικό βάρος) των καλλιέργειες υψηλής απόδοσης στη συνολική έκταση του u200 δημητριακά υπό μελέτη

περιοχή? Δηλαδή, είναι απαραίτητο να αξιολογηθούν οι ονομαζόμενες παράμετροι (x, z) στον γενικό πληθυσμό. Για να υπολογίσουμε τους βαθμούς έχουμε:

Ν = 20000; - = 20000 x 0,1 = 2000; ~=30;<т = л / 4; № 2000,

Όπως είναι γνωστό, ο επιλεκτικός αριθμητικός μέσος όρος είναι μια αποτελεσματική εκτίμηση

γενικός αριθμητικός μέσος όρος. Έτσι, μπορεί να γίνει δεκτό ότι

η καλύτερη εκτίμηση της γενικής παραμέτρου (^) είναι 30. Για τον προσδιορισμό του βαθμού

ακρίβεια της εκτίμησης, είναι απαραίτητο να βρεθεί το μέσο (τυπικό) σφάλμα του:

ια. n~iΑπρίλιος 2000 PPL

t = l - (1--) = - (1--) = 0,04

v n N i2000 2000^

Η τιμή σφάλματος που προκύπτει υποδεικνύει υψηλή ακρίβεια της εκτίμησης. Η τιμή του m εδώ σημαίνει ότι με επαναλαμβανόμενη επανάληψη τέτοιων δειγμάτων, το σφάλμα εκτίμησης παραμέτρων θα ήταν κατά μέσο όρο 0,04. Δηλαδή πίσω από την τελεία

Σύμφωνα με εκτιμήσεις, η μέση απόδοση στα αγροκτήματα της περιοχής θα είναι x = 30 - 0,04 εκατοστά ανά στρέμμα.

Για να ληφθεί μια σημειακή εκτίμηση του μεριδίου των καλλιεργειών σιτηρών υψηλής απόδοσης στη συνολική έκταση των καλλιεργειών σιτηρών, η καλύτερη εκτίμηση μπορεί να ληφθεί ως το μερίδιο στο δείγμα ¥ = 0,6. Έτσι, μπορούμε να πούμε ότι σύμφωνα με τα αποτελέσματα των παρατηρήσεων, η καλύτερη εκτίμηση του επιθυμητού δείκτη δομής θα είναι ο αριθμός 0,6. Βελτιώνοντας τους υπολογισμούς, θα πρέπει να υπολογίσετε το μέσο σφάλμα αυτής της εκτίμησης: t και (1 _ p) και 0,6 (1 - 0,b) (1 = 0,01

v Π N v 2000 2000 ένα

Όπως μπορείτε να δείτε, το μέσο σφάλμα στην εκτίμηση του γενικού χαρακτηριστικού είναι 0,01.

Το αποτέλεσμα που λήφθηκε σημαίνει ότι εάν το δείγμα επαναλήφθηκε επανειλημμένα με όγκο 2000 εκταρίων σιτηρών, το μέσο σφάλμα της αποδεκτής εκτίμησης του μεριδίου (ειδικό βάρος) των καλλιέργειες υψηλής απόδοσης στην περιοχή των σιτηρών των επιχειρήσεων σε η περιοχή θα ήταν ± 0,01. Στην περίπτωση αυτή, P = 0,6 ± 0,01. Σε ποσοστιαία βάση, το μερίδιο των καλλιεργειών υψηλής απόδοσης στη συνολική έκταση σιτηρών της περιοχής θα είναι κατά μέσο όρο 60 ± I.

Οι υπολογισμοί δείχνουν ότι για μια συγκεκριμένη περίπτωση, η καλύτερη εκτίμηση του επιθυμητού δείκτη δομής θα είναι ο αριθμός 0,6 και το μέσο σφάλμα της εκτίμησης προς τη μία ή την άλλη κατεύθυνση θα είναι περίπου ίσο με 0,01. Όπως μπορείτε να δείτε, η εκτίμηση είναι αρκετά ακριβής.

Είναι γνωστές αρκετές μέθοδοι για την σημειακή εκτίμηση της τυπικής απόκλισης σε περιπτώσεις όπου το δείγμα γίνεται από έναν γενικό πληθυσμό μονάδων με κανονική κατανομή και η παράμετρος β είναι άγνωστη. Μια απλή (ευκολότερη στον υπολογισμό) εκτίμηση είναι το εύρος διακύμανσης (και °) του δείγματος, πολλαπλασιαζόμενο με έναν συντελεστή διόρθωσης που λαμβάνεται από τυπικούς πίνακες και που εξαρτάται από το μέγεθος του δείγματος (για μικρά δείγματα). Η παράμετρος τυπικής απόκλισης στον γενικό πληθυσμό μπορεί να εκτιμηθεί χρησιμοποιώντας την υπολογισμένη διακύμανση του δείγματος, λαμβάνοντας υπόψη τον αριθμό των βαθμών ελευθερίας. Η τετραγωνική ρίζα αυτής της διακύμανσης δίνει μια τιμή που θα χρησιμοποιηθεί ως εκτίμηση της γενικής τυπικής απόκλισης).

Χρησιμοποιώντας την τιμή της παραμέτρου στο "υπολογίστε το μέσο σφάλμα της εκτίμησης του γενικού μέσου όρου (x") με τον τρόπο που συζητήθηκε παραπάνω.

Όπως αναφέρθηκε προηγουμένως, σύμφωνα με την απαίτηση ικανότητας, η εμπιστοσύνη στην ακρίβεια μιας συγκεκριμένης εκτίμησης σημείων αυξάνεται με την αύξηση του μεγέθους του δείγματος. Είναι κάπως δύσκολο να αποδειχθεί αυτή η θεωρητική θέση στο παράδειγμα μιας σημειακής εκτίμησης. Η επίδραση του μεγέθους του δείγματος στην ακρίβεια της εκτίμησης είναι προφανής κατά τον υπολογισμό των εκτιμήσεων διαστήματος. Θα συζητηθούν παρακάτω.

Ο Πίνακας 39 παραθέτει τις πιο συχνά χρησιμοποιούμενες σημειακές εκτιμήσεις παραμέτρων πληθυσμού.

Πίνακας 39

Βασικές εκτιμήσεις σημείων _

Οι εκτιμήσεις που υπολογίζονται με διαφορετικούς τρόπους μπορεί να μην είναι ίδιες σε μέγεθος. Από αυτή την άποψη, σε πρακτικούς υπολογισμούς, δεν πρέπει να ασχολείται κανείς με τον διαδοχικό υπολογισμό πιθανών επιλογών, αλλά, βασιζόμενος στις ιδιότητες διαφόρων εκτιμήσεων, να επιλέξει μία από αυτές.

Με έναν μικρό αριθμό μονάδων παρατηρήσεων, η σημειακή εκτίμηση είναι σε μεγάλο βαθμό τυχαία και επομένως όχι πολύ αξιόπιστη. Επομένως, σε μικρά δείγματα, μπορεί να διαφέρει πολύ από το εκτιμώμενο χαρακτηριστικό του γενικού πληθυσμού. Αυτή η κατάσταση οδηγεί σε μεγάλα λάθη στα συμπεράσματα που ισχύουν για τον γενικό πληθυσμό με βάση τα αποτελέσματα του δείγματος. Για το λόγο αυτό, χρησιμοποιούνται εκτιμήσεις διαστήματος για μικρά δείγματα.

Σε αντίθεση με την εκτίμηση σημείων, η εκτίμηση διαστήματος δίνει το εύρος των σημείων εντός των οποίων πρέπει να βρίσκεται η παράμετρος πληθυσμού. Επιπλέον, η εκτίμηση του διαστήματος δείχνει την πιθανότητα και, ως εκ τούτου, είναι σημαντική στη στατιστική ανάλυση.

Καλείται μια εκτίμηση διαστήματος, η οποία χαρακτηρίζεται από δύο αριθμούς - τα όρια του διαστήματος που καλύπτει (καλύπτει) την εκτιμώμενη παράμετρο. Μια τέτοια εκτίμηση είναι ένα ορισμένο διάστημα στο οποίο η επιθυμητή παράμετρος βρίσκεται με δεδομένη πιθανότητα. Το κέντρο του διαστήματος είναι μια εκτίμηση σημείου δείγματος.

Έτσι, η εκτίμηση διαστήματος είναι μια περαιτέρω εξέλιξη της εκτίμησης σημείου, όταν μια τέτοια εκτίμηση είναι αναποτελεσματική με ένα μικρό μέγεθος δείγματος.

Το πρόβλημα της εκτίμησης διαστήματος σε γενική μορφή μπορεί να διατυπωθεί ως εξής: σύμφωνα με τα δεδομένα μιας παρατήρησης δείγματος, είναι απαραίτητο να κατασκευαστεί ένα αριθμητικό διάστημα σε σχέση με το οποίο, με ένα προηγουμένως επιλεγμένο επίπεδο πιθανότητας, μπορεί να υποστηριχθεί ότι η εκτιμώμενη η παράμετρος βρίσκεται μέσα σε αυτό το διάστημα.

Εάν πάρουμε έναν αρκετά μεγάλο αριθμό μονάδων δειγματοληψίας, τότε, χρησιμοποιώντας το θεώρημα Lyapunov, μπορούμε να αποδείξουμε την πιθανότητα ότι το σφάλμα δειγματοληψίας δεν θα υπερβεί κάποια δεδομένη τιμή a, δηλαδή

Και ~ "*!" Α ή Ι Όχι. "ζ. υΑ.

Συγκεκριμένα, αυτό το θεώρημα καθιστά δυνατή την εκτίμηση των σφαλμάτων των κατά προσέγγιση ισοτήτων:

- "P (n και -συχνότητα) x "x. n

Αν ^ * 2Xz..., x - ~ ανεξάρτητες τυχαίες μεταβλητές και n, τότε η πιθανότητα του μέσου όρου τους (x) είναι στην περιοχή από a έως 6 και μπορεί να προσδιοριστεί από τις εξισώσεις:

p(a(μι) 1 και 2 αυτά τα,

_ένα- E (x); _ σε - E (x) DE ° α

Η πιθανότητα P ονομάζεται πιθανότητα εμπιστοσύνης.

Έτσι, η πιθανότητα εμπιστοσύνης (αξιοπιστία) της εκτίμησης της γενικής παραμέτρου σύμφωνα με μια δειγματοληπτική εκτίμηση είναι η πιθανότητα με την οποία πραγματοποιούνται οι ανισότητες:

| ~ Χ | <а; | и, ориентир | <д

όπου α είναι το οριακό σφάλμα της εκτίμησης, σύμφωνα με τον μέσο όρο και το μερίδιο.

Τα όρια στα οποία μπορεί να εντοπιστεί το γενικό χαρακτηριστικό με αυτή τη δεδομένη πιθανότητα ονομάζονται διαστήματα εμπιστοσύνης (όρια εμπιστοσύνης). Και τα όρια αυτού του διαστήματος ονομάζονται όρια εμπιστοσύνης.

Τα όρια εμπιστοσύνης (ή ανεκτικών) είναι όρια πέρα ​​από τα οποία ένα δεδομένο χαρακτηριστικό λόγω τυχαίων διακυμάνσεων έχει ασήμαντη πιθανότητα (A ^ 0,5, p 2<0,01; Л <0,001). Понятие "доверительный интервал" введено Дж.Нейман и К.Пирсоном (1950 г.). Это установленный по выборочным данным интервал, который с заданной вероятностью (доверительной вероятностью) охватывает (покрывает) настоящее, но неизвестно для нас значение параметра. Если уровня доверительной вероятности принять значения 0,95, то эта вероятность свидетельствует о том, что при частых приложениях данного способа (метода) вычислений доверительный интервал примерно в 95% случаев будет покрывать параметр. Доверительный интервал генеральной средней и генеральной доли определяется на основе приведенных выше неравенств, из которых

έπεται ότι ~ _A - x - ~ + A; Αρ. _Α - ζ. - Αρ. + Α.

Στις μαθηματικές στατιστικές, η αξιοπιστία μιας συγκεκριμένης παραμέτρου εκτιμάται από την τιμή των ακόλουθων τριών επιπέδων πιθανότητας (μερικές φορές ονομάζονται "κατώφλια πιθανότητας"): L \u003d 0,95; ^ 2 \u003d 0,99; P 3 \u003d 0,999. Πιθανότητες αποφασίστηκε να παραμεληθεί, δηλαδή ένα 1 = 0,05;; a 2 = 0,01; "3 \u003d 0,001 ονομάζονται επίπεδα σημαντικότητας ή επίπεδα σημαντικότητας. Από τα παραπάνω επίπεδα, αξιόπιστα συμπεράσματα παρέχονται από την πιθανότητα P 3 = 0,999. Κάθε επίπεδο εμπιστοσύνης αντιστοιχεί σε μια ορισμένη τιμή της κανονικοποιημένης απόκλισης (βλ. Πίνακα 27). Εάν δεν υπάρχουν τυπικοί πίνακες τιμών του διαστήματος πιθανότητας στη διάθεση, τότε αυτή η πιθανότητα μπορεί να υπολογιστεί με έναν ορισμένο βαθμό προσέγγισης με τον τύπο:

R (<) = - = ^ = 1 ε"~ y i.

Στο σχήμα 11, εκείνα τα μέρη της συνολικής επιφάνειας που οριοθετούνται από την κανονική καμπύλη και τον άξονα της τετμημένης που αντιστοιχούν στην τιμή <= ± 1;<= ± 2; <= и 3 и для которых вероятности равны 0,6287, 0,9545; 0,9973. При точечном оценке рассчитывается, как уже известно, средняя ошибка выборки, при интервальном - предельная.

Ανάλογα με τις αρχές της επιλογής μονάδων (επαναλαμβανόμενη ή μη), οι δομικοί τύποι για τον υπολογισμό των σφαλμάτων δειγματοληψίας

διαφέρουν ως προς το μέγεθος της διόρθωσης (Ν).

Ρύζι. 11. Κανονική καμπύλη πιθανοτήτων

Ο Πίνακας 40 δείχνει τους τύπους για τον υπολογισμό των σφαλμάτων στις εκτιμήσεις της γενικής παραμέτρου.

Ας εξετάσουμε μια συγκεκριμένη περίπτωση διαστήματος εκτίμησης των παραμέτρων του γενικού πληθυσμού σύμφωνα με τα δεδομένα της δειγματοληπτικής παρατήρησης.

Παράδειγμα.Κατά τη διάρκεια επιλεκτικής έρευνας σε αγροκτήματα της περιοχής, διαπιστώθηκε ότι η μέση ημερήσια απόδοση γάλακτος των αγελάδων (x) είναι 10 κιλά. Το μερίδιο των καθαρόαιμων βοοειδών στο σύνολο του ζωικού κεφαλαίου είναι 80%. Το σφάλμα δειγματοληψίας με πιθανότητα εμπιστοσύνης P = 0,954 αποδείχθηκε ότι ήταν 0,2 kg. για ιδιωτικά καθαρόαιμα βοοειδή 1%.

Έτσι, τα όρια μέσα στα οποία μπορεί να βρίσκεται ο γενικός μέσος όρος

η απόδοση θα είναι 9,8<х <10,2; для генеральной доли скота -79 <Р <81.

Συμπέρασμα: με πιθανότητα 0,954 μπορεί να υποστηριχθεί ότι η διαφορά μεταξύ της επιλεκτικής μέσης παραγωγικότητας των αγελάδων και της γενικής παραγωγικότητας είναι 0,2 kg. Το όριο μέσης ημερήσιας απόδοσης γάλακτος είναι 9,8 και 10,2 κιλά. Το μερίδιο (ειδικό βάρος) των καθαρόαιμων βοοειδών στις επιχειρήσεις της περιοχής κυμαίνεται από 79 έως 81%, το σφάλμα εκτίμησης δεν ξεπερνά το 1%.

Πίνακας 40

Υπολογισμός σημείων και διαστημάτων δειγματοληπτικών σφαλμάτων

Όταν οργανώνετε ένα δείγμα, είναι σημαντικό να προσδιορίσετε το απαιτούμενο μέγεθος (n). Το τελευταίο εξαρτάται από τη διακύμανση των μονάδων του πληθυσμού που ερευνήθηκε. Όσο μεγαλύτερη είναι η τυχαιότητα, τόσο μεγαλύτερο θα πρέπει να είναι το μέγεθος του δείγματος. Ανατροφοδότηση μεταξύ του μεγέθους του δείγματος και του οριακού του σφάλματος. Η επιθυμία να ληφθεί ένα μικρότερο σφάλμα απαιτεί αύξηση του μεγέθους του δείγματος.

Το απαιτούμενο μέγεθος δείγματος προσδιορίζεται με βάση τους τύπους για το οριακό δειγματοληπτικό σφάλμα (e) με δεδομένο επίπεδο πιθανότητας (P). Με μαθηματικούς μετασχηματισμούς προκύπτουν τύποι για τον υπολογισμό του μεγέθους του δείγματος (Πίνακας 41).

Πίνακας 41

Υπολογισμός του απαιτούμενου μεγέθους δείγματος _

Θα πρέπει να σημειωθεί ότι όλα όσα αναφέρονται σε σχέση με τις στατιστικές εκτιμήσεις βασίζονται στην υπόθεση ότι ο πληθυσμός του δείγματος, οι παράμετροι του οποίου χρησιμοποιούνται στην αξιολόγηση, λαμβάνεται με τη χρήση μιας μεθόδου επιλογής (μέθοδος) που παρέχει πιθανότητες δειγματοληψίας.

Ταυτόχρονα, κατά την επιλογή του επιπέδου εμπιστοσύνης της εκτίμησης, θα πρέπει να καθοδηγείται από την αρχή ότι η επιλογή του επιπέδου του δεν είναι μαθηματικό πρόβλημα, αλλά καθορίζεται από το συγκεκριμένο πρόβλημα που επιλύεται. Προς υποστήριξη των παραπάνω, εξετάστε ένα παράδειγμα.

Παράδειγμα.Ας υποθέσουμε ότι σε δύο επιχειρήσεις η πιθανότητα παραγωγής τελικών (υψηλής ποιότητας) προϊόντων είναι P = 0,999, δηλαδή η πιθανότητα απόκτησης ελαττωματικών προϊόντων θα είναι a = 0,001. Είναι δυνατόν, στο πλαίσιο μαθηματικών εκτιμήσεων, χωρίς να ενδιαφέρομαι για τη φύση του προϊόντος, να αποφασιστεί εάν υπήρχε μεγάλη πιθανότητα έλλειψης a = 0,001. Ας υποθέσουμε ότι μια εταιρεία παράγει σπαρτήρες και η δεύτερη - αεροσκάφη για την επεξεργασία των καλλιεργειών. Εάν υπάρχει ένα ελαττωματικό ανά 1000 σπαρτήρες, τότε αυτό μπορεί να αντιμετωπιστεί, διότι η επανατήξη του 0,1% των σπαρτικών είναι φθηνότερη από την αναδιάρθρωση της τεχνολογικής διαδικασίας. Εάν υπάρχει ένα ελαττωματικό αεροσκάφος ανά 1000 αεροσκάφη, αυτό σίγουρα θα οδηγήσει σε σοβαρές συνέπειες κατά τη λειτουργία του. Άρα, στην πρώτη περίπτωση, η πιθανότητα να γίνει γάμος ένα = 0,001 μπορεί να γίνει δεκτό, στη δεύτερη περίπτωση - όχι. Για το λόγο αυτό, η επιλογή της πιθανότητας εμπιστοσύνης στους υπολογισμούς γενικά και στον υπολογισμό των εκτιμήσεων, ειδικότερα, θα πρέπει να γίνεται με βάση τις ειδικές συνθήκες του προβλήματος.

Ανάλογα με τους στόχους της μελέτης, μπορεί να είναι απαραίτητος ο υπολογισμός ενός ή δύο ορίων εμπιστοσύνης. Εάν τα χαρακτηριστικά του προβλήματος που επιλύεται απαιτούν τον καθορισμό ενός μόνο από τα όρια, άνω ή κάτω, μπορείτε να βεβαιωθείτε ότι η πιθανότητα με την οποία ορίζεται αυτό το όριο θα είναι μεγαλύτερη από ό,τι όταν και τα δύο όρια καθορίζονται για την ίδια τιμή του συντελεστή εμπιστοσύνης 1

Αφήστε τα όρια εμπιστοσύνης να τεθούν με πιθανότητα P = 0,95, δηλαδή,

στο 95% των περιπτώσεων, ο γενικός μέσος όρος (x) δεν θα είναι μικρότερος από τον χαμηλότερο

διάστημα εμπιστοσύνης x ™ - x "m και όχι περισσότερο από την ανώτερη εμπιστοσύνη

διάστημα Xup - = x + Σε αυτήν την περίπτωση, μόνο με πιθανότητα a = 0,05 (ή 5%), η μέση γενική μπορεί να υπερβεί τα καθορισμένα όρια. Εφόσον η κατανομή του Χ είναι συμμετρική, τότε το ήμισυ αυτού του επιπέδου

πιθανότητα, δηλαδή, 2,5% θα πέσει στην περίπτωση που x (x ™ -και το δεύτερο μισό - στην περίπτωση που, x ^ x "^ -. Από αυτό προκύπτει ότι η πιθανότητα ότι ο μέσος γενικός μπορεί να είναι μικρότερος από κορυφαία αξία

Το όριο εμπιστοσύνης του Khwei "-, είναι ίσο με 0,975 (δηλαδή 0,95 + 0,025). Επομένως, δημιουργούνται συνθήκες όταν, με δύο όρια εμπιστοσύνης, παραμελούμε

η τιμή του x είναι μικρότερη από x "" *., και μεγαλύτερη ή Xeerx. κλήση

μόνο ένα όριο εμπιστοσύνης, π.χ. Για την ίδια τιμή του συντελεστή εμπιστοσύνης X, το επίπεδο σημαντικότητας a εδώ αποδεικνύεται ότι είναι δύο φορές μικρότερο.

Εάν υπολογίζονται μόνο χαρακτηριστικές τιμές που υπερβαίνουν

(ή αντίστροφα μην υπερβαίνετε) την τιμή της επιθυμητής παραμέτρου x, το διάστημα εμπιστοσύνης ονομάζεται μονόπλευρο. Εάν οι υπό εξέταση τιμές είναι περιορισμένες και στις δύο πλευρές, το διάστημα εμπιστοσύνης ονομάζεται διπλής όψης. Από τα παραπάνω προκύπτει ότι οι υποθέσεις και μια σειρά κριτηρίων, ιδίως το τεστ Χ του Student, θα πρέπει να θεωρούνται μονόπλευρες και αμφίπλευρες. Επομένως, σύμφωνα με μια υπόθεση δύο ουρών, το επίπεδο σημαντικότητας για την ίδια τιμή του X θα είναι διπλάσιο από το επίπεδο σημαντικότητας του μονόπλευρου. Εάν θέλουμε να διατηρήσουμε το επίπεδο σημαντικότητας (και το επίπεδο εμπιστοσύνης) το ίδιο με μια υπόθεση μιας ουράς όπως και με μια υπόθεση δύο ουρών, τότε η τιμή του X θα πρέπει να ληφθεί μικρότερη. Αυτό το χαρακτηριστικό λήφθηκε υπόψη κατά τη σύνταξη τυπικών πινάκων κριτηρίων X-Student (Παράρτημα 1).

Είναι γνωστό ότι από πρακτική άποψη δεν ενδιαφέρουν τόσο τα διαστήματα εμπιστοσύνης της πιθανής τιμής του γενικού μέσου όρου, αλλά εκείνες οι μέγιστες και οι ελάχιστες τιμές, περισσότερο ή μικρότερες από τις οποίες δεν μπορεί να είναι ο γενικός μέσος όρος. μια δεδομένη (σιγουριά) πιθανότητα. Στη μαθηματική στατιστική, ονομάζονται εγγυημένο μέγιστο και εγγυημένο ελάχιστο μέσο όρο. Δηλώνοντας τις ονομαζόμενες παραμέτρους

αντίστοιχα, μέσω και x ™, μπορείτε να γράψετε: ХШ ™ = x +; xship = x~.

Κατά τον υπολογισμό των εγγυημένων μέγιστων και ελάχιστων τιμών του γενικού μέσου όρου, ως τα όρια ενός μονόπλευρου διαστήματος εμπιστοσύνης στους παραπάνω τύπους, η τιμή 1 λαμβάνεται ως μονόπλευρο κριτήριο.

Παράδειγμα.Για 20 τοποθεσίες δειγματοληψίας, η μέση απόδοση σε ζαχαρότευτλα ήταν 300 n/ha. Αυτός ο μέσος όρος του δείγματος χαρακτηρίζει το αντίστοιχο

πληθυσμιακή παράμετρος (x) με σφάλμα 10 n/ha. Σύμφωνα με την επιλεκτικότητα των εκτιμήσεων, η γενική μέση απόδοση μπορεί να είναι είτε μεγαλύτερη είτε μικρότερη από τον μέσο όρο του δείγματος x = 300. Με πιθανότητα P = 0,95, μπορεί να υποστηριχθεί ότι η επιθυμητή παράμετρος δεν θα είναι μεγαλύτερη από ХШ "= 300 + 1,73 x10 = 317,3 q / εκτάριο.

Η τιμή 1 λαμβάνεται για τον αριθμό των βαθμών ελευθερίας ^ = 20-1 με μια μονόπλευρη κρίσιμη περιοχή και ένα επίπεδο σημασίας ένα = 0,05 (Παράρτημα 1). Έτσι, με πιθανότητα P = 0,95, το εγγυημένο μέγιστο δυνατό επίπεδο της γενικής μέσης απόδοσης εκτιμάται σε 317 n / ha, δηλαδή, υπό ευνοϊκές συνθήκες, η μέση απόδοση ζαχαρότευτλων δεν υπερβαίνει την καθορισμένη τιμή.

Σε ορισμένους κλάδους της γνώσης (για παράδειγμα, στις φυσικές επιστήμες), η θεωρία της αξιολόγησης είναι κατώτερη από τη θεωρία της δοκιμής στατιστικών υποθέσεων. Στα οικονομικά, οι μέθοδοι στατιστικής αξιολόγησης παίζουν πολύ σημαντικό ρόλο στην επαλήθευση της αξιοπιστίας των αποτελεσμάτων της έρευνας, καθώς και σε διάφορους πρακτικούς υπολογισμούς. Πρώτα απ 'όλα, αυτό αφορά τη χρήση μιας σημειακής εκτίμησης των υπό μελέτη στατιστικών πληθυσμών. Η επιλογή της καλύτερης δυνατής εκτίμησης είναι το κύριο πρόβλημα της σημειακής εκτίμησης. Η δυνατότητα μιας τέτοιας επιλογής οφείλεται στη γνώση των βασικών ιδιοτήτων (απαιτήσεων) των στατιστικών εκτιμήσεων.

μετατοπίζεται Ο. της σελίδας. για τη διακύμανση, αφού ; ως αμετακίνητο Ο. με. για το s 2 συνήθως παίρνει κανείς τη συνάρτηση


δείτε επίσης Αμερόληπτος εκτιμητής.

Για μέτρο ακρίβειας μη μετατοπισμένου Ο. με. και για την παράμετρο, η διακύμανση Da λαμβάνεται συχνότερα.

O. s. με τη μικρότερη διασπορά. το καλύτερο. Στο παραπάνω παράδειγμα, ο αριθμητικός μέσος όρος (1) είναι το καλύτερο Ο. με. Ωστόσο, εάν τυχαίες μεταβλητές X iδιαφορετικό από το κανονικό, τότε O. s. (1) μπορεί να μην είναι το καλύτερο. Για παράδειγμα, εάν τα αποτελέσματα των παρατηρήσεων Χ iκατανέμεται ομοιόμορφα στο διάστημα ( προ ΧΡΙΣΤΟΥ), τότε το καλύτερο Ο. σ. για τα μαθηματικά. προσδοκίες α=(β+γ)/2 θα είναι το ήμισυ του αθροίσματος των ακραίων τιμών

(3)

Ως χαρακτηριστικό για τη σύγκριση της ακρίβειας διαφόρων Ο. s. εφαρμόστε την αποδοτικότητα - διακυμάνσεις της καλύτερης εκτίμησης και της δεδομένης αμερόληπτης εκτίμησης. Για παράδειγμα, εάν τα αποτελέσματα των παρατηρήσεων Χ iκατανέμονται ομοιόμορφα, τότε οι αποκλίσεις των εκτιμήσεων (1) και (3) εκφράζονται με τους τύπους

και (4)

Εφόσον η εκτίμηση (3) είναι η καλύτερη, η αποτελεσματικότητα της εκτίμησης (1) σε αυτή την περίπτωση είναι

Με μεγάλο αριθμό παρατηρήσεων, συνήθως απαιτούν ότι το επιλεγμένο Ο. με. προσδοκώμενη από πιθανότητα για την πραγματική τιμή της παραμέτρου ένα,δηλ. για οποιοδήποτε e > 0

τέτοια Ο. σ. που ονομάζεται συνεπής (ένα παράδειγμα συνεπούς O. s, - οποιοδήποτε, η διακύμανση του οποίου τείνει στο μηδέν στο, βλ. επίσης Συνεπής αξιολόγηση). Δεδομένου ότι η τάση προς το όριο παίζει σημαντικό ρόλο σε αυτή την περίπτωση, ασυμπτωτικά καλύτερες είναι οι ασυμπτωτικά αποτελεσματικές Ο.Σ., δηλαδή τέτοιες Ο.σ. για τις οποίες, για

Για παράδειγμα, αν κατανεμηθεί εξίσου κανονικά, τότε το O. s. Το (2) είναι μια ασυμπτωτικά αποτελεσματική εκτίμηση για την άγνωστη παράμετρο , αφού για , η διακύμανση της εκτίμησης και η διακύμανση της καλύτερης εκτίμησης είναι ασυμπτωτικά ισοδύναμες:

και επιπλέον,

Θεμελιώδης αξία για τη θεωρία της σελίδας του Ο. και οι εφαρμογές του έχει το γεγονός ότι ο Ο. σ. για την παράμετρο a, περιορίζεται από κάτω από μια συγκεκριμένη τιμή (ο R. Fischer πρότεινε να χαρακτηριστεί η ποσότητα των πληροφοριών για την άγνωστη παράμετρο a που περιέχεται στα αποτελέσματα των παρατηρήσεων με αυτήν την τιμή). Για παράδειγμα, εάν είναι ανεξάρτητα και ισόποσα κατανεμημένα με πυκνότητα πιθανότητας p(x; ένα).και αν - O. s. για κάποια συνάρτηση g(a) στην παράμετρο a, μετά σε μια ευρεία κατηγορία περιπτώσεων

Καλείται η συνάρτηση b(a). μετατόπιση, και το αντίστροφο της δεξιάς πλευράς της ανισότητας (5), που ονομάζεται. την ποσότητα των πληροφοριών (σύμφωνα με τον Fisher) σχετικά με τη συνάρτηση g(a) , που περιέχεται στην παρατήρηση. Ειδικότερα, εάν το α είναι αμερόληπτο Ο. s. παράμετρος ένα,τότε,

και τον όγκο των πληροφοριών nIaΣε αυτή την περίπτωση, είναι ανάλογο με τον αριθμό των παρατηρήσεων (η συνάρτηση I(a) ονομάζεται η ποσότητα των πληροφοριών που περιέχονται σε μία παρατήρηση).

Οι κύριες συνθήκες υπό τις οποίες ισχύουν οι ανισότητες (5) και (6) είναι η ομαλότητα της εκτίμησης για το α ως συνάρτηση του X i,και επίσης στην παράμετρο του συνόλου αυτών των σημείων Χ,όπου p( x, α)=0. Η τελευταία προϋπόθεση δεν ικανοποιείται, για παράδειγμα, στην περίπτωση ομοιόμορφης κατανομής και επομένως η διακύμανση του O. s. (3) δεν ικανοποιεί την ανισότητα (6) [σύμφωνα με (4) αυτή η διασπορά είναι της τάξης του n -2, ενώ με την ανισότητα (6) δεν μπορεί να είναι μικρότερη από n -1].

Οι ανισότητες (5) και (6) ισχύουν επίσης για διακριτά κατανεμημένες τυχαίες μεταβλητές X iχρειάζεται μόνο στον ορισμό της πληροφορίας I(a). p(x; ένα).αντικαταστήστε με την πιθανότητα του συμβάντος (Χ=χ).

Αν η διασπορά του αμερόληπτου Ο. σ. a* για την παράμετρο a συμπίπτει με τη δεξιά πλευρά της ανισότητας (6), τότε είναι η καλύτερη εκτίμηση. Η αντίστροφη δήλωση, μιλώντας γενικά, δεν είναι αλήθεια: η διακύμανση του καλύτερου Ο. σ. μπορεί να υπερβαίνει. Ωστόσο, εάν , τότε η διακύμανση της καλύτερης εκτίμησης είναι ασυμπτωτικά ισοδύναμη με τη δεξιά πλευρά του (6), δηλ., . Έτσι, χρησιμοποιώντας την ποσότητα των πληροφοριών (σύμφωνα με τον Fisher), μπορεί κανείς να προσδιορίσει την ασυμπτωτική αποδοτικότητα μη μετατοπισμένου Ο. σελίδας. α, υποθέτοντας

Ιδιαίτερα γόνιμη είναι η πληροφοριακή προσέγγιση της θεωρίας του Ο. του s. επηρεάζει όταν η πυκνότητα (στη διακριτή περίπτωση - ) της κοινής κατανομής των τυχαίων μεταβλητών μπορεί να αναπαρασταθεί ως γινόμενο δύο συναρτήσεων h( x 1 , x 2 ,..., x σελ).[y( x 1 , x 2 ,..., x n);ένα] , από τα οποία δεν εξαρτάται το πρώτο ένα,και το δεύτερο είναι η πυκνότητα κατανομής μιας ορισμένης τυχαίας μεταβλητής Z=y(Χ 1, Χ 2,...,Χ σελ), που ονομάζεται επαρκή στατιστικά στοιχείαή εξαντλητικά στατιστικά στοιχεία.

Μία από τις πιο διαδεδομένες μεθόδους εύρεσης του σημείου Ο. σελίδα - μέθοδος στιγμών.Σύμφωνα με αυτή τη μέθοδο, θεωρητικά κατανομή ανάλογα με άγνωστες παραμέτρους τοποθετείται σε ένα διακριτό δείγμα, το οποίο προσδιορίζεται από τα αποτελέσματα των παρατηρήσεων X iκαι αντιπροσωπεύει την κατανομή πιθανότητας μιας φανταστικής τυχαίας μεταβλητής που παίρνει τιμές με ίσες πιθανότητες ίσες με 1/n (η κατανομή του δείγματος μπορεί να θεωρηθεί ως σημειακή κατανομή για μια θεωρητική κατανομή). Όπως ο Ο. με. για τις θεωρητικές στιγμές. οι κατανομές λαμβάνουν τις αντίστοιχες στιγμές της κατανομής δειγματοληψίας. πχ για τα μαθηματικά. Προσδοκία ai και διακύμανση s 2 μέθοδος ροπών δίνει το ακόλουθο ΛΣ: (1) και διακύμανση δείγματος (2). Οι άγνωστες παράμετροι συνήθως εκφράζονται (ακριβώς ή κατά προσέγγιση) ως συναρτήσεις πολλών θεωρητικών ροπών. διανομή. Αντικατάσταση σε αυτές τις συναρτήσεις θεωρητική. οι στιγμές επιλεκτικές, λάβουν απαιτούνται Ο. με. Αυτή η μέθοδος, που συχνά οδηγεί στην πράξη σε σχετικά απλούς υπολογισμούς, συνήθως αποδίδει O. s. χαμηλή ασυμπτωτική απόδοση (βλ. παραπάνω ένα παράδειγμα εκτίμησης της μαθηματικής προσδοκίας μιας ομοιόμορφης κατανομής).

Άλλη μέθοδος εύρεσης Ο. σελίδας, πιο τέλεια με θεωρητική. απόψεις,- μέθοδος μέγιστης πιθανότητας,ή τη μέθοδο μέγιστης πιθανότητας. Σύμφωνα με αυτή τη μέθοδο, θεωρείται η συνάρτηση πιθανότητας L(a), η οποία είναι συνάρτηση της άγνωστης παραμέτρου a και προκύπτει ως αποτέλεσμα της αντικατάστασης στην πυκνότητα της κοινής κατανομής ορισμάτων x iοι ίδιες οι τυχαίες μεταβλητές X i; αν Ξι -είναι ανεξάρτητες και ισόποσα κατανεμημένες με πυκνότητα πιθανότητας p(x; ένα), τότε

(αν X iκατανέμονται διακριτά, τότε στον ορισμό της συνάρτησης πιθανότητας L, η πυκνότητα θα πρέπει να αντικατασταθεί από τις πιθανότητες των γεγονότων ). Όπως ο Ο. με. η μέγιστη πιθανότητα για μια άγνωστη παράμετρο a λαμβάνεται ως μια τέτοια τιμή a, για την οποία η L(a) φτάνει τη μέγιστη τιμή της (στην περίπτωση αυτή, αντί για L, θεωρείται συχνά η λεγόμενη λογαριθμική συνάρτηση πιθανότητας ; λόγω της μονοτονίας του λογάριθμου συμπίπτουν τα σημεία μεγίστων των συναρτήσεων L(a) και l(a). Παραδείγματα Ο. με. εκτιμήσεις μέγιστης πιθανότητας είναι μέθοδος ελαχίστων τετραγώνων.

Το κύριο πλεονέκτημα του Ο. με. Η μέγιστη πιθανότητα έγκειται στο γεγονός ότι, υπό ορισμένες γενικές συνθήκες, αυτές οι εκτιμήσεις είναι συνεπείς, ασυμπτωτικά αποτελεσματικές και κατανέμονται περίπου κανονικά.

Οι ιδιότητες που αναφέρονται σημαίνουν ότι αν το a είναι O. s. μέγιστη πιθανότητα, λοιπόν

(αν τα Χ είναι ανεξάρτητα, τότε ). Έτσι, για τη συνάρτηση κατανομής του κανονικοποιημένου Ο. s. υπάρχει μια οριακή σχέση

πλεονεκτήματα του Ο. με. Η μέγιστη πιθανότητα δικαιολογεί την υπολογιστική εργασία εύρεσης του μέγιστου της συνάρτησης L(ή l) . Σε ορισμένες περιπτώσεις, το υπολογιστικό έργο μειώνεται σημαντικά λόγω των ακόλουθων ιδιοτήτων: πρώτον, εάν το a* είναι τέτοιο O.S. για το οποίο το (6) γίνεται ισότητα, τότε το O.S. Η μέγιστη πιθανότητα είναι μοναδική και συμπίπτει με το a*· δεύτερον, αν υπάρχει Z, τότε το O. s. η μέγιστη πιθανότητα είναι συνάρτηση Ζ.

Ας είναι, για παράδειγμα, ανεξάρτητο και κατανεμημένο εξίσου κανονικά έτσι ώστε

Να γιατί

Συντεταγμένες a = a 0και s= s 0 μέγιστα σημεία της συνάρτησης I( ένα, s).ικανοποιεί το σύστημα των εξισώσεων


Έτσι, και, επομένως, στην προκειμένη περίπτωση, ο O. s. (1) και (2) - εκτιμήσεις μέγιστης πιθανότητας, και - το καλύτερο O. s. παράμετρος ένα,κανονικά κατανεμημένο (, ), και - ασυμπτωτικά αποτελεσματικό O. s. Παράμετροι 2 , κατανεμημένο για μεγάλο p είναι περίπου κανονικό (). Και οι δύο εκτιμήσεις είναι ανεξάρτητες επαρκείς στατιστικές.

Ένα άλλο παράδειγμα, στο οποίο

Αυτή η πυκνότητα περιγράφει ικανοποιητικά την κατανομή μιας από τις συντεταγμένες των σωματιδίων που έχουν φτάσει σε μια επίπεδη οθόνη και ξεφεύγουν από ένα σημείο που βρίσκεται έξω από την οθόνη (α - η συντεταγμένη της προβολής της πηγής στην οθόνη - θεωρείται ότι είναι άγνωστη). Για την καθορισμένη κατανομή των μαθηματικών. η προσδοκία δεν υπάρχει γιατί η αντίστοιχη αποκλίνει. Επομένως η αναζήτηση του Ο. κατά σελίδα. γιατί η μέθοδος των στιγμών είναι αδύνατη. Επίσημη αίτηση ως Ο. της σελίδας. ο αριθμητικός μέσος όρος (1) δεν έχει νόημα, καθώς κατανέμεται στην περίπτωση αυτή με την ίδια πυκνότητα p(x; a) με κάθε μεμονωμένο αποτέλεσμα παρατήρησης. Για την εκτίμηση, μπορεί κανείς να χρησιμοποιήσει το γεγονός ότι η εξεταζόμενη κατανομή είναι συμμετρική ως προς το σημείο x=aκαι ως εκ τούτου, ένα -θεωρητική διάμεσος διανομή. Τροποποιώντας κάπως τη μέθοδο των ροπών, όπως ο O. s. για αποδοχή του λεγόμενου. δείγμα διάμεσο m, το οποίο είναι αμερόληπτο O. s. για a, και αν το p είναι μεγάλο, τότε το m κατανέμεται περίπου κανονικά με διακύμανση


Ταυτοχρονα

επομένως και, ως εκ τούτου, σύμφωνα με το (7) ασυμπτωτικά. η αποτελεσματικότητα είναι ίση. Έτσι, για να είναι το m εξίσου ακριβές O. s. για το α, καθώς και για την εκτίμηση μέγιστης πιθανότητας a, ο αριθμός των παρατηρήσεων θα πρέπει να αυξηθεί κατά 25%. Εάν το κόστος του πειράματος είναι υψηλό, τότε θα πρέπει να χρησιμοποιηθεί το O. για τον προσδιορισμό της σελίδας. α, που σε αυτή την περίπτωση ορίζεται ως οι εξισώσεις

Ως πρώτη προσέγγιση, επιλέγεται ένα 0 =u και στη συνέχεια αυτό λύνεται με διαδοχικές προσεγγίσεις σύμφωνα με τον τύπο

δείτε επίσης Σημειακή εκτίμηση.

Εκτιμήσεις διαστήματος. Η εκτίμηση διαστήματος ονομάζεται. ένα τέτοιο σύστημα συνόρων, το οποίο είναι γεωμετρικά αναπαραστάσιμο ως ένα σύνολο σημείων που ανήκουν στον χώρο παραμέτρων. Διάστημα Ο. με. μπορεί να θεωρηθεί ως σημείο Ο. με. Αυτό το σύνολο εξαρτάται από τα αποτελέσματα των παρατηρήσεων και, επομένως, είναι τυχαίο. επομένως κάθε διάστημα Ο. με. τίθεται σε αντιστοιχία με την πιθανότητα κατά την οποία αυτή η εκτίμηση «καλύπτει» την άγνωστη παραμετρική. σημείο. Μια τέτοια πιθανότητα, σε γενικές γραμμές, εξαρτάται από τις άγνωστες παραμέτρους. επομένως ως χαρακτηριστικό της αξιοπιστίας του διαστήματος Ο. με. αποδεχτείτε την εμπιστοσύνη - τη μικρότερη δυνατή τιμή της καθορισμένης πιθανότητας. Ενημερωτική στατιστική. Τα συμπεράσματα καθιστούν δυνατή τη λήψη μόνο αυτών των διαστημάτων O. s., ο συντελεστής εμπιστοσύνης to-rykh είναι κοντά στη μονάδα.

Εάν εκτιμηθεί μία παράμετρος a, τότε το διάστημα O. με. συνήθως είναι κάποια (b, g) (τα λεγόμενα ), τα τελικά σημεία των οποίων (b και g είναι συναρτήσεις των αποτελεσμάτων των παρατηρήσεων· ο συντελεστής εμπιστοσύνης co σε αυτή την περίπτωση ορίζεται ως οι πιθανότητες της ταυτόχρονης εμφάνισης δύο γεγονότων (σι< a} и (g >α) υπολογίζεται σε όλες τις πιθανές τιμές της παραμέτρου α:


Αν το μέσο ενός τέτοιου διαστήματος ληφθεί ως σημείο Ο. με. για την παράμετρο a, τότε με πιθανότητα τουλάχιστον ω μπορεί να υποστηριχθεί ότι αυτό το O. s. δεν υπερβαίνει το μισό του διαστήματος. Με άλλα λόγια, εάν ακολουθήσουμε τον υποδεικνυόμενο κανόνα για την εκτίμηση του απόλυτου σφάλματος, τότε ένα λανθασμένο συμπέρασμα θα προκύψει κατά μέσο όρο σε λιγότερο από περιπτώσεις. Για έναν σταθερό συντελεστή εμπιστοσύνης με τα μικρότερα διαστήματα εμπιστοσύνης είναι τα πλέον συμφέροντα, για τα οποία τα μαθηματικά το προσδοκώμενο μήκος φτάνει τη μικρότερη τιμή.

Αν η κατανομή των τυχαίων μεταβλητών X iεξαρτάται από μία μόνο άγνωστη παράμετρο ένα,τότε η κατασκευή ενός διαστήματος εμπιστοσύνης πραγματοποιείται συνήθως με τη βοήθεια κάποιου σημείου Ο. σ. ένα. Για την πλειονότητα των πρακτικά ενδιαφέρουσες περιπτώσεις, η συνάρτηση διανομής ενός εύλογα επιλεγμένου O. s. και μονοτονικά εξαρτάται από την παράμετρο ένα.Σε αυτές τις συνθήκες για την εύρεση του διαστήματος Ο. της σελίδας. ακολουθεί στο F(x; ένα) υποκατάστατο x=ένα . και βρες τις ρίζες α 1 = α 1(a, w) και εξισώσεις 2 \u003d a 2 (a, w).

(9) όπου

[για συνεχείς διανομές]. Τα σημεία με συντεταγμένες και περιορίζουν το διάστημα εμπιστοσύνης με τον παράγοντα εμπιστοσύνης w. Φυσικά, ένα διάστημα που κατασκευάζεται με τόσο απλό τρόπο μπορεί σε πολλές περιπτώσεις να διαφέρει από το βέλτιστο (συντομότερο). Ωστόσο, εάν το α είναι ένα ασυμπτωτικά αποτελεσματικό Ο.Σ. για ένα, τότε για έναν αρκετά μεγάλο αριθμό παρατηρήσεων ένα τέτοιο διάστημα O. s. πρακτικά ασήμαντα διαφορετικό από το βέλτιστο. Ειδικότερα, αυτό ισχύει για τον Ο. σ. μέγιστη πιθανότητα, επειδή είναι ασυμπτωτικά κανονικά κατανεμημένη (βλ. (8)). Σε περιπτώσεις που οι εξισώσεις (9) είναι δύσκολες, το διάστημα O. s. υπολογίστε περίπου με τη βοήθεια του σημείου Ο. με. μέγιστη πιθανότητα και αναλογία (8):

που Χ -ρίζα της εξίσωσης

Εάν , τότε ο πραγματικός συντελεστής εμπιστοσύνης της εκτίμησης διαστήματος τείνει σε w. Σε μια γενικότερη περίπτωση, η κατανομή των αποτελεσμάτων των παρατηρήσεων X i- εξαρτάται από πολλές παραμέτρους α, β.... Υπό αυτές τις συνθήκες, οι παραπάνω κανόνες για την κατασκευή διαστημάτων εμπιστοσύνης συχνά αποδεικνύονται ανεφάρμοστοι, αφού η κατανομή του σημείου Ο. με. ένα , εξαρτάται, κατά κανόνα, όχι μόνο από το a, αλλά και από άλλες παραμέτρους. Ωστόσο, σε πρακτικά ενδιαφέρουσες περιπτώσεις ο O. s. Το a μπορεί να αντικατασταθεί από μια τέτοια συνάρτηση από τα αποτελέσματα των παρατηρήσεων X iκαι μια άγνωστη παράμετρος i, η κατανομή της οποίας δεν εξαρτάται (ή "σχεδόν δεν εξαρτάται") από όλες τις άγνωστες παραμέτρους. Παράδειγμα τέτοιας συνάρτησης είναι το κανονικοποιημένο O. s. μέγιστη πιθανότητα ; αν ο παρονομαστής περιέχει ορίσματα α, β...αντικαταστήστε τις με εκτιμήσεις μέγιστης πιθανότητας α, β,. . . , τότε η κατανομή ορίου θα παραμείνει ίδια όπως στον τύπο (8). Επομένως, κατά προσέγγιση διαστήματα εμπιστοσύνης για κάθε παράμετρο ξεχωριστά μπορούν να δημιουργηθούν ως εξής ίδιο,όπως στην περίπτωση μιας παραμέτρου.

Όπως σημειώθηκε παραπάνω, εάν , ... είναι ανεξάρτητες και εξίσου κανονικά κατανεμημένες τυχαίες μεταβλητές, τότε το s 2 είναι το καλύτερο O. s. για τις παραμέτρους a και s 2 αντίστοιχα. Συνάρτηση διανομής O. s. εκφράζεται με τον τύπο


και επομένως εξαρτάται όχι μόνο από το a, αλλά και από το s. Παράλληλα, η διανομή των λεγόμενων. φοιτητική σχέση


δεν εξαρτάται ούτε από το α ούτε από το και

όπου η σταθερά επιλέγεται έτσι ώστε η ισότητα . Άρα το διάστημα εμπιστοσύνης

αντιστοιχεί στον συντελεστή εμπιστοσύνης

Η κατανομή της εκτίμησης s 2 εξαρτάται μόνο από το s 2, και η συνάρτηση κατανομής του O. s. Το s 2 δίνεται από τον τύπο

όπου η σταθερά D n-1 προσδιορίζεται από τη συνθήκη (η λεγόμενη -κατανομή με n-1 βαθμούς ελευθερίας).

Εφόσον η πιθανότητα αυξάνεται μονότονα με την αύξηση του s, να κατασκευαστεί ένα διάστημα O. s. ισχύει ο κανόνας (9). Έτσι, εάν x 1και x 2 είναι οι ρίζες των εξισώσεων και = , τότε το διάστημα εμπιστοσύνης

αντιστοιχεί στον συντελεστή εμπιστοσύνης w. Από εδώ, συγκεκριμένα, προκύπτει ότι το διάστημα εμπιστοσύνης για το σχετικό σφάλμα δίνεται από τις ανισότητες

Λεπτομερείς πίνακες με τις συναρτήσεις και τις κατανομές κατανομής του Μαθητή είναι διαθέσιμοι στα περισσότερα εγχειρίδια για τα μαθηματικά. στατιστική.

Μέχρι τώρα, υποτίθεται ότι η συνάρτηση κατανομής των αποτελεσμάτων των παρατηρήσεων είναι γνωστή εντός των τιμών πολλών παραμέτρων. Ωστόσο, σε εφαρμογές συναντά κανείς συχνά την περίπτωση που η συνάρτηση διανομής είναι άγνωστη. Σε αυτή την κατάσταση, το λεγόμενο. μη παραμετρικές μεθόδους στατιστικής(δηλαδή, μέθοδοι που δεν εξαρτώνται από την αρχική κατανομή πιθανοτήτων). Έστω, για παράδειγμα, απαιτείται να εκτιμηθεί η διάμεσος του θεωρητικού συνεχής κατανομή ανεξάρτητων τυχαίων μεταβλητών X 1 , X 2 ,..., X σελ(για συμμετρικές κατανομές συμπίπτει με τη μαθηματική προσδοκία, αν φυσικά υπάρχει). Έστω Y 1 οι ίδιες ποσότητες X iαλλά διατεταγμένα σε αύξουσα σειρά. Τότε αν κ-ένας ακέραιος αριθμός που ικανοποιεί τις ανισότητες n/2, τότε

Έτσι, - διάστημα Ο. με. για TS με τον συντελεστή εμπιστοσύνης w=w n,k. Αυτό ισχύει για οποιαδήποτε συνεχή κατανομή τυχαίων μεταβλητών X i .

Σημειώθηκε παραπάνω ότι η επιλεκτική κατανομή είναι το σημείο Ο. με. για ένα άγνωστο θεωρητικό διανομή. Επιπλέον, η συνάρτηση κατανομής δειγματοληψίας F n(χ). - αμετάβλητος Ο. σ. για τη θεωρητική λειτουργία. κατανομή F(x) . Ταυτόχρονα, όπως φαίνεται ΑΛΛΑ. N. Kolmogorov, διανομή στατιστικών

δεν εξαρτάται από το άγνωστο θεωρητικό. κατανομή και όπως τείνει προς την οριακή κατανομή K(y) , to-roe naz. η κατανομή του Κολμογκόροφ. Έτσι, εάν y -λύση της εξίσωσης K(y)=w, τότε με πιθανότητα w μπορεί να υποστηριχθεί ότι οι θεωρητικές συναρτήσεις. κατανομή F (y) "καλύπτεται" πλήρως από τη λωρίδα που περικλείεται μεταξύ των γραφημάτων των συναρτήσεων (όταν η διαφορά μεταξύ των κατανομών προκαταρκτικών και ορίων των στατιστικών l n είναι πρακτικά ασήμαντη). Τέτοιο διάστημα Ο. με. που ονομάζεται ζώνη εμπιστοσύνης. δείτε επίσης Διαλειμματική αξιολόγηση.

Στατιστικές εκτιμήσεις στη θεωρία των σφαλμάτων.Η θεωρία των σφαλμάτων είναι ένα τμήμα μαθηματικών στατιστικών που αφιερώνεται στον αριθμητικό προσδιορισμό άγνωστων μεγεθών από τα αποτελέσματα των μετρήσεων. Λόγω της τυχαίας φύσης των σφαλμάτων μέτρησης και, ίσως, της τυχαίας φύσης του υπό μελέτη φαινομένου, δεν είναι όλα αυτά τα αποτελέσματα ίσα: σε επαναλαμβανόμενες μετρήσεις, μερικά από αυτά συμβαίνουν πιο συχνά, άλλα λιγότερο συχνά.

Η βάση της θεωρίας των σφαλμάτων είναι μαθηματική. , σύμφωνα με την οποία, πριν από το πείραμα, το σύνολο όλων των πιθανών αποτελεσμάτων μέτρησης αντιμετωπίζεται ως ένα σύνολο τιμών μιας ορισμένης τυχαίας μεταβλητής. Επομένως, σημαντικό ρόλο αποκτά ο Ο. Τα συμπεράσματα της θεωρίας των σφαλμάτων είναι στατιστικά. . Το νόημα και το περιεχόμενο τέτοιων συμπερασμάτων (καθώς και τα συμπεράσματα του Ο.

Υποθέτοντας ότι το αποτέλεσμα της μέτρησης X είναι μια τυχαία μεταβλητή, υπάρχουν τρεις κύριοι τύποι σφαλμάτων μέτρησης: συστηματικά, τυχαία και ακαθάριστα (οι ποιοτικές περιγραφές τέτοιων σφαλμάτων δίνονται στο άρθρο. Θεωρία σφάλματος). Σε αυτή την περίπτωση, το σφάλμα μέτρησης της άγνωστης ποσότητας αναζ. Χ-α, μαθηματικά. προσδοκία αυτής της διαφοράς Ε( Χα)που ονομάζεται συστηματικό σφάλμα (αν b \u003d 0, τότε λένε ότι οι μετρήσεις στερούνται συστηματικών σφαλμάτων) και η διαφορά d \u003d X- α-βπου ονομάζεται τυχαίο λάθος . Έτσι, εάν δοθούν ανεξάρτητες από το p μετρήσεις του a, τότε τα αποτελέσματά τους μπορούν να γραφούν ως ισότητες

όπου ai και b είναι σταθερές, a d Εγώ- τυχαίες μεταβλητές. Πιο γενικά

όπου β Εγώ- δεν εξαρτώνται από δ Εγώτυχαίες μεταβλητές, οι οποίες είναι ίσες με μηδέν με πιθανότητα πολύ κοντά στη μονάδα (επομένως, οποιαδήποτε άλλη τιμή είναι απίθανη). σι Εγώπου ονομάζεται χονδροειδές λάθος.

Το έργο της αξιολόγησης (και της εξάλειψης) συστηματικής. τα λάθη συνήθως υπερβαίνουν τα μαθηματικά. στατιστική. Οι εξαιρέσεις είναι τα λεγόμενα. η μέθοδος των προτύπων, σύμφωνα με τον Krom, για την αξιολόγηση του b, εκτελείται μια σειρά μετρήσεων γνωστής τιμής a (σε αυτή τη μέθοδο σι-εκτιμώμενη αξία και μια - γνωστή συστηματική. σφάλμα), καθώς και , που σας επιτρέπει να αξιολογήσετε τη συστηματική. αποκλίσεις μεταξύ πολλών σειρών μετρήσεων.

Το κύριο καθήκον της θεωρίας των σφαλμάτων είναι η εύρεση του Ο. με. για άγνωστη τιμή του a και εκτίμηση της ακρίβειας της μέτρησης. Αν η συστηματική το σφάλμα εξαλείφεται (b=0) και οι παρατηρήσεις δεν περιέχουν χονδροειδή σφάλματα, τότε σύμφωνα με το (10) Χ Εγώ=a+d Εγώκαι, επομένως, σε αυτή την περίπτωση το πρόβλημα της εκτίμησης του c ανάγεται στην εύρεση, με τη μια ή την άλλη έννοια, ενός βέλτιστου O. s. για τα μαθηματικά. προσδοκίες για πανομοιότυπα κατανεμημένες τυχαίες μεταβλητές X i .Όπως φαίνεται στις προηγούμενες ενότητες, ο τύπος τέτοιου O. s. (σημείο ή διάστημα) ουσιαστικά εξαρτάται από τον νόμο κατανομής των τυχαίων σφαλμάτων. Εάν αυτός ο νόμος είναι γνωστός μέχρι μερικές άγνωστες παραμέτρους, τότε για την εκτίμηση, καθώς και για την εκτίμηση, είναι δυνατόν να εφαρμοστεί, για παράδειγμα, η μέθοδος μέγιστης πιθανότητας. διαφορετικά, ακολουθεί πρώτα σύμφωνα με τα αποτελέσματα των παρατηρήσεων Χ iβρες O. s. για μια άγνωστη συνάρτηση κατανομής τυχαίου σφάλματος δ Εγώ(το «μη παραμετρικό» διάστημα Ο. μιας τέτοιας συνάρτησης υποδεικνύεται παραπάνω). Στην πράξη οι εργασίες αρκούνται συχνά σε δύο Ο. σελίδας. και (βλέπε (1) και (2)). Αν δ Εγώκατανέμονται εξίσου κανονικά, τότε αυτά τα Ο. σ. το καλύτερο; Σε άλλες περιπτώσεις, αυτές οι εκτιμήσεις μπορεί να είναι αναποτελεσματικές.

Η παρουσία χονδροειδών σφαλμάτων περιπλέκει το πρόβλημα της εκτίμησης της παραμέτρου α. Συνήθως το ποσοστό των παρατηρήσεων στις οποίες είναι μικρό και μαθηματικό. περιμένω μη μηδενικό |β Εγώ| υπερβαίνει σημαντικά (εμφανίζονται μεγάλα σφάλματα ως αποτέλεσμα τυχαίου λανθασμένου υπολογισμού, εσφαλμένης ανάγνωσης των ενδείξεων της συσκευής μέτρησης κ.λπ.). Τα αποτελέσματα των μετρήσεων που περιέχουν χονδροειδή σφάλματα είναι συχνά ορατά, επειδή διαφέρουν πολύ από άλλα αποτελέσματα μετρήσεων. Υπό αυτές τις συνθήκες, ο πιο πρόσφορος τρόπος εντοπισμού (και εξάλειψης) μεγάλων σφαλμάτων είναι η άμεση ανάλυση των μετρήσεων, ο ενδελεχής έλεγχος της αμετάβλητης των συνθηκών όλων των πειραμάτων, η καταγραφή των αποτελεσμάτων "σε δύο χέρια" κ.λπ. Στατιστικά. μέθοδοι για τον εντοπισμό χονδρών σφαλμάτων θα πρέπει να χρησιμοποιούνται μόνο σε αμφίβολες περιπτώσεις.

Το απλούστερο παράδειγμα τέτοιων μεθόδων είναι ο κρατιστής. ταυτοποίηση μιας ακραίας παρατήρησης, όταν είτε Υ 1 =ελάχ.Χ 1, ή Y p \u003d maxX i(υποτίθεται ότι στις ισότητες (11) b=0 και ο νόμος κατανομής των ποσοτήτων d Εγώγνωστός). Προκειμένου να διαπιστωθεί εάν η υπόθεση της παρουσίας ενός χονδροειδούς σφάλματος είναι δικαιολογημένη, για ένα ζευγάρι Y 1 , Y nυπολογίστε το κοινό διάστημα Ο. με. (εμπιστοσύνη ), υποθέτοντας όλα β Εγώμηδέν. Αν αυτό το Ο. σ. "καλύπτει" το σημείο με συντεταγμένες ( Y 1 , Y n), τότε η υποψία ύπαρξης χονδροειδούς σφάλματος θα πρέπει να θεωρείται στατιστικά αβάσιμη. Διαφορετικά, η υπόθεση της παρουσίας ενός χονδροειδούς σφάλματος πρέπει να αναγνωριστεί ως επιβεβαιωμένη (στην περίπτωση αυτή, μια παρατήρηση που απορρίπτεται συνήθως απορρίπτεται, καθώς δεν είναι στατιστικά δυνατό να εκτιμηθεί αξιόπιστα το μέγεθος ενός χονδροειδούς σφάλματος από μία παρατήρηση).

Θέμα 7. Στατιστικές εκτιμήσεις παραμέτρων κατανομής: σημειακές και διαστημικές εκτιμήσεις

Η έννοια των στατιστικών μεθόδων έγκειται στο γεγονός ότι, με βάση ένα δείγμα περιορισμένου μεγέθους, δηλαδή για κάποιο μέρος του γενικού πληθυσμού, να κάνει μια λογική κρίση για τις ιδιότητές του στο σύνολό του.

Φυσικά, η αντικατάσταση μιας πληθυσμιακής μελέτης με μια δειγματοληπτική μελέτη εγείρει μια σειρά από ερωτήματα:

1. Σε ποιο βαθμό το δείγμα αντικατοπτρίζει τις ιδιότητες του γενικού πληθυσμού, δηλαδή κατά πόσο το δείγμα είναι αντιπροσωπευτικό του γενικού πληθυσμού;

2. Τι πληροφορίες για τις τιμές των παραμέτρων του γενικού πληθυσμού μπορούν να δώσουν οι παράμετροι του δείγματος;

3. Μπορεί να υποστηριχθεί ότι τα στατιστικά χαρακτηριστικά που λαμβάνονται με δειγματοληψία (μέσος όρος, διακύμανση ή οποιεσδήποτε άλλες παραγόμενες τιμές) είναι ίσα με εκείνα τα χαρακτηριστικά που μπορούν να ληφθούν από τον γενικό πληθυσμό.

Ο έλεγχος δείχνει ότι οι τιμές των παραμέτρων που λαμβάνονται για διαφορετικά δείγματα από τον ίδιο γενικό πληθυσμό συνήθως δεν ταιριάζουν. Οι αριθμητικές τιμές των παραμέτρων του δείγματος που υπολογίζονται τυχαία είναι μόνο το αποτέλεσμα μιας κατά προσέγγιση στατιστική αξιολόγησητιμές αυτών των παραμέτρων στο γενικό πληθυσμό. Η στατιστική εκτίμηση, λόγω της μεταβλητότητας των παρατηρούμενων φαινομένων, επιτρέπει τη λήψη μόνο των κατά προσέγγιση τιμών τους.

Σημείωση. Αυστηρά μιλώντας, στις στατιστικές, μια εκτίμηση είναι ένας κανόνας για τον υπολογισμό της παραμέτρου που εκτιμάται, και ο όρος αξιολόγηση, δηλαδή αξιολόγηση, σημαίνει ότι υποδεικνύει μια κατά προσέγγιση τιμή.

Διακρίνετε τις εκτιμήσεις σημείοκαι εκτιμήσεις διαστήματος.

Σημειακή εκτίμηση παραμέτρων κατανομής

Ας είναι x 1 , x 2 , …, x n– δειγματοληψία όγκου nαπό το γενικό πληθυσμό με συνάρτηση κατανομής φά(Χ).

Τα αριθμητικά χαρακτηριστικά αυτού του δείγματος ονομάζονται εκλεκτικός (εμπειρικός) αριθμητικά χαρακτηριστικά.

Σημειώστε ότι τα αριθμητικά χαρακτηριστικά του δείγματος είναι χαρακτηριστικά ενός δεδομένου δείγματος, αλλά δεν είναι χαρακτηριστικά της κατανομής του γενικού πληθυσμού. Ωστόσο, αυτά τα χαρακτηριστικά μπορούν να χρησιμοποιηθούν για την εκτίμηση των παραμέτρων του γενικού πληθυσμού.

διάσπαρτοςονομάζεται στατιστική εκτίμηση, η οποία καθορίζεται από έναν μόνο αριθμό.

Η βαθμολογική εκτίμηση χαρακτηρίζεται από ιδιότητες:αμερόληπτη, βιωσιμότητα και αποτελεσματικότητα.

αμερόληπτοςονομάζεται σημειακή εκτίμηση, η μαθηματική προσδοκία της οποίας είναι ίση με την εκτιμώμενη παράμετρο για οποιοδήποτε μέγεθος δείγματος.

Η εκτίμηση σημείων ονομάζεται πλούσιος , εάν με απεριόριστη αύξηση του μεγέθους του δείγματος ( n® ¥) συγκλίνει κατά πιθανότητα στην πραγματική τιμή της παραμέτρου, δηλαδή τείνει στην πραγματική τιμή της εκτιμώμενης παραμέτρου του γενικού πληθυσμού.

αποτελεσματικόςονομάζεται σημειακή εκτίμηση, η οποία (για ένα δεδομένο μέγεθος δείγματος n) έχει τη μικρότερη δυνατή διακύμανση, δηλαδή εγγυάται τη μικρότερη απόκλιση της εκτίμησης του δείγματος από την ίδια εκτίμηση του γενικού πληθυσμού.

Τα μαθηματικά στατιστικά δείχνουν ότι μια συνεπής, αμερόληπτη εκτίμηση της γενικής μέσης τιμής a είναι η μέση τιμή του δείγματος:

που x i- επιλογή δειγματοληψίας, n i– επιλογές συχνότητας x i, είναι το μέγεθος του δείγματος.

Αμερόληπτη εκτίμηση της γενικής διακύμανσηςχρησιμεύει για τη διόρθωση της διακύμανσης του δείγματος

,

Πιο βολική φόρμουλα .

Βαθμός μικρόΤο 2 για τη γενική διακύμανση είναι επίσης συνεπές, αλλά όχι αποτελεσματικό. Στην περίπτωση όμως κανονικής κατανομής είναι «ασυμπτωτικά αποδοτική», δηλαδή με αύξηση nο λόγος της διακύμανσής του προς την ελάχιστη δυνατή προσεγγίζει την ενότητα απεριόριστα.

Έτσι, δίνεται ένα δείγμα από τη διανομή φά(Χ) τυχαία μεταβλητή Χμε άγνωστη προσδοκία ένακαι διασπορά s 2, τότε για να υπολογίσουμε τις τιμές αυτών των παραμέτρων, έχουμε το δικαίωμα να χρησιμοποιήσουμε τους ακόλουθους κατά προσέγγιση τύπους:

Οι σημειακές εκτιμήσεις έχουν το μειονέκτημα ότι, με ένα μικρό μέγεθος δείγματος, μπορεί να διαφέρουν σημαντικά από τις εκτιμώμενες παραμέτρους. Επομένως, για να έχουμε μια ιδέα της εγγύτητας μεταξύ μιας παραμέτρου και της εκτίμησής της, εισάγονται οι λεγόμενες εκτιμήσεις διαστήματος στα μαθηματικά στατιστικά στοιχεία.

Διάστημα εμπιστοσύνης

Εάν, κατά τη στατιστική επεξεργασία των αποτελεσμάτων, απαιτείται να βρεθεί όχι μόνο μια σημειακή εκτίμηση της άγνωστης παραμέτρου θ, αλλά και να χαρακτηριστεί η ακρίβεια αυτής της εκτίμησης, τότε βρίσκεται ένα διάστημα εμπιστοσύνης.

Διάστημα εμπιστοσύνηςείναι το διάστημα στο οποίο η άγνωστη παράμετρος του γενικού πληθυσμού βρίσκεται με μια προκαθορισμένη πιθανότητα εμπιστοσύνης.

Πιθανότητα εμπιστοσύνηςείναι η πιθανότητα με την οποία η παράμετρος άγνωστου πληθυσμού ανήκει στο διάστημα εμπιστοσύνης.

Το μήκος του διαστήματος εμπιστοσύνης χαρακτηρίζει την ακρίβεια της εκτίμησης του διαστήματος και εξαρτάται από το μέγεθος του δείγματος και το επίπεδο εμπιστοσύνης. Με αύξηση του μεγέθους του δείγματος, το μήκος θα περιοριστεί. το διάστημα μειώνεται (η ακρίβεια αυξάνεται) και όταν η πιθανότητα εμπιστοσύνης τείνει στο 1, το μήκος θα είναι εμπιστοσύνη. Το διάστημα αυξάνεται (η ακρίβεια μειώνεται) Μαζί με το επίπεδο εμπιστοσύνης p, το επίπεδο σημαντικότητας α = 1 - p χρησιμοποιείται συχνά στην πράξη.

Συνήθως λαμβάνετε p = 0,95 ή (σπάνια) 0,99. Αυτές οι πιθανότητες αναγνωρίζονται ως επαρκείς για μια σίγουρη κρίση σχετικά με τις γενικές παραμέτρους με βάση γνωστούς δείκτες δείγματος.

Το διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία είναι: όπου S - RMS, - η κρίσιμη τιμή της κατανομής του μαθητή (Βλ. ΠΑΡΑΡΤΗΜΑ 1 στο Θέμα 7)

Σχέδιο διάλεξης:

    Η έννοια της αξιολόγησης

    Ιδιότητες στατιστικών εκτιμήσεων

    Μέθοδοι εύρεσης εκτιμήσεων σημείων

    Εκτίμηση παραμέτρων διαστήματος

    Διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία με μια γνωστή διακύμανση ενός κανονικά κατανεμημένου πληθυσμού.

    Κατανομή Χ-τετράγωνο και Κατανομή Μαθητή.

    Διάστημα εμπιστοσύνης για τη μαθηματική προσδοκία μιας τυχαίας μεταβλητής που έχει κανονική κατανομή με άγνωστη διακύμανση.

    Διάστημα εμπιστοσύνης για την τυπική απόκλιση της κανονικής κατανομής.

Βιβλιογραφία:

    Wentzel, E.S. Θεωρία πιθανοτήτων [Κείμενο] / Ε.Σ. Ο Βέντσελ. - Μ.: Γυμνάσιο, 2006. - 575 σελ.

    Gmurman, V.E. Θεωρία πιθανοτήτων και μαθηματική στατιστική [Κείμενο] / V.E. Γκμούρμαν. - Μ.: Γυμνάσιο, 2007. - 480 σελ.

    Kremer, N.Sh. Θεωρία πιθανοτήτων και μαθηματική στατιστική [Κείμενο] / N.Sh. Kremer - M: UNITI, 2002. - 543 p.

Σ.1. Η έννοια της αξιολόγησης

Κατανομές όπως διωνυμική, εκθετική, κανονική είναι οικογένειες κατανομών που εξαρτώνται από μία ή περισσότερες παραμέτρους. Για παράδειγμα, η εκθετική κατανομή με πυκνότητα πιθανότητας , εξαρτάται από μια παράμετρο λ, την κανονική κατανομή
- από δύο παραμέτρους Μκαι σ. Κατά κανόνα, είναι σαφές από τις συνθήκες του υπό μελέτη προβλήματος ποια οικογένεια διανομών συζητείται. Ωστόσο, οι συγκεκριμένες τιμές των παραμέτρων αυτής της κατανομής, οι οποίες περιλαμβάνονται στις εκφράσεις των χαρακτηριστικών κατανομής που μας ενδιαφέρουν, παραμένουν άγνωστες. Επομένως, είναι απαραίτητο να γνωρίζουμε τουλάχιστον μια κατά προσέγγιση τιμή αυτών των ποσοτήτων.

Αφήστε τον νόμο κατανομής του γενικού πληθυσμού να οριστεί μέχρι τις τιμές των παραμέτρων που περιλαμβάνονται στην κατανομή του
, μερικά από τα οποία μπορεί να είναι γνωστά. Ένα από τα καθήκοντα της μαθηματικής στατιστικής είναι να βρει εκτιμήσεις άγνωστων παραμέτρων από ένα δείγμα παρατηρήσεων
από το γενικό πληθυσμό. Η εκτίμηση άγνωστων παραμέτρων συνίσταται στην κατασκευή μιας συνάρτησης
από ένα τυχαίο δείγμα έτσι ώστε η τιμή αυτής της συνάρτησης να είναι περίπου ίση με την εκτιμώμενη άγνωστη παράμετρο θ . Λειτουργία που ονομάζεται στατιστικήπαράμετρος θ .

Στατιστικός εκτίμηση(εφεξής μόνο εκτίμηση) παράμετρος θ θεωρητική κατανομή ονομάζεται κατά προσέγγιση τιμή της, ανάλογα με τα δεδομένα επιλογής.

Βαθμός είναι μια τυχαία μεταβλητή, επειδή είναι συνάρτηση ανεξάρτητων τυχαίων μεταβλητών
; εάν κάνετε διαφορετικό δείγμα, τότε η συνάρτηση θα λάβει, γενικά, διαφορετική τιμή.

Υπάρχουν δύο τύποι εκτιμήσεων - σημείου και διαστήματος.

διάσπαρτοςονομάζεται εκτίμηση που καθορίζεται από έναν μόνο αριθμό. Με έναν μικρό αριθμό παρατηρήσεων, αυτές οι εκτιμήσεις μπορούν να οδηγήσουν σε χονδροειδή σφάλματα. Για την αποφυγή τους, χρησιμοποιούνται εκτιμήσεις διαστήματος.

Διάστημαονομάζεται εκτίμηση, η οποία καθορίζεται από δύο αριθμούς - τα άκρα του διαστήματος, στο οποίο η εκτιμώμενη τιμή περικλείεται με μια δεδομένη πιθανότητα θ .

Σ. 2 Ιδιότητες στατιστικών εκτιμήσεων

η αξία
που ονομάζεται ακρίβεια αξιολόγησης. Το λιγότερο
, όσο καλύτερα, τόσο ακριβέστερα προσδιορίζεται η άγνωστη παράμετρος.

Για την εκτίμηση οποιασδήποτε παραμέτρου επιβάλλεται ένας αριθμός απαιτήσεων, τις οποίες πρέπει να ικανοποιεί για να είναι «κοντά» στην πραγματική τιμή της παραμέτρου, δηλ. είναι κατά κάποιο τρόπο μια «καλοήθης» αξιολόγηση. Η ποιότητα μιας εκτίμησης προσδιορίζεται ελέγχοντας εάν έχει τις ιδιότητες της αμερόληπτης, της αποτελεσματικότητας και της συνέπειας.

Βαθμός παράμετρος θ που ονομάζεται αμερόληπτος(χωρίς συστηματικά σφάλματα) εάν ο μέσος όρος της εκτίμησης είναι ίδιος με την πραγματική τιμή θ :

. (1)

Εάν η ισότητα (1) δεν ισχύει, τότε η εκτίμηση που ονομάζεται εκτοπισμένος(με συστηματικά λάθη). Αυτή η προκατάληψη μπορεί να οφείλεται σε σφάλματα στη μέτρηση, στην καταμέτρηση ή στη μη τυχαία φύση του δείγματος. Τα συστηματικά σφάλματα οδηγούν σε υπερεκτίμηση ή υποτίμηση.

Για ορισμένα προβλήματα μαθηματικών στατιστικών, μπορεί να υπάρχουν αρκετές αμερόληπτες εκτιμήσεις. Συνήθως προτιμάται αυτό που έχει τη μικρότερη διασπορά (διασπορά).

Βαθμός που ονομάζεται αποτελεσματικόςεάν έχει τη μικρότερη απόκλιση μεταξύ όλων των πιθανών αμερόληπτων εκτιμήσεων της παραμέτρου θ .

Ας είναι ρε() είναι η ελάχιστη απόκλιση και
είναι η διακύμανση οποιουδήποτε άλλου αμερόληπτου εκτιμητή παράμετρος θ . Στη συνέχεια η αποτελεσματικότητα της εκτίμησης είναι ίσο με

. (2)

Είναι ξεκάθαρο ότι
. Όσο πιο κοντά
έως 1, τόσο πιο αποτελεσματική είναι η αξιολόγηση . Αν ένα
στο
, τότε καλείται η εκτίμηση ασυμπτωτικά αποτελεσματική.

Σχόλιο: Αν σκοράρει μετατοπίστηκε, τότε η μικρότητα της διασποράς του δεν σημαίνει τη μικρότητα του λάθους του. Λαμβάνοντας, για παράδειγμα, ως εκτίμηση της παραμέτρου θ κάποιο νούμερο , λαμβάνουμε μια εκτίμηση ακόμη και με μηδενική διακύμανση. Ωστόσο, σε αυτή την περίπτωση, το σφάλμα (σφάλμα)
μπορεί να είναι αυθαίρετα μεγάλο.

Βαθμός που ονομάζεται πλούσιος, εάν με αύξηση του μεγέθους του δείγματος (
) η εκτίμηση συγκλίνει κατά πιθανότητα στην ακριβή τιμή της παραμέτρου θ , δηλ. αν για κανένα

. (3)

Συνέπεια της αξιολόγησης παράμετρος θ σημαίνει ότι με την ανάπτυξη nποιότητα αξιολόγησης μεγέθους δείγματος βελτιωνεται.

Θεώρημα 1. Ο μέσος όρος του δείγματος είναι μια αμερόληπτη και συνεπής εκτίμηση της προσδοκίας.

Θεώρημα 2. Η διορθωμένη διακύμανση του δείγματος είναι μια αμερόληπτη και συνεπής εκτίμηση της διακύμανσης.

Θεώρημα 3. Η συνάρτηση εμπειρικής κατανομής του δείγματος είναι μια αμερόληπτη και συνεπής εκτίμηση της συνάρτησης κατανομής μιας τυχαίας μεταβλητής.