Έννοια της στατιστικής αξιολόγησης. Ορισμός στατιστικής αξιολόγησης

Ας είναι απαραίτητο να μελετήσουμε ένα ποσοτικό χαρακτηριστικό ενός γενικού πληθυσμού. Ας υποθέσουμε ότι, από θεωρητικές εκτιμήσεις, μπορέσαμε να καθορίσουμε ποια ακριβώς κατανομή έχει το χαρακτηριστικό. Το πρόβλημα προκύπτει με την εκτίμηση των παραμέτρων που καθορίζουν αυτή την κατανομή. Για παράδειγμα, εάν είναι γνωστό εκ των προτέρων ότι το χαρακτηριστικό που μελετάται κατανέμεται στον γενικό πληθυσμό σύμφωνα με έναν κανονικό νόμο, τότε είναι απαραίτητο να εκτιμηθεί η μαθηματική προσδοκία και η τυπική απόκλιση, καθώς αυτές οι δύο παράμετροι καθορίζουν πλήρως την κανονική κατανομή. Εάν υπάρχει λόγος να πιστεύουμε ότι ένα χαρακτηριστικό έχει κατανομή Poisson, τότε είναι απαραίτητο να εκτιμηθεί η παράμετρος με την οποία προσδιορίζεται αυτή η κατανομή. Συνήθως, μόνο δείγματα δεδομένων που λαμβάνονται από παρατηρήσεις είναι διαθέσιμα: , , ... , . Η εκτιμώμενη παράμετρος εκφράζεται μέσω αυτών των δεδομένων. Θεωρώντας , , ... ως τιμές ανεξάρτητων τυχαίων μεταβλητών , , ... , , μπορούμε να πούμε ότι η εύρεση μιας στατιστικής εκτίμησης μιας άγνωστης παραμέτρου μιας θεωρητικής κατανομής σημαίνει την εύρεση μιας συνάρτησης παρατηρούμενων τυχαίων μεταβλητών, η οποία δίνει μια κατά προσέγγιση τιμή της εκτιμώμενης παραμέτρου.

Ετσι, στατιστική αξιολόγησηΜια άγνωστη παράμετρος μιας θεωρητικής κατανομής ονομάζεται συνάρτηση παρατηρούμενων τυχαίων μεταβλητών. Καλείται μια στατιστική εκτίμηση μιας παραμέτρου άγνωστου πληθυσμού χρησιμοποιώντας έναν αριθμό σημείο. Οι ακόλουθες εκτιμήσεις σημείων θεωρούνται: μεροληπτικές και αμερόληπτες, αποτελεσματικές και συνεπείς.

Προκειμένου οι στατιστικές εκτιμήσεις να παρέχουν καλές προσεγγίσεις των εκτιμώμενων παραμέτρων, πρέπει να πληρούν ορισμένες απαιτήσεις. Ας υποδείξουμε αυτές τις απαιτήσεις. Έστω ότι υπάρχει μια στατιστική εκτίμηση μιας άγνωστης παραμέτρου της θεωρητικής κατανομής. Ας υποθέσουμε ότι έχει βρεθεί μια εκτίμηση από ένα δείγμα όγκου. Ας επαναλάβουμε το πείραμα, δηλ. θα εξαγάγουμε ένα άλλο δείγμα ίδιου μεγέθους από τον γενικό πληθυσμό τους και, χρησιμοποιώντας τα δεδομένα του, θα βρούμε μια εκτίμηση κ.λπ. Θα λάβουμε αριθμούς , , ... , που θα είναι διαφορετικοί από τον καθένα άλλα. Έτσι, η εκτίμηση μπορεί να θεωρηθεί ως τυχαία μεταβλητή και οι αριθμοί , , ... , ως πιθανές τιμές της.

Εάν η εκτίμηση δίνει μια κατά προσέγγιση τιμή με υπέρβαση, τότε ο αριθμός που βρέθηκε από τα δεδομένα του δείγματος ( ) θα είναι μεγαλύτερη από την πραγματική τιμή. Κατά συνέπεια, η μαθηματική προσδοκία (μέση τιμή) της τυχαίας μεταβλητής θα είναι μεγαλύτερη από , δηλ. Εάν δίνει μια κατά προσέγγιση τιμή με ένα μειονέκτημα, τότε .

Χρησιμοποιώντας λοιπόν στατιστική αξιολόγηση, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο, θα οδηγούσε σε συστηματικά σφάλματα. Επομένως, είναι απαραίτητο να απαιτείται η μαθηματική προσδοκία της εκτίμησης να είναι ίση με την εκτιμώμενη παράμετρο. Η συμμόρφωση με την απαίτηση εξαλείφει τα συστηματικά σφάλματα.

Αμερόληπτοςονομάζεται στατιστική εκτίμηση, η μαθηματική προσδοκία της οποίας είναι ίση με την εκτιμώμενη παράμετρο, δηλ.

Εκτοπισμένοςονομάζεται στατιστική εκτίμηση, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο.

Ωστόσο, είναι λάθος να υποθέσουμε ότι μια αμερόληπτη εκτίμηση δίνει πάντα μια καλή προσέγγιση της εκτιμώμενης παραμέτρου. Πράγματι, οι πιθανές τιμές μπορεί να είναι ευρέως διασκορπισμένες γύρω από τη μέση τιμή τους, δηλαδή, η διασπορά της τιμής μπορεί να είναι σημαντική. Σε αυτήν την περίπτωση, η εκτίμηση που βρέθηκε από τα δεδομένα ενός δείγματος, για παράδειγμα, μπορεί να αποδειχθεί πολύ απομακρυσμένη από τη μέση τιμή του και επομένως από την ίδια την εκτιμώμενη παράμετρο. Αν παίρναμε ως κατά προσέγγιση τιμή, θα κάναμε μεγάλο λάθος. Εάν απαιτείτε η διακύμανση μιας ποσότητας να είναι μικρή, τότε η πιθανότητα να κάνετε μεγάλο σφάλμα θα εξαλειφθεί. Επομένως, η στατιστική αξιολόγηση υπόκειται σε απαιτήσεις αποτελεσματικότητας.

Αποτελεσματικόςείναι μια στατιστική εκτίμηση που (για ένα δεδομένο μέγεθος δείγματος) έχει τη μικρότερη δυνατή διακύμανση. Όταν εξετάζονται μεγάλα δείγματα, οι στατιστικές εκτιμήσεις απαιτείται να είναι συνεπείς.

Πλούσιοςονομάζεται στατιστική εκτίμηση, η οποία τείνει κατά πιθανότητα στην εκτιμώμενη παράμετρο. Για παράδειγμα, εάν η διακύμανση μιας αμερόληπτης εκτίμησης στο τείνει στο μηδέν, τότε μια τέτοια εκτίμηση αποδεικνύεται συνεπής.

Ας εξετάσουμε το ερώτημα ποια χαρακτηριστικά δείγματος εκτιμούν καλύτερα τον γενικό μέσο όρο και τη διακύμανση ως προς την αμερόληπτη, την αποτελεσματικότητα και τη συνέπεια.

Ας μελετήσουμε έναν διακριτό γενικό πληθυσμό σε σχέση με ένα ποσοτικό χαρακτηριστικό. Γενική Δευτεροβάθμιαονομάζεται αριθμητικός μέσος όρος των χαρακτηριστικών τιμών του γενικού πληθυσμού. Μπορεί να υπολογιστεί χρησιμοποιώντας τύπους ή , όπου είναι οι τιμές του χαρακτηριστικού του γενικού πληθυσμού όγκου, είναι οι αντίστοιχες συχνότητες και .

Αφήστε ένα δείγμα όγκου με χαρακτηριστικές τιμές να εξαχθεί από τον γενικό πληθυσμό ως αποτέλεσμα ανεξάρτητων παρατηρήσεων ενός ποσοτικού χαρακτηριστικού . Μέσος όρος δείγματοςονομάζεται αριθμητικός μέσος όρος του πληθυσμού του δείγματος. Μπορεί να υπολογιστεί χρησιμοποιώντας τύπους ή , όπου είναι οι τιμές του χαρακτηριστικού στον πληθυσμό δείγματος όγκου, είναι οι αντίστοιχες συχνότητες και .

Εάν ο γενικός μέσος όρος είναι άγνωστος και απαιτείται να εκτιμηθεί χρησιμοποιώντας δεδομένα δείγματος, τότε ο μέσος όρος του δείγματος, ο οποίος είναι μια αμερόληπτη και συνεπής εκτίμηση, λαμβάνεται ως εκτίμηση του γενικού μέσου όρου. Επομένως, εάν βρεθούν μέσα δείγματος από πολλά δείγματα επαρκώς μεγάλου μεγέθους από τον ίδιο γενικό πληθυσμό, τότε θα είναι περίπου ίσα μεταξύ τους. Αυτό είναι το ακίνητο σταθερότητα των μέσων δείγματος.

Σημειώστε ότι εάν οι διακυμάνσεις δύο πληθυσμών είναι ίδιες, τότε η εγγύτητα του μέσου όρου του δείγματος με το γενικό μέσο δεν εξαρτάται από την αναλογία του μεγέθους του δείγματος προς το μέγεθος του γενικού πληθυσμού. Εξαρτάται από το μέγεθος του δείγματος: όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο λιγότερο ο μέσος όρος του δείγματος διαφέρει από τον γενικό μέσο όρο.

Για να χαρακτηριστεί η διασπορά των τιμών ενός ποσοτικού χαρακτηριστικού ενός πληθυσμού γύρω από τη μέση τιμή του, εισάγεται ένα συνοπτικό χαρακτηριστικό - η γενική διασπορά. Γενική διακύμανσηονομάζεται αριθμητικός μέσος όρος των τετραγωνικών αποκλίσεων των τιμών του χαρακτηριστικού του πληθυσμού από τη μέση τιμή τους, ο οποίος υπολογίζεται χρησιμοποιώντας τους τύπους: , ή .

Για να χαρακτηριστεί η διασπορά των παρατηρούμενων τιμών ενός ποσοτικού χαρακτηριστικού ενός δείγματος γύρω από τη μέση τιμή του, εισάγεται ένα συνοπτικό χαρακτηριστικό - διακύμανση δείγματος. Διακύμανση δείγματοςονομάζεται αριθμητικός μέσος όρος των τετραγωνικών αποκλίσεων των παρατηρούμενων τιμών ενός χαρακτηριστικού από τη μέση τιμή τους, ο οποίος υπολογίζεται χρησιμοποιώντας τους τύπους: , ή .

Εκτός από τη διασπορά, για να χαρακτηριστεί η διασπορά των τιμών ενός χαρακτηριστικού του γενικού πληθυσμού (δείγματος) γύρω από τη μέση τιμή του, χρησιμοποιείται ένα συνοπτικό χαρακτηριστικό - η τυπική απόκλιση. Γενική τυπική απόκλισηπου ονομάζεται Τετραγωνική ρίζααπό τη γενική διακύμανση: . Δείγμα τυπικής απόκλισηςονομάζεται τετραγωνική ρίζα της διακύμανσης του δείγματος:

Αφήστε ένα δείγμα όγκου να εξαχθεί από τον γενικό πληθυσμό ως αποτέλεσμα ανεξάρτητων παρατηρήσεων σε ένα ποσοτικό χαρακτηριστικό. Απαιτείται η εκτίμηση της άγνωστης γενικής διακύμανσης με βάση τα δεδομένα του δείγματος. Εάν λάβουμε τη διασπορά του δείγματος ως εκτίμηση της γενικής διακύμανσης, τότε αυτή η εκτίμηση θα οδηγήσει σε συστηματικά σφάλματα, δίνοντας μια υποεκτιμημένη τιμή της γενικής διακύμανσης. Αυτό εξηγείται από το γεγονός ότι η διακύμανση του δείγματος είναι μια μεροληπτική εκτίμηση. Με άλλα λόγια, η μαθηματική προσδοκία της διακύμανσης του δείγματος δεν είναι ίση με την εκτιμώμενη γενική διακύμανση, αλλά είναι ίση με .

Είναι εύκολο να διορθωθεί η διακύμανση του δείγματος έτσι ώστε η αναμενόμενη τιμή της να είναι ίση με τη διακύμανση του πληθυσμού. Για να γίνει αυτό, αρκεί να πολλαπλασιάσουμε με ένα κλάσμα. Ως αποτέλεσμα, λαμβάνουμε τη διορθωμένη διακύμανση, η οποία συνήθως συμβολίζεται με . Η διορθωμένη διακύμανση θα είναι μια αμερόληπτη εκτίμηση της διακύμανσης του πληθυσμού: .

2. Εκτιμήσεις διαστήματος.

Μαζί με τη σημειακή εκτίμηση, η στατιστική θεωρία της εκτίμησης παραμέτρων ασχολείται με θέματα εκτίμησης διαστήματος. Το πρόβλημα της εκτίμησης διαστήματος μπορεί να διατυπωθεί ως εξής: με βάση τα δεδομένα του δείγματος, κατασκευάστε ένα αριθμητικό ουδέτερο, σε σχέση με το οποίο, με προεπιλεγμένη πιθανότητα, μπορούμε να πούμε ότι η εκτιμώμενη παράμετρος βρίσκεται μέσα σε αυτό το διάστημα. Η εκτίμηση διαστήματος είναι ιδιαίτερα απαραίτητη με μικρό αριθμό παρατηρήσεων, όταν η σημειακή εκτίμηση είναι σε μεγάλο βαθμό τυχαία και, επομένως, δεν είναι πολύ αξιόπιστη.

Διάστημα εμπιστοσύνηςγια μια παράμετρο, καλείται ένα τέτοιο διάστημα, σε σχέση με το οποίο είναι δυνατό, με προεπιλεγμένη πιθανότητα κοντά στη μονάδα, να ισχυριστεί κανείς ότι περιέχει μια άγνωστη τιμή της παραμέτρου, δηλ. . Όσο μικρότερος είναι ο αριθμός για την επιλεγμένη πιθανότητα, τόσο πιο ακριβής είναι η εκτίμηση της άγνωστης παραμέτρου. Και το αντίστροφο, εάν αυτός ο αριθμός είναι μεγάλος, τότε η εκτίμηση που γίνεται χρησιμοποιώντας αυτό το διάστημα είναι ελάχιστα χρήσιμη για εξάσκηση. Δεδομένου ότι τα άκρα του διαστήματος εμπιστοσύνης εξαρτώνται από τα στοιχεία του δείγματος, οι τιμές και μπορεί να διαφέρουν από δείγμα σε δείγμα. Η πιθανότητα ονομάζεται συνήθως πιθανότητα εμπιστοσύνης (αξιοπιστία). Συνήθως, η αξιοπιστία της εκτίμησης προσδιορίζεται εκ των προτέρων και ως τιμή λαμβάνεται ένας αριθμός κοντά στο ένα. Η επιλογή της πιθανότητας εμπιστοσύνης δεν είναι μαθηματικό πρόβλημα, αλλά καθορίζεται από το συγκεκριμένο πρόβλημα που επιλύεται. Η αξιοπιστία που ορίζεται πιο συχνά είναι ίση με ; ; .

Ας παρουσιάσουμε χωρίς εξαγωγή ένα διάστημα εμπιστοσύνης για τον γενικό μέσο όρο για μια γνωστή τιμή της τυπικής απόκλισης, με την προϋπόθεση ότι η τυχαία μεταβλητή (ποσοτικό χαρακτηριστικό) κατανέμεται κανονικά:

όπου είναι ένας προκαθορισμένος αριθμός κοντά στο ένα και οι τιμές συνάρτησης δίνονται στο Παράρτημα 2.

Η έννοια αυτής της σχέσης είναι η εξής: μπορεί να δηλωθεί αξιόπιστα ότι το διάστημα εμπιστοσύνης ( ) καλύπτει την άγνωστη παράμετρο, η ακρίβεια της εκτίμησης είναι ίση με . Ο αριθμός καθορίζεται από την ισότητα ή . Χρησιμοποιώντας τον πίνακα (Παράρτημα 2), βρείτε το όρισμα στο οποίο αντιστοιχεί η τιμή της συνάρτησης Laplace, ίση με .

Παράδειγμα 1. Η τυχαία μεταβλητή έχει κανονική κατανομή με γνωστή τυπική απόκλιση. Βρείτε διαστήματα εμπιστοσύνης για την εκτίμηση του άγνωστου γενικού μέσου όρου με βάση τα μέσα δείγματος, εάν δίνεται το μέγεθος του δείγματος και η αξιοπιστία της εκτίμησης.

Λύση. Ας το βρούμε. Από τη σχέση προκύπτει ότι . Χρησιμοποιώντας τον πίνακα (Παράρτημα 2) βρίσκουμε . Ας βρούμε την ακρίβεια της εκτίμησης . Τα διαστήματα εμπιστοσύνης θα είναι: . Για παράδειγμα, εάν , τότε το διάστημα εμπιστοσύνης έχει τα ακόλουθα όρια εμπιστοσύνης: ; . Έτσι, οι τιμές της άγνωστης παραμέτρου, σύμφωνα με τα δεδομένα του δείγματος, ικανοποιούν την ανισότητα .

Διάστημα εμπιστοσύνης για τον γενικό μέσο όρο της κανονικής κατανομής του χαρακτηριστικού στο άγνωστη σημασίαη τυπική απόκλιση δίνεται από την έκφραση .

Από αυτό προκύπτει ότι μπορεί να δηλωθεί αξιόπιστα ότι το διάστημα εμπιστοσύνης καλύπτει την άγνωστη παράμετρο.

Υπάρχουν έτοιμοι πίνακες (Παράρτημα 4), χρησιμοποιώντας τους οποίους, δεδομένων των δεδομένων, μπορεί κανείς να βρει την πιθανότητα και αντίστροφα, με δεδομένους τους δεδομένους, μπορεί να βρει.

Παράδειγμα 2. Τα ποσοτικά χαρακτηριστικά του πληθυσμού κατανέμονται κανονικά. Με βάση το δείγμα όγκου, βρέθηκε ο μέσος όρος του δείγματος και η διορθωμένη τυπική απόκλιση. Υπολογίστε έναν άγνωστο γενικό μέσο όρο χρησιμοποιώντας ένα διάστημα εμπιστοσύνης με αξιοπιστία.

Λύση. Ας το βρούμε. Χρησιμοποιώντας τον πίνακα (Παράρτημα 4) βρίσκουμε: . Ας βρούμε τα όρια εμπιστοσύνης:

Έτσι, με την αξιοπιστία, η άγνωστη παράμετρος περιέχεται στο διάστημα εμπιστοσύνης.

3. Η έννοια της στατιστικής υπόθεσης. Γενική διατύπωση του προβλήματος ελέγχου υποθέσεων.

Ο έλεγχος στατιστικών υποθέσεων σχετίζεται στενά με τη θεωρία της εκτίμησης παραμέτρων. Στις φυσικές επιστήμες, την τεχνολογία και τα οικονομικά, για να διευκρινίσουν το ένα ή το άλλο τυχαίο γεγονός, συχνά καταφεύγουν στην έκφραση υποθέσεων που μπορούν να ελεγχθούν στατιστικά, δηλαδή με βάση τα αποτελέσματα των παρατηρήσεων σε ένα τυχαίο δείγμα. Κάτω από στατιστικές υποθέσειςεννοούνται υποθέσεις που σχετίζονται είτε με τον τύπο είτε με μεμονωμένες παραμέτρους της κατανομής μιας τυχαίας μεταβλητής. Έτσι, για παράδειγμα, η στατιστική υπόθεση είναι ότι η κατανομή της παραγωγικότητας της εργασίας των εργαζομένων που εκτελούν την ίδια εργασία υπό τις ίδιες συνθήκες έχει έναν κανονικό νόμο κατανομής. Η υπόθεση ότι τα μέσα μεγέθη των εξαρτημάτων που παράγονται σε παρόμοια μηχανήματα παράλληλης λειτουργίας δεν διαφέρουν μεταξύ τους θα είναι επίσης στατιστική.

Η στατιστική υπόθεση ονομάζεται απλός, εάν καθορίζει μοναδικά την κατανομή της τυχαίας μεταβλητής, διαφορετικά καλείται η υπόθεση συγκρότημα.Για παράδειγμα, μια απλή υπόθεση είναι η υπόθεση ότι μια τυχαία μεταβλητή κατανέμεται κανονικά με μαθηματική προσδοκίαίσο με μηδέν και διασπορά, ίσο με ένα. Εάν υποτεθεί ότι μια τυχαία μεταβλητή έχει κανονική κατανομή με διακύμανση ίση με ένα και η μαθηματική προσδοκία είναι ένας αριθμός από το διάστημα, τότε αυτή είναι μια σύνθετη υπόθεση. Ένα άλλο παράδειγμα σύνθετης υπόθεσης είναι η υπόθεση ότι μια συνεχής τυχαία μεταβλητή είναι πιθανό να πάρει μια τιμή από το διάστημα, οπότε η κατανομή της τυχαίας μεταβλητής μπορεί να είναι οποιαδήποτε από την κατηγορία συνεχών κατανομών.

Συχνά η κατανομή μιας ποσότητας είναι γνωστή και είναι απαραίτητο να δοκιμαστούν υποθέσεις σχετικά με την τιμή των παραμέτρων αυτής της κατανομής χρησιμοποιώντας ένα δείγμα παρατηρήσεων. Τέτοιες υποθέσεις ονομάζονται παραμετρική.

Η υπόθεση που ελέγχεται ονομάζεται μηδενική υπόθεσηκαι ορίζεται . Μαζί με την υπόθεση, εξετάζεται μια από τις εναλλακτικές (ανταγωνιστικές) υποθέσεις. Για παράδειγμα, εάν ελέγχεται η υπόθεση ότι μια παράμετρος είναι ίση με κάποια δεδομένη τιμή, δηλ. : , τότε μία από τις ακόλουθες υποθέσεις μπορεί να θεωρηθεί ως εναλλακτική υπόθεση: : ; : ; : ; : , όπου είναι η καθορισμένη τιμή, . Η επιλογή μιας εναλλακτικής υπόθεσης καθορίζεται από τη συγκεκριμένη διατύπωση του προβλήματος.

Ο κανόνας με τον οποίο λαμβάνεται η απόφαση για αποδοχή ή απόρριψη μιας υπόθεσης ονομάζεται κριτήριο. Δεδομένου ότι η απόφαση λαμβάνεται με βάση ένα δείγμα παρατηρήσεων μιας τυχαίας μεταβλητής, είναι απαραίτητο να επιλεγεί ένα κατάλληλο στατιστικό στοιχείο, που στην περίπτωση αυτή ονομάζεται στατιστική κριτηρίου. Κατά τον έλεγχο μιας απλής παραμετρικής υπόθεσης: επιλέγονται τα ίδια στατιστικά στοιχεία ως στατιστικά κριτηρίου όπως και για την εκτίμηση της παραμέτρου.

Ο έλεγχος στατιστικών υποθέσεων βασίζεται στην αρχή ότι τα γεγονότα χαμηλής πιθανότητας θεωρούνται αδύνατα και τα γεγονότα που έχουν υψηλή πιθανότητα θεωρούνται αξιόπιστα. Αυτή η αρχή μπορεί να εφαρμοστεί ως εξής. Πριν από την ανάλυση του δείγματος, καθορίζεται μια ορισμένη μικρή πιθανότητα, που ονομάζεται επίπεδο σημασίας. Έστω ένα σύνολο στατιστικών τιμών και έστω ένα υποσύνολο έτσι ώστε, υπό την προϋπόθεση ότι η υπόθεση είναι αληθής, η πιθανότητα να εμπίπτει η στατιστική του κριτηρίου είναι ίση με, δηλ. .

Ας υποδηλώσουμε με την τιμή δείγματος των στατιστικών που υπολογίζονται από ένα δείγμα παρατηρήσεων. Το κριτήριο διατυπώνεται ως εξής: απορρίψτε την υπόθεση εάν ; αποδεχτείτε την υπόθεση εάν . Ένα κριτήριο που βασίζεται στη χρήση ενός προκαθορισμένου επιπέδου σημασίας ονομάζεται κριτήριο σημαντικότητας. Το σύνολο όλων των τιμών των στατιστικών του κριτηρίου στο οποίο λαμβάνεται απόφαση για απόρριψη της υπόθεσης ονομάζεται κρίσιμη περιοχή; η περιοχή λέγεται περιοχή υιοθεσίαςυποθέσεις.

Το επίπεδο σημαντικότητας καθορίζει το μέγεθος της κρίσιμης περιοχής. Η θέση της κρίσιμης περιοχής στο σύνολο των στατιστικών τιμών εξαρτάται από τη διατύπωση της εναλλακτικής υπόθεσης. Για παράδειγμα, εάν η υπόθεση ελεγχθεί: , και η εναλλακτική υπόθεση διατυπωθεί ως: (), τότε η κρίσιμη περιοχή βρίσκεται στη δεξιά (αριστερά) «ουρά» της στατιστικής κατανομής, δηλαδή έχει τη μορφή ανισότητας: (), πού και είναι εκείνες οι στατιστικές τιμές που γίνονται δεκτές με πιθανότητες αναλόγως και υπό την προϋπόθεση ότι η υπόθεση είναι αληθής. Σε αυτή την περίπτωση το κριτήριο καλείται μονόπλευρη, δεξιόχειρας και αριστερόχειρας, αντίστοιχα. Εάν η εναλλακτική υπόθεση διατυπωθεί ως εξής: , τότε η κρίσιμη περιοχή βρίσκεται και στις δύο «ουρές» της κατανομής, δηλ. προσδιορίζεται από ένα σύνολο ανισοτήτων και ; σε αυτή την περίπτωση το κριτήριο ονομάζεται αμφίδρομη.

Στο Σχ. Το Σχήμα 30 δείχνει τη θέση της κρίσιμης περιοχής για διάφορες εναλλακτικές υποθέσεις. Εδώ είναι η πυκνότητα κατανομής των στατιστικών του κριτηρίου, με την προϋπόθεση ότι η υπόθεση είναι αληθής, είναι η περιοχή αποδοχής της υπόθεσης, .

Έτσι, ο έλεγχος μιας παραμετρικής στατιστικής υπόθεσης χρησιμοποιώντας ένα τεστ σημαντικότητας μπορεί να χωριστεί στα ακόλουθα στάδια:

1) διατυπώστε υποθέσεις που μπορούν να ελεγχθούν () και εναλλακτικές ()·

2) να ορίσετε ένα επίπεδο σημασίας. ως ασυνεπής με τα αποτελέσματα των παρατηρήσεων· αν , τότε αποδεχτείτε την υπόθεση, δηλ. υποθέστε ότι η υπόθεση δεν έρχεται σε αντίθεση με τα αποτελέσματα της παρατήρησης.

Συνήθως, κατά την εκτέλεση των βημάτων 4 - 7, χρησιμοποιούνται στατιστικά στοιχεία των οποίων τα ποσά είναι πινακοποιημένα: στατιστικά με κανονική κατανομή, στατιστικά μαθητών, στατιστικά Fisher.

Παράδειγμα 3. Σύμφωνα με τα στοιχεία διαβατηρίου του κινητήρα του αυτοκινήτου, η κατανάλωση καυσίμου ανά 100 χλμχιλιόμετρα είναι 10 l. Ως αποτέλεσμα της αλλαγής του σχεδιασμού του κινητήρα, η κατανάλωση καυσίμου αναμένεται να μειωθεί. Πραγματοποιούνται δοκιμές για επαλήθευση 25 τυχαία επιλεγμένα αυτοκίνητα με αναβαθμισμένο κινητήρα, με δείγμα μέσης κατανάλωσης καυσίμου ανά 100 χλμτα χιλιόμετρα σύμφωνα με τα αποτελέσματα των δοκιμών ήταν 9,3 λίτρα. Ας υποθέσουμε ότι το δείγμα κατανάλωσης καυσίμου προέρχεται από έναν κανονικά κατανεμημένο πληθυσμό με μέσο όρο και διακύμανση. Υπό την προϋπόθεση ότι η υπόθεση της κρίσιμης περιοχής για τις αρχικές στατιστικές είναι αληθής, δηλαδή ίση με το επίπεδο σημαντικότητας. Βρείτε τις πιθανότητες σφαλμάτων του πρώτου και του δεύτερου τύπου για ένα κριτήριο με τόσο κρίσιμη περιοχή. έχει κανονική κατανομή με μαθηματική προσδοκία ίση με και διακύμανση ίση με . Βρίσκουμε την πιθανότητα σφάλματος δεύτερου τύπου χρησιμοποιώντας τον τύπο (11.2):

Επομένως, σύμφωνα με το αποδεκτό κριτήριο, το 13,6% των αυτοκινήτων με κατανάλωση καυσίμου 9 lεπί 100 χλμΤα χιλιόμετρα ταξινομούνται ως οχήματα με κατανάλωση καυσίμου 10 l.

4. Θεωρητικές και εμπειρικές συχνότητες. Κριτήρια συναίνεσης.

Εμπειρικές συχνότητες- συχνότητες που αποκτήθηκαν ως αποτέλεσμα εμπειρίας (παρατήρηση). Θεωρητικές συχνότητεςυπολογίζονται χρησιμοποιώντας τύπους. Για τον κανονικό νόμο κατανομής μπορούν να βρεθούν ως εξής:

, (11.3)

για αυτοπροετοιμασία για ένα πρακτικό μάθημα στα μαθηματικά

Θέμα: Στατιστική κατανομή δειγμάτων, διακριτές και διαλειμματικές σειρές διακύμανσης. Σημειακές και διαστημικές εκτιμήσεις παραμέτρων κατανομής. Σφάλματα μέτρησης και οι εκτιμήσεις τους.

Συνάφεια του θέματος: εξοικείωση με τις βασικές έννοιες και μεθόδους της μαθηματικής στατιστικής ως μέσο επίλυσης προβλημάτων φυσικής, χημικής, βιολογικής και άλλης φύσης που συναντώνται τόσο στη διαδικασία μελέτης εξειδικευμένων κλάδων όσο και σε περαιτέρω επαγγελματικές δραστηριότητες

Σκοπός του μαθήματος: μάθουν να κατασκευάζουν στατιστικές σειρές για διακριτές και συνεχείς τυχαίες μεταβλητές και υπολογίζουν σημειακές εκτιμήσεις γενικών παραμέτρων, υπολογίζουν σφάλματα σε άμεσες και έμμεσες μετρήσεις.

Σχέδιο μελέτης θέματος

1. Βασικά προβλήματα της μαθηματικής στατιστικής.

2. Γενικοί και δειγματοληπτικοί πληθυσμοί.

3. Σειρές διακριτών παραλλαγών και η γραφική αναπαράστασή της.

4. Σειρά παραλλαγής διαστήματος και η γραφική αναπαράστασή της. Είδη στατιστικών εκτιμήσεων.

5. Απαιτήσεις για στατιστικές αξιολογήσεις.

6. Οι έννοιες των γενικών και δειγματοληπτικών μέσων.

7. Έννοιες γενικών, δειγμάτων και διορθωμένων διακυμάνσεων.

8. Έννοιες γενικής, δείγματος και διορθωμένης τυπικής απόκλισης.

Κύρια βιβλιογραφία:

1. Morozov, Yu.V. Βασικές αρχές ανώτερων μαθηματικών και στατιστικής: εγχειρίδιο. για φοιτητές ιατρικής και φαρμακοποιός. πανεπιστήμια και τμήματα/Yu.V. Μορόζοφ.-

Μ.: Ιατρική, 2004.-232 σελ.

2. Βασικές αρχές ανώτερων μαθηματικών και μαθηματικές στατιστικές: εγχειρίδιο. για φοιτητές ιατρικής και φαρμακοποιός. πανεπιστήμια/I.V. Pavlushkov, L.V. Rozovsky, A.E. Kapultsevich καιάλλο - 2η έκδ., αναθεωρημένη - M.: GOETAR -

ΜΜΕ, 2006.-423 σελ.

Πρόσθετη βιβλιογραφία:

Μεθοδολογικές συστάσεις για πρακτικά μαθήματαστα ανώτερα μαθηματικά [Ηλεκτρονικός πόρος]:εκπαιδευτική μέθοδος. εγχειρίδιο για πανεπιστήμια/συγγραφέας-σύν. : T.A. Novichkova; GOU VPO "Kursk State Medical University", τμήμα. φυσική, πληροφορική και μαθηματικά.-Kursk: KSMU, 2009.

Gmurman V.E. Θεωρία και μαθηματική στατιστική. Μ. «Γυμνάσιο», εφ. 5, 2004.

Ερωτήσεις για αυτοέλεγχο:

1) Ορισμός στατιστικών σειρών.

2) Ορισμός του πληθυσμού.

3) Ορισμός του πληθυσμού του δείγματος.

4) Αντιπροσωπευτικότητα του δείγματος.

5) Τύποι δειγμάτων.

6) Πώς ονομάζεται μια παραλλαγή;

7) Καθορισμός κατάταξης.

8) Προσδιορισμός συχνότητας, σχετικής συχνότητας, συσσωρευμένης συχνότητας.

9) Αλγόριθμος για την κατασκευή μιας σειράς μεταβολών διαστήματος.

10) Ορισμός πολυγώνου, αθροιστική (διακεκριμένη σειρά παραλλαγής).

11) Ορισμός ιστογράμματος, συσσώρευση (σειρές μεταβολών διαστήματος), προσδιορισμός στατιστικής εκτίμησης.

12) ποιες είναι οι απαιτήσεις για στατιστικές αξιολογήσεις;

13) Ποια στατιστική εκτίμηση ονομάζεται προκατειλημμένη ή αμερόληπτη;

14) τύπους για τον υπολογισμό του γενικού μέσου όρου και του μέσου όρου του δείγματος για ομαδοποιημένα και μη ομαδοποιημένα δεδομένα.

15) τύπους για τον υπολογισμό των διακυμάνσεων πληθυσμού και δείγματος για ομαδοποιημένα και μη ομαδοποιημένα δεδομένα.

16) Ποια εκτίμηση είναι η μέση τιμή του δείγματος για τη γενική μέση τιμή;

17) Ποια εκτίμηση είναι η διακύμανση του δείγματος για τη γενική διακύμανση;

18) Τύπος για τον υπολογισμό της διορθωμένης τυπικής απόκλισης.

19) Ποιες μετρήσεις ονομάζονται άμεσες;

20) Τι σημαίνει το αληθινό απόλυτο σφάλμα της τιμής Χ;

21) Ποια λαμβάνεται ως η πραγματική τιμή του Χ;

22) Ποια είναι μια σημειακή εκτίμηση της πραγματικής τιμής του X;

23) Ποια είναι η εκτίμηση της διακύμανσης του X;

25) Πώς να βρείτε τα όρια του διαστήματος εμπιστοσύνης για την πραγματική τιμή του X;

26) Ποιες μετρήσεις ονομάζονται έμμεσες;

27) Αν y = f(x1, x2, ..., xn), τότε ποιος τύπος χρησιμοποιείται για τον υπολογισμό του ριζικού μέσου τετραγώνου σφάλματος της μέσης τιμής y;

28) Ποιος τύπος χρησιμοποιείται για να βρεθεί το απόλυτο σφάλμα y: y ?

29) Πώς να βρείτε το σχετικό σφάλμα y:ε y ?

Εργασίες αυτοδιδασκαλίας:

1. Ως αποτέλεσμα ξεχωριστών δοκιμών της δραστηριότητας της τετρακυκλίνης, ελήφθησαν οι ακόλουθες τιμές (σε μονάδες δράσης ανά 1 mg): 925, 940, 760, 905, 995, 965, 940, 925, 940, 905. έως συντάσσουν μια σειρά διανομής. Κατασκευάστε ένα πολύγωνο, σωρεύστε.

2. Κατασκευάστε ένα ιστόγραμμα σχετικών συχνοτήτων σύμφωνα με την κατανομή του δείγματος: 11, 15, 16, 18, 15.5, 19, 20.1, 20.9, 23, 24.5, 23, 21, 23.9, 24.6, 25.5.2, 20.5 32.

3. Βρείτε τη διορθωμένη τυπική απόκλιση από μια δεδομένη κατανομή δειγματοληψίας

Οδηγίες δράσης:

1. Μάθετε βασικές έννοιες για το θέμα

2. Απαντήστε σε ερωτήσεις για αυτοέλεγχο

3. Εργαστείτε με παραδείγματα επίλυσης προβλημάτων στο θέμα

4. Ολοκληρώστε εργασίες για αυτοέλεγχο

5. Λύστε τεστ για το θέμα

Αφού μελετήσει αυτό το θέμα, ο μαθητής πρέπει να γνωρίζει: η έννοια μιας σειράς παραλλαγών, τα είδη της και η γραφική τους αναπαράσταση,

έννοιες της στατιστικής αξιολόγησης, τα είδη τους, απαιτήσεις για αξιολογήσεις, έννοιες γενικών και δειγματοληπτικών μέσων, γενικές και δειγματοληπτικές αποκλίσεις. να είναι σε θέση: να κατασκευάζει στατιστικές σειρές για διακριτές και συνεχείς τυχαίες μεταβλητές και να υπολογίζει σημειακές εκτιμήσεις γενικών παραμέτρων, να υπολογίζει σφάλματα σε άμεσες και έμμεσες μετρήσεις.

Σύντομη θεωρία

Στατιστικά μαθηματικώνείναι ένας κλάδος των εφαρμοσμένων μαθηματικών αφιερωμένος σε μεθόδους συλλογής, ομαδοποίησης και ανάλυσης στατιστικών πληροφοριών που λαμβάνονται ως αποτέλεσμα παρατηρήσεων ή πειραμάτων.

Από εδώ ακολουθούν τα προβλήματα της μαθηματικής στατιστικής:

μέθοδοι επιλογής στατιστικών δεδομένων.

τρόποι ομαδοποίησης στατιστικών δεδομένων.

μέθοδοι ανάλυσης δεδομένων:

εκτίμηση των παραμέτρων μιας γνωστής κατανομής.

Εκτίμηση άγνωστης συνάρτησης κατανομής.

αξιολόγηση της εξάρτησης μιας τυχαίας μεταβλητής από άλλες.

έλεγχος στατιστικών υποθέσεων.

μέθοδοι για τον προσδιορισμό του αριθμού των παρατηρήσεων (προγραμματισμός πειράματος).

λαμβάνοντας αποφάσεις.

ΣΕ μαθηματική στατιστική, συσχετίζεται η μελέτη μιας τυχαίας μεταβλητής

Με εκτελώντας μια σειρά από ανεξάρτητα πειράματα στα οποία παίρνει ορισμένες τιμές.

Στατιστικός πληθυσμός– ένα σύνολο αντικειμένων που είναι ομοιογενή ως προς κάποιο ποιοτικό ή ποσοτικό χαρακτηριστικό.

Για παράδειγμα, εάν υπάρχει μια σειρά από δισκία μιας φαρμακευτικής ουσίας, τότε η τυπικότητα του δισκίου μπορεί να χρησιμεύσει ως ποιοτικό σημάδι και το ελεγχόμενο βάρος του δισκίου μπορεί να χρησιμεύσει ως ποσοτικό σημάδι.

Πληθυσμός– ένα σύνολο που αποτελείται από όλα τα αντικείμενα που μπορούν να του αποδοθούν.

Θεωρητικά, αυτό μπορεί να ισχύει. μια απείρως μεγάλη ή πλησιάζει στο άπειρο συλλογή.

Για παράδειγμα, όλοι οι ασθενείς με ρευματισμούς σφαίρα- γενικός πληθυσμός. Στην πραγματικότητα, αυτό είναι εντός συγκεκριμένων ορίων (πόλη, περιοχή).

Ο αριθμός των αντικειμένων σε έναν πληθυσμό ονομάζεται όγκος του και συμβολίζεται με Ν.

Πληθυσμός δείγματος– ένα σύνολο αντικειμένων που επιλέγονται τυχαία από τον γενικό πληθυσμό.

Ο αριθμός των αντικειμένων στο δείγμα ονομάζεται όγκος του και συμβολίζεται με n.

Προκειμένου οι ιδιότητες του δείγματος να αντικατοπτρίζουν τις ιδιότητες του πληθυσμού αρκετά καλά, το δείγμα πρέπει να είναι αντιπρόσωπος (αντιπρόσωπος).

Αυτή η απαίτηση διασφαλίζει ότι η επιλογή των στοιχείων στο δείγμα είναι τυχαία, δηλ. οποιοδήποτε αντικείμενο είναι εξίσου πιθανό να συμπεριληφθεί στο δείγμα.

Ανάλογα με την τεχνική επιλογής αντικειμένων από τον γενικό πληθυσμό, τα δείγματα χωρίζονται σε:

Αλλεπάλληλος

Ανεπανάληπτο

(το επιλεγμένο αντικείμενο επιστρέφεται

(το επιλεγμένο αντικείμενο δεν επιστρέφεται

στο γενικό πληθυσμό)

στο γενικό πληθυσμό)

Στην πράξη, χρησιμοποιείται μη επαναλαμβανόμενη δειγματοληψία.

Με μεγάλους όγκους Ν του γενικού πληθυσμού και μικρό σχετικό όγκο n/N του δείγματος, οι διαφορές στους τύπους που περιγράφουν και τα δύο δείγματα σύμφωνα με την τεχνική της επιλογής τους είναι μικρές.

Διακεκριμένη διανομή σειρών

Οι παρατηρούμενες τιμές ενός χαρακτηριστικού ονομάζονται παραλλαγές. Κατάταξη – επιλογή διάταξης σε αύξουσα σειρά, ή

φθίνων

Σειρά παραλλαγήςονομάζεται μια ταξινομημένη σειρά επιλογών και οι αντίστοιχες συχνότητές τους.

Κατανομή στατιστικών δειγμάτωνκαλέστε μια λίστα επιλογών και τις αντίστοιχες συχνότητες ή τις σχετικές συχνότητες.

Ας εξαχθεί ένα δείγμα μεγέθους n από τον γενικό πληθυσμό. Η ποσοτική τιμή του υπό μελέτη χαρακτηριστικού x1 εμφανίστηκε m1 φορές, x2 – m 2

φορές, …, x k – m k φορές.

Επιπλέον, ∑ m i = n

i =1

Οι αριθμοί mi ονομάζονται συχνότητες και οι λόγοι τους προς το μέγεθος δείγματος n ονομάζονται σχετικές συχνότητες pi =mi /n. Επιπλέον, Σpi =1.

Για την περίπτωση που ένα ποσοτικό χαρακτηριστικό είναι διακριτό, οι τιμές του και οι αντίστοιχες συχνότητες ή σχετικές συχνότητες παρουσιάζονται με τη μορφή πίνακα.

pi =mi/n

πι * =

m1/n

(m1 +m2 )/n

mi*/n

Κατά τη μελέτη σειρών παραλλαγών, μαζί με την έννοια της συχνότητας, χρησιμοποιείται η συσσωρευμένη συχνότητα (mi *). Η συσσωρευμένη συχνότητα δείχνει πόσες παραλλαγές παρατηρήθηκαν με τιμή χαρακτηριστικού μικρότερη από x.

Ο λόγος της συσσωρευμένης συχνότητας mi * προς τον συνολικό αριθμό των παρατηρήσεων n ονομάζεται σχετική συχνότητα pi * = mi * /n.

Γραφική αναπαράσταση διακριτής στατιστικής σειράς – πολύγωνο συχνοτήτων (σχετική).

Το πολύγωνο χρησιμεύει για την απεικόνιση μιας διακριτής σειράς παραλλαγής και είναι μια διακεκομμένη γραμμή στην οποία τα άκρα των ευθύγραμμων τμημάτων έχουν συντεταγμένες (xi, mi) ή (xi, pi) στην περίπτωση ενός πολυγώνου σχετικών συχνοτήτων.

Διαστημικές στατιστικές σειρές.

Στην περίπτωση μεγάλου αριθμού επιλογών (n>50) και συνεχούς κατανομής του χαρακτηριστικού, η στατιστική κατανομή του χαρακτηριστικού μπορεί να καθοριστεί ως ακολουθία διαστημάτων και των αντίστοιχων συχνοτήτων τους.

Συχνότερα χρησιμοποιούνται σειρές με ίσο διάστημα.

Πρέπει να επιλέξετε το σωστό πλάτος διαστήματος κλάσης. Ο αριθμός των διαστημάτων πρέπει να εξαρτάται από το εύρος του δείγματος και τον όγκο του.

Αλγόριθμος για την κατασκευή ιστογράμματος.

1. Δίνεται ένα δείγμα X = (x 1, x 2, ..., x n); n – ο όγκος του

Εύρος δειγμάτων D = x max – x min

2. Αριθμός τάξεων

K = 1 + 3,32 × log n (τύπος Sturgess για n< 100 )

K = 5 × log n (τύπος Brooks για n > 100)

3. Η τιμή του διαστήματος κλάσης D x = D / K

4. Όρια και μεσαία σημεία μερικών διαστημάτων

x1l = xmin – D x / 2

x1pr = x2l = xmin + D x / 2

x 1 = x min

x 2 = x 1 + D x

5. Συχνότητες πτώσης στο διάστημα:

σειρά παραλλαγών και είναι ένα κλιμακωτό σχήμα ορθογωνίων με βάσεις ίσες με τα διαστήματα των τιμών των χαρακτηριστικών xi =xi+1 -xi, i=1,2,…,k και ύψη ίσα με τις συχνότητες (σχετικές συχνότητες) mi (pi ) των διαστημάτων.

Εάν συνδέσετε τα μέσα των άνω βάσεων των ορθογωνίων με ευθύγραμμα τμήματα, μπορείτε να πάρετε ένα πολύγωνο της ίδιας κατανομής.

Εμπειρική συνάρτηση κατανομής Για να πάρετε μια ιδέα της κατανομής της τυχαίας

Οι τιμές X, για τις οποίες ο νόμος κατανομής είναι άγνωστος, κατασκευάζουν μια εμπειρική συνάρτηση κατανομής.

Η εμπειρική συνάρτηση κατανομής (συνάρτηση κατανομής δείγματος) είναι η συνάρτηση F* (x), η οποία καθορίζει για κάθε τιμή x τη σχετική συχνότητα του γεγονότος X

, όπου m* είναι ο αριθμός των παρατηρήσεων στις οποίες η τιμή του χαρακτηριστικού X παρατηρήθηκε μικρότερη από x.

Η συνάρτηση κατανομής πληθυσμού ονομάζεται θεωρητική συνάρτηση.

Η διαφορά μεταξύ της εμπειρικής και της θεωρητικής συνάρτησης είναι ότι η θεωρητική συνάρτηση καθορίζει την πιθανότητα του γεγονότος X<х, а эмпирическая – относительную частоту данного события.

Έννοια της στατιστικής αξιολόγησης.

Απαιτείται η μελέτη ενός ποσοτικού χαρακτηριστικού του γενικού πληθυσμού. Ας πούμε ότι γνωρίζουμε τον νόμο κατανομής του πληθυσμού. Αυτός ο νόμος καθορίζεται από πολλές παραμέτρους. Τα δείγματα δεδομένων χρησιμοποιούνται για την εκτίμηση άγνωστων παραμέτρων πληθυσμού.

Στατιστική αξιολόγησηΜια άγνωστη παράμετρος της κατανομής του πληθυσμού ονομάζεται συνάρτηση παρατηρούμενων τυχαίων μεταβλητών.

Ας υποδηλώσουμε:

θ – άγνωστη παράμετρος. θ* – στατιστική αξιολόγηση άγνωστης παραμέτρου. θ* = f (x 1, x 2, …, x n)

Η στατιστική εκτίμηση του θ* είναι τυχαία μεταβλητή, επομένως, έχει διασπορά και τυπική απόκλιση, καθώς και σφάλμα αντιπροσωπευτικότητας (απόκλιση του δείκτη δείγματος από το γενικό).

Υπάρχουν δύο τύποι στατιστικών εκτιμήσεων: σημείου και διαστήματος.

Μια εκτίμηση με έναν μόνο αριθμό που εξαρτάται από τα δεδομένα του δείγματος ονομάζεται σημειακή εκτίμηση.

Μια εκτίμηση με δύο αριθμούς που είναι τα άκρα ενός διαστήματος ονομάζεται διάστημα.

Απαιτήσεις για σημειακές στατιστικές εκτιμήσεις.

Η ποιότητα της αξιολόγησης δεν καθορίζεται από ένα συγκεκριμένο δείγμα, αλλά από

σε ολόκληρο το νοητό σύνολο συγκεκριμένων δειγμάτων, δηλ. σε όλο το σύνολο

σημειακές εκτιμήσεις θ i * της άγνωστης παραμέτρου θ .

Για να δίνουν καλά οι στατιστικές εκτιμήσεις

προσέγγιση των εκτιμώμενων παραμέτρων, πρέπει να ικανοποιούν

τις ακόλουθες απαιτήσεις:

αμερόληπτο (χωρίς συστηματικά σφάλματα

οποιοδήποτε μέγεθος δείγματος M(θ *) = θ);

αποδοτικότητα (μεταξύ όλων των πιθανών εκτιμήσεων, αποτελεσματική

η εκτίμηση έχει τη μικρότερη διακύμανση min D(θ *) ).

πλούτος

(επιδίωξη

πιθανότητες

η εκτιμώμενη παράμετρος ως n → ∞, δηλ. θ * ¾¾ ¾ ® θ );

n →∞

Γενικός

Σημειακή εκτίμηση

Ιδιότητες

παράμετρος

βαθμολογική εκτίμηση

M(X) = xr =

Μη μετατοπίσιμο

x in = ∑ x i

= ∑ m i x i δείγμα

Αποτελεσματικός

∑x i

i = 1

i = 1

Πλούσιος

N i = 1

Ασυμπτωτικά

− x

− x

αμερόληπτη, δηλ.

М(Dв) ¹ σг 2, αλλά

n i = 1

n i = 1

D(X) = σ g =

διακύμανση δείγματος

) = σ

− x i )

n →∞

N i = 1

S 2 =

Δ διορθώθηκε

n - 1

Μη μετατοπίσιμο

διασπορά

δ σε =

Μετατοπίσιμο

(πρότυπο)

σ g =

σ g 2

διορθώθηκε

ρίζα μέσο τετράγωνο

Αμερόληπτος

απόκλιση

είναι μια τυχαία μεταβλητή, τότε έχει διακύμανση –

xv

δείγμα μέσης διακύμανσης:

× n × S 2 =

) = Δ(

∑ xi ) =

D(∑ xi ) =

∑ D(xi ) =

∑(xi−

n(n − 1) i =1

Ακρίβεια, αξιοπιστία αξιολόγησης

Εκτίμηση διαστήματοςονομάζεται εκτίμηση που καθορίζεται από δύο αριθμούς - τα άκρα του διαστήματος.

Οι εκτιμήσεις διαστήματος σάς επιτρέπουν να καθορίσετε την ακρίβεια και την αξιοπιστία μιας σημειακής εκτίμησης.

Έστω q * μια σημειακή εκτίμηση της άγνωστης παραμέτρου q, η οποία είναι μια τυχαία μεταβλητή.

Όσο μικρότερο είναι το ½q - q * ½, τόσο ακριβέστερα το q * καθορίζει την παράμετρο q.

Αν δ > 0 και ½q - q * ½< δ , то чем меньше δ , тем точнее оценка. Число

δ λέγεται ακρίβεια αξιολόγησης.

ΣΕ δύναμη της τύχης q * μπορούμε να μιλήσουμε μόνο για την πιθανότητα της ανισότητας ½q - q * ½< e .

Αξιοπιστία (πιθανότητα εμπιστοσύνης) της εκτίμησης q * που ονομάζεται πιθανότητασολ , με την οποία πραγματοποιείται η ανισότητα½q - q * ½< δ .

Τυπικά g = 0,95; 0,99; 0,999…P(|Θ-Θ*|< δ)=γ

Μερικές φορές λέγεται ότι η πιθανότητα εμπιστοσύνης g χαρακτηρίζει τον βαθμό εμπιστοσύνης μας ότι το διάστημα εμπιστοσύνης θα καλύψει την παράμετρο q.

P (q * - e< q < q * + e} = g означает, что вероятность того, что интервал (q * - e ; q * + e ) заключает в себе неизвестный параметр q , равна g :

Πιθανότητα μια άγνωστη παράμετρος να μην εμπίπτει στο διάστημα ½q - q * ½< e , равна 1 - g = a (уровень значимости).

Το επίπεδο σημαντικότητας (ρίσκο) είναι η πιθανότητα ο συντελεστής απόκλισης του εμπειρικού χαρακτηριστικού από το θεωρητικό να υπερβεί το μέγιστο σφάλμα P(|Θ-Θ*|< ∆)=γ , предельная ошибка – максимально допустимая |Θ-Θ*|< ∆

Κατανομή μαθητών

Έστω X ~ N(μ,σ), και οι παράμετροι κατανομής είναι άγνωστες.

Ας εξετάσουμε την κατανομή της ποσότητας T = x σε − μ.

Η κατανομή της τιμής T με f=n-1 βαθμούς ελευθερίας ονομάζεται κατανομή t ή κατανομή Student.

Η συνάρτηση πυκνότητας πιθανότητας φ(t) εξαρτάται από τον αριθμό των βαθμών ελευθερίας και δεν εξαρτάται από τη διασπορά των τυχαίων μεταβλητών.

Καθώς ο αριθμός των βαθμών ελευθερίας αυξάνεται, η κατανομή αυτής της ποσότητας προσεγγίζει την κανονική

Μια εκτίμηση διαστήματος της μαθηματικής προσδοκίας για μια άγνωστη διακύμανση είναι το διάστημα

(x - tγ (f) × Sx; x + tγ (f) × Sx)

Διαστημική εκτίμηση της μαθηματικής προσδοκίας με γνωστό

διακύμανση είναι το διάστημα

(x - uα × Sx; x + uα × Sx)

Φ (u α ) = 1− α είναι η συνάρτηση Laplace.

Παραδείγματα επίλυσης προβλημάτων

1) Παρουσιάστε το με τη μορφή στατιστικής διακριτής σειράς, κατασκευάστε ένα πολύγωνο συχνοτήτων, σχετικών συχνοτήτων, αθροιστική καμπύλη (καμπύλη συσσωρευμένης συχνότητας): 6.7; 6.8; 7; 6.5; 7.3; 7; 7.2; 6.9; 7.1; 6.8; 7.1; 6.8; 7.1; 7.2; 6.8; 6.9;

7; 6,7; 6,6; 6,3; 7,5; 6,9.

Λύση. mi – συχνότητα, p – σχετική συχνότητα, pi * – συσσωρευμένη σχετική συχνότητα

πι*

Πολύγωνο συχνότητας

Στατιστικές εκτιμήσεις παραμέτρων πληθυσμού. Στατιστικές υποθέσεις

ΔΙΑΛΕΞΗ 16

Ας είναι απαραίτητο να μελετήσουμε ένα ποσοτικό χαρακτηριστικό ενός γενικού πληθυσμού. Ας υποθέσουμε ότι, από θεωρητικές εκτιμήσεις, μπορέσαμε να καθορίσουμε ποια ακριβώς κατανομή έχει το χαρακτηριστικό. Αυτό εγείρει το πρόβλημα της εκτίμησης των παραμέτρων που καθορίζουν αυτήν την κατανομή. Για παράδειγμα, εάν είναι γνωστό ότι το χαρακτηριστικό που μελετάται κατανέμεται στον γενικό πληθυσμό σύμφωνα με έναν κανονικό νόμο, τότε είναι απαραίτητο να εκτιμηθεί (περίπου να βρεθεί) η μαθηματική προσδοκία και η τυπική απόκλιση, καθώς αυτές οι δύο παράμετροι καθορίζουν πλήρως την κανονική κατανομή . Εάν υπάρχουν λόγοι να πιστεύουμε ότι το χαρακτηριστικό έχει κατανομή Poisson, τότε είναι απαραίτητο να εκτιμηθεί η παράμετρος με την οποία προσδιορίζεται αυτή η κατανομή.

Συνήθως, σε μια κατανομή, ο ερευνητής έχει μόνο δείγματα δεδομένων, για παράδειγμα, τιμές ενός ποσοτικού χαρακτηριστικού που λαμβάνονται ως αποτέλεσμα παρατηρήσεων (εφεξής, οι παρατηρήσεις θεωρούνται ανεξάρτητες). Η εκτιμώμενη παράμετρος εκφράζεται μέσω αυτών των δεδομένων.

Θεωρώντας ως τιμές ανεξάρτητων τυχαίων μεταβλητών , μπορούμε να πούμε ότι η εύρεση μιας στατιστικής εκτίμησης μιας άγνωστης παραμέτρου μιας θεωρητικής κατανομής σημαίνει εύρεση μιας συνάρτησης παρατηρούμενων τυχαίων μεταβλητών, η οποία δίνει μια κατά προσέγγιση τιμή της εκτιμώμενης παραμέτρου. Για παράδειγμα, όπως θα φανεί παρακάτω, για να εκτιμήσετε τη μαθηματική προσδοκία μιας κανονικής κατανομής, χρησιμοποιήστε τη συνάρτηση (ο αριθμητικός μέσος όρος των παρατηρούμενων τιμών του χαρακτηριστικού):

.

Ετσι, στατιστική αξιολόγησηΜια άγνωστη παράμετρος μιας θεωρητικής κατανομής ονομάζεται συνάρτηση παρατηρούμενων τυχαίων μεταβλητών. Καλείται μια στατιστική εκτίμηση μιας παραμέτρου άγνωστου πληθυσμού, γραμμένη ως ενιαίος αριθμός σημείο. Εξετάστε τις ακόλουθες εκτιμήσεις σημείων: προκατειλημμένες και αμερόληπτες, αποτελεσματικές και συνεπείς.

Προκειμένου οι στατιστικές εκτιμήσεις να παρέχουν «καλές» προσεγγίσεις των εκτιμώμενων παραμέτρων, πρέπει να πληρούν ορισμένες απαιτήσεις. Ας υποδείξουμε αυτές τις απαιτήσεις.

Έστω ότι υπάρχει μια στατιστική εκτίμηση μιας άγνωστης παραμέτρου της θεωρητικής κατανομής. Ας υποθέσουμε ότι κατά τη δειγματοληψία του όγκου, βρίσκεται μια εκτίμηση. Ας επαναλάβουμε το πείραμα, δηλαδή θα εξαγάγουμε ένα άλλο δείγμα ίδιου μεγέθους από τον γενικό πληθυσμό και θα χρησιμοποιήσουμε τα δεδομένα του για να βρούμε μια εκτίμηση κ.λπ. Επαναλαμβάνοντας το πείραμα πολλές φορές, παίρνουμε τους αριθμούς , τα οποία, σε γενικές γραμμές, θα διαφέρουν μεταξύ τους. Έτσι, η βαθμολογία μπορεί να θεωρηθεί ως τυχαία μεταβλητή και οι αριθμοί – ως πιθανές έννοιές του.

Είναι σαφές ότι εάν η εκτίμηση δίνει μια κατά προσέγγιση τιμή με υπέρβαση, τότε κάθε αριθμός που θα βρεθεί από τα δεδομένα του δείγματος θα είναι μεγαλύτερος από την πραγματική τιμή. Κατά συνέπεια, σε αυτή την περίπτωση η μαθηματική (μέση τιμή) της τυχαίας μεταβλητής θα είναι μεγαλύτερη από , δηλαδή, . Προφανώς, αν δίνει μια κατά προσέγγιση τιμή με ένα μειονέκτημα, τότε .


Επομένως, η χρήση μιας στατιστικής εκτίμησης, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο, οδηγεί σε συστηματικά (του ίδιου πρόσημου) σφάλματα. Για το λόγο αυτό, είναι φυσικό να απαιτείται η μαθηματική προσδοκία της εκτίμησης να είναι ίση με την εκτιμώμενη παράμετρο. Αν και η συμμόρφωση με αυτήν την απαίτηση δεν θα εξαλείψει γενικά τα σφάλματα (ορισμένες τιμές είναι μεγαλύτερες από και άλλες μικρότερες από), σφάλματα διαφορετικών ενδείξεων θα συμβαίνουν εξίσου συχνά. Ωστόσο, η συμμόρφωση με την απαίτηση εγγυάται την αδυναμία λήψης συστηματικών σφαλμάτων, δηλαδή εξαλείφει τα συστηματικά σφάλματα.

Αμερόληπτοςονομάζεται στατιστική εκτίμηση (σφάλμα), η μαθηματική προσδοκία της οποίας είναι ίση με την εκτιμώμενη παράμετρο για οποιοδήποτε μέγεθος δείγματος, δηλαδή.

Εκτοπισμένοςονομάζεται στατιστική εκτίμηση, η μαθηματική προσδοκία της οποίας δεν είναι ίση με την εκτιμώμενη παράμετρο για οποιοδήποτε μέγεθος δείγματος, δηλαδή.

Ωστόσο, θα ήταν λάθος να υποθέσουμε ότι μια αμερόληπτη εκτίμηση παρέχει πάντα μια καλή προσέγγιση της παραμέτρου που εκτιμάται. Πράγματι, οι πιθανές τιμές μπορεί να είναι ευρέως διάσπαρτες γύρω από τη μέση τιμή τους, δηλαδή, η διασπορά μπορεί να είναι σημαντική. Σε αυτήν την περίπτωση, η εκτίμηση που βρέθηκε από τα δεδομένα ενός δείγματος, για παράδειγμα, μπορεί να αποδειχθεί πολύ μακριά από τη μέση τιμή, και επομένως από την ίδια την εκτιμώμενη παράμετρο. Έτσι, λαμβάνοντας ως κατά προσέγγιση τιμή, θα κάνουμε ένα μεγάλο λάθος. Εάν απαιτείτε η απόκλιση να είναι μικρή, τότε η πιθανότητα να κάνετε μεγάλο σφάλμα θα αποκλειστεί. Για το λόγο αυτό, η στατιστική αξιολόγηση υπόκειται στην απαίτηση της αποτελεσματικότητας.

Αποτελεσματικόςείναι μια στατιστική εκτίμηση που (για ένα δεδομένο μέγεθος δείγματος) έχει τη μικρότερη δυνατή διακύμανση.

Πλούσιοςκαλούν μια στατιστική εκτίμηση, η οποία τείνει κατά πιθανότητα στην εκτιμώμενη παράμετρο, δηλαδή η ισότητα είναι αληθής:

.

Για παράδειγμα, εάν η διακύμανση μιας αμερόληπτης εκτίμησης στο τείνει στο μηδέν, τότε μια τέτοια εκτίμηση αποδεικνύεται επίσης συνεπής.

Ας εξετάσουμε το ερώτημα ποια χαρακτηριστικά δείγματος εκτιμούν καλύτερα τον γενικό μέσο όρο και τη διακύμανση ως προς την αμερόληπτη, την αποτελεσματικότητα και τη συνέπεια.

Ας μελετήσουμε έναν διακριτό γενικό πληθυσμό σε σχέση με κάποιο ποσοτικό χαρακτηριστικό.

Γενική Δευτεροβάθμιαονομάζεται αριθμητικός μέσος όρος των χαρακτηριστικών τιμών του γενικού πληθυσμού. Υπολογίζεται με τον τύπο:

§ - εάν όλες οι τιμές των χαρακτηριστικών του γενικού πληθυσμού όγκου είναι διαφορετικές.

§ – εάν οι τιμές του χαρακτηριστικού του γενικού πληθυσμού έχουν συχνότητες αντίστοιχα, και . Δηλαδή, ο γενικός μέσος όρος είναι ένας σταθμισμένος μέσος όρος τιμών χαρακτηριστικών με βάρη ίσα με τις αντίστοιχες συχνότητες.

Σχόλιο: αφήστε τον γενικό πληθυσμό του τόμου να περιέχει αντικείμενα με διαφορετικές τιμές του χαρακτηριστικού. Ας φανταστούμε ότι ένα αντικείμενο επιλέγεται τυχαία από αυτό το σύνολο. Η πιθανότητα να ανακτηθεί ένα αντικείμενο με τιμή χαρακτηριστικού, για παράδειγμα, είναι προφανώς ίση με . Οποιοδήποτε άλλο αντικείμενο μπορεί να ανακτηθεί με την ίδια πιθανότητα. Έτσι, η τιμή ενός χαρακτηριστικού μπορεί να θεωρηθεί ως μια τυχαία μεταβλητή, οι πιθανές τιμές της οποίας έχουν τις ίδιες πιθανότητες ίσες με . Σε αυτή την περίπτωση, δεν είναι δύσκολο να βρεθεί η μαθηματική προσδοκία:

Έτσι, εάν θεωρήσουμε το χαρακτηριστικό της έρευνας του γενικού πληθυσμού ως τυχαία μεταβλητή, τότε η μαθηματική προσδοκία του χαρακτηριστικού είναι ίση με τον γενικό μέσο όρο αυτού του χαρακτηριστικού: . Καταλήξαμε σε αυτό το συμπέρασμα θεωρώντας ότι όλα τα αντικείμενα στον γενικό πληθυσμό έχουν διαφορετικές τιμές χαρακτηριστικών. Το ίδιο αποτέλεσμα θα ληφθεί αν υποθέσουμε ότι ο γενικός πληθυσμός περιέχει πολλά αντικείμενα με την ίδια τιμή χαρακτηριστικού.

Γενικεύοντας το ληφθέν αποτέλεσμα στον γενικό πληθυσμό με συνεχή κατανομή του χαρακτηριστικού, ορίζουμε τον γενικό μέσο όρο ως τη μαθηματική προσδοκία του χαρακτηριστικού: .

Αφήστε ένα δείγμα όγκου να εξαχθεί για να μελετηθεί ο γενικός πληθυσμός σχετικά με ένα ποσοτικό χαρακτηριστικό.

Μέσος όρος δείγματοςονομάζεται αριθμητικός μέσος όρος των χαρακτηριστικών τιμών του πληθυσμού του δείγματος. Υπολογίζεται με τον τύπο:

§ - εάν όλες οι τιμές των χαρακτηριστικών του όγκου του δείγματος είναι διαφορετικές.

§ – εάν οι τιμές των χαρακτηριστικών του πληθυσμού του δείγματος έχουν συχνότητες αντίστοιχα, και . Δηλαδή, ο μέσος όρος του δείγματος είναι ένας σταθμισμένος μέσος όρος τιμών χαρακτηριστικών με βάρη ίσα με τις αντίστοιχες συχνότητες.

Σχόλιο: Ο μέσος όρος του δείγματος που βρέθηκε από τα δεδομένα ενός δείγματος είναι προφανώς ένας συγκεκριμένος αριθμός. Εάν πάρετε άλλα δείγματα ίδιου μεγέθους από τον ίδιο πληθυσμό, τότε ο μέσος όρος του δείγματος θα αλλάξει από δείγμα σε δείγμα. Έτσι, ο μέσος όρος του δείγματος μπορεί να θεωρηθεί ως τυχαία μεταβλητή, και επομένως, μπορούμε να μιλήσουμε για τις κατανομές (θεωρητικές και εμπειρικές) του μέσου όρου του δείγματος και τα αριθμητικά χαρακτηριστικά αυτής της κατανομής, ειδικότερα, τη μαθηματική προσδοκία και διακύμανση του δείγματος διανομή.

Επιπλέον, εάν ο γενικός μέσος όρος είναι άγνωστος και απαιτείται η εκτίμησή του χρησιμοποιώντας δεδομένα δείγματος, τότε ο μέσος όρος του δείγματος, ο οποίος είναι μια αμερόληπτη και συνεπής εκτίμηση, λαμβάνεται ως εκτίμηση του γενικού μέσου όρου (προτείνουμε να αποδείξετε αυτήν τη δήλωση μόνοι σας). Από τα παραπάνω προκύπτει ότι αν βρεθούν μέσα δείγματος για πολλά δείγματα επαρκώς μεγάλου όγκου από τον ίδιο γενικό πληθυσμό, τότε θα είναι περίπου ίσα μεταξύ τους. Αυτό είναι το ακίνητο σταθερότητα των μέσων δείγματος.

Σημειώστε ότι εάν οι διακυμάνσεις δύο πληθυσμών είναι ίδιες, τότε η εγγύτητα του μέσου όρου του δείγματος με το γενικό μέσο δεν εξαρτάται από την αναλογία του μεγέθους του δείγματος προς το μέγεθος του γενικού πληθυσμού. Εξαρτάται από το μέγεθος του δείγματος: όσο μεγαλύτερο είναι το μέγεθος του δείγματος, τόσο λιγότερο ο μέσος όρος του δείγματος διαφέρει από τον γενικό μέσο όρο. Για παράδειγμα, εάν το 1% των αντικειμένων επιλέγεται από έναν πληθυσμό και το 4% των αντικειμένων επιλέγεται από έναν άλλο πληθυσμό και ο όγκος του πρώτου δείγματος αποδειχθεί μεγαλύτερος από τον δεύτερο, τότε ο μέσος όρος του πρώτου δείγματος θα διαφέρει λιγότερο από ο αντίστοιχος γενικός μέσος όρος από τον δεύτερο.

Αφού μελετήσει αυτό το κεφάλαιο, ο μαθητής θα ξέρω,ότι ένα δείγμα μπορεί να θεωρηθεί ως εμπειρικό ανάλογο ενός γενικού πληθυσμού, ότι με τη βοήθεια δειγματοληπτικών δεδομένων μπορεί κανείς να κρίνει τις ιδιότητες ενός γενικού πληθυσμού και να αξιολογήσει τα χαρακτηριστικά του, τους βασικούς νόμους κατανομής των στατιστικών εκτιμήσεων, έχω την δυνατότητα ναπαράγουν σημειακές και διαστημικές εκτιμήσεις των παραμέτρων πληθυσμού χρησιμοποιώντας τη μέθοδο των ροπών και της μέγιστης πιθανότητας, τα δικάτρόπους προσδιορισμού της ακρίβειας και της αξιοπιστίας των εκτιμήσεων που λαμβάνονται.

Είδη στατιστικών εκτιμήσεων

Αυτό που γνωρίζουμε για τις παραμέτρους του γενικού πληθυσμού είναι ότι αντικειμενικά υπάρχουν, αλλά είναι αδύνατο να τις προσδιορίσουμε άμεσα λόγω του γεγονότος ότι ο γενικός πληθυσμός είναι είτε άπειρος είτε υπερβολικά μεγάλος. Επομένως, το ερώτημα μπορεί να αφορά μόνο την αξιολόγηση αυτών των χαρακτηριστικών.

Είχε προηγουμένως διαπιστωθεί ότι για ένα δείγμα που εξάγεται από έναν γενικό πληθυσμό, υπό τις προϋποθέσεις αντιπροσωπευτικότητας, είναι δυνατό να προσδιοριστούν χαρακτηριστικά που είναι ανάλογα με τα χαρακτηριστικά του γενικού πληθυσμού.

cjp Ορισμός 8.1.Οι κατά προσέγγιση τιμές των παραμέτρων κατανομής που βρέθηκαν από το δείγμα ονομάζονται εκτιμήσεις παραμέτρων.

Ας υποδηλώσουμε την εκτιμώμενη παράμετρο της τυχαίας μεταβλητής (γενικός πληθυσμός) ως 0 και η εκτίμησή της που λήφθηκε χρησιμοποιώντας το δείγμα ως 0.

Η βαθμολογία 0 είναι μια τυχαία μεταβλητή επειδή οποιοδήποτε δείγμα είναι τυχαίο. Οι εκτιμήσεις που λαμβάνονται για διαφορετικά δείγματα θα διαφέρουν μεταξύ τους. Επομένως, θα θεωρήσουμε το 0 συνάρτηση ανάλογα με το δείγμα: 0 = 0(X in).

ShchR Ορισμός 8.2. Η στατιστική αξιολόγηση ονομάζεται πλούσιος,αν τείνει κατά πιθανότητα στην εκτιμώμενη παράμετρο:

Αυτή η ισότητα σημαίνει ότι το συμβάν 0=0 γίνεται αξιόπιστο καθώς το μέγεθος του δείγματος αυξάνεται επ' αόριστον.

Ένα παράδειγμα θα ήταν η σχετική συχνότητα κάποιου γεγονότος ΕΝΑ,η οποία είναι μια συνεπής εκτίμηση της πιθανότητας αυτού του γεγονότος σύμφωνα με το θεώρημα του Poisson (βλ. τύπο (6.1), μέρος 1).

Ορισμός 8.3.Μια στατιστική εκτίμηση λέγεται ότι είναι αποτελεσματική εάν έχει τη μικρότερη απόκλιση για τα ίδια μεγέθη δείγματος.

Σκεφτείτε την αξιολόγηση Μ xμαθηματική προσδοκία Μ xτυχαία μεταβλητή Χ.Ως τέτοια εκτίμηση επιλέγουμε Χ.Ας βρούμε τη μαθηματική προσδοκία μιας τυχαίας μεταβλητής Χ.

Ας κάνουμε πρώτα μια σημαντική δήλωση: δεδομένου ότι όλες οι τυχαίες μεταβλητές Χ,προέρχονται από τον ίδιο πληθυσμό Χ,που σημαίνει ότι έχουν την ίδια κατανομή με Χ,μπορεί να γραφτεί:

Τώρα ας βρούμε M(X σε):


Έτσι, ο μέσος όρος του δείγματος είναι μια στατιστική εκτίμηση της μαθηματικής προσδοκίας μιας τυχαίας μεταβλητής. Αυτή η εκτίμηση είναι συνεπής επειδή, σύμφωνα με το συμπέρασμα του θεωρήματος του Chebyshev, συγκλίνει κατά πιθανότητα στη μαθηματική προσδοκία (6.3).

Έχουμε διαπιστώσει ότι στην υπό εξέταση περίπτωση, η μαθηματική προσδοκία της επιλεγμένης εκτίμησής μας (τυχαία μεταβλητή) είναι ίση με την ίδια την εκτιμώμενη παράμετρο. Οι εκτιμήσεις με αυτή την ιδιότητα καταλαμβάνουν ιδιαίτερη θέση στη μαθηματική στατιστική· ονομάζονται αμερόληπτες.

Ορισμός 8.4.Η στατιστική εκτίμηση © ονομάζεται αμερόληπτη εάν η μαθηματική της προσδοκία είναι ίση με την εκτιμώμενη παράμετρο

Εάν αυτή η απαίτηση δεν πληρούται, τότε η εκτίμηση ονομάζεται προκατειλημμένη.

Επομένως, ο μέσος όρος του δείγματος είναι μια αμερόληπτη εκτίμηση της αναμενόμενης τιμής.

Ας αναλύσουμε τη μεροληψία διασποράς δείγματος ρε, εάν επιλεγεί ως εκτίμηση της γενικής διακύμανσης Dx.Για να το κάνουμε αυτό, ας ελέγξουμε αν η συνθήκη (8.2) ικανοποιείται;):


Ας μετατρέψουμε καθέναν από τους δύο όρους που προκύπτουν:

Εδώ χρησιμοποιήθηκε η ισότητα M(X.) = M(X 2),δίκαιο για τον ίδιο λόγο με το (8.1).

Ας δούμε τον δεύτερο όρο. Χρησιμοποιώντας τον τύπο του τετραγωνικού αθροίσματος Πόρους που παίρνουμε


Λαμβάνοντας πάλι υπόψη την ισότητα (8.1), καθώς και το γεγονός ότι τα Χ και Χ είναι ανεξάρτητες τυχαίες μεταβλητές, γράφουμε

και τελικά παίρνουμε:

Ας αντικαταστήσουμε τα ληφθέντα αποτελέσματα σε (8.3)

Μετά τη μεταμόρφωση παίρνουμε

Έτσι, μπορούμε να συμπεράνουμε ότι η διακύμανση του δείγματος είναι εκτοπισμένοιεκτίμηση της γενικής διακύμανσης.

Λαμβάνοντας υπόψη το αποτέλεσμα που προέκυψε, θέσαμε ως στόχο να κατασκευάσουμε μια εκτίμηση της γενικής διακύμανσης που θα ικανοποιούσε την αμερόληπτη συνθήκη (8.2). Για να το κάνετε αυτό, εξετάστε την τυχαία μεταβλητή

Είναι εύκολο να δούμε ότι για αυτήν την ποσότητα η προϋπόθεση (8.2) ικανοποιείται:

Σημειώστε ότι οι διαφορές μεταξύ της διακύμανσης του δείγματος και της διορθωμένης διακύμανσης δείγματος γίνονται ασήμαντες σε μεγαλύτερα μεγέθη δείγματος.

Όταν επιλέγετε εκτιμήσεις των χαρακτηριστικών των τυχαίων μεταβλητών, είναι σημαντικό να γνωρίζετε την ακρίβειά τους. Σε ορισμένες περιπτώσεις, απαιτείται υψηλή ακρίβεια και μερικές φορές αρκεί μια πρόχειρη εκτίμηση. Για παράδειγμα, όταν σχεδιάζουμε μια πτήση ανταπόκρισης, είναι σημαντικό για εμάς να γνωρίζουμε όσο το δυνατόν ακριβέστερα την προγραμματισμένη ώρα άφιξης στο σημείο σύνδεσης. Σε μια άλλη περίπτωση, για παράδειγμα, όταν βρισκόμαστε στο σπίτι και περιμένουμε έναν κούριερ με τα προϊόντα που παραγγείλαμε, η υψηλή ακρίβεια της ώρας άφιξής του δεν είναι σημαντική για εμάς. Και στις δύο περιπτώσεις, η τυχαία μεταβλητή είναι ο χρόνος άφιξης και το χαρακτηριστικό της τυχαίας μεταβλητής που μας ενδιαφέρει είναι ο μέσος χρόνος ταξιδιού.

Υπάρχουν δύο είδη αξιολογήσεων. Στην πρώτη περίπτωση, το καθήκον είναι να ληφθεί μια συγκεκριμένη αριθμητική τιμή της παραμέτρου. Σε άλλη περίπτωση, προσδιορίζεται ένα διάστημα στο οποίο η παράμετρος που μας ενδιαφέρει πέφτει με δεδομένη πιθανότητα.

) προβλήματα μαθηματικής στατιστικής.

Ας υποθέσουμε ότι υπάρχει μια παραμετρική οικογένεια κατανομών πιθανοτήτων (για λόγους απλότητας, θα εξετάσουμε την κατανομή των τυχαίων μεταβλητών και την περίπτωση μιας παραμέτρου). Εδώ είναι μια αριθμητική παράμετρος της οποίας η τιμή είναι άγνωστη. Απαιτείται να εκτιμηθεί με βάση το διαθέσιμο δείγμα τιμών που δημιουργείται από αυτήν την κατανομή.

Υπάρχουν δύο κύριοι τύποι αξιολογήσεων: σημειακές εκτιμήσειςΚαι διαστήματα εμπιστοσύνης.

Εκτίμηση σημείων

Η εκτίμηση σημείων είναι ένας τύπος στατιστικής εκτίμησης στην οποία η τιμή μιας άγνωστης παραμέτρου προσεγγίζεται με έναν ξεχωριστό αριθμό. Δηλαδή, είναι απαραίτητο να καθοριστεί η λειτουργία του δείγματος (στατιστικά)

,

του οποίου η τιμή θα θεωρηθεί ως προσέγγιση της άγνωστης αληθινής τιμής.

Οι συνήθεις μέθοδοι για την κατασκευή σημειακών εκτιμήσεων παραμέτρων περιλαμβάνουν: μέθοδο μέγιστης πιθανότητας, μέθοδο ροπών, μέθοδο ποσοστοιχίας.

Ακολουθούν ορισμένες ιδιότητες που μπορεί να έχουν ή να μην έχουν οι σημειακές εκτιμήσεις.

Πλούτος

Μία από τις πιο προφανείς απαιτήσεις για μια σημειακή εκτίμηση είναι ότι μπορεί να αναμένεται μια αρκετά καλή προσέγγιση στην πραγματική τιμή της παραμέτρου για αρκετά μεγάλα μεγέθη δειγμάτων. Αυτό σημαίνει ότι η εκτίμηση πρέπει να συγκλίνει στην πραγματική τιμή στο . Αυτή η ιδιότητα αξιολόγησης ονομάζεται πλούτος. Δεδομένου ότι μιλάμε για τυχαίες μεταβλητές για τις οποίες υπάρχουν διαφορετικοί τύποι σύγκλισης, αυτή η ιδιότητα μπορεί να διατυπωθεί με ακρίβεια με διαφορετικούς τρόπους:

Όταν χρησιμοποιείτε απλώς έναν όρο πλούτος, τότε συνήθως εννοούμε αδύναμη συνέπεια, δηλ. σύγκλιση στις πιθανότητες.

Η συνθήκη συνοχής είναι πρακτικά υποχρεωτική για όλες τις εκτιμήσεις που χρησιμοποιούνται στην πράξη. Οι εκτιμήσεις αποτυχίας χρησιμοποιούνται εξαιρετικά σπάνια.

Αμερόληπτη και ασυμπτωτική αμερόληπτη

Η εκτίμηση παραμέτρων καλείται αμερόληπτος, εάν η μαθηματική προσδοκία του είναι ίση με την πραγματική τιμή της εκτιμώμενης παραμέτρου:

.

Μια πιο αδύναμη κατάσταση είναι ασυμπτωτικός αμερόληπτος, που σημαίνει ότι η μαθηματική προσδοκία της εκτίμησης συγκλίνει στην πραγματική τιμή της παραμέτρου καθώς αυξάνεται το μέγεθος του δείγματος:

.

Η αμερόληπτη είναι μια προτεινόμενη ιδιότητα για εκτιμήσεις. Ωστόσο, η σημασία του δεν πρέπει να υπερεκτιμάται. Τις περισσότερες φορές, υπάρχουν αμερόληπτες εκτιμήσεις παραμέτρων και στη συνέχεια προσπαθούν να λάβουν υπόψη μόνο αυτές. Ωστόσο, ενδέχεται να υπάρχουν στατιστικά προβλήματα στα οποία δεν υπάρχουν αμερόληπτες εκτιμήσεις. Το πιο διάσημο παράδειγμα είναι το εξής: εξετάστε την κατανομή Poisson με μια παράμετρο και θέστε το πρόβλημα της εκτίμησης της παραμέτρου . Μπορεί να αποδειχθεί ότι δεν υπάρχει αμερόληπτος εκτιμητής για αυτό το πρόβλημα.

Σύγκριση βαθμολογιών και αποτελεσματικότητας

Για να συγκρίνετε διαφορετικές εκτιμήσεις της ίδιας παραμέτρου, χρησιμοποιείται η ακόλουθη μέθοδος: επιλέξτε μερικές συνάρτηση κινδύνου, που μετρά την απόκλιση της εκτίμησης από την πραγματική τιμή της παραμέτρου και η καλύτερη θεωρείται αυτή για την οποία αυτή η συνάρτηση παίρνει μικρότερη τιμή.

Τις περισσότερες φορές, η μαθηματική προσδοκία της τετραγωνικής απόκλισης της εκτίμησης από την πραγματική τιμή θεωρείται συνάρτηση κινδύνου

Για αμερόληπτες εκτιμήσεις, αυτή είναι απλώς η απόκλιση.

Υπάρχει ένα κατώτερο όριο σε αυτή τη συνάρτηση κινδύνου που ονομάζεται Ανισότητα Cramer-Rao.

Οι (αμερόληπτοι) εκτιμητές για τους οποίους επιτυγχάνεται αυτό το κάτω όριο (δηλαδή έχουν τη μικρότερη δυνατή διακύμανση) ονομάζονται αποτελεσματικός. Ωστόσο, η ύπαρξη μιας αποτελεσματικής εκτίμησης είναι μια μάλλον ισχυρή απαίτηση για την εργασία, κάτι που δεν συμβαίνει πάντα.

Μια πιο αδύναμη κατάσταση είναι ασυμπτωτική αποτελεσματικότητα, πράγμα που σημαίνει ότι η αναλογία της διακύμανσης της αμερόληπτης εκτίμησης προς το κάτω όριο Cramer-Rao τείνει σε ενότητα στο .

Σημειώστε ότι κάτω από επαρκώς ευρείες παραδοχές σχετικά με την κατανομή υπό μελέτη, η μέθοδος μέγιστης πιθανότητας δίνει μια ασυμπτωτικά αποτελεσματική εκτίμηση της παραμέτρου και εάν υπάρχει μια αποτελεσματική εκτίμηση, τότε δίνει μια αποτελεσματική εκτίμηση.

Επαρκείς στατιστικές

Τα στατιστικά λέγονται επαρκήςγια την παράμετρο , εάν η υπό όρους κατανομή δειγματοληψίας με την προϋπόθεση ότι , δεν εξαρτάται από την παράμετρο για όλες .

Η σημασία της έννοιας των επαρκών στατιστικών καθορίζεται από τα ακόλουθα έγκριση. Εάν είναι ένα επαρκές στατιστικό στοιχείο και είναι μια αμερόληπτη εκτίμηση της παραμέτρου , τότε η υπό όρους προσδοκία είναι επίσης μια αμερόληπτη εκτίμηση της παραμέτρου και η διακύμανσή της είναι μικρότερη ή ίση με τη διακύμανση της αρχικής εκτίμησης.

Θυμηθείτε ότι η υπό όρους προσδοκία είναι μια τυχαία μεταβλητή που είναι συνάρτηση του . Έτσι, στην κατηγορία των αμερόληπτων εκτιμήσεων, αρκεί να ληφθούν υπόψη μόνο εκείνες που αποτελούν συναρτήσεις επαρκών στατιστικών (εφόσον υπάρχουν τέτοιες στατιστικές για ένα δεδομένο πρόβλημα).

Η (αμερόληπτη) εκτίμηση της αποτελεσματικής παραμέτρου είναι πάντα επαρκής στατιστική.

Μπορούμε να πούμε ότι επαρκή στατιστικά στοιχεία περιέχουν όλες τις πληροφορίες σχετικά με την παράμετρο που εκτιμάται και περιέχονται στο δείγμα.