Πώς να προσδιορίσετε τον τύπο διανομής πιθανοτήτων για δεδομένα

Πίνακας περιεχομένων:

Anonim

Όταν συλλέγετε δεδομένα σχετικά με το σύστημα ή τη διαδικασία σας, το επόμενο βήμα είναι να προσδιορίσετε το είδος της κατανομής πιθανότητας που έχετε. Οι τύποι κατανομών πιθανότητας είναι: διακριτές ομοιόμορφες, Bernoulli, διωνυμικές, αρνητικές διωνυμικές, Poisson, γεωμετρικές, συνεχείς ομοιόμορφες, κανονικές (καμπύλη καμπύλης), εκθετικές κατανομές γάμμα και βήτα. Η συρρίκνωση ακόμη και μερικών από τη λίστα των δυνατοτήτων καθιστά τον προσδιορισμό της πιο κοντινής τιμής R τετραγωνισμένη πολύ πιο γρήγορα.

Στοιχεία που θα χρειαστείτε

  • Λογισμικό γραφικών

  • Μέσα υπολογισμού της τετραγωνικής τιμής R (καλύτερη ανάλυση προσαρμογής)

Σχεδιάστε τα δεδομένα για μια οπτική αναπαράσταση του τύπου δεδομένων.

Ένα από τα πρώτα βήματα για τον προσδιορισμό της κατανομής δεδομένων που έχει κάποιος - και επομένως ο τύπος εξίσωσης που χρησιμοποιείται για τη μοντελοποίηση των δεδομένων - είναι να αποκλείσει αυτό που δεν μπορεί να είναι. • Εάν υπάρχουν στο σύστημα δεδομένων αιχμές, δεν μπορεί να είναι διακεκριμένη ομοιόμορφη κατανομή. • Εάν τα δεδομένα έχουν περισσότερες από μία κορυφές, δεν είναι Poisson ή binomial. • Αν έχει μία μόνο καμπύλη, δεν έχει δευτερεύουσες κορυφές και έχει αργή κλίση σε κάθε πλευρά, μπορεί να είναι Poisson ή κατανομή γάμμα. Αλλά δεν μπορεί να είναι μια διακριτή ομοιόμορφη κατανομή. • Εάν τα δεδομένα είναι ομοιόμορφα κατανεμημένα και δεν υπάρχει κατεύθυνση προς τη μία πλευρά, είναι ασφαλές να αποκλείσουμε τη διανομή γάμμα ή Weibull. • Αν η λειτουργία έχει ομοιόμορφη κατανομή ή κορυφή στη μέση των αποτελεσμάτων, δεν είναι γεωμετρική κατανομή ή εκθετική κατανομή. • Αν η εμφάνιση ενός παράγοντα μεταβάλλεται με μια περιβαλλοντική μεταβλητή, πιθανώς δεν είναι η κατανομή Poisson.

Αφού ο τύπος κατανομής πιθανοτήτων έχει μειωθεί, κάντε μια ανάλυση τετράγωνου R για κάθε πιθανό τύπο κατανομής πιθανοτήτων. Αυτός με την υψηλότερη τιμή τετραγώνου R είναι κατά πάσα πιθανότητα σωστός.

Εξαφάνιση ενός σημείου δεδομένων. Στη συνέχεια, υπολογίστε εκ νέου το τετράγωνο R. Εάν ο ίδιος τύπος κατανομής πιθανοτήτων εμφανίζεται ως ο πλησιέστερος συνδυασμός, τότε υπάρχει μεγάλη σιγουριά ότι αυτή είναι η σωστή κατανομή πιθανότητας που θα χρησιμοποιηθεί για το σύνολο δεδομένων.

Συμβουλές

  • Εάν τα δεδομένα παρουσιάζουν πολλαπλές κορυφές με μια ευρεία διασπορά, είναι πιθανό ότι διεξάγονται δύο ξεχωριστές διεργασίες ή το προϊόν που λαμβάνεται ως δείγμα αναμιγνύεται. Ανάκτηση των δεδομένων και στη συνέχεια εκ νέου ανάλυση.

Προειδοποίηση

Επαληθεύστε τις εξισώσεις που δημιουργούνται σε μεταγενέστερα σύνολα δεδομένων για να επιβεβαιώσετε ότι εξακολουθούν να είναι ακριβείς για το σύνολο δεδομένων. Είναι πιθανό οι περιβαλλοντικοί παράγοντες και η μετατόπιση της διαδικασίας να έχουν κάνει λανθασμένες εξισώσεις και μοντέλα ρεύματος.