Έχουμε αντέξει έναν αρκετά ανηφορικό δρόμο από τις κατανομές έως τη θεωρία των πιθανοτήτων και τώρα θα απολαύσουμε τον κόπο μας και την κάπως ευκολότερη κατηφορική διαδρομή που μας φέρνει πιο δυνατούς πίσω στο σημείο εκκίνησης. Ευτυχώς είναι έτσι τα πράγματα που και οι καινούργιοι αναγνώστες προλαβαίνουν να ακολουθήσουν.

Στο προηγούμενο τεύχος, στο οποίο είχαμε την ερώτηση «Αν στρίψετε ένα νόμισμα δύο φορές στη σειρά, ποια είναι η πιθανότητα να έλθει δύο φορές κορόνα;» έγινε στα σιωπηλά κάτι πολύ σημαντικό. Η λύση προκύπτει με δύο τρόπους. Στον έναν τρόπο πρέπει να σκεφθούμε όλες τις πιθανές εκβάσεις με κάθε στρίψιμο. Δηλαδή λέμε: Αν βγει πρώτα κορόνα (Κ), στη συνέχεια έχουμε δύο περιπτώσεις. Το επόμενο στρίψιμο να δώσει ή κορόνα (Κ) ή γράμματα (Γ). Στη μία περίπτωση έχουμε τελικά τον συνδυασμό Κ-Κ, στην άλλη Κ-Γ. Αν στο πρώτο στρίψιμο είχαμε γράμματα (Γ), μετά υπήρχαν δύο περιπτώσεις: Γ-Γ ή Γ-Κ. Συνολικά 4 περιπτώσεις και μόνο η μία (Κ-Κ) ήταν η επιθυμητή. Αρα αυτό που θέλαμε βγαίνει να είναι 1 στα 4. Αν κάναμε τον υπολογισμό με τις πιθανότητες, έβγαινε ότι (1/2) Χ (1/2) = (1/4). Δηλαδή το ίδιο, αλλά εδώ παρατηρούμε μια εξαιρετικά γόνιμη σύνδεση που απαίτησε αρκετή υπομονή στα προηγούμενα μέχρι να φθάσουμε τώρα να την αναδείξουμε: Είναι δυνατόν και πρόσφορο δηλαδή η απαρίθμηση καταστάσεων μία προς μία, για να βρούμε το πόσο εύκολα ή δύσκολα συμβαίνει κάτι, να αντικατασταθεί με τις πιθανότητες να προκύψει καθεμία από αυτές τις καταστάσεις. Και ο υπολογισμός να γίνεται έτσι αρκετά πιο απλά και γρήγορα.

 Ασφαλή περιθώρια

Για ένα τέτοιο αντίστοιχο «μαγικό» (αλλά και εκεί πλήρως αιτιολογημένο) άλμα έχει καλλιεργηθεί πλέον το έδαφος να συμβεί και με τις κατανομές στοιχείων ή γεγονότων. Δηλαδή και εκεί θα κάνουμε υπολογισμούς περνώντας σε κατανομές πιθανοτήτων πλέον. Ενδιάμεσα όμως, μέχρι να φθάσουμε έως εκεί, θα συναντήσουμε και αρκετά άλλα χρήσιμα πράγματα.

Οντας ακόμη στην επικράτεια των πιθανοτήτων, θα πρέπει να αντιμετωπίσουμε ένα σοβαρό πρόβλημα που αν δεν είμαστε «του επαγγέλματος» δεν είναι εύκολο να υποπτευθούμε ότι υπάρχει. Διότι ακόμα και αν πάρουμε ένα παράδειγμα όπως ποιο είναι το μέσο ύψος των ανδρών στην Ελλάδα, κάτι δηλαδή μακριά από τις σκιές που μπορεί να ρίξει η πολιτική τοποθέτηση του καθενός από εμάς (αμφισβητώντας τα στοιχεία μιας υπουργικής ομιλίας ή μιας απόφασης), ακόμα και αυτό δεν είναι εύκολο να παρουσιαστεί με αξιοπιστία. Απόλυτα σίγουροι για την εγκυρότητα του αποτελέσματος θα ήμασταν αν μπορούσαμε να μετρήσουμε το ύψος του κάθε Ελληνα. Αν αυτό δεν έγινε και μετρήθηκαν μόνο τα ύψη κάποιων ανδρών σε μια αντιπροσωπευτική έστω ομάδα, αρχίζει η αγωνία αυτού που πήρε το δείγμα. Και ένας από τους ρόλους της Στατιστικής ως επιστήμης είναι να βρίσκει τρόπους να προσεγγίζονται με ένα ή περισσότερα δείγματα από τα μέλη ενός συνόλου όσο γίνεται καλύτερα τα (πραγματικά) αριθμητικά στοιχεία ολόκληρου του συνόλου. Εδώ, για παράδειγμα, πού βρίσκεται το μέσο ύψος όλων;

Διάστημα εμπιστοσύνης

Ένα από τα πολύ παλιά όπλα είναι τα διαστήματα εμπιστοσύνης (Confidence Intervals), όπου έχει συνδυαστεί μια διαισθητική εκτίμηση με θεωρία πιθανοτήτων. Εμείς εδώ, που κάνουμε κάπως «μαθηματικά του δρόμου», ενδιαφερόμαστε κυρίως να καταλαβαίνουμε τι εννοούν οι ειδικοί και κάποιες φορές και οι πολιτικοί, όπως τώρα με την επιδημία, όταν χρησιμοποιούν κάποιους όρους που δεν εξηγήθηκαν και πολύ στο σχολείο.

Ας πάρουμε λοιπόν μια έρευνα όπου έκαναν πολλές φορές με τον ίδιο τρόπο μια δειγματοληψία, π.χ. πήγαιναν σε κάποια, αλλά όχι σε όλα, τα σχολεία και στο καθένα μετρούσαν το ύψος των παιδιών στην Α’ τάξη, θέλοντας να βγάλουν τον μέσο όρο για το ύψος των ελληνόπουλων όταν ξεκινούν το σχολείο. Αν μετά μας έλεγαν πως το αποτέλεσμά τους διαθέτει 95% «διάστημα εμπιστοσύνης» ώστε να ισχύει για όλη την Ελλάδα, αυτό δεν θα πρέπει να το εκλάβουμε ότι βρέθηκε με πλήρη σχεδόν ακρίβεια ο μέσος όρος του ύψους. Στην πραγματικότητα ισχύει ότι αν το δοκίμαζαν πολλές φορές, ας πούμε σε 100 διαφορετικά σχολεία, στις 95 τουλάχιστον των περιπτώσεων ο πραγματικός μέσος όρος του ύψους (που όμως δεν τον γνωρίσαμε ποτέ) θα βρίσκεται μέσα σε αυτό το διάστημα.

Ετσι, αντί για τον πολύ φτωχό σε πληροφορία μέσο όρο, όπως είχαμε αναφέρει παλαιότερα, αν γινόταν για παράδειγμα μια πιο ολοκληρωμένη στατιστική έρευνα για το πόσοι επιβάτες, ποιες ώρες βρίσκονται σε ποιας χωρητικότητας λεωφορεία στις μεγάλες πόλεις, δεν θα υπήρχαν τόσες αμφισβητήσεις και τόσες αυθαίρετες ερμηνείες…

Πνευματική γυμναστική

  • Σε εποχή προτού εμφανιστεί η COVID-19 στη συνεδρίαση ενός συμβουλίου τραπέζης τα 17 μέλη κανονικά, πριν από την έναρξη, θα αντάλλασσαν χειραψίες όλοι με όλους. Αλλά 4 μέλη, για δικούς τους λόγους, δεν έδωσαν μεταξύ τους τα χέρια. Πόσες χειραψίες έγιναν τελικά;
  • Έχουμε δύο ολόιδια μεγάλα βάζα, με 50 μπαλάκια κόκκινα και 50 μπλε. Κάποιος με δεμένα μάτια θα βάλει το χέρι του σε ένα από τα βάζα και θα ανασύρει ένα μπαλάκι. Πώς θα τοποθετήσουμε από πριν τα μπαλάκια ώστε να μεγιστοποιηθεί η πιθανότητα το μπαλάκι που θα βγάλουμε να είναι κόκκινο; Ζητούμε να υπολογιστεί αυτή η πιθανότητα.

Η λύση του προηγούμενου κουίζ

Με αφορμή το 2020 που ήταν δίσεκτο (από κάθε άποψη) ζητήσαμε να υπολογιστεί γενικά η πιθανότητα να γεννηθεί κάποιος στις 29 Φεβρουαρίου. Οποιος ή όποια γυμνάστηκε με επιμέλεια τις προηγούμενες φορές δεν θα δυσκολεύθηκε να σκεφθεί ότι αφού 29 Φεβρουαρίου είναι κάθε τέσσερα χρόνια, η πιθανότητα είναι (1/4) για να γεννηθείς μέσα σε δίσεκτο έτος. Για να πετύχεις όμως και τη μία αυτή ημέρα ακριβώς (29.2) από τις 366 που έχει ο δίσεκτος χρόνος η πιθανότητα είναι (1/366). Επειδή πρέπει να συμπέσουν ΚΑΙ η χρονιά ΚΑΙ η ημέρα (ενώ είναι μεταξύ τους ανεξάρτητα), όπως έχουμε μάθει πλέον καλά, θα πολλαπλασιάσουμε τις δύο πιθανότητες: (1/4) Χ (1/366) = 1/ 1464.

Για τους πιο αποφασισμένους να βρουν πώς η πιθανότητα μεταβάλλεται κάπως στην περίπτωση που παίρνουν την επιπλέον ημέρα μόνον όσοι αιώνες διαιρούνται ακριβώς με το 400, κάτι που έγινε με το 2000 (όπως το καθόρισε ο πάπας Γρηγόριος ΙΓ’ το 1582 με τη μεταρρύθμισή του, διότι υπάρχει μια διαφορά 11 λεπτών για να είναι ακριβώς η διάρκεια του έτους 365 ημέρες και ένα τέταρτο της ημέρας), η απάντηση είναι η εξής: Από το 1601 έως το 2020 παραλείφθηκε 3 φορές η 29η ημέρα (1770, 1800, 1900, με βάση τα προηγούμενα). Οπότε είχαμε στο διάστημα αυτό 102 δίσεκτα έτη και 318 με 28 ημέρες. Και στο σύνολό τους (102 x 366) + (318 x 365) = 153402 ημέρες. Οπότε η πιθανότητα είναι (102/153402) = 0.0006649 ή 1/1504 ενώ χωρίς αυτή τη ρύθμιση ήταν 1/1464, δηλαδή λίγο μεγαλύτερη, διότι αφαιρέσαμε στη δεύτερη περίπτωση και 3 ακόμα πιθανές ημέρες γέννησης.

Γράψτε το σχόλιό σας

Ακολουθήστε το στο Google News και μάθετε πρώτοι όλες τις ειδήσεις
Δείτε όλες τις τελευταίες Ειδήσεις από την Ελλάδα και τον Κόσμο, στο