Πέμπτη 28 Φεβρουαρίου 2013

Πόσα διαφορετικά tweets μπορούν να υπάρξουν μαθηματικά;


Όλοι γνωρίζουμε ότι υπάρχει ένα όριο 140 χαρακτήρων στα tweets που στέλνουμε στο δημοφιλές κοινωνικό δίκτυο Twitter
και εύλογα γεννάται η απορία του πόσα διαφορετικά tweets είναι εφικτό να υπάρξουν...Πρακτικά, αμέτρητα αλλά χρησιμοποιώντας μαθηματικά μπορούμε να έχουμε μια πολύ καλή προσέγγιση:

Λαμβάνοντας υπόψιν, λοιπόν, το όριο των 140 χαρακτήρων και την ύπαρξη 26 γραμμάτων στην αγγλική αλφάβητο (27 αν μετρήσουμε και το κενό) υπάρχουν 27≈10πιθανοί συνδυασμoί. Επειδή, βέβαια, το Twitter δεν σε περιορίζει σε αυτούς τους χαρακτήρες αλλά υποστηρίζει και το Unicode ο πιθανός αριθμός διαφορετικών συνδυασμών ανεβαίνει στο 10. Όλα ωραία μέχρι εδώ αλλά αυτός ο αριθμός μας δίνει έναν συνδυασμό γραμμάτων που δεν δημιουργούν απαραίτητα λέξεις και προτάσεις με νόημα!

Ο Claude Shannon καθόρισε ότι το περιεχόμενο πληροφοριών της καθομιλουμένης στα Αγγλικά είναι περίπου 1.0 με 1.2 bits ανά γράμμα. Αυτό σημαίνει ότι ένας καλός αλγόριθμος μπορεί να συμπιέσει κείμενο ASCII στα Αγγλικά που είναι 8 bits ανά γράμμα σε περίπου το ένα όγδοο του αρχικού μεγέθους. Οπότε εάν ένα κομμάτι κειμένου περιέχει χ bits πληροφοριών, τότε υπάρχουν 2 διαφορετικά μηνύματα που μπορεί να μεταφέρει. Με λίγη μαθηματική μαγεία συμπεραίνουμε ότι υπάρχουν χοντρικά 2×1.1≈2×10διαφορετικοί συνδυασμοί αγγλικών προτάσεων σε tweets. Αυτό θα απαιτούσε περίπου 10 δευτερόλεπτα για να διαβαστούν όλα τα tweets!

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου

Για να αποφευχθούν περιπτώσεις εμφάνισης υβριστικών σχολίων ή άλλων ποινικά κολάσιμων πράξεων, όλα τα σχόλια πριν δημοσιευτούν ελέγχονται.

Παρακαλούμε μην αποστέλετε πληροφορίες άχρηστες προς τη λειτουργία του συγκεκριμένου blog.

Τα μηνύματα είναι προσωπικές απόψεις των αποστολέων και σε καμία περίπτωση δεν εκφράζουν τους δημιουργούς ή διαχειριστές της συγκεκριμένης σελίδας.