Saturday 3 December 2011

Making the List to End All Lists

Το πράγμα έχει αρχίσει να σοβαρεύει.

Όλα ξεκίνησαν από εδώ: Με δεδομένο το ότι, τέτοιες μέρες κάθε χρόνο, κάνουμε όλοι τις λίστες μας με τα καλύτερα albums της χρονιάς που φεύγει, επιχειρήσαμε να συστηματοποιήσουμε και να τυποποιήσουμε τη διαδικασία χωρίζοντάς τη σε 10 βήματα. Το
δεύτερο μέρος της προσπάθειάς μας ανέλυσε τη θεωρητική βάση πίσω από την αναγκαιότητα ανάπτυξης μιας ακόμη πιο επιστημονικής προσέγγισης στο θέμα: Είναι απαράδεκτο και ασυγχώρητο ένα album που αξίζει για Νο. 16 στη λίστα να βρεθεί λανθασμένα στο Νο. 15 ή στο Νο. 17. Διαταράσσεται η Κοσμική ισορροπία. Ένα τέτοιο λάθος μπορεί να σε βασανίζει για μήνες μετά, αυτά τα πράγματα δεν μπορείς να τα αφήνεις στην τύχη.

Έτσι φτάσαμε σε αυτό, το τρίτο και πιθανότατα τελευταίο μέρος της τιτάνιας προσπάθειάς μας να δημιουργήσουμε την Απόλυτη Λίστα. Τη Λίστα Που Δεν Αφήνει Αμφιβολίες. Τη Λίστα Που Θα Σβήσει Όλες Τις Άλλες Λίστες.


Επιστρατεύσαμε μια στρατιά από εμπειρογνώμονες: μαθηματικούς, οικονομολόγους, game theorists και κοινωνιολόγους. Τους κλειδαμπαρώσαμε για μία ολόκληρη εβδομάδα σε ένα δωμάτιο χωρίς τηλέφωνο και internet, με μόνη ψυχαγωγία ένα "greatest hits" του Yanni, λέγοντάς τους ότι θα βγουν μόνο όταν δημιουργήσουν τη μαθηματική φόρμουλα υπολογισμού των καλύτερων albums της χρονιάς. Τους αφήναμε κάθε μέρα κάτω από την πόρτα νερό και γαλέτες, και περιμέναμε.

Κυρίες και κύριοι, η αναμονή τελείωσε. Είμαι βαθύτατα συγκινημένος που η δική μου μικρή, ταπεινή πρωτοβουλία οδήγησε σε ένα τόσο σημαντικό επιστημονικό breakthrough. Τέρμα η αγωνία για το αν αδίκησες ένα album. Τέρμα η αυτοαμφισβήτηση και ο προβληματισμός για το αν η λίστα σου εκφράζει
πραγματικά τις μουσικές σου προτιμήσεις. Με υπερηφάνεια σας παρουσιάζω μία απλή μαθηματική φόρμουλα, εγκαίρως για να κάνετε τη λίστα σας με τα καλύτερα albums του 2011 γρήγορα, ανώδυνα και σωστά. Από σήμερα ο κόσμος είναι ένα καλύτερο μέρος.

Για την καλύτερη κατανόηση του κειμένου, συνιστούμε να κάνετε πρώτα μια επαναληπτική ανάγνωση των δύο προηγούμενων blog posts. Μην ανησυχείτε, θα σας περιμένουμε.

...
...

...

OK, έτοιμοι τώρα; Ο λόγος στην επιστημονική μου συνεργάτιδα και επικεφαλής της ομάδας των εμπειρογνωμόνων, τη μαθηματικό Άγκαθα Τερατάκη. Άγκαθα, δικό σου:


"Καταρχάς, ΔΕΝ ψάχνεις για ΛΟΓΑΡΙΘΜΟ, ψάχνεις για ΑΛΓΟΡΙΘΜΟ. Και τα δύο έχουν σχέση με τα μαθηματικά, αλλά δεν είναι σε καμία περίπτωση το ίδιο πράγμα! Ως εκ τούτου, η απάντηση σε αυτό που ζητάς αποκλείεται να είναι μια γραμμή.


Ψάχνουμε λοιπόν για αλγόριθμο. Μία μηχανιστική/αυτόματη/σαφή/ρητή/ξεκάθαρη μέθοδο/διαδικασία/νόμο η οποία από κάποια δεδομένα σου δίνει κάποιο αποτέλεσμα. Στην δική μας περίπτωση ψάχνουμε το εξής: από ένα σύνολο π.χ. 40 δίσκων (δεδομένα) να διαλέξουμε τους 20 (αποτέλεσμα).

Μία πρόταση για το πώς να ξεπεράσεις το πρόβλημα με τις φορές που άκουσες τον δίσκο λόγω του LDL (Law of Diminishing Listens) είναι το averaging.

Έστω ότι έχω 3 δίσκους. Τον Α, τον Β και τον Γ. Διάλεξε π.χ. τις τρεις "καλύτερες" εβδομάδες του κάθε δίσκου, τις εβδομάδες δηλαδή που άκουγες τον καθένα περισσότερο.


Πες ότι τον Α τον άκουσα μία εβδομάδα 15 φορές, την άλλη 10, την άλλη 2 και μετά από λίγους μήνες τον άκουσα πάλι 10 φορές σε μία εβδομάδα. Διαλέγω λοιπόν την πρώτη, την δεύτερη και την άσχετη εβδομάδα. Σύνολο ακροάσεων 35 φορές. Άρα 35 πόντοι. Ή 35 δια του 3 πόντοι = 11,67.


Τον Β τον άκουσα 10 φορές την πρώτη εβδομάδα, 2 την δεύτερη, 10 την τρίτη, 5 την τέταρτη και μία άλλη άσχετη εβδομάδα τον άκουσα πάλι 10 φορές. Διαλέγω την πρώτη, την τρίτη και την άσχετη εβδομάδα. Σύνολο ακροάσεων 30. Άρα 30 πόντοι.Ή 30 δια του 3 =10 πόντοι κλπ.


Προβλήματα:


Αν η λίστα πρέπει να παραδοθεί αρχές Δεκέμβρη, αποκλείεις ρητά τους δίσκους που άκουσες μετά την πρώτη εβδομάδα του Νοέμβρη. Θα μπορούσες βεβαίως να μετρήσεις μόνο τις "καλύτερες ΔΥΟ εβδομάδες" του δίσκου, έτσι ώστε να μπορείς να συμπεριλάβεις και δίσκους που άκουσες την δεύτερη εβδομάδα του Νοέμβρη. Το θέμα είναι όσο περισσότερες εβδομάδες συμπεριλάβεις στον υπολογισμό της μέσης τιμής τόσο καλύτερα έχεις "εκτιμήσει/μετρήσει" τους δίσκους, αλλά από την άλλη, δε μπορείς να συμπεριλάβεις 10 εβδομάδες, εκτός και αν βγάζεις τους καλύτερους δίσκους που κυκλοφόρησαν μέχρι τα μέσα Οκτώβρη. Πιστεύω λοιπόν ότι οι "καλύτερες τρεις" εβδομάδες είναι αρκετά αντιπροσωπευτικές.


Επίσης, καλό θα ήταν να διαχωρίσουμε τις εργάσιμες μέρες από τα Σαββατοκύριακα και να ακολουθήσουμε την διαδικασία 2 φορές, αλλά αυτό περιπλέκει τα πράγματα περισσότερο, οπότε το αφήνουμε για αργότερα.


Εξυπακούεται ότι μιλάμε για πλήρεις ακροάσεις έτσι; Όχι συγκεκριμένα τραγούδια.


Πρέπει επίσης ο δίσκος που έχεις ακούσει τις περισσότερες φορές μέσα στη χρονιά να πριμοδοτηθεί π.χ. με 10 πόντους, ο δεύτερος με 8, ο τρίτος με 6, ο τέταρτος με 4 ο πέμπτος με 2.... ή κάτι τέτοιο. Δε λέω να πριμοδοτηθεί ο πρώτος με 20 πόντους, ο δεύτερος με 19 κλπ., γιατί θεωρώ ότι μετά από τον πέμπτο ή έκτο δίσκο οι ακροάσεις πέφτουν σε φυσιολογικά επίπεδα, ενώ τους πρώτους π.χ. 5 τους ακούς δεκάδες φορές. Οι υπόλοιποι δίσκοι λοιπόν πριμοδοτούνται με μηδέν πόντους.

Έχουμε και λέμε λοιπόν:
Για την επιμέρους ΝOP (Number of Plays) βαθμολογία ας πούμε του "Premonition 13", που συνολικά το ακουσα 20 φορές και είναι ο π.χ. 5ος πιο πολυπαιγμένος δίσκος μου για αυτή την χρονιά, έχουμε:

ΝΟΡ = 2 πόντοι (από την πριμοδότηση) + οι πόντοι από τις τοπ 3 εβδομάδες (π.χ. 35/3) = 2 + 35/3 πόντοι.


Αυτός λοιπόν είναι ένας αρκετά ακριβής τρόπος να μετρήσουμε την αξία ενός δίσκου βάσει του δείκτη ΝΟΡ.


Έχουμε λοιπόν μια συνάρτηση:

Premonition 13 |-> NOP(Premonition 13) = 2 + 35/3 = 13,66

B |-> NOP(B)= Χ

Γ |-
> ΝΟΡ(Γ)= Υ

Αυτός με το μεγαλύτερο ΝΟΡ κερδίζει αυτό τον επιμέρους δείκτη.


Απομένει να κάνουμε κάτι παρόμοιο και για τους άλλους δείκτες π.χ. "καινούργια μουσική πρόταση/καινοτομία", "απήχηση/επιδραστικότητα", "απλά το γουστάρω", "ποιότητα στίχων" κλπ.


Ο δείκτης DIG για παράδειγμα μετράει πόσο το γουστάρω
:

DIG(Premonition 13)=9

O δείκτης LYR μετράει την ποιότητα των στίχων:

LYR(Premonition13)=9


Η αξία του Premonition 13 δηλαδή είναι μέχρι τώρα:

TOTAL(Premonition13) = NOP(Premonition13) + DIG(Premonition 13) + LYR(Premonition13) = 13,67 + 9 + 9


Φυσικά είναι σωστότερο να βάλουμε κάποιους συντελεστές/weights μπροστά από τα LYR, DIG, NOP κλπ. που να ανταποκρίνονται στη βαρύτητα του κάθε δείκτη. Κάπως έτσι δηλαδή:


TOTAL = 1 x NOP + 2 x DIG + 1 x LYR + 3 x INN


INN = relative innovation, π.χ. ΙΝΝ(PREMONITION 13) = 0, ΙΝΝ(ULCERATE) = 1

Κάπως έτσι λοιπόν φτάνουμε στην εξίσωση της δημιουργίας λίστας με τα καλύτερα άλμπουμ της χρονιάς. Ελπίζουμε πως θα την υιοθετήσουν όλοι οι αναγνώστες μας, για να έχουμε επιτέλους σωστές λίστες:"




\[ TRV(r_j) =\sum_1^n w_i \cdot Ind_i (r_j) \, , \]
where $TRV(r_j)$ is the total record value of the $j^{\text{th}}$ record, $1 \leq j \leq k$, with respect to the $n$ in number indexes of your choice. $Ind_i$ is the $i^{\text{th}}$ index, $w_i$ the weight corresponding to the $i^{\text{th}}$ index and $k$ is the total number of records entering the competition.

2 comments:

  1. You really need to get a second hobby OTHER than music that can absorb some of the excess energy. Basket-weaving perhaps.

    And you really need to get the list obsession checked out before it is too late...

    ReplyDelete
  2. Αυτό που έχει γίνει είναι απλά πανέμορφο!!

    ReplyDelete