Μουσική και Τεχνητή Νοημοσύνη (ΑΙ)

Το θέμα “Τεχνητή Νοημοσύνη” είναι φυσικά πολύ γενικότερο της μουσικής, πόσο μάλλον ειδικά του ρεμπέτικου.

Παρ’ όλα αυτά, στα δικά μας μουσικά τεκταινόμενα, η εφαρμογή του στην τεχνητή σύνθεση/παραγωγή μουσικής φαίνεται να έχει πολύ ενδιαφέρον, ειδικά αν σκεφτούμε πως ακόμα είμαστε μόλις στην αρχή του φαινομένου.

Το έχετε παρακολουθήσει; Προς τα που πιστεύετε θα εξελιχθεί και που θα οδηγηθούμε μεσοπρόθεσμα; Πως θα επηρεάσει τους ακροατές αλλά και τους επαγγελματίες μουσικούς τις επόμενες δεκαετίες;

Ένα παράδειγμα.
Το “Gangsta’s Paradise” είναι ένα πασίγνωστο rap κομμάτι από τα 90s. Εδώ, μπορούμε να ακούσουμε να το “ερμηνεύει” ο …Frank Sinatra!

4 «Μου αρέσει»

Εγω δουλεύω πάνω στην ενσωμάτωση A.Ι. σε τραπεζικά και συστήματα και συστήματα ηλεκτρονικής διακυβέρνησης. Οι δυνατότητες που δίνει είναι απεριόριστες και γίνεται ολοένα και πιο εύχρηστη οπότε θα αλλάξει τη ζωή μας πολύ σύντομα.

Σίγουρα θα είναι όπως τα κινητά και το ιντερνέτ. Πριν οχι και τοσα πολλά χρονια μια χαρα μπορούσαμε να ζήσουμε χωρίς αυτά, ενώ σήμερα φαντάζει σχεδόν αδύνατο. Για χειρότερα απο αυτό δεν ξερω, τουλαχιστον οχι αρχικά.

Σχετικά με τη μουσική, σίγουρα αυτοματοποιημένες ηχοληπτικές εργασιες (μιξη αλλά ειδικά το μαστερ κτλ) σιγουρα θα επηρεαστούν άμεσα. Και σε δευτερο χρονο θα έχουμε πετάλια με AI να βαζουν εφέ και να αλλάζουν παραμέτρους (πχ για να κοβουν μικροφωνισμούς και feedback) σε πραγματικό χρόνο.

Για τα πιο μουσικά συμφωνώ με την αναλυση στο κανάλι εδω:

2 «Μου αρέσει»

σιγουρα ειναι θεμα χρησης. οπως και με το μαχαιρι… παντως οι ταινιες, μας προειδοποιησαν…

1 «Μου αρέσει»

Προσωπικά θεωρώ ότι όσο προχωράει η τεχνητή νοημοσύνη τόσο τελειώνει και η αληθινή ζωή…
Θα πετύχουμε να ακούσουμε ξανά την φωνή του Μάρκου σε νέα τραγούδια ?
Θα το ήθελε κανείς ?
Να ακούμε τον Hendrix να παίζει Rammstein?
Δεν βρίσκω κανένα όφελος…
Για να έρθουν σε 15 χρόνια αυτοματοποιημένα ρομπότ που θα κρατάνε όργανα και θα παίζουν ότι τα προγραμματίσουμε ? (Δεν νομίζω ότι απέχουμε πολύ από αυτό…).
Γενικά η τεχνολογία για εμένα είναι κατανοητή στα πλαίσια που σώζει ζωές (ζώων και ανθρώπων) και μας εξυπηρετεί χωρίς να μολύνουμε…
Άλλο να κάνεις ενα mastering, άλλο ένα edit να καθαρίσεις χιόνια, να ακούσουμε καθαρές πρώτες ηχογραφήσεις και άλλο να βάζω τον Μάρκο να παίζει στην Γλυκερία με δεύτερες τον Μητροπάνο…

3 «Μου αρέσει»

Δεν ξέρω… ίσως διαφωνώ γιατί όλο αυτό βασίζεται σε συναισθηματικούς περιορισμούς που βάζουμε πάνω από την “τέχνη” γενικότερα. Γιατί πρέπει η τέχνη να είναι αποτέλεσμα δημιουργίας κάποιου ανθρώπου και γιατί όχι μιας μηχανής;

Και γιατί όχι να μη δίνει όλο αυτό τη δημιουργία νέων μορφών (μετα)μοντέρνας τέχνης. Και γιατί όχι η φωνή του Μάρκου να τραγουδάει ένα σύγχρονο κομμάτι, σαν δήλωση/έκφραση των διαχρονικών προβλημάτων που αντιμετωπίζει ο άνθρωπος;

Νομίζω όποιους φραγμούς βάζουμε είναι στις δικές μας προκαταλήψεις γύρω από το τι είναι τέχνη και τι συναισθηματικό δέσιμο έχουμε με αυτή.

2 «Μου αρέσει»

Και εγω ίσως διαφωνήσω και με το Χρήστο και με τον Πάνο.
Θεωρώ πως η ανθρώπινη παρουσία ακόμα εκτιμάται και την αναζητούμε. Ζούμε σε μια εποχή υβριδική οπου ο αυτοματισμός και η τεχνητή νοημοσύνη έχουν τη θέση τους στην κοινωνία μας, σίγουρα επιρρεάζουν τον τρόπο ζωής μας (πχ οι αυτοματισμοί γλυτωνουν ή και κοστίζουν δουλειές) αλλά η υπολογιστική δύναμη και ακρίβεια νομίζω μας ειναι συλλογικά αδιάφορη ως πνευματική παρουσία.
Θυμάμαι το deep blue to 90κατι, τον υπολογιστή που έπαιζε και συχνά νικούσε σκακιστές όπως τον Κασπάροφ. Κάποιες 10ετίες τώρα αργότερα, δεν ξέρω αν κανείς θα ήθελε να δει για πολύ ώρα 2 υπερ-υπολογιστές να παίζουν σκάκι, ακόμα και αν μπορούν να παράγουν τα πιο εντυπωσιακά παιχνίδια. Θέλουμε να δούμε τους πιο ταλαντουχους σκακιστές.
Ακόμα και σε περιπτώσεις που η τεχνητή νοημοσύνη δεν διακρίνεται πλέον απο την ανθρώπινη, στο σύνολο μας θέλουμε να μάθουμε αν πρόκειται για ανθρωπινο έργο ή τεχνητό. Νομίζω πως μας είναι σημαντικό να ξέρουμε αν κάποιος ξόδεψε όλη του τη ζωή και το ταλεντο του να βγάλει κάτι ή αν πρόκειται για κατι φτιαγμένο τεχνητά. Ανεξάρτητα λοιπόν απο τα επιπεδα που κάθε γενιά υπολογιστών φτάνει, νομίζω οτι πάντα η ανθρώπινη αφοσίωση θα μετριέται αλλιώς.

4 «Μου αρέσει»

Χρήστο θα διαφωνήσω γιατί έχουμε άλλη ερμηνεία για την λέξη τέχνη.
Ίσως είμαι λίγο έως πολύ παραδοσιακός αλλά για μένα τέχνη είναι :

Θεωρώ όλες οι τέχνες είναι ταυτόσημες των εκάστοτε συναισθημάτων των δημιουργών τους.

Επίσης ο Μάρκος είναι ένας, αν μπορεί να αναπαραχθεί τεχνητά τότε μαζί με τον Μάρκο αν αναπαράγουμε άλλους 10 απευθείας περισσεύουν όλοι οι επαγγελματίες μουσικοί του ρεμπέτικου.
Αν η μουσική γράφεται τεχνητά από υπολογιστή (γίνεται ήδη) τότε πάλι περισσεύουν όλοι όσοι γράφουν μουσική.
Άρα μένουν μόνο οι ερασιτέχνες που το κάνουν γιατί τους αρέσει.

Σκεφτείτε έναν αγώνα tennis με ρομπότ, έναν αγώνα φόρμουλα με υπολογιστές κ.τ.λ.

Ακόμη και δραστηριότητες εκτός τέχνης παύουν να έχουν την σημασία τους.

Το βλέπω σαν να πετάμε τους ίδιους τους εαυτούς μας εκτός της ίδιας μας της ζωής, κάτι το οποίο δεν οδηγεί σε ζωή.

1 «Μου αρέσει»

Σε αυτό θα συμφωνήσω!

Από την άλλη, η διάσταση που θέλω να δώσω είναι ότι η τεχνητή νοημοσύνη μπορεί να δώσει τη δυνατότητα και σε άλλες μορφές τέχνης. Ή να δώσει τη δυνατότητα της δημιουργίας σε περισσότερους ανθρώπους.

Για παράδειγμα βλέπω την εξής περίπτωση: Σκηνοθέτης θέλεις να δημιουργήσει μια ταινία μικρού μήκους που να έχει ένα συγκεκριμένο σενάριο. Γράφει το σενάριο, αλλά από μόνος του δεν έχει τη δυνατότητα να φτιάξει τα γραφικά και τη μουσική επένδυση. Οπότε αναθέτει στην τεχνητή νοημοσύνη να του τα φτιάξει (ναι υπάρχουν αυτά!)

Και για να απαντήσω στον Πάνο…

Δεν λέω να αντικατασταθεί ο Μάρκος ή ο κάθε Μάρκος. Αυτό που λέω είναι ότι μπορεί να χρησιμοποιηθεί το στυλ του Μάρκου για να δημιουργηθεί κάτι νέο. Η τεχνητή νοημοσύνη έχει τη δυνατότητα να μαθαίνει και να αναπαράγει μοτίβα… μέχρι εκεί όμως… εμείς μπορούμε να δούμε τι θα κάνουμε με αυτά τα μοτίβα…

Κλείνω με αυτό :rofl:

1 «Μου αρέσει»

Όσες φορές διάβασα αποτέλεσματα απαντήσεων της τεχνητής νοημοσύνης, ήταν ανατριχιαστικά, αλλά δυστυχώς θα μας επιβληθεί ΚΑΙ αυτή η δικτατορία.
Βέβαια δεν έχουμε να φοβηθούμε τίποτα. Έχουμε ΔΗΜΟΚΡΑΤΙΑ.

2 «Μου αρέσει»

Όπως έχουν πει όλοι οι μεγάλοι Ψ (θεραπευτες) της ιστορίας το δυσκολότερο είναι να σκεφτείς το πιο απλό…
Εδώ θα συμπληρώσω με ένα πείραμα που έκαναν και ρώτησαν νήπια και ενήλικες για το πόσες χρήσεις έχει ένας συνδετήρας.
Οι ενήλικες σκέφτηκαν κάπου 10 και κάτι, τα νήπια σκέφτηκαν 3ψηφιο αριθμό χρήσεων, αυτό μεταφράζεται ως ανύπαρκτη φαντασία & εφευρετικότητα για την ενήλικη ζωή μας, το οποίο σημαίνει ελάχιστη δημιουργικότητα.
Αυτό κολλάει στο γιατί δεν γράφονται τραγούδια σήμερα, όπως στο γιατί το 40 άκουγαν στο καφενείο 3 φορές ένα τραγούδι και το έβγαζαν το βράδυ και σήμερα βλέπουμε νότα νότα το youtube ,και θέλουμε και χρόνο.
Θεωρώ πως ήδη έχουμε αυτοευνουχιστει βρίσκοντας πάντα την ευκολία μας με όλη την γενική τεχνολογία.
Χρήστο με την τελευταία σου φωτογραφία απλά έμεινα παγωτό… Είναι spooky φίλε :open_mouth: , είναι πολύ τρελό το τι μπορεί να κάνει η τεχνητή νοημοσύνη.

2 «Μου αρέσει»

Και αυτό είναι το GPT-3.5! Η τελευταία έκδοση είναι το GPT-4 που δεν το έχω δοκιμάσει γιατί είναι επί πληρωμή. Λένε ότι είναι πολύ πολύ καλύτερο…

1 «Μου αρέσει»

Εδώ βέβαια δεν πρόκειται απλά για μοτίβο. Πέρα που και στο μοτίβο έτσι κι έτσι τα πήγε, το οποίο είναι και το πιο ασήμαντο συγκριτικά με το ουσιαστικό θέμα, εδώ πρόκειται για την καλλιτεχνικά προσομοιωμένη άποψη της τεχνητής νοημοσύνης για τον εαυτό της, δηλαδή για την άποψη (για τον εαυτό της) με την οποία την έχουν “προικίσει” οι προγραμματιστές της, όπως - υποθέτω - την έχουν “προικίσει” και με μια άποψη για κάθε τι το επιστητό.
Το καλλιτεχνικά δύσκολο, που είναι και το κυριολεκτικά καλλιτεχνικό, είναι να φτιάξεις εσύ, εγώ κλπ ένα στιχούργημα με τη δική σου, δική μου κλπ άποψη για την τεχνητή νοημοσύνη σε μοτίβο Τσιτσάνη ή όποιο άλλο. Και να εκτεθείς εσύ ο ίδιος, εγώ, αυτός κλπ, μέσω της δημιουργίας σου (μου, του) και της άποψης που αυτή φέρει.

Και γενικότερα, την ανθρώπινη συνείδηση, γνώση, δημιουργία και τη σκοπιμότητα στην οποία προσανατολίζονται αυτά, τίποτα δεν μπορεί να τα υποκαταστήσει. Όσο κι αν η ΤΝ μπορεί να προβληθεί σαν μυαλό που σκέφτεται στη θέση του ανθρώπινου μυαλού. Κι όσο κι αν η εμπορική της αξιοποίηση “θέλει” να την επιβάλει σαν τέτοιο υποκατάστατο.
Η εφαρμογή της τεχνολογίας όμως πρέπει να προσδιορίζεται από τις ανθρώπινες ανάγκες, και αυτές τις εννοώ σαν ολοκληρωμένο σύνολο κι όχι σαν κάτι το “ευκαιριακό” που εξυπηρετείται στη μια ή την άλλη “τυχαία” συγκυρία. Το ότι κάποια πράγματα μπορούν να γίνονται μόνο και μόνο επειδή μπορούν να γίνουν, δεν είναι και επαρκής λόγος για να γίνονται…
Όσο για τις ανθρώπινες ανάγκες σαν συνολικό περιεχόμενο, ούτε η τεχνητή νοημοσύνη μπορεί να τις καθορίσει, ούτε δυστυχώς κι ο ίδιος ο άνθρωπος για όσο η κοινωνική του ενότητα είναι διασπασμένη σε συμφέροντα εκ θεμελίων αλληλοσυγκρουόμενα. Πρόκειται αφενός για ζήτημα πραγματικής κοινωνικής θέσης, και αφετέρου πλευράς στην οποία “πολιτικά” αυτοτοποθετείται ο άνθρωπος εντός αυτής της διασπασμένης κοινωνικής ενότητας. Νομίζω.

2 «Μου αρέσει»

Το ενδιαφέρον εδώ είναι ότι οι προγραμματιστές της δεν την έχουν προικίσει ακριβώς με αυτή την άποψη ή με την κάθε άποψη. Στην πραγματικότητα ο τρόπος που λειτουργούν αυτά τα μηχανήματα είναι αρκετά απλός στη γενική του μορφή και έχει και μια ιδιαίτερη ομορφιά. Θα προσπαθήσω να το εξηγήσω όσο πιο απλά γίνεται:

Τα συστήματα αυτά τα ονομάζουμε LLMs (Large Language Models - Μεγάλα Μοντέλα Γλώσσας). Στην πραγματικότητα είναι ένα σύστημα το οποίο έχει τη δυνατότητα να αναδιατάσσεται και να αναδιοργανώνει τις “συνδέσεις” του εσωτερικά με στόχο να αναγνωρίζει και να αναπαράγει μοτίβα μετά από μια διαδικασία αρχικής εκπαίδευσης. Χωρίς τη διαδικασία εκπαίδευσης το μηχάνημα βγάζει μόνο θόρυβο (white noise) σαν έξοδο.

Η διαδικασία εκπαίδευσης γίνεται συγκεντρώνοντας όσο το δυνατόν περισσότερο υλικό σε μορφή κειμένου, το οποίο συνήθως προκύπτει από το διαδίκτυο (wikipedia, forums, διάφορα sites κτλ κτλ). Αυτό το υλικό μπορεί να είναι της τάξης των δισεκατομμυρίων λέξεων… Και στην συνέχεια το υλικό αυτό το δίνουν στο μηχάνημα να το διαβάσει. Όσο περισσότερο υλικό του δίνουν τόσο αυτό αναγνωρίζει τα περίπλοκα εσωτερικά μοτίβα της γλώσσας μας και κατ’ επέκταση τα εσωτερικά μοτίβα της ανθρώπινης σκέψης (αν αναγνωρίσουμε ότι η γλώσσα είναι ένα -περιορισμένο- μοντέλο της σκέψης μας).

Μετά αυτό το μοτίβο, μπορεί να το αναπαράγει. Στην πραγματικότητα αυτό που κάνει είναι δίνοντάς του μια πρόταση, αυτό ξεκινάει να τη συμπληρώνει σύμφωνα με το πώς θεωρεί ότι θα έπρεπε να συνεχίσει η πρόταση αυτή βάσει των μοτίβων που γνωρίζει. Η διαδικασία είναι κάπως έτσι:

Με αρχική φράση “Το παιδί πήγε…” το σύστημα προβλέπει ποια είναι η πιο πιθανή λέξη για να συνεχίσει η πρόταση, πχ “σχολείο” , “για”, “στο” κτλ.

Αυτό που είναι ενδιαφέρον είναι ότι για το μηχάνημα ό,τι μπορεί να αναπαρασταθεί ως χαρακτήρες κειμένου είναι ένα μοτίβο γλώσσας, έτσι με τον ίδιο τρόπο μπορεί να παράξει μουσική, ταμπλατούρες, ακολουθίες πρωτεΐνων και άλλα πολλά, μέχρι και να ζωγραφίσει χρησιμοποιώντας χαρακτήρες. Το μόνο που χρειάζεται είναι να έχει εκπαιδευτεί σε κάποιο αντίστοιχο περίπου παράδειγμα.

Αυτό που όμως βρίσκω ακόμα πιο ενδιαφέρον είναι ότι αν λάβουμε υπόψη μας την διαδικασία με την οποία εκπαιδεύτηκε το μηχάνημα, το σύνολο των “ιδεών” του είναι στην πραγματικότητα ένα αμάγαλμα των ιδεών που περιλαμβάνονται στο corpus που χρησιμοποιήθηκε για να εκπαιδευτεί, και άρα είναι ένα αμάγαλμα των ιδεών του συνόλου της ανθρωπότητας. (ή ένας μέσος όρος αυτού)

Ένα μεγάλο πρόβλημα των μοντέλων αυτών πχ είναι ότι πολύ συχνά είναι προκατειλημμένα με τις ίδιες προκαταλήψεις που έχει η πλειοψηφία της ανθρωπότητας. Πολύ συχνά εμφανίζουν σεξιστικές, ρατσιστικές, ομοφοβικές κτλ προκαταλήψεις.

Και για να προσθέσω… μπορεί και υλικό από το φόρουμ μας να έχει χρησιμοποιηθεί στην εκπαίδευση αυτή…

Άρα θα μπορούσαμε να πούμε ότι συνήθως οι νέοι που μπαίνουν στο φόρουμ είναι ευγενικοί, τους απασχολούν οι κλίμακες και οι περισσότεροι γιορτάζουν του Αγίου Νικολάου ?

αυτό ειδικά δεν είναι και τρελό συμπέρασμα :rofl:

@nikosn
@liga_rosa
@nikos_politis

3 «Μου αρέσει»

Αναρωτιομουν κι εγώ γιατί με ταγκαραν στο θέμα της τεχνητής νοημοσύνης :laughing:
Το μόνο σχόλιο που έχω να κάνω προς το παρόν, είναι ότι στην πραγματικότητα η ανθρωπότητα κινδυνεύει από την φυσική ηλιθιότητα :cry:

4 «Μου αρέσει»

Μα αυτά σε ένα βαθμό υπάρχουν ήδη.

Τώρα αν το εφέ και το κόψιμο του μικροφωνισμού δε θα γίνεται με στατιστική επεξεργασία σήματος και υπολογισμό φάσματος αλλά με νευρωνικά δίκτυα δεν είναι και καμιά φοβερή αλλαγή δημιουργικότητας/αισθητικής.

1 «Μου αρέσει»

Νομίζω ότι κι αυτό ένα “προίκισμα” είναι, και μάλιστα επιλεγμένο ειδικά για την ΤΝ που προορίζεται για τη μάζα. Υποθέτω δηλαδή ότι για εφαρμογές που έχει πραγματικά σημασία το τι “ξέρει” η ΤΝ (όχι όμως ότι και για τη γενική “λαϊκή” εφαρμογή της δεν έχει σημασία), η “εκπαίδευσή” της θα είναι ιδιαίτερα επιλεκτική και δεν θα επαφίεται στην “τυχαιότητα” των πληροφοριών του διαδικτύου. Ενώ για την ΤΝ που είναι άμεσα προσβάσιμη στο πλήθος, ο προγραμματισμός αναπαράγει “νοημοσύνη πλήθους”. Οπότε, σύμφωνα με αυτά, πχ δεν μπορούμε να είμαστε και σίγουροι ότι η ΤΝ “ξέρει” αν η γη είναι σφαιρική ή επίπεδη κλπ. “Δημοκρατικό” θα πει κανείς. Όμως δημοκρατία και ελευθερία δεν υπάρχει με αποδιαρθρωμένη γνώση, και η παραγωγή της γνώσης δεν είναι θέμα πλειοψηφίας και μειοψηφίας ούτε αμαλγάματος, υπόκειται σε διαφορετικούς όρους, όρους επιστήμης που δεν είναι ξένοι κι από τους όρους της τέχνης, στο βαθμό που και οι δυο αυτές μορφές δικαιώνονται με την προσπάθειά τους να προσεγγίσουν και να εκφράσουν την αλήθεια. Δεν μπορούμε να ψηφίσουμε για το πόσο κάνει 1+1 ούτε για το σε πόσους βαθμούς βράζει το νερό, και σε τελική ανάλυση ούτε για το αν ο πλούσιος πλουτίζει με τη δουλειά του ή με τη δουλειά των άλλων…
Από αυτές τις απόψεις λοιπόν και η ΤΝ (η άμεσα προσβάσιμη στο πλήθος) είναι πράγματι “προικισμένη” από τους προγραμματιστές της…

Οπότε, θα έλεγα, ο “κίνδυνος” αναπαράγεται τώρα και τεχνητά, στον βαθμό που η ΤΝ αναπαράγει τη “φυσική ηλιθιότητα” και μάλιστα της δίνει δική της “ανεξάρτητη” ζωή υπό όρους “μέσου παραγωγής” της.

Αυτά νομίζω, και πάλι, και αν όχι προφανώς, πάντως σίγουρα το πρόβλημά μου δεν είναι γενικά και αόριστα στην τεχνολογία αλλά στην υπαρκτή διαχείρισή της από αυτούς που την ιδιοποιούνται ως οι ιδιοκτήτες της, πράγμα που δεν αφορά μόνο την ΤΝ βέβαια. Ωστόσο δεν τρέφω και την αυταπάτη, ότι από τη θέση τους σαν ιδιοκτήτες της θα μπορούσαν να κάνουν κάτι καλύτερο, έστω κι αν θα ήταν διαφορετικό. Ακόμα δηλαδή και η επιλεκτικότητά τους (όσον αφορά το τι “πρέπει” - από τη σκοπιά τους - να περιέχει η “νοημοσύνη του πλήθους”) θα ήταν επιλεκτικότητα επίπλαστη και, εν ολίγοις, επίσης πλαστή (όπως και η μη-επιλεκτικότητα). Υψηλής τεχνολογίας καθρεφτάκια και χάντρες για τους ιθαγενείς, προκειμένου να εκποιήσουν και να ανταλλάξουν (να εκποιήσουμε και να ανταλλάξουμε) ό,τι ακόμα δεν έχει εντελώς εκποιηθεί και ανταλλαγεί.

1 «Μου αρέσει»

Ε, και λοιπόν; Από τα ρομπότ περιμένουμε ν’ ακούσουμε ανούσια μουσική χωρίς έμπνευση και φλόγα, χωρίς τέχνη; Ξερουμε και μόνοι μας οι άνθρωποι να βγάλουμε ψεύτικη μουσική, και συχνά με «όργανα» που προγραμματίζονται.

Αν η ψεύτικη ή κακή τέχνη, ή η μη τέχνη, ήταν απειλή, θα μας είχε προ πολλού φάει. Κι εμάς και τη γνήσια τέχνη.