top of page
Search

Η Τεχνητή Νοημοσύνη στον Κόσμο της Μουσικής

  • Petros Kizas
  • Jun 11, 2024
  • 7 min read

Updated: Jun 13, 2024

  



Τα τελευταία χρόνια, η τεχνολογία της τεχνητής νοημοσύνης (ΤΝ) έχει αρχίσει να επηρεάζει διάφορους τομείς της τέχνης, προκαλώντας προβληματισμό και ανησυχία σε πολλούς καλλιτέχνες σχετικά με το μέλλον του επαγγέλματός τους. Η ΤΝ έχει διεισδύσει δυναμικά στην καθημερινότητά μας, αλλάζοντας τον τρόπο με τον οποίο ζούμε, εργαζόμαστε και δημιουργούμε.

Ένα από τα πιο συναρπαστικά και αμφιλεγόμενα πεδία όπου η ΤΝ κάνει την παρουσία της αισθητή είναι η μουσική. Μέσα από νέες δυνατότητες και εργαλεία, η ΤΝ επαναπροσδιορίζει τη δημιουργικότητα στη μουσική, ανοίγοντας δρόμους που προηγουμένως ήταν αδιανόητοι. Σε αυτό το άρθρο, θα προσπαθήσω να εμβαθύνω στον αντίκτυπο της ΤΝ στη μουσική δημιουργικότητα, εξερευνώντας τεχνικά ζητήματα, όπως τα χαρακτηριστικά των μοντέλων ΤΝ που χρησιμοποιούνται για τη δημιουργία μουσικής, εξηγώντας πώς λειτουργούν αυτά τα μοντέλα και ποια είναι τα βήματα της διαδικασίας. Επιπλέον, θα προσπαθήσω να αγγίξω ευαίσθητα ερωτήματα όπως το τι συνιστά τέχνη και δημιουργία, και αν τα έργα που παράγονται από την ΤΝ μπορούν να θεωρηθούν τέχνη.



Ιστορική Αναδρομή


Η ιστορία της τεχνολογίας στη μουσική είναι γεμάτη σημαντικές καινοτομίες που άλλαξαν τον τρόπο που δημιουργούμε και απολαμβάνουμε τη μουσική. Ξεκινώντας από τον φωνόγραφο του Τόμας Έντισον το 1877, η δυνατότητα ηχογράφησης και αναπαραγωγής ήχου άνοιξε νέες προοπτικές για τους μουσικούς και το κοινό. Οι πρώτες αντιδράσεις ήταν ανάμεικτες, με πολλούς μουσικούς να ανησυχούν ότι η τεχνολογία αυτή θα καταργούσε την αξία των ζωντανών παραστάσεων. Ωστόσο, ο φωνόγραφος επέτρεψε στους καλλιτέχνες να διαδώσουν τη μουσική τους σε παγκόσμιο επίπεδο και να φτάσουν σε ακροατήρια που ποτέ δεν θα μπορούσαν να φτάσουν αλλιώς.

Στον 20ό αιώνα, η εισαγωγή των ηλεκτρικών οργάνων, όπως η ηλεκτρική κιθάρα και τα συνθεσάιζερ, προκάλεσε ακόμη περισσότερες ανησυχίες. Οι παραδοσιακοί μουσικοί φοβήθηκαν ότι αυτά τα νέα όργανα θα αντικαθιστούσαν τα ακουστικά και θα αλλοίωναν την ποιότητα της μουσικής. Ωστόσο, τα ηλεκτρικά όργανα άνοιξαν τον δρόμο για νέες μορφές μουσικής έκφρασης, όπως η ροκ, η ποπ και η ηλεκτρονική μουσική, επιτρέποντας στους καλλιτέχνες να πειραματιστούν με νέους ήχους και τεχνικές.

Η ψηφιακή επανάσταση της δεκαετίας του 1980 και του 1990 έφερε ακόμη μεγαλύτερες αλλαγές. Τα ψηφιακά εργαλεία ηχογράφησης και η τεχνολογία MIDI έκαναν την ηχογράφηση και επεξεργασία μουσικής πιο προσιτή και ευέλικτη από ποτέ. Τα drum machines και οι τράπεζες ήχων επέτρεψαν στους μουσικούς να δημιουργήσουν σύνθετους ρυθμούς και να έχουν πρόσβαση σε μια ποικιλία ήχων που προηγουμένως θα ήταν αδύνατο να αποκτηθούν χωρίς ακριβά στούντιο και εξοπλισμό. Και εδώ, όμως, υπήρξαν ανησυχίες. Πολλοί μουσικοί ανησυχούσαν ότι η υπερβολική εξάρτηση από τα ψηφιακά εργαλεία θα οδηγούσε σε απώλεια της αυθεντικότητας και της ζωντάνιας της μουσικής.

Θυμάμαι ως ντράμερ, πιτσιρικάς τότε, στη δεκαετία του '80 και του '90 την εισαγωγή των drum machines. Αυτές οι συσκευές είχαν τη δυνατότητα να παίζουν ντραμς βάσει των οδηγιών του χειριστή, προσφέροντας ρυθμούς, εισαγωγές, γέφυρες και φινάλε. Οι μουσικοί που συνήθως έπαιζαν πλήκτρα μας αντικατέστησαν με τα drum machines για να μειώσουν τα έξοδα και να αυξήσουν τα κέρδη τους. Αυτό μας ανησύχησε, καθώς υπήρχε ο φόβος ότι κάποια στιγμή όλοι θα μπορούσαμε να αντικατασταθούμε από αυτό το μαραφέτι. Ωστόσο, μακροπρόθεσμα, η τεχνολογία αυτή έκανε περισσότερο καλό παρά κακό, δίνοντας τη δυνατότητα σε μουσικούς με περιορισμένο προϋπολογισμό να δημιουργήσουν μουσική πιο οικονομικά και να εκφραστούν δημιουργικά χωρίς να χρειάζεται να πάνε σε μεγάλα στούντιο.


Πώς Λειτουργεί η ΤΝ


Η ΤΝ χρησιμοποιεί τεχνικές μηχανικής μάθησης (machine learning) και βαθιάς μάθησης (Deep Learning) για να δημιουργήσει μουσική. Οι δύο κύριες κατηγορίες μοντέλων είναι τα Μοντέλα Γεννητικής Αντίστροφης Δικτύωσης (Generative Adversarial Networks - GANs) και τα Αναδρομικα Νευρωνικα Δίκτυα (Recurrent Neural Networks - RNNs).

Τα GANs αποτελούνται από δύο νευρωνικά δίκτυα που ανταγωνίζονται μεταξύ τους: ένα γεννήτορα και έναν διακριτή. Ο γεννήτορας δημιουργεί νέες μουσικές συνθέσεις, ενώ ο διακριτής αξιολογεί αυτές τις συνθέσεις και προσπαθεί να διακρίνει αν είναι πραγματικές ή ψεύτικες. Μέσω αυτής της διαδικασίας ανταγωνισμού, ο γεννήτορας βελτιώνεται συνεχώς, παράγοντας όλο και πιο πειστικές μουσικές συνθέσεις. Αυτός ο ανταγωνιστικός μηχανισμός βοηθά στη δημιουργία μουσικής που μοιάζει ανθρώπινη και είναι υψηλής ποιότητας.

Τα RNNs, ειδικά οι παραλλαγές τους όπως τα Long Short-Term Memory (LSTM) και τα Gated Recurrent Units (GRUs), είναι ιδανικά για μουσική δημιουργία λόγω της ικανότητάς τους να διαχειρίζονται ακολουθίες δεδομένων και να μαθαίνουν από μακροπρόθεσμες εξαρτήσεις. Αυτά τα δίκτυα μαθαίνουν από υπάρχουσες μουσικές συνθέσεις, αναλύοντας τα μοτίβα και τις δομές που τις χαρακτηρίζουν. Έτσι, μπορούν να χρησιμοποιήσουν αυτές τις γνώσεις για να παράγουν νέα μουσικά κομμάτια που έχουν συνοχή και ρυθμική αρμονία.


Η Διαδικασία Σύνθεσης Μουσικής με ΤΝ


  1. Εκπαίδευση με Δεδομένα Μουσικής: Τα μοντέλα ΤΝ εκπαιδεύονται χρησιμοποιώντας μεγάλα σύνολα δεδομένων από μουσικά κομμάτια. Αυτά τα δεδομένα περιλαμβάνουν τις νότες, τους ρυθμούς, τις διάρκειες και άλλες μουσικές παραμέτρους. Αυτή η διαδικασία εκπαίδευσης είναι παρόμοια με το να διδάσκεις ένα μαθητή μουσικής πώς να παίζει ένα όργανο χρησιμοποιώντας πολλά παραδείγματα.

  2. Προετοιμασία Δεδομένων: Πριν την εκπαίδευση, τα δεδομένα συχνά μετατρέπονται σε μορφή που μπορεί να καταλάβει η ΤΝ, όπως η μορφή MIDI. Η μορφή MIDI είναι ένας τρόπος να αντιπροσωπεύουμε μουσική με ψηφιακό τρόπο, περιγράφοντας κάθε νότα και το πώς παίζεται.

  3. Εκπαίδευση του Μοντέλου: Κατά την εκπαίδευση, το μοντέλο μαθαίνει να προβλέπει την επόμενη νότα ή τη συνέχεια ενός μουσικού κομματιού, βασισμένο στις προηγούμενες νότες. Τα RNNs είναι πολύ καλά σε αυτό επειδή μπορούν να θυμούνται τι έχει συμβεί στο παρελθόν και να χρησιμοποιούν αυτές τις πληροφορίες για να δημιουργήσουν μουσική που έχει συνοχή και ρυθμική αρμονία.

  4. Δημιουργία Νέας Μουσικής: Αφού εκπαιδευτεί, το μοντέλο μπορεί να χρησιμοποιηθεί για τη δημιουργία νέων μουσικών κομματιών. Οι χρήστες μπορούν να δώσουν στο μοντέλο μια αρχική ακολουθία (seed sequence), δηλαδή μια μικρή σειρά από νότες, και το μοντέλο θα δημιουργήσει το υπόλοιπο του κομματιού βασισμένο στις γνώσεις που έχει αποκτήσει.


Πιο κάτω παραθέτω ένα βίντεο που έφτιαξα με τη βοήθεια μοντέλων ΤΝ, με σκοπό να εξερευνήσω τις δυνατότητές τους. Σαν πείραμα, έγραψα ένα τετράστιχο και προσπάθησα να παράξω μουσική σε πολλά διαφορετικά στυλ, για να δω πώς θα αποδοθεί από τα μοντέλα.

Το τετραστοιχο ειναι:


We’re rebels tonight, ready to fight,

With a roar and a shout, we'll light up the night.

No rules, no chains, we’re breaking away,

Rock 'n' roll forever, we’re here to stay!



Παραδείγματα Εφαρμογών ΤΝ στη Μουσική


OpenAI's MuseNet: Το MuseNet είναι ένα μοντέλο ΤΝ που μπορεί να συνθέσει μουσική σε διάφορα στυλ και είδη, όπως κλασική, τζαζ και ποπ. Μπορεί να πάρει μια αρχική ακολουθία από νότες και να συνεχίσει να δημιουργεί μουσική που ταιριάζει στο επιθυμητό στυλ.

Google Magenta: Το Google Magenta χρησιμοποιεί ΤΝ για να δημιουργήσει νέους ήχους και μουσική. Μεταξύ των εργαλείων του είναι το NSynth, που δημιουργεί νέους ήχους, και το MusicVAE, που μπορεί να δημιουργήσει μεταβάσεις και παραλλαγές μουσικών φράσεων, επιτρέποντας στους μουσικούς να πειραματιστούν με νέες ιδέες και ήχους.


Άλλα μοντέλα ΤΝ που παράγουν μουσική είναι μεταξυ αλλων τα Jukedeck, Amper Music, AIVA, Amadeus Code και Melodrive, suno κλπ. ανάλογα με τις απαιτήσεις του χρήστη και το στυλ με το οποίο θέλει να ασχοληθεί.


Ηθικά και Φιλοσοφικά Ερωτήματα


Η ενσωμάτωση της ΤΝ στη μουσική δημιουργικότητα εγείρει σημαντικά φιλοσοφικά και ηθικά ζητήματα. Τι είναι τέχνη; Τι είναι δημιουργία; Μπορεί αυτό που παράγεται από την ΤΝ να θεωρηθεί τέχνη;

Η τέχνη συχνά ορίζεται ως η έκφραση της ανθρώπινης δημιουργικότητας και συναισθημάτων μέσω διαφόρων μέσων, όπως η μουσική, η ζωγραφική και η λογοτεχνία. Όταν η ΤΝ δημιουργεί μουσική, χρησιμοποιεί δεδομένα και αλγορίθμους για να παράγει ένα αποτέλεσμα. Αυτή η διαδικασία, αν και εντυπωσιακή, διαφέρει από την ανθρώπινη δημιουργικότητα, η οποία συνδυάζει προσωπικές εμπειρίες, συναισθήματα και φαντασία. Η ερώτηση αν η μουσική που παράγεται από την ΤΝ μπορεί να θεωρηθεί τέχνη είναι περίπλοκη και προκαλεί έντονες συζητήσεις.

Από τη μία πλευρά, η ΤΝ μπορεί να δημιουργήσει μουσικά κομμάτια που είναι τεχνικά άρτια και αισθητικά ευχάριστα. Αυτά τα κομμάτια μπορούν να ακούγονται ως εντελώς νέες συνθέσεις και να προκαλούν συναισθήματα στο κοινό. Από την άλλη πλευρά, αυτά τα κομμάτια στερούνται της ανθρώπινης αφής και των συναισθηματικών εκφράσεων που συνήθως χαρακτηρίζουν την τέχνη. Ορισμένοι υποστηρίζουν ότι η τέχνη απαιτεί την ανθρώπινη πρόθεση και το συναίσθημα, κάτι που η ΤΝ δεν μπορεί να προσφέρει. Άλλοι, ωστόσο, πιστεύουν ότι η ΤΝ μπορεί να παράγει τέχνη, αρκεί να προκαλεί συναισθήματα και να εμπνέει το κοινό.

Επιπλέον, υπάρχουν ανησυχίες σχετικά με τα δικαιώματα πνευματικής ιδιοκτησίας. Αν ένα κομμάτι μουσικής που δημιουργήθηκε από ΤΝ βασίζεται σε υπάρχουσες συνθέσεις, ποιος έχει τα δικαιώματα; Ο δημιουργός του αλγορίθμου, ο χρήστης που παρείχε τα δεδομένα ή η ίδια η μηχανή; Αυτά τα ερωτήματα δεν έχουν ακόμη ξεκάθαρες απαντήσεις και αποτελούν σημαντικό ζήτημα για τη μελλοντική νομοθεσία και τις πρακτικές στη μουσική βιομηχανία.


Το Μέλλον του Επαγγέλματος του Συνθέτη


Η τεχνητή νοημοσύνη επαναπροσδιορίζει τη μουσική δημιουργικότητα, προσφέροντας νέα εργαλεία για τη σύνθεση, την παραγωγή και την κατανάλωση μουσικής. Παρά τις προκλήσεις και τα φιλοσοφικά ερωτήματα, η ΤΝ προσφέρει μοναδικές ευκαιρίες για εξέλιξη και καινοτομία. Οι μουσικοί του μέλλοντος θα πρέπει να προσαρμοστούν στις νέες τεχνολογίες, αξιοποιώντας τα εργαλεία της ΤΝ για να δημιουργήσουν πρωτοποριακά έργα που συνδυάζουν την ανθρώπινη φαντασία με την τεχνολογική καινοτομία.

Οι συνθέτες θα χρειαστεί να αναπτύξουν νέες δεξιότητες και να εξοικειωθούν με τα εργαλεία ΤΝ, ώστε να ενσωματώσουν αυτές τις τεχνολογίες στη δημιουργική τους διαδικασία. Η ΤΝ μπορεί να χρησιμοποιηθεί για την παραγωγή ιδεών, την αναζήτηση νέων μουσικών μοτίβων και τη βελτιστοποίηση της παραγωγής. Παράλληλα, η ανθρώπινη δημιουργικότητα και φαντασία θα παραμείνουν αναντικατάστατες, προσφέροντας την απαραίτητη έμπνευση και συναίσθημα που η ΤΝ δεν μπορεί να αναπαράγει.

Η συνεργασία μεταξύ ανθρώπων και μηχανών μπορεί να οδηγήσει σε μια νέα εποχή στη μουσική βιομηχανία, γεμάτη νέες μορφές έκφρασης και δημιουργικότητας. Οι συνθέτες θα έχουν τη δυνατότητα να εξερευνήσουν νέους δρόμους και να επεκτείνουν τα όρια της μουσικής δημιουργίας, συνδυάζοντας την τεχνολογική καινοτομία με την παραδοσιακή τέχνη. Αυτή η συνεργασία μπορεί να δημιουργήσει μοναδικά έργα που θα εμπνέουν και θα προκαλούν το κοινό, διατηρώντας την τέχνη της μουσικής ζωντανή και συναρπαστική.



Παρακάτω παραθέτω κάποια τραγούδια που δημιούργησα με τη χρήση διαφόρων μοντέλων τεχνητής νοημοσύνης.


Σε στυλ queen


Silicon Hearts


Σε στυλ Bruce Springsteen.

Through the storm

Alternative Rock

Ambitious man


Gothic Metal (sample)

Gothic Metal

 

Παρακάτω παραθέτω ένα stand-up comedy κομμάτι που δημιούργησα με τη χρήση μοντέλου τεχνητής νοημοσύνης, με θέμα την ίδια την τεχνητή νοημοσύνη

standup comedy about AI music

*Για περισσότερες μουσικές συνθέσεις που σχετίζονται με την τεχνολογία της Τεχνητής Νοημοσύνης, επισκεφτείτε την ενότητα "My Compositions" σε αυτήν την ιστοσελίδα. Το άλμπουμ "Echoes of Algorithms" δημιουργήθηκε με τη βοήθεια Τεχνητής Νοημοσύνης.

 
 
 

Comments


©2022 by PetrosKizas

bottom of page