Μια εταιρεία που διευθύνεται από τεχνητή νοημοσύνη μόλις αποκάλυψε πώς θα μπορούσε να είναι πραγματικά το εργασιακό μας μέλλον

Published on January 22, 2026 at 8:35 PM

Μια ομάδα ερευνητών δημιούργησε μια εικονική εταιρεία στελεχωμένη εξ ολοκλήρου από προϊόντα τεχνητής νοημοσύνης για να διαπιστώσει εάν οι μηχανές θα μπορούσαν πραγματικά να αντικαταστήσουν τους ανθρώπους-εργαζομένους.

Τα ευρήματα θα πρέπει να καθησυχάσουν όποιον ανησυχεί για την απώλεια της εργασίας του λόγω της τεχνητής νοημοσύνης.

Είναι η τεχνητή νοημοσύνη στα πρόθυρα να καταλάβει τις δουλειές μας; Ορισμένες εταιρείες στοιχηματίζουν σε αυτήν, ενώ άλλες παραμένουν επιφυλακτικές, αποκαλώντας την τεχνολογία υπερβολικά διαφημισμένη. Ποια είναι, λοιπόν, η αλήθεια;

Σε μια προδημοσίευση μελέτης που δημοσιεύτηκε στο Arxiv, ερευνητές από το Πανεπιστήμιο Carnegie Mellon δημιούργησαν μια προσομοιωμένη εταιρεία και προσέλαβαν προϊόντα Τεχνητής Νοημοσύνης για να τη λειτουργήσουν. Το αποτέλεσμα, ωστόσο, δεν ήταν καθόλου ενθαρρυντικό.

Το "προσωπικό" περιλάμβανε προϊόντα βασισμένα στον Claude της Anthropic, τον GPT-4o της OpenAI, τον Gemini της Google, τον Nova της Amazon, τον Llama της Meta και τον Qwen της Alibaba. Σε κάθε έναν ανατέθηκε ένας ρόλος, όπως οικονομικός αναλυτής, διαχειριστής έργου ή μηχανικός λογισμικού. Εν τω μεταξύ, οι ερευνητές χρησιμοποίησαν μια άλλη πλατφόρμα για να προσομοιώσουν συναδέλφους με τους οποίους έπρεπε να επικοινωνήσουν τα ΑΙΤΙΑ "στελέχη" για συγκεκριμένες εργασίες - συμπεριλαμβανομένου ενός τμήματος ανθρώπινου δυναμικού.

Τα ΑΙ "στελέχη" απέτυχαν σε περισσότερα από τα τρία τέταρτα των εργασιών τους.

Στα ΑΙ "στελέχη" ανατέθηκε μια σειρά εργασιών, από την ανάλυση βάσεων δεδομένων έως τη διεξαγωγή εικονικών περιηγήσεων σε χώρους γραφείων. Το Claude 3.5 Sonnet είχε την υψηλότερη απόδοση, αλλά ακόμη και αυτό κατάφερε να ολοκληρώσει μόνο το 24% των εργασιών του. Υπολογίζοντας τις μερικές ολοκληρώσεις, ο αριθμός αυτός αυξήθηκε σε μόλις 34,4%.

Το Gemini 2.0 Flash ακολούθησε, τερματίζοντας στο 11,4% - και κανένα άλλο ΑΙ "στέλεχος" δεν ξεπέρασε το 10%. Όσον αφορά το κόστος, το Claude 3.5 Sonnet εξοικονόμησε λειτουργικά έξοδα $6,34, σε σύγκριση με τα μέτρια $0,79 του Gemini 2.0 Flash. Ωστόσο, τα συνολικά αποτελέσματα καθιστούν σαφές ότι τα σημερινά εργαλεία τεχνητής νοημοσύνης - παρά την ταχύτητα και την αποτελεσματικότητά τους - απέχουν πολύ από το να είναι ικανά για πραγματικά αυτόνομη εργασία.

Οι ερευνητές σημείωσαν ότι πολλές αποτυχίες προήλθαν από παρερμηνεία ανεπαίσθητων οδηγιών. Όταν τους ζητήθηκε να αποθηκεύσουν ένα αρχείο με επέκταση ".docx", για παράδειγμα, τα ΑΙ δεν το αναγνώρισαν ως έγγραφο του Microsoft Word. Επίσης, σκόνταψαν σε εργασίες που απαιτούσαν επικοινωνία ή κοινωνική συλλογιστική. Η μεγαλύτερη πρόκληση προέκυψε κατά την περιήγηση στο διαδίκτυο - ειδικά κατά τον χειρισμό αναδυόμενων παραθύρων. Και όταν τα συστήματα χάθηκαν, συχνά ακολούθησαν συντομεύσεις, παρακάμπτοντας δύσκολα βήματα και υποθέτοντας λανθασμένα την επιτυχή ολοκλήρωση της εργασίας τους.

Αυτά τα ευρήματα υποδηλώνουν ότι ενώ η τεχνητή νοημοσύνη μπορεί να διαπρέψει σε συγκεκριμένες και στενά καθορισμένες εργασίες, απέχει ακόμη πολύ από το να λειτουργεί ανεξάρτητα. Προς το παρόν, η ανθρώπινη κρίση, η δημιουργικότητα και η προσαρμοστικότητα παραμένουν ζωτικά μέρη οποιουδήποτε χώρου εργασίας.

Add comment

Comments

There are no comments yet.