Παρουσίαση
Τα Σώματα κειμένων
Βιβλιογραφία
Σώματα Κειμένων
Το σώμα κειμένων του Ηλεκτρονικού Κόμβου του Κέντρου Ελληνικής Γλώσσας (ΚΕΓ) [1]
Περικλής Πολίτης ()Λέκτορας
Τμήμα Δημοσιογραφίας και Μέσων Μαζικής Επικοινωνίας
Αριστοτέλειο Πανεπιστήμιο Θεσσαλονίκης
Περιεχόμενα
- Περιγραφή των σωμάτων κειμένων του Ηλεκτρονικού Κόμβου
- Σχολιασμός των ταξινομικών αρχών του Ηλεκτρονικού Κόμβου.
- Διδακτική αξιοποίηση των σωμάτων κειμένων του Ηλεκτρονικού Κόμβου.
- Βιβλιογραφικές αναφορές.
Περιγραφή των σωμάτων κειμένων του Ηλεκτρονικού Κόμβου
Πρόκειται για ηλεκτρονικό σώμα κειμένων δημοσιογραφικού λόγου μεγέθους 1.000.000 λεκτικών τύπων. Τα κείμενα προέρχονται από την ημερήσια εφημερίδα της Θεσσαλονίκης 'Μακεδονία'[2] και καλύπτουν το χρονικό διάστημα από τον Ιανουάριο του 1997 μέχρι τον Μάρτιο του 1998. Επιλέχτηκαν από ένα πολύ μεγαλύτερο σύνολο κειμένων (έκτασης περίπου 122.000.000 λεκτικών τύπων) που παραχωρήθηκε στο ΚΕΓ από τον εκδότη τής εν λόγω εφημερίδας. Αυτό σημαίνει ότι η επιλογή του δείγματος είναι εντελώς αντιπροσωπευτική, στον βαθμό, βέβαια, που η δεξαμενή των κειμένων καλύπτει αναλογικά όλα τα επιμέρους σώματα της εφημερίδας, δηλαδή τις θεματικές στήλες της (ρουμπρίκες).
Η επιλογή των κειμένων έγινε με βάση τα επιμέρους σώματα της εφημερίδας. Για κάθε ένα από αυτά βρέθηκαν, μέσω αυτόματης μέτρησης, οι λεκτικοί τύποι που εμφανίζονται με την υψηλότερη συχνότητα. Οι τύποι αυτοί, ως λέξεις-κλειδιά, αποτέλεσαν το κριτήριο και για την επιλογή των κειμένων. Για παράδειγμα, όσον αφορά το επιμέρους σώμα Αστυνομικά πιθανότατα επιλέχτηκαν κείμενα που περιλαμβάνουν λέξεις-κλειδιά όπως ύποπτος, δράστης, αστυνομικός, τροχαίο ατύχημα κ.λπ.
Σχολιασμός των ταξινομικών αρχών του Ηλεκτρονικού Κόμβου.
Τα επιμέρους σώματα αντιστοιχούν, σε σημαντικό βαθμό, στη δομή της εφημερίδας και είναι τα εξής 15: Απόψεις, Αστυνομικά, Αθλητικά, Διαφημίσεις, Επιστολές, Πολιτιστικά, Καιρός, Κοινωνικά, Οικονομικά, Πολιτική, Ρεπορτάζ, Συνεντεύξεις, Τηλεόραση, Βιογραφίες, Χρήμα. Η σειρά αυτή, με την οποία εμφανίζονται στη μηχανή αναζήτησης του corpus, είναι αλφαβητική (με βάση την αντιστοιχία του ελληνικού προς το λατινικό αλφάβητο) και δεν απεικονίζει τη διάταξη των θεματικών στηλών της εφημερίδας, δηλαδή τη «φιλοσοφία» της σελιδοποίησής της, ούτε υποδηλώνει κάποια άλλη ταξινομική βάση. Η αλφαβητική σειρά των σωμάτων πιθανόν να προκρίθηκε ως πιο ουδέτερη και πιο χρηστική έναντι άλλων λύσεων που προϋποθέτουν ποιοτικά τυπολογικά κριτήρια.
Αξίζει εδώ να σημειωθεί ότι στο εισαγωγικό σημείωμα του corpus γίνεται λόγος για 17 και όχι για 15 «τομείς ενημέρωσης». Παρατίθενται με σειρά που μοιάζει να ακολουθεί απόλυτα τη δομή της εφημερίδας (όχι απαραίτητα και την ονοματολογία των στηλών) και είναι οι εξής: Αστυνομικό δελτίο, Πολιτικό ρεπορτάζ, Ειδησεογραφικό ρεπορτάζ, Οικονομικό ρεπορτάζ, Αθλητικό ρεπορτάζ, Πολιτιστικό ρεπορτάζ, Διαφημιστικό ρεπορτάζ, Επιστολές αναγνωστών, Συνεντεύξεις, Βιογραφικά προσωπικοτήτων, Χρηματιστήριο, Μετεωρολογικό δελτίο, Τηλεοπτικό ρεπορτάζ, Κοινωνικά, Αγγελίες, Ζώδια, Σταυρόλεξα.
Αν συγκρίνει κανείς τους δύο καταλόγους, βρίσκει διαφορές που παρουσιάζουν σημαντικό θεωρητικό ενδιαφέρον και ταυτόχρονα υποδηλώνουν τον ταξινομικό προβληματισμό της ομάδας εργασίας από τον αρχικό σχεδιασμό του corpus μέχρι την υλοποίησή του. Το σώμα Απόψεις (που περιλαμβάνει σχολιαστικά δημοσιογραφικά κείμενα) δεν υπάρχει στον δεύτερο κατάλογο. Τα σώματα Αστυνομικά, Αθλητικά, Διαφημίσεις, Πολιτιστικά, Οικονομικά, Πολιτική, Τηλεόραση δηλώνονται ως είδη ρεπορτάζ στον δεύτερο κατάλογο, ενώ η συγκεκριμένη ονοματοδότηση τομέων κοινωνικής δραστηριότητας που εμφανίζεται στη μηχανή αναζήτησης δεν παραπέμπει υποχρεωτικά σε ρεπορτάζ. Το σώμα Ρεπορτάζ μάλλον αντιστοιχεί στο Ειδησεογραφικό ρεπορτάζ του δεύτερου καταλόγου. Τα σώματα Επιστολές, Καιρός, Κοινωνικά, Συνεντεύξεις, Βιογραφίες και Χρήμα υπάρχουν και στους δύο καταλόγους. Τέλος, τα ήσσονα εφημεριδικά είδη Αγγελίες, Ζώδια, Σταυρόλεξα, αν και, από ό,τι φαίνεται, περιλήφθηκαν στον αρχικό σχεδιασμό, αποκλείστηκαν από το corpus, ίσως επειδή θεωρήθηκε ότι παρουσιάζουν περιορισμένο κειμενικό και γλωσσικό ενδιαφέρον.
Η ονοματολογία των σωμάτων (δηλαδή, των δημοσιογραφικών ειδών λόγου) που χρησιμοποιείται στη μηχανή αναζήτησης του corpus θέτει ορισμένα θεωρητικά προβλήματα ταξινόμησης του δημοσιογραφικού λόγου. Το κυριότερο έχει να κάνει με την (αν)αντιστοιχία θεματικών στηλών και κειμενικών ειδών του δημοσιογραφικού λόγου[3]. Είναι γνωστό ότι οι εφημερίδες, για να εδραιώσουν την εκδοτική τους ταυτότητα και για να διαφοροποιηθούν από τις υπόλοιπες εφημερίδες, επιλέγουν ονόματα θεματικών στηλών τα οποία δεν υποδεικνύουν πάντοτε με σαφήνεια το είδος λόγου που στεγάζουν. Στη συγκεκριμένη περίπτωση δεν είναι σαφές αν οι κατηγορίες Αστυνομικά, Αθλητικά, Οικονομικά κ.λπ. περιλαμβάνουν ειδήσεις (συντάσσονται στα γραφεία των εφημερίδων με πρώτη ύλη τα τηλεγραφήματα) ή ρεπορτάζ (προϋποθέτουν τη μεσολάβηση του ρεπόρτερ, την αυτοψία του στον τόπο του συμβάντος, και έναν φωτισμό προσώπων και πραγμάτων που δεν συναντούμε στην είδηση γραφείου) ή και τα δύο. Αν, πάλι, οι εν λόγω κατηγορίες περιλαμβάνουν και ρεπορτάζ, τότε τι διαφορετικό περιέχεται στη χωριστή κατηγορία Ρεπορτάζ;
Μια άλλη παρατήρηση αφορά το περιεχόμενο σωμάτων όπως Διαφημίσεις, Τηλεόραση, Κοινωνικά και Βιογραφίες. Αρκεί μια μικρή έρευνα στο corpus για να μας πείσει ότι στις Διαφημίσεις δεν περιλαμβάνονται εμπορικές ή άλλου είδους διαφημίσεις -εξάλλου, η διαφήμιση δεν θεωρείται δημοσιογραφικό είδος λόγου, παρά τα κειμενικά υβρίδια που έχουν δημιουργηθεί τα τελευταία χρόνια, όπως για παράδειγμα το advertorial
(μείξη πληροφοριακού και διαφημιστικού λόγου). Περιλαμβάνονται δημοσιογραφικά
κείμενα που παραγγέλλονται από βιομηχανίες ή εμπορικές επιχειρήσεις και
περιγράφουν τα προϊόντα τους, χωρίς, ωστόσο, να τα προωθούν ανοιχτά. Η κατηγορία Τηλεόραση περιλαμβάνει το πρόγραμμα τηλεοπτικών σταθμών, παρουσιάσεις εκπομπών αλλά και τηλεκριτική. Τα Κοινωνικά δεν αναφέρονται τόσο στο κοινωνικό ρεπορτάζ όσο σε αυτό που είναι γνωστό ως στήλη «Κοσμικά». Τέλος, οι Βιογραφίες δεν είναι «πραγματικές» βιογραφίες. Είναι πορτρέτα με τη δημοσιογραφική σημασία του όρου, δηλαδή σκίτσα προσωπικοτήτων που απασχολούν την επικαιρότητα, κάποτε εμπλουτισμένα και με αποσπάσματα από συνεντεύξεις τους.
Αξίζει, επίσης, να σημειωθεί ότι στο corpus έχουν περιληφθεί κατηγορίες κειμένων που συγκροτούν την περιφέρεια του λόγου της έντυπης δημοσιογραφίας, όπως ο Καιρός (δηλαδή, το μετεωρολογικό δελτίο, που είναι κείμενο επιστημονικής εκλαΐκευσης) και το Χρήμα (δηλαδή, η κίνηση του Χρηματιστηρίου, που είναι κι αυτό κείμενο ειδικής πληροφόρησης). Από την άλλη μεριά, έχουν περιληφθεί και Επιστολές αναγνωστών, που αποτελούν μια καθιερωμένη στήλη όλων των μεγάλων εφημερίδων, αλλά σίγουρα δεν συνιστούν δείγμα επαγγελματικού δημοσιογραφικού λόγου. Παρά το γεγονός ότι τα τρία σώματα συνυπάρχουν με τα εδραιωμένα είδη της δημοσιογραφίας, αυτό σε καμιά περίπτωση δεν δημιουργεί προβλήματα στην εκμετάλλευση του corpus. Αντίθετα, έτσι εμπλουτίζονται τα περιεχόμενά του. Πρόβλημα ίσως αποτελεί το ότι, σε μια αναζήτηση λεξικών τεμαχίων (και των περιβαλλόντων τους) σε όλα τα επιμέρους σώματα, τα αποτελέσματα δίνουν μια σωρευτική εικόνα τους. Δεν γίνεται ίσως αντιληπτό ότι σε είδη λόγου όπως τα τρία τελευταία οι συμφραστικοί δείκτες του ύφους (και κυρίως οι ρόλοι του πομπού και του δέκτη) διαφέρουν από τους αντίστοιχους του επαγγελματικού δημοσιογραφικού λόγου, οπότε έχουμε να κάνουμε με άλλο επίπεδο ύφους ή διαφορετική λειτουργική ποικιλία.
Ένα τελευταίο θεωρητικό ζήτημα θέτει η κατάταξη των ειδών λόγου σε ένα μόνο επίπεδο. Αν θεωρήσουμε ότι ο έντυπος δημοσιογραφικός λόγος περιλαμβάνει τρία γένη (ειδησεογραφία, συνέντευξη και σχολιασμό), τότε ενδεχομένως τα είδη λόγου του corpus μπορούν να διαταχθούν σε μια δενδρόσχημη διάταξη δύο επιπέδων. Οι ψηλότεροι κόμβοι του «δένδρου» θα είναι: πρώτον, η ειδησεογραφία, με χαμηλότερους κόμβους τις ειδήσεις, τα ρεπορτάζ (ίσως και τις σύντομες ειδήσεις, αν σ' αυτές παραπέμπει η κατηγορία Αστυνομικά) και τις «βιογραφίες» (πορτρέτα)∙ δεύτερον, η συνέντευξη, και τρίτον, η σχολιογραφία (Απόψεις). Ο Καιρός και το Χρήμα είναι χρηστικά είδη και πρέπει να αποτελέσουν χωριστούς κόμβους, το ίδιο και οι Επιστολές των αναγνωστών. Τέλος, οι ειδήσεις και τα ρεπορτάζ, λόγω του θεματικού τους εύρους, θα περιλαμβάνουν, ως κόμβους του πιο χαμηλού επιπέδου, τα διάφορα είδη τους (π.χ. αθλητική ή οικονομική είδηση∙ πολιτικό ή πολιτιστικό ρεπορτάζ).
Όπως σωστά σημειώνεται στο ενημερωτικό σημείωμα, τα σώματα που επιλέχτηκαν αντιπροσωπεύουν «ενδεικτικά σημασιολογικά πεδία και πράξεις λόγου». Πράγματι, η θεματολογία μιας μεγάλης εφημερίδας, όπως και η 'Μακεδονία', περιλαμβάνει πληθώρα πληροφοριών από διάφορα γνωστικά πεδία. Οι ρουμπρίκες μιας εφημερίδες αντιπροσωπεύουν οικογένειες συμβάντων που κρυσταλλώθηκαν μέσα στην ιστορική διαδρομή του τύπου και πραγματώνονται γλωσσικά με ειδικά λεξιλόγια. Συνεπώς, το corpus, παρά τη μικρή του έκταση, αποτελεί αναντικατάστατο εργαλείο για τη μελέτη και τη διδασκαλία ειδικών λεξιλογίων, πέρα από τη μελέτη και τη διδασκαλία της καθημερινής γλώσσας, η οποία επίσης εξυπηρετείται θαυμάσια. Όσον αφορά τις «πράξεις λόγου», δηλαδή τα συμβάντα λόγου που αποτελούν την πρώτη ύλη των δημοσιογραφικών ειδών λόγου, το corpus αποτελεί ένα εργαστήριο «εθνογραφίας της επικοινωνίας». Μέσα από το υλικό του μπορούν να μελετηθούν και να διδαχτούν αυθεντικά συμβάντα λόγου και πράξης που αφορούν είτε τη δημόσια σφαίρα (για παράδειγμα, πολιτικά ή οικονομικά συμβάντα δημόσιου ενδιαφέροντος) είτε την ιδιωτική σφαίρα (για παράδειγμα, αστυνομικά ή «κοσμικά» συμβάντα).
Διδακτική αξιοποίηση των σωμάτων κειμένων του Ηλεκτρονικού Κόμβου.
Τα σώματα κειμένων που παρουσιάζουμε, εκτός από τη μελέτη των κειμενικών ειδών του δημοσιογραφικού λόγου και της επικαιρότητας, προσφέρονται και για τη μελέτη του συστήματος της Νέας Ελληνικής. Το μορφολογικό λεξικό που συνοδεύει το corpus περιέχει όλους τους γραμματικούς τύπους των επιλεγμένων κειμένων και διασυνδέεται με τα λεξικά του Ηλεκτρονικού Κόμβου. Έτσι, η γλωσσική μελέτη και διδασκαλία εμπλουτίζεται με μη κατασκευασμένα παραδείγματα και οι χρήστες αποκομίζουν μια πραγματική εικόνα της συστημικής δομής της γλώσσας μας και της εξελικτικής της πορείας.
Βιβλιογραφικές αναφορές.
- AdamJ.-M. (1997). "Unités rédactionnelles et genres discursifs: cadre général pour une approche de la presse écrite", Pratiques 94: 3-18.
- Adam J.-M. (2001). "Genres de la presse écrite et analyse de discours", Semen 13: 7-14.
- Grosse E.-U. (2001). "Evolution et typologie des genres journalistiques. Essai d'une vue d'ensemble", Semen 13: 15-36.
1 Υπεύθυνοι για την επιλογή, τον σχεδιασμό και τη συγκρότηση του εν λόγω σώματος κειμένων ήσαν οι καθηγητές κ. Α. Αναστασιάδη-Συμεωνίδη και κ. Ι. Ν. Καζάζης ενώ την τεχνική υποστήριξη του έργου είχε ο αναπληρωτής καθηγητής κ. Γ. Παπανικολάου. Τη σύσταση, κατάρτιση και επεξεργασία του μορφολογικού λεξικού που συνοδεύει το συγκεκριμένο σώμα κειμένων ανέλαβε η κ. Ε. Σκλαβούνου, ερευνήτρια στο Institut Gaspard Monge.
2 Ενώ στην ηλεκτρονική σελίδα αναζήτησης δεδομένων του corpus λέγεται ότι το υλικό προέρχεται από την εφημερίδα 'Μακεδονία', σε υπερκείμενη σελίδα, όπου δίνονται γενικές πληροφορίες για τη σύσταση των λεξικών και των σωμάτων κειμένων του Ηλεκτρονικού Κόμβου, λέγεται ότι το υλικό του corpus προέρχεται από δύο εφημερίδες: τη 'Μακεδονία' και τη 'Θεσσαλονίκη', οι οποίες ανήκουν στον ίδιο εκδοτικό οργανισμό.
3 Για μια πρώτη συστηματική προσέγγιση του ζητήματος βλ. Adam (1997), Adam (2001) και Grosse (2001).