Γεώργιος Α. Παυλόπουλος (Μεταδιδακτορικός φοιτητής), Ιωάννης Ηλιόπουλος (Επίκουρος Καθηγητής)
Εργαστήριο Βιοπληροφορικής και Υπολογιστικής Βιολογίας, Ιατρική Σχολή Πανεπιστημιίου Κρήτης, Ηράκλειο, Ελλάς.
Η Βιοπληροφορική και η Υπολογιστική Βιολογία είναι σύγχρονοι κλάδοι της επιστήμης που κυρίως αφορούν την ανάπτυξη λογισμικού και την εφαρμογή αλγόριθμων για την επεξεργασία βιοïατρικών δεδομένων με απώτερο σκοπό την κατανόηση πολύπλοκων βιολογικών μηχανισμών και την ανακάλυψη καινούριας γνώσης. Η δημιουργία αυτών των κλάδων όπου ουσιαστικά είναι το πάντρεμα μεταξύ της πληροφορικής, βιολογίας και ιατρικής ήταν μια επιτακτική ανάγκη δεδομένης της ανάγκης για διαχείριση του τεράστιου όγκου πληροφορίας που είναι σήμερα διαθέσιμος στις βιοεπιστήμες.
Σήμερα ζούμε στην εποχή των «Μεγάλων Δεδομένων» [1], όπου η εκθετική αύξηση του όγκου των δεδομένων στην έρευνα για τις βιοεπιστήμες είναι αδιαμφισβήτητη. Σήμερα η σχετική βιβλιογραφία χαρακτηριστικά αποτελείται σήμερα ~27 εκατομμύρια περιλήψεις δημοσιευμένων εργασιών στην PubMed και ~3,5 εκατομμύρια πλήρη κείμενα στην PubMedCentral. Επιπλέον, υπάρχουν περισσότερες από 300 θεμελιωμένες βιολογικές βάσεις δεδομένων με πληροφορίες σχετικά με διάφορες βιολογικές οντότητες και τις ενώσεις τους. Προφανή παραδείγματα περιλαμβάνουν: ασθένειες, οι πρωτεΐνες, τα γονίδια, τα χημικά προϊόντα, μεταβολικά μονοπάτια, μικρά μόρια, οντολογίες, ακολουθίες και δομές πρωτεϊνών και νουκλεοτιδικών μορίων, καθώς και δεδομένα που σχετίζονται με την έκφραση γονιδίων.
H πρώτη χαρτογράφηση του ανθρώπινου γονιδιώματος (2002) πήρε περίπου 13 χρόνια για να ολοκληρωθεί ενώ το κόστος ανήλθε σε περίπου $3 δισεκατομμύρια δολάρια. Ωστόσο, μπορούμε σήμερα να χαρτογραφήσουμε ένα ανθρώπινο γονιδίωμα για $1.000 και μπορούμε να αποκωδικοποιήσουμε περισσότερα από 320 γονιδιώματα σε μία εβδομάδα [2]. Αξίζει να σημειωθεί ότι, μόνο πολύ λίγα είδη (~ 12.000) έχουν αλληλουχηθεί πλήρως, ενώ ένα μεγάλο μέρος της λειτουργίας των γονιδίων τους δεν είναι πλήρως κατανοητό ή εξακολουθεί να παραμένει τελείως άγνωστο [3]. Για να δώσουμε μια τάξη μεγέθους, το ανθρώπινο γονιδίωμα είναι ~3,3 δισεκατομμύρια ζεύγη βάσεων σε μήκος και αποτελείται από πάνω από ~20.000 ανθρώπινα γονίδια οργανωμένα σε 23 ζεύγη χρωμοσωμάτων [4, 5]. Ότι αφορά τις πρωτεΐνες, σήμερα πάνω από 60,000 πρωτεϊνικές δομές έχουν διευκρινιστεί [6] αλλά παρόλα αυτά , πολλές από τις λειτουργίες τους παραμένουν άγνωστες ή μερικώς κατανοητές.
Δεδομένων των τεχνολογικών επιτευγμάτων στον τομέα της βιολογίας και βιοπληροφορικής όπως οι τεχνικές αλληλούχισης νέας γενιάς, το πεδίο της εξατομικευμένης ιατρικής είναι στα πρόθυρα μιας επανάστασης, προτείνοντας μια αναπροσαρμογή της υγειονομικής περίθαλψης που θα λαμβάνει υπόψιν τον γονότυπο ενός ασθενούς και όχι απλά τον φαινότυπο. Έτσι ιδανικά ένα φάρμακο θα χορηγείται σε έναν ασθενή ανάλογα με το γενετικό του προφίλ και ανάλογα με βιοδείκτες που τον χαρακτηρίζουν προσπαθώντας να εξαλειφθούν οι όποιες παρενέργειες και παράλληλα να γίνεται η επιλογή του καταλληλότερου φαρμάκου. Φυσικά κάτι τέτοιο θα επαναπροσδιορίσει τις τεχνικές σχεδίασης φαρμάκων από τις εκάστοτε φαρμακευτικές εταιρίες. Επιπλέον, γνωρίζοντας τον γονότυπο ενός ατόμου θα μπορούμε ακόμη να προβλέψουμε ότι μελλοντικά, το άτομο αυτό, θα μπορούσε να εμφανίσει κάποιες ασθένειες έτσι ώστε να γίνει μια επιτυχής πρόληψη η οποία όχι μόνο θα μπορούσε να αποτρέψει δυσάρεστες καταστάσεις για το άτομο αλλά και θα μπορούσε να γλυτώσει επιπλέον επιβαρύνσεις του υγειονομικού συστήματος (έξοδα νοσηλείας κλπ).
Ένας άλλος τομέας της Βιοπληροφορικής ο οποίος βρίσκεται σε ανάπτυξη είναι και αυτός της ανάλυσης μεγάλης ποσότητας βιβλιογραφικών δεδομένων. Η εξόρυξη πληροφορίας μέσα από τα εκατομμύρια επιστημονικών άρθρων είναι μια πρόκληση και οι κύριοι άξονες είναι πρώτα η οργάνωση της τεράστιας αυτής πληροφορίας έτσι ώστε να γίνει κατανοητή και πιο χρήσιμη αλλά και η ανακάλυψη νέας γνώσης μέσα από επιστημονικά άρθρα.
Φυσικά, μέσα σε όλο αυτόν το χώρο η πληροφορική έρχεται να παίξει ένα σπουδαίο ρόλο όπου σύγχρονα πληροφοριακά συστήματα θα πρέπει να υλοποιηθούν ώστε οι πληροφορίες αυτές να συνοδεύονται από ιατρικό ιστορικό και ψηφιακές εικόνες ενώ παράλληλα να εγγυώνται το ιδιωτικό απόρρητο.
Βιβλιογραφία
1. Howe D, Costanzo M, Fey P, Gojobori T, Hannick L, Hide W, Hill DP, Kania R, Schaeffer M, St Pierre Set al: Big data: The future of biocuration. Nature 2008, 455(7209):47-50.
2. May M: LIFE SCIENCE TECHNOLOGIES: Big biological impacts from big data. Science 2014:Mike May.
3. Reddy TB, Thomas AD, Stamatis D, Bertsch J, Isbandi M, Jansson J, Mallajosyula J, Pagani I, Lobos EA, Kyrpides NC: The Genomes OnLine Database (GOLD) v.5: a metadata management system based on a four level (meta)genome project classification. Nucleic Acids Res 2015, 43(Database issue):D1099-1106.
4. International Human Genome Sequencing C: Finishing the euchromatic sequence of the human genome. Nature 2004, 431(7011):931-945.
5. Ezkurdia I, Juan D, Rodriguez JM, Frankish A, Diekhans M, Harrow J, Vazquez J, Valencia A, Tress ML: Multiple evidence strands suggest that there may be as few as 19,000 human protein-coding genes. Human molecular genetics 2014, 23(22):5866-5878.
6. Berman H, Henrick K, Nakamura H: Announcing the worldwide Protein Data Bank. Nat Struct Biol 2003, 10(12):980.