Il record informatico e la produzione delle proteine cellulari

Viviamo nell’era digitale. E’ ormai veramente difficile, se non impossibile, trovare un qualunque processo che non venga in qualche modo gestito, controllato, amministrato o migliorato attraverso l’utilizzo di un computer e di un programma informatico, di un database o di una qualunque applicazione “software”.
In questi contesti, il programmatore e l’operatore di sistemi, database o applicativi informatici, hanno quasi sempre una croce e delizia con cui convivere: quello che in gergo viene spesso definito “il record”.
Non si intende in questo caso il primato ottenuto da un atleta in una specialità – quindi nemmeno una possibile volontà di realizzare la migliore prestazione con un computer – ma dell’unità base di un archivio informatico.
Il record è molto semplicemente un insieme di informazioni, più o meno complesse e ampie, strutturata in uno o più campi.
Per esemplificare, in un insieme che chiameremo “persone”, costituito da svariati record, il singolo record potrebbe contenere per esempio due campi, il campo “nome” ed il campo “cognome”, ma anche i campi “sesso” e “data di nascita”.
Di solito i record possono rappresentare un “incubo” per gli addetti ai lavori e non solo per il fatto che possono contenere informazioni importanti, cosa che di per se può bastare a creare apprensioni quando è a rischio la loro integrità: la condizione che crea grattacapi – ma anche soddisfazioni – a chi ci ha a che fare è a volte la semplice condizione di “variabilità” di questi record.
Per fare un altro esempio, infatti, se il record in questione riguardasse l’ammontare del nostro conto in banca, questo potrebbe subire molto spesso delle variazioni, le quali, cosa ancora più complicata, andrebbero salvate o arricchite da ulteriori dati, al fine di poter disporre di altre informazioni di ritorno, come la quantità di variazione, il momento in cui si è verificata, il motivo e tante altre informazioni.
Quando aggiungiamo un record simile ad uno precedente ma con una variazione nel suo contenuto, spesso viene fatto ricorso ad un’informazione codificata, piuttosto semplice, che ci permette di organizzare ed interpretare le varie informazioni – già presenti o potenzialmente associabili – legate a questi record: lo “stato”.
Continuiamo con un altro esempio, che poi riprenderemo: se in un archivio o database di una banca aggiungo un record ad ogni nuovo conto aperto e devo mantenere un archivio dei conti chiusi, mi serve almeno un “campo” in cui scrivere “A” per identificare lo stato “aperto” di un conto e “C” per identificarne lo stato di “chiuso”; se volessi interrogare l’archivio per avere un ritorno sulla quantità di conti aperti o chiusi mi basterebbe (a) creare il suddetto campo nel record, (b) popolarlo con l’informazione giusta al momento giusto e (c) andare a richiamare quell’informazione, quello “stato” del record, nel momento in cui voglio una risposta alla mia “interrogazione”.
Numero_ record | Codice_conto | Intestatario_conto | Tipologia_conto | Data_apertura | Stato_conto |
1 | AA132989 | ROSSI MARIO | SEMPLICE | 01/01/2014 | A |
2 | AG234456 | BIANCHI LUIGI | CORRISPONDENZA | 06/07/2013 | A |
3 | CR267539 | VERDI LUCIO | SEMPLICE | 01/05/2012 | C |
Fig. 1: Esempio di tabella con record corrispondenti a rispettivi conti bancari; da notare la colonna “Stato_conto” contenente l’informazione relativa allo stato dello stesso .
E’ normale riscontrare queste considerazioni e queste logiche esaminando i dettagli nella gestione delle informazioni che riguardano i programmi ed i database informatici: queste soluzioni sono presenti oggi, all’apice dell’era dell’informazione, grazie a decadi di miglioramenti apportati da esseri intelligenti con quello specifico intento, quindi quello che esiste è quanto di meglio l’uomo sia riuscito a sviluppare in anni e anni di crescita intellettuale e tecnologica.
Può invece apparire meno “normale” scoprire che queste stesse logiche e considerazioni, frutto di anni ed anni di applicazioni da parte dell’uomo, l’essere più intelligente del pianeta, sono pienamente utilizzate nei processi biologici che operano nelle cellule all’interno del nostro corpo, come in quelle di ogni organismo vivente.
E questo avviene dai tempi della comparsa dei primi “semplici” organismi unicellulari, con logiche e processi fondamentalmente invariati.
La produzione delle proteine necessita di una gestione dello stato
Ogni essere vivente è fatto di cellule; ogni cellula è fatta di proteine (o di loro prodotti).
Le proteine non sono “sostanze”, come a volte sentiamo semplicisticamente asserire; è sicuro che da un certo punto di vista ogni cosa è una “sostanza”, anche il computer su cui sto scrivendo, essendo le “sostanze” costituite da atomi ed essendo gli atomi alla base della materia.
Le proteine sono piuttosto meccanismi chimico-elettro-meccanici (e, come vedremo, anche informatici) che costituiscono, costruiscono, regolano, manutengono, gestiscono, trasformano creano e distruggono (ma fanno anche altro) le cellule viventi ed i ed i tessuti di ogni organismo che “vive” (a anche di quelli che “non vivono”, come i virus).
La loro sconfinata diversità è rimarchevole: viene stimato che all’interno delle cellule del corpo umano esistano almeno 25.000 diversi tipi di proteine, ognuna con la sua specificità legata ad un momento, ad uno scopo, ad una quantità necessaria o contestuale per l’espletamento della loro funzione.
Per esempio, le cellule specializzate per svolgere le principali funzioni “difensive” del sistema immunitario, i leucociti, o globuli bianchi, viaggiano attraverso il nostro corpo utilizzando i vasi sanguigni, pronti ad intervenire dove e quando serve.
Come fa il leucocita a sapere dove, quando e come intervenire? Mentre viaggia nel vaso sanguigno, approssimandosi all’area dell’infezione batterica o dell’infiammazione, viene dapprima “ancorato”, quindi rallentato ed infine agevolato nell’infilarsi nel tessuto di un organo adiacente da una serie di specifiche proteine che agiscono coordinatamente.
Ovviamente queste proteine sono a loro volta attivate da altre proteine, a loro volta attivate dall’evento infiammatorio o infettivo.
Il leucocita “ancorato”, rallentato ed arrestato viene quindi avvicinato ai punti di adesione tra cellula e cellula del vaso sanguigno e fatto uscire da esso attraverso una serie incredibile di modificazioni strutturali dello stesso globulo bianco, con innumerevoli e contestuali scambi di segnali con le cellule adiacenti che gli permetteranno di “insinuarsi” tra le pareti cellulari fino a raggiungere la destinazione.
L’incredibile diversità e specificità di proteine indispensabili al verificarsi degli eventi semplicisticamente presentati nel paragrafo precedente, i quali rappresentano una minima parte dei migliaia di processi che servono a rendere possibile la vita, va resa disponibile, nelle quantità, nei tempi e nei modi giusti.
Cosa prepara e produce le proteine nella cellula? La risposta è semplice: altre proteine, a loro volta prodotte nello stesso modo.
Ma facendo un’analogia, penso sia immediato comprendere come, in una linea di produzione che deve sfornare continuamente e sulla base di specifiche esigenze in continua variazione 25.000 pezzi diversi, sia indispensabile gestire il flusso di produzione, in qualche modo.
Anche perché la “fabbrica” in questione, ovvero la cellula, è qualcosa di una complessità quasi incredibile e la scienza fa ancora fatica a capirne a fondo solo i processi principali.
Ad esempio, un solo singolo gene che, nella sua sequenza di nucleotidi, codifica la composizione della relativa proteina, può essere “mescolato” da altri sistemi proteici per produrre più variazioni di una stessa sequenza, il tutto controllato e gestito automaticamente da un sistema che si auto-costruisce a partire dalla prima cellula fecondata – o dalla stessa cellula che si auto-duplica dividendosi automaticamente, come nel caso dei batteri.
La quantità e diversità è tale che in una “fabbrica” del genere un “problema di produzione” non significherebbe solo la linea di produzione ferma, con conseguente perdita economica, ma la stessa vita della cellula e dell’intero organismo che la ospita.
Quindi risulta chiaro che, come minimo, è necessario avere sotto controllo la linea di produzione dei pezzi, potendo controllarne le varie fasi, magari potendo anche sapere a che punto è il singolo pezzo in fase di produzione: una gestione dello “stato”.
Gestione dello stato e informazione
Quando un programma informatico deve controllare le variazioni di un record è necessario che un programmatore assegni semioticamente una condizione ad una informazione e strutturi il programma in modo che questo venga gestito.
Se con il mio programma volessi controllare la produzione di una automobile nella fase finale della sua costruzione, diciamo ad esempio durante la verniciatura, potrei fare in modo che (a) alcuni sensori ottici riconoscano l’entrata della scocca nella vasca di verniciatura, che (b) altri sensori di prossimità azionino le ventole di asciugatura dei modelli verniciati, che (c) un timer disattivi l’asciugatura e che (d) un sensore di peso comporti l’attivazione di un carrello adibito allo spostamento dei modelli verniciati per la successiva fase di produzione.
Se il mio programma seguisse ogni scocca che attraversa questa fase, potrei creare nel database utilizzato dal mio programma un campo specifico che chiameremo “Stato_verniciatura”, in cui memorizzerò l’informazione ricevuta dai vari trasduttori sopra citati in quattro diverse lettere, “A”, “B”, “C” e “D”: con una semplice funzione che confronta i record aventi lo stato “A” e non quelli successivi potrei sapere in tempo reale quante auto devo ancora verniciare, quante sono verniciate e quante sto per consegnare alla fase successiva.
Credo che questo banale esempio possa rappresentare sufficientemente l’utilità nella gestione degli stati in informatica e le sue innumerevoli, infinite applicazioni.
Questo potente mezzo di assegnazione di “significato” e di “scopo” a delle semplici “lettere”, utilizzate però con i dovuti strumenti e nel contesto appropriato, permette di aumentare in maniera impressionante la quantità di informazioni di ritorno da un processo con esse gestito: posso controllare ogni aspetto della qualità nella mia produzione, come la velocità e la precisione, regolarla sulla base delle richieste, del personale, del contesto ambientale, dell’approvvigionamento di materie prime, etc.
Le potenzialità sono pressoché illimitate se attorno a quelle semplici “lettere” c’è una esigenza, un progetto ed un meccanismo che ne consenta la gestione: per sfruttare queste potenzialità, chiaramente, è indispensabile che un essere intelligente modifichi il programma inserendo le istruzioni necessarie.
Lo stato di un record nel RE e nell’apparto di Golgi
Le cellule sono costituite da svariate componenti discrete che svolgono diverse funzioni, detti organuli o organelli.
Tra questi, due importanti parti sono il reticolo endoplasmatico (RE) e l’apparato di Golgi (AG), tra i più importanti nella produzione delle proteine e nel loro smistamento all’interno della cellula.
Le proteine che vengono “lavorate” e distribuite attraverso questi due prodigi elettro-chimico-meccanici, il RE e l’AG, circolano al loro interno utilizzando delle vescicole che si “staccano” e “riattaccano” dalle pareti degli organelli attraverso altre mediazioni proteiche che non andremo ad analizzare.
Semplificando con un’ulteriore analogia ripresa dalle precedenti (ma per forza di cose resa un pochino più complessa), le proteine potrebbe corrispondere ad una auto da completare in una catena di montaggio, il RE e l’AG alla catena di montaggio e le vescicole ai robot trasportatori deputati a far circolare le automobili “in costruzione”.
Come si può controllare tutto questo flusso di preparazione, montaggio e distribuzione?
Un informatico, al giorno d’oggi, proporrebbe di farlo con un programma che permetta agevolmente una gestione degli stati nelle varie fasi della produzione.
A questo punto introduciamo il nocciolo della questione: la cosa veramente incredibile è riscontrare che questa soluzione, frutto di decine di anni di intelligenza applicata e migliorata, pensata e proposta da un esperto e competente essere umano intelligente, è esattamente quello che avviene all’interno della cellula attraverso l’utilizzo specifico di composti chimici di zuccheri, detti oligosaccaridi o N-glicani, in grado di fornire una semiotica, un informazione precisa e diretta sullo stato e quindi sulla fase a cui una proteina è arrivata in un dato momento.
Paragoniamo dunque le proteine a dei record e questi zuccheri al campo che contiene l’informazione relativa allo stato del record stesso e vediamo se l’analogia regge.
Queste catene di zuccheri vengono preparate e “attaccate” alla proteina nascente come una specie di “diario di montaggio” che le accompagnerà per tutte le fasi successive fino a quando verranno staccate perché non più necessarie.
Fig. 2: Oligosaccaride legato ad N (tratto da [1]); notare i 14 zuccheri indicati dalle altrettante lettere, 3 glucosi (triangoli), 9 mannosi (cerchi) e 2 N-acetilglucosamine (cubi); le frecce rosse indicano punti in cui specifici enzimi “tagliano” i legami degli zuccheri e li rimuovono, al fine di registrare varie specifiche fasi nella produzione delle proteine a cui l’oligosaccaride viene “attaccato” (tratto da [1]).
Prima di essere utilizzate come “diario di montaggio”, queste strutture chimiche devono essere costruite e attaccate alla proteina “nascente”, o in fase di produzione: solo per preparare l’oligosaccaride intervengono almeno 15 diverse proteine, tutte coordinate in momenti precisi e deputate ad effettuare specifiche modifiche alla catena zuccherina.
Fig. 3: Schema semplificato del processo di preparazione di un oligosaccaride legato ad N (tratto da [1]); le sigle in caratteri maiuscoli e numeri (“ALG5”, “DPM1”, “SEC59″…) identificano gli specifici singoli enzimi che effettuano il relativo step della biosintesi (tratto da [1]).
Questo enorme lavoro di preparazione permette, una volta concluso, di espletare la funzione di gestione degli stati, una funzione indispensabile che si aggiunge a quelle che compongono ciò che viene definito dai biologi molecolari e dai biochimici come un vero e proprio sistema di “Controllo di Qualità”, operante all’interno della cellula nel RE e nell’AG, sistema che viene decritto nel seguente modo da un articolo tecnico sull’argomento [2]:
“Il sistema di CQ [controllo di qualità] è adattato per gestire virtualmente qualunque condizione che risulti in una conformazione proteica diversa dallo stato nativo. Quindi, scenari multipli di CQ emergono dagli svariati modi in cui le proteine possono fallire nell’acquisire la loro conformazione nativa”.
Un sistema quindi talmente complesso che è in grado di gestire ed intervenire in automatico sulla “qualità” della produzione in base a tutti i possibili scenari che si concretizzassero, cosa che, in un sistema in grado di produrre più di 20.000 diversi pezzi, è qualche cosa di straordinario.
Per esempio, alcune proteine richiedono gli oligosaccaridi per ripiegarsi correttamente nell’ER. Inoltre, gli oligosaccaridi conferiscono anche stabilità a molte strutture proteiche prodotte, oltre che favorirne la preparazione ed il trasporto.
Inoltre le adesioni tra cellule sono agevolate se sulle proteine che fungono da “ganci” sono presenti oligosaccaridi: un tipico esempio è proprio rappresentato dai leucociti, citati sopra come esempio, con le loro molecole di adesione cellulare, dette “CAMs”.
Fig. 3: Due esempio di cicli di modificazioni strutturali effettuate sugli oligosaccaridi adesi alla proteina nascente, dove sotto ad ogni “stato” della catena modificata viene riportato lo specifico nome della struttura ottenuta (tratto da [2]).
Insomma, ognuna delle forme modificate di oligosaccaridi ha delle caratteristiche sia “strutturali” che chimiche che “semiotiche”, per riprendere il nostro tema, caratteristiche che sono necessarie al processo di produzione della proteina nascente.
La struttura zuccherina viene trasferita sulle proteine ed attaccata ad una speciale parte della sequenza di amminoacidi che le costituiscono, operando poi così da blocco o da “promozione” per l’adesione con altre proteine adibite allo smistamento e gestione della proteina nascente, come le lectine omologhe calreticulina e calnexina, indicando quindi anche a che “punto” della produzione è arrivata la proteina nascente.
Inoltre, esattamente come avverrebbe nel nostro esempio della verniciatura descritto prima, se i trasduttori che segnalano il passaggio della scocca fossero disattivati non è detto che la stessa non completerebbe comunque il ciclo di verniciatura; potrebbero però verificarsi anomalie sulla qualità del risultato finale, come anche problemi di controllo dell’intero processo e risulterebbero invendibili.
Infatti, in esperimenti di laboratorio dove la sintetizzazione di parte degli oligosaccaridi viene inibita, le proteine vengono prodotte ma non si ripiegano correttamente (quindi non sono funzionali), si accumulano nell’ER e risultano meno stabili: insomma, “invendibili”.
Adattamento od innovazione irriducibilmente complessa?
Ora, il paragrafo sopra citato che descrive il sistema di controllo di qualità utilizzava un termine per accennare come un insieme di sistemi di questo tipo possa aver fatto la sua comparsa negli organismi viventi (sempre dando per scontato che abbia fatto la sua comparsa dopo l’organismo vivente stesso): questo termine è “adattato”.
In effetti non si vuole mettere in dubbio che gli organismi siano in grado di adattarsi ai cambiamenti dell’ambiente, selezionando “versioni” più adatte nei vari contesti.
Ma l’adattamento non crea innovazione biologica: a questi livelli di complessità, nulla di non già pre-esistente è mai stato sperimentalmente osservato “emergere” da precedenti e/o diversi sistemi.
Infatti, un’innovazione a livello biologico di una tale complessità , con costrizioni funzionali che richiedono una funzionalità olisticamente e simultaneamente espressa, viene spesso descritta dai teorici dell’Intelligent Design come “irriducibilmente complessa”, per intero o nelle sue parti.
Infatti, se a livello evolutivo devo “ritrovarmi” a poter utilizzare gli oligosaccaridi per effettuare una gestione degli stati come avviene in informatica non dovrò solo “sperare” probabilisticamente che l’oligosaccaride venga selezionato con la sua struttura utile a gestire le varie “transazioni” ma devo farlo anche per tutti i sistemi di preparazione dello stesso (abbiamo visto quanto questa sia complessa ed articolata) nonché per tutto ciò che utilizza le informazioni in esso contenute e la sua struttura biochimica, con le sue caratteristiche di stabilità.
E’ vero che l’adattamento evolutivo opera per gradi, selezionando di volta in volta la “versione” più vantaggiosa del “programma” in questione – per usare nomenclature informatiche – ma è proprio questa condizione che rende difficilissimo dimostrare sia logicamente che sperimentalmente i “salti” evolutivi indispensabili a queste transizioni.
Va infatti identificata una funzione completa e che porti del vantaggio in tutti i passaggi ipotetici utili ad ottenere gli oligosaccaridi e le centinaia di macchine molecolari ad essi connesse e che stanno dietro ad un sistema del genere.
E’ facile capire come la somma di tutte queste probabilità, che come detto devono conservare un vantaggio ad ogni “step” della selezione, rende troppo implausibile uno scenario ipotetico che ne preveda il superamento senza una logica nella quantità di informazione biologica necessaria per sistemi del genere, anche senza arrivare ad analizzare o a proporre i dettagli di questi step.
Esattamente come chi vi raccontasse di aver indovinato a caso il vostro numero di cellulare facendo delle telefonate di prova, farebbe automaticamente scattare in voi il rifiuto di credergli, anche i fattori di (i) tempo a disposizione dalla comparsa della vita sulla terra scientificamente accettato, (ii) modo di “esplorazione” dello spazio probabilistico che l’evoluzione adotta e (iii) complessità olistica dei sistemi da realizzare rendono scientificamente un vero azzardo favolesco dare per scontato un tipo di processo senza poterlo osservare ne dimostrare, solo perché può essere l’unico modo di ottenere un risultato.
Va anche detto che queste molecole sono “conservate” praticamente in tutti gli organismi viventi complessi (eucarioti), ovvero non si riscontrano variazioni nella loro struttura tra gli esseri viventi, quindi è molto complicato definire una “linea evolutiva” scientificamente soddisfacente relativa alla comparsa, quand’anche ipotetica o speculativa.
E’ possibile provare ad ipotizzare un oligosaccaride più semplice, con meno “stati” gestiti, da porre su una scala evolutiva come “precursore” degli attuali? Molto complicato, per una serie di ragioni che possiamo riassumere riprendendo le nostre analogie.
Come potrebbe funzionare un sistema di controllo di qualità della verniciatura che verificasse, per esempio, solo l’ingresso e l’uscita della scocca?
Come potrebbe un programma, ricompilato inserendo casualmente lettere nel suo codice, creare tutte le strutture necessarie ad implementare la gestione degli stati da uno, due al massimo a ben quattordici, sapendo che dietro ad ogni stato ci sono decine e decine di altri “rami” di programma che andrebbero creati contestualmente ed immediatamente per svolgere specifiche e complesse funzioni?
Un oligosaccaride composto da uno o due zuccheri non è così proibitivo probabilisticamente parlando, ma aggiungere solamente un altro zucchero alla catena significa come minimo (i) che questa “informazione” biologica sia legata semioticamente ad una condizione nell’avanzamento della produzione della proteina (forse uno degli ostacoli più grandi per l’evoluzione di questa struttura zuccherina), (ii) che “compaia” o “venga in aiuto” (mentre svolge altre funzioni ) l’enzima che lo aggiunge (quindi un’altra proteina, costituita specificamente da centinai di amminoacidi), (iii) che gli enzimi o le proteine che “leggono” questo “stato” esistano, siano strutturate per leggerlo e per agire una volta attivate da esso e (iv) che la stabilità strutturale che gli oligosaccaridi concorrono a creare sia tale anche con una struttura così diversa.
Gli oligosaccaridi non sono un’analogia con lo stato di un record informatico e tutto ciò che vi sta dietro: sono veri e propri supporti molecolari per la gestione dell’informazione biologica, che vengono auto-costruiti dalle stesse proteine che aiutano a produrre, in modo automatico.
Riferimenti:
- “ROLES OF N-LINKED GLYCANS IN THE ENDOPLASMIC RETICULUM”, Ari Helenius and Markus Aebi, Annu. Rev. Biochem. 2004.
- “QUALITY CONTROL AND PROTEIN FOLDING IN THE SECRETORY PATHWAY”, E. Sergio Trombetta and Armando J. Parodi, Annu. Rev. Cell Dev. Biol. 2003.
(Di C. A. Cossano con la collaborazione di F. Arduini e C. Puliti; editing e pubblicazione D. Ricciardulli; si ringrazia per il contributo anche T. Bissoli).