En l'era del "Big Data", la possibilitat de compartir, processar i emmagatzemar grans quantitats d'informació resulta imprescindible en tots els àmbits de l'activitat humana. La investigació científica no està exempta d'aquesta imposició tècnica. D'altra banda, les tècniques espectroscòpiques permeten als científics observar l'estructura de la matèria des de petites molècules a grans biopolímers com proteïnes o àcids nucleics. Aquestes tècniques espectroscòpiques proporcionen informació amb resolució atòmica d'aquests sistemes moleculars. Una d'aquestes tècniques avançades és la Ressonància Magnètica Nuclear, que utilitza les propietats magnètiques dels nuclis per obtenir valuosa informació dels sistemes moleculars de diferent complexitat, des de molècules biològiques a sintètiques. Els avenços tecnològics han permès que l'adquisició d'aquestes dades espectroscòpiques sigui cada vegada més ràpida i precisa, el que està generant gran quantitat d'informació que ha de ser processada i emmagatzemada per a la seva posterior anàlisi o distribució entre la comunitat científica. En tot aquest procés, l'espai de memòria necessari ha de ser optimitzat i estalviat. Lamentablement, algunes d'aquestes dades espectroscòpiques presenten un alt percentatge de soroll (> 90%) que no conté informació útil però ocupa espai de memòria. Això és especialment crític en estudis de metabolòmica, on s'han de processar i analitzar una quantitat enorme de mostres i, per tant, dades espectroscòpiques. Això provoca que en moltes ocasions el component predominant en aquestes dades sigui en realitat el soroll mancat d'informació.
En una investigació realitzada en col·laboració entre l'IDAEA i l'IQAC (tots dos centres del CSIC a Barcelona) s'ha desenvolupat un procediment (anomenat VOI de l'anglès Variables-Of-Interest) que permet netejar aquestes dades espectroscòpiques del soroll, mantenint la resolució espectral i per tant la informació d'interès. Això redueix enormement la memòria necessària per emmagatzemar i processar aquesta informació. A més, l'eliminació del soroll evita que aquest tingui un pes important en l'anàlisi i interpretació dels resultats. Aquesta investigació s'ha publicat recentment a la revista Chemical Communications (Puig-Castellví et al. Chem. Commun.2018, 54, 3090, DOI: 10.1039 / c7cc09891j) i ha estat seleccionada per a la portada interna de l'últim número. En paraules de l'Investigador de l'IQAC Ignacio Alfonso "La capacitat del nostre mètode està perfectament il·lustrada en la imatge que hem proposat per a la portada, en què un tallagespa elimina el soroll sobrant d'un espectre bidimensional de RMN. És un símil de la vida quotidiana que ajuda a entendre el que fa el mètode realment a nivell matemàtic". Els investigadors han aplicat el VOI a diferents tipus d'experiments multidimensionals de RMN de diverses mostres complexes, des metabòlits a proteïnes, i fins i tot extractes de llevat. El mètode és especialment útil per a estudis de metabolòmica, com els mateixos investigadors ressalten i demostren en el treball.
Puig-Castellví F, Pérez Y, Piña B, Tauler R, Alfonso I. Compression of multidimensional NMR spectra allows a faster and more accurate analysis of complex samples. Chem. Commun. (Camb). 2018, 54, 3090-3093. doi: 10.1039/c7cc09891j.
By Institute for Advanced Chemistry of Catalonia (IQAC-CSIC)