Genome Biology ha pubblicato un articolo su uno studio di un team di ricercatori australiani che hanno rivelato come, nel campo della genetica, moltissimi studi scientifici contengano errori dovuti all’utilizzo di Microsoft Excel. Sono stati analizzati circa 3.600 studi genetici pubblicati da autorevoli riviste scientifiche con i relativi file allegati, in cui sono presenti tabelle che elencano i geni utilizzati.
A programmatic scan of leading genomics journals reveals that approximately one-fifth of papers with supplementary Excel gene lists contain erroneous gene name conversions.
Dall’analisi è emerso che un quinto degli studi pubblicati e corredati da allegati in Excel contengono errori, generati dal formato applicato automatica alle celle che contengono i nomi dei geni, indicati con abbreviazioni. I due esempi illustrati chiariscono come sia possibile generare questo tipo di errori: il gene “Membrane-Associated Ring Finger (C3HC4) 1, E3 Ubiquitin Protein Ligase” viene abbreviato con MARCH1, mentre il gene “Septina 2” come SEPT2. Impostato in inglese, Excel li converte automaticamente in date (1 marzo, 2 settembre).
Per ovviare all’inconveniente, chi utilizza il file Excel dovrebbe impostare impostare il formato testo di una colonna prima di compilarne le celle con quel tipo di dati. Il problema, oltre che con Excel, si presenta anche con le applicazioni Calc di LibreOffice e OpenOffice, mentre pare che nei file creati con Fogli di Google (Google Sheets) le conversioni automatiche non vengano applicate (nemmeno se aperti successivamente da Excel o Calc).
Formattare preventivamente le celle in cui devono essere scritti dati così come li vogliamo è una buona regola da applicare sempre, non solo in campo scientifico.