Descripción del proyecto
Reducir el tamaño de almacenamiento de datos masivos genómicos y mejorar el análisis y la interoperabilidad
La era de los datos masivos ha puesto en nuestras manos el poder de grandes cantidades de números para obtener una imagen más detallada sobre fenómenos en ámbitos que abarcan desde el mercado hipotecario hasta la epidemiología y el cambio climático. Sin embargo, el almacenamiento y el análisis de todos esos datos —además de garantizar que se puedan compartir para acelerar la información y la innovación— representa un cambio notable. La empresa suiza de «software» sanitario GenomSys ha desarrollado la herramienta de «software» GenCoder para simplificar la compresión y el análisis de datos genómicos, así como garantizar la interoperabilidad entre los formatos utilizados por las partes interesadas, como clínicas, institutos de investigación, biobancos y empresas biotecnológicas. El proyecto GenCoder, financiado con fondos europeos, ayuda al equipo a optimizar la tecnología y allanar el camino para su comercialización.
Objetivo
Next-Generation Sequencing (NGS) devices have enormously impacted on genomic analysis and life sciences, with a
drastic price reduction for sequencing a human genome (1,000 USD) and faster data processing, which resulted in the
exponential accumulation of genomic data. However, the vast amount of genomic data produced and stored in clinics,
research institutes, bio-banks and biotech companies is bringing along cumbersome informatics challenges: the huge
amount of data to be stored imply massive costs for data storage (850 €/TB per year, with average size of a whole human
genome being in the range of 0.4-3 TB), also due to the use of ineffective data formats not specifically designed for genomic
data; the lack of interoperability and standardized software and protocols prevents genome analysis centres to implement
reliable, scalable, and widely-accepted applications for cross-correlating and comparing genomic data. GenCoder by
GenomSys is a software tool specifically designed for efficient genomic information representation, compression and
transport, which provides the following main performances: (1) High compression rates in lossless mode (up to 90% with
respect to the BAM standard); (2) Selective access to specific blocks of data and metadata, so to significantly speed-up data
analysis; (3) Interoperability amongst available data formats, enabled by the compliance with the ISO standard MPEG-G (to
be released in 2019), which is being developed by a joint working group having GenomSys as main contributor.
The Phase 1 project will have as main outcomes the optimization and validation of the GenCoder performances through
tests involving huge datasets in selected data sequencing and storage facilities, and the business plan of the product, which
consolidates the business model and pricing, the marketing strategy, and the financial plan.
Ámbito científico
Programa(s)
Convocatoria de propuestas
Consulte otros proyectos de esta convocatoriaConvocatoria de subcontratación
H2020-SMEInst-2018-2020-1
Régimen de financiación
SME-1 - SME instrument phase 1Coordinador
1015 LAUSANNE
Suiza
Organización definida por ella misma como pequeña y mediana empresa (pyme) en el momento de la firma del acuerdo de subvención.