随着信息化程度的不断提高,科研数据分散在各个系统的数据库中,形成一个个数据孤岛,缺乏统一完整的研发周期数据视图,数据无法被快速精准定位,数据标准与质量问题普遍存在……正是这些痛点,严重阻碍着研发过程由信息化向智能化迈进的脚步!
本期访谈视频中,创腾科技SDH产品总监孙总将针对这些棘手问题出现的根源作深入的剖析。
企业研发数据资产管理现状
在信息化发展历程中,很多制药企业、化工企业和科研单位,持续在IT方面进行投入和建设,例如用户通过使用ELN(电子实验记录本)/ CIMS(试剂库存管理系统)/PM(项目管理系统)等各类业务系统,不断将发展过程中的业务和经营管理端的各种能力以数据形态沉淀下来,数据量呈现高速增长势态。
而随着数据不断积累,企业也面临着诸多问题与挑战。例如,针对某个业务领域缺乏统一完整的数据视图。科研业务数据分散在企业的各个业务系统中。
以新药研发合成实验室为例,自主合成的大量小分子化合物是重要的资产。化合物数据信息往往存储在多个系统,合成信息存储在 ELN 中,化合物样品信息存储在 CMS中,分析测试信息存储在 LIMS 中,所属项目信息存储在 PM 中……由于缺乏统一的视图,科研人员无法快速精准的获取自己所需的数据,也无法快速从宏观层面掌握手中化合物样品的综合情况。
数据孤岛问题普遍存在
相关数据表明,数字化转型过程中,有超过90%的企业都存在数据孤岛问题。
从 IT 视角来看,传统企业普遍采用烟囱式的开发模式架构与应用,各个数据中心都是基于不同历史时期、为满足不同业务目的而单独建设,各个部门与业务都有独立的数据存储和IT硬件设备,业务之间不便于共享数据,无法直接访问,造成资源孤岛、应用孤岛和数据孤岛。直接反映在以下问题中:
(1)数据标准与质量问题:
烟囱式模式与孤岛状态,例如频繁发生同名指标在不同业务系统中不同口径等问题。
(2)业务需求响应问题:
烟囱式项目开发往往是从头搭建,开发周期长,导致业务响应速度慢,难于适应复杂、变化快的业务需求,无法持续创新与发展。
(3)资源成本问题:
烟囱式重复开发建设与维护带来重复投资,计算和存储成倍增加,服务器数量和管理成本持续增大,造成企业资源和成本大量浪费。
针对上述问题,2020年创腾科技首次提出了“数据基因组”概念,旨在将散落在研发过程中的科学数据进行融合、溯源,绘制数据基因组图谱,从而破译全部科研业务数据信息,形成数据资产网络。SDH(Scientific Data Hierarchy)科学数据基因组平台由此诞生!
SDH可以为企业组织消除科研数据壁垒,打通业务间的数据通路,实现数据资产的整合与应用共享,节约知识转移与异常问题溯源时间,提高研发效率,降低研发成本。