点击下载【SDH科学数据基因组平台-创腾科技.pdf 】
产品简介
通过科学数据基因组平台(SDH),企业组织可以对来自不同数据源的海量科学数据进行抽取、整合、清洗、索引,建立统一数据规范,灵活构建和管理主题库,并按需抽提所需数据。赋能业务人员的数据使用能力,加速企业的智能化创新。
传统方式面临的挑战
1)医药及化工企业传统数据管理方式:基于不同历史时期、为满足不同通过科学数据基因组平台(SDH),企业组织可以对来自不同数据源的海量科学数据进行抽取、整合、清洗、索引,建立统一数据规范,灵活构建和管理主题库,并按需抽提所需数据。赋能业务人员的数据使用能力,加速企业的智能化创新。
业务目的而单独建设专项专业科研数据库:
◆ 管理种类繁多的专业科研数据库及数据中心对IT依赖大,但既懂业务又懂数据的人才匮乏;
◆ 数据标准与质量问题普遍存在;
◆ 各个专业科研数据库单独建设与维护,造成企业资源和成本大量浪费
2)针对科研业务领域缺乏统一完整的数据视图
科研业务数据都分散在企业组织的各个业务系统中,由于缺乏统一视图,科研人员无法快速精准地定位自己所需的数据,也无法快速从宏观层面掌握研发进程的综合情况。
3)制药、化工企业组织,整体数据基础相对薄弱
尽管像ELN、LIMS等业务系统已经普遍存在,但很多研发业务环节间的工作仍然依靠文本文件记录和管理,导致研发业务相关数据不能互通互联,造成数据孤岛。
核心功能
科研业务数据融合
科学数据溯源
数据基因组构建与管理
多数据源连接
自定义数据模型
按需抽取数据
功能特点
1)星链多数据源
汇聚企业内部不同业务系统与数据应用,兼顾外源各类专业数据库,科学数据基因组支持多种异构数据源。
多数据格式支持
◆ 关系型数据库,包括Oracle, MySQL, SQL Server等;
◆ NoSQL存储,包括MongoDB, Redis等;
科学数据支持
◆ 小分子结构、大分子、序列、晶体结构等;
应用数据支持
◆ 业务系统,包括ELN,LIMS,LES,CIMS,CMS,PM等;
◆ 分子模拟和AI智能平台,包括MaXFlow等;
外源数据支持
◆ CNPD/MNPD/TCMD数据库;
◆ 小分子药物活性、靶点等相关数据库(千万级)。
2)数据赋能
按需抽取数据,SDH提供输出高质量数据,助力企业实现数据智能:
◆ 自助式数据抽取,便携搭建BI报表;
◆ 与分子模拟与AI智能平台对接;
◆ 科学数据处理:结构式绘制与检索,描述符计算
3)内容视图
内容视图是将来自不同数据源中的数据表之间建立关联关系,根据业务需求,可视化构建与管理数据模型,为数据基因组的搭建作数据准备。
◆ 支持跨源数据关联
◆ 锚点连接与拖拽操作,轻松构建数据表关联关系
◆ 科研领域独特的内容视图类型:离散型、连续型、重复型
◆ 自定义数据模型与管理
4)数据基因组
数据基因组 -- 为了破译科研领域中全部科研业务数据信息,将散落在研发进程中的科学数据进行重组、融合,建立数据溯源关系,为企业数据智能积累数据资产。
数据基因组是从业务视角语境化构建数据模型,为研发智能打造业务主题数据库。
◆ 树状思维导图与旭日图 - 双视图,从不同视角管理数据基因组
◆ 灵活建立数据模型与跨源字段的绑定关系
◆ 数据基因溯源,实现数据基因全生命周期管理
◆ 自定义可视化数据基因组构建与管理
SDH带来的价值与收益
科学数据基因组(SDH)为企业创造数据资产,以数据价值赋能企业客户;
建立企业数据规范,打造AI模型和数据资产,赋能企业新价值。
科学数据基因组(SDH)为生命科学和材料领域消除科研数据壁垒,打通科研业务间的科学数据通路来实现数据资产的整合与共享;对科学数据探索和智能分析提供了技术支撑。
AI建模效率(提高80%+)
数据获取时间(减少80%+)
加速数字化转型(提高60%+)
企业R&D时间成本(降低25%+)
数据采集与整理时间(降低80%-90%)
研发过程中的知识转移时间(降低70%-80%)
研发进程中异常问题溯源时间(降低80%-90%)
基础IT设施成本(降低30-40%)
▴ 智能报表(一)
▴ 科学数据处理工具
▴ 智能报表(二)
▴ 智能报表(三)
▴ 数据基因组列表页
▴ 内容视图详情页
▴ 数据基因详情页
▴ 数据基因组树状脑图
▴ 数据基因组旭日图