在新药开发领域,有人做过这样的比喻,那些容易的靶点——“低垂的果实”都已经被摘完了,未来则需要去被茂密枝叶遮挡的果树高处去摘取果实。而AI(人工智能)将是帮助我们爬上果树高处,摘取果实的梯子。
的确,随着近年来大数据、云计算等IT技术的发展,人工智能在药物设计与开发领域已获得了长足的进步。在新药物靶点和作用机制越来越少所带来的障碍面前,无论是提升研发效率,还是深挖已有数据获取新洞见等方面,AI都可以大展身手!
然而,您是否思考过,目前在药物设计与开发领域,人工智能的发展存在着哪些禁锢呢?
高质量数据获取难?
为了建立预测模型,我们需要足够多的优质数据来训练算法。显然,AI的表现受到输入数据数量和质量的影响,因此海量高质量数据的获取是人工智能在药物设计领域获得突破的基础。
在2019年的药明康德全球论坛上,业界专家纷纷表示,低质量的数据可能导致算法从数据中获取到虚假的信号,从而导致“垃圾进,垃圾出”的扩大化。现今存在的公开数据往往由于格式、代表性等多种原因,无法成为高质量的数据。
那么,有没有一种方式或工具,可以将制药企业/科研机构内部产生的大量数据(包括实验数据与模拟计算数据)以及外部公有数据库,进行统一的抽取、整合、清洗、索引之后,建立起统一的数据规范,形成可以供机器学习算法利用的高质量大数据?
亟需精通机器学习与生命科学的跨界人才?
业界专家认为,人工智能永远不会取代传统的研究人员。了解生命科学或业务流程的研究人员需要提出正确的问题来指导机器学习。如果将AI在药物研发中的作用比作一个智能厨房,智能厨房拥有智能微波炉、咖啡机和其它智能工具,试想,如果没有人类,这些智能工具是没法儿做出晚餐的,而人的作用就在于可以将这些工具整合起来很快地做出一顿丰盛的晚餐。
insitro创始人兼首席执行官Daphne Koller博士认为,在当前的生命科学研究领域,跨界人才尤为稀缺——机器学习和生命科学所使用的是截然不同的术语体系,有着截然不同的思维方式,两者之间的思维沟通充满挑战。
那么,有没有一种方式或工具,能够帮助生物科学家或工程师提升访问和使用数据的能力?并且能够形成一个让实验科学家、模拟科学家和数据科学家都能各尽其能、各取所需的智能平台,同时促进数据的开放与共享,进而推进机器学习在药物研发领域的快速良性发展?
5月29日晚 创腾科技
在国内率先研发的面向生命科学和材料科学领域的
科学数据融合与数据溯源平台:科学数据基因组平台SDH
基于分子模拟的人工智能创新平台:MaXFlow
华丽绽放,敬请期待!
参考资料:
1. 未来需要怎样的大数据与AI? | 药明康德全球论坛实录 https://mp.weixin.qq.com/s/58308B2N4D_okT5a3jzK_A
2. 专访《时代周刊》风云人物:AI研发新药,我要提醒这几点https://mp.weixin.qq.com/s/znM4an4ByoxtpJUYV8AMiA