$22.3年净现值8M

主要亮点

类别

医疗保健 & 生命科学

解决方案亮点

 
CDP私有云,SDX, CDSW
 

影响

  • $22.8 million net present value over 3 years; 10 months to break-even with CDP Private Cloud investment

  • 将全基因组关联研究分析的时间从80年缩短到几周

  • R内的用户可以看到97%的数据&D

  • 通过预测分析提高药物开发过程的成功率

制药组织高度重视药物发现管道的速度和质量. 从研究和测试到临床试验和监管批准,将一种新药或疫苗推向市场需要6到12年的时间和近30亿美元的资金. 一旦新产品上市, 制药公司在专利到期前收回开发成本的机会很小. 增加挑战, 近年来,药品生产成本一直保持不变, 导致盈利能力大幅下降.

这家全球制药公司处于研究的前沿,并希望加快药物安全投放市场. 实现这些雄心勃勃的目标,保持行业领先地位, 该公司需要重新考虑其数据架构和战略.

挑战

他们设想的数据平台的关键目标是通过统一分布式和竖井数据集来实现战略业务价值, 如临床, 实验室, 和生产数据, 跨不同的遗留系统. 该平台还将解决R缺乏自助访问数据的问题&D部门和科学家, 降低与现有流程相关的成本, 并满足质量和合规要求. 他们认为采用混合云架构是最有效的.

这项工作带来了一些新的和加剧的数据和技术挑战,包括:

  • 吵闹的邻居问题 -如此多的分析师在共享数据集上工作,意味着工作量的不可预测性——尖峰, 伴随着激烈的争论. 错误的数据会导致大量的管道重新运行. 在某些情况下,多个租户甚至跨不同的集群共享计算. 这导致药物发现的科学假设分析延迟了4周,增加了运营成本
  • 将ETL工作负载增加三倍 -对于大型组织来说,有时需要两到三个月的时间来完成硬件的采购和供应, 这使得难以及时扩展计算资源以应对季节性的工作负载.
  • 到处运行 -公司希望在数据所在的地方灵活地运行工作负载,并以一种优化资源利用率的方式.e. 以云原生的方式,无论是在前提中还是在公共云中. 
  • 最大化的投资 -由于资源利用严重不足,不可能最大限度地增加硬件资产的资本支出. 在一个例子中,不管实际使用情况如何,Impala运行在150个节点上,30%的静态预留内存. 这使得这些资源在很长一段时间内处于空闲状态. 更糟糕的是,Spark的关键工作被留下来等待资源完成其他任务. 在他们的遗留体系结构中,水平扩展是不可能的. 
  • 延长sla —升级过程耗时3 ~ 4个月, 包括应用补丁和运行端到端测试, 以减少对下游应用的影响.  因此,平台团队需要为业务用户制定更长的sla
  • 数据的两倍 -他们想把每天的工作量增加一倍, 研究人员访问数据的数量从1,500 to 3,000, 并预计在一年内将数据量从25pb增加到50pb. 

解决方案  

经过仔细的评估, 这家全球制药公司转向了由k85彩乐园的CDP私有云(CDP Private Cloud)领导的混合方式, 合作伙伴技术, 以及自己开发的工具来提供R内部所有数据的整体视图&D,为研究人员提供了巨大的分析优势. 平台以资产的形式提供信息, 从各种来源获取数据,然后进行整理, 住, 存储, 洁净, 治理, 并根据流行度进行优化.

该平台合并了来自整个组织的所有数据. 作为一个结果, 研究人员可以结合和分析数据, 特别的, 无论什么时候, 如何, 它是在哪里产生的. 有了新平台, 研究人员正在使用这些制药分析来获得洞察力,帮助简化R的每一个方面&维过程. 例如, 以前,要确定最佳的参与者组合可能需要几个月的时间, 收集和分析来自多个临床试验的数据. 现在, 临床试验数据标准化,便于分析, 同样的分析可以在几分钟内完成.

隐私和安全在医疗保健行业至关重要, 该公司需要确认该平台符合严格的行业和内部标准, 包括健康保险可携带性和责任法案(HIPAA). 通过利用k85彩乐园的共享数据体验(SDX)功能, 公司可以以集中的方式管理所有元数据和策略信息.

k85彩乐园数据科学工作台(CDSW)是该栈的另一个重要部分. CDSW正在被用于数据发现, 探索, 特别的分析, 通过安全的自助服务访问受治理的数据,以进行探索和分析.

结果

采用CDP私有云, 这家全球制药公司已经能够通过OCP和HDFS中的数据解决水平扩展问题, 解决“噪声邻居”问题, 提高内存利用率, 并实现一个通用的安全接口. 此外,他们还看到了以下好处:

  • 提高药物发现管道的速度和质量: 药物研发的时间表和价格都太高了, 尽管, 新药的成功率只有12%. 这就是为什么药物发现渠道的速度和质量是如此重要. 在开发过程的每个阶段,成功的几率都会下降. 这家全球制药公司现在已经能够加快药物发现的管道. 例如,传统的基因组数据分析工具需要80年才能完成. 通过利用k85彩乐园的平台, 该公司不仅能够进行全基因组关联研究分析, 但完成这项分析的时间被缩短到几周. 除了, 更多的研究人员更容易获得所有的研究数据, 通过CDP中完全集成的搜索引擎,基于丰富而强大的Solr. 已经完成了发现路径的质量和信心,并允许并行运行更多的实验,同时能够减少重复工作.
  • 启用自助服务访问数据: 另一位主要选手赢得了R&D集团已经实现了降低数据访问障碍的目标. 现在R内的用户可以看到97%的数据&D. 这包括已经发生的数千个临床试验, 在哪里引入数据并返回给企业. 部分发现和数据管理过程已经通过Solr和CDP的其他开源组件提供的丰富api实现自动化. 降低访问数据的门槛让科学家们能够触手可及地深入研究制药分析.
  • 利用人工智能和机器学习: 人工智能(AI)和机器学习(ML)都被用于挖掘遗传学和基因组学数据. 使数据可用,便于分析, 它需要被摄入, 策划, 可发现的, 访问需要管理. 通过使用预测分析来确定更有可能完成计划的目标, 药物开发过程的成功率提高了.

R&D团队通过利用遗传和基因组数据上的AI和ML来更好地识别和验证目标,从而实现了这一使命. k85彩乐园平台是他们成功的关键组件. 随着这家全球制药公司在其众多R&维过程, 高管们希望最终能在上市时间方面有所改变, 将新药物和疫苗更快、更便宜地推向市场,以帮助患者.