导航菜单

40万亿GB的医疗数据,如何助力新药研发?

今年5月,国家药品监督管理局药品评价中心(CDE)发布了《真实世界证据支持药物研发的基本考虑》(意见稿),意思是“如何将现实世界证据(RWE)纳入中国的药物研发和监管决策“并开始成为监管者。正式考虑并开始解决问题。

业界一度热烈争论:“RWE可以解决哪些临床问题?RWS需要整合哪些数据?RWD采集和处理过程是否可追溯?数据分析的方法是什么?”

要回答这些从监督到登陆的“灵魂折磨”,并让现实世界的证据“用于我”,首先要解决的问题是医学数据库的问题。

在这方面,7月29日,在2019年中国生物统计学年会上,医学大数据与人工智能企业LinkDoc的创始人兼首席执行官张天泽主题为“中国医学数据库的现状与挑战”。从行业前沿探索和从业者分享的思想和经验。

01

行业需求是真正的推动力

“过去,有几种推动医学数据库发展的力量。”

首先是“技术驱动”。根据IDC Digital的数据,到2020年,医疗数据量将达到40万亿GB,是2010年的30倍。在过去的十年中,医疗信息化迎来了巨大的发展,并且已经孕育了大量的“原始数据”。材料“为人类”,如未熔化的原油“,医学数据化的下一阶段是基于海量数据信息。出口服务价值的关键和唯一的出路。

其次是“政策推动”。 2016年,国务院办公厅发布《关于促进和规范健康医疗大数据应用发展的指导意见》,并于2017年发布《关于促进“互联网+医疗健康”发展的意见》,然后向2018年发布的国家卫生和健康委员会《国家健康医疗大数据标准、安全和服务管理办法(试行)》.简单地梳理下来,在三年左右,国家共发布30多项政策文件,将医疗保健大数据纳入国家大数据战略布局,加快中国医疗数据资源的共享和利用。

最后,最重要的是,“需求牵引力”。

药物开发和评估,药品营销和流通,商业健康保险,辅助诊断和辅助治疗,基因数据分析,医学专业继续教育,临床研究服务,药物监管,公共卫生管理.在所有医疗领域,数据可以发挥很大的价值。 “医疗数据平台和资源是新医疗行业的中心,在个性化和精确诊断和治疗的时代,它们尤为重要。”

在如此强烈的需求牵引下,中国创建了一些特定的功能数据库和特定的人口数据库,如医学文献数据库,生物信息数据库,临床医学数据库,保险支付数据库等。

“但该行业的需求和牵引力实际上是真正的力量。”

02

在重大疾病的药物研究需求方面的强大牵引力

今天,特别是在药物研究和开发领域,这种牵引力的力量越来越强烈。

据统计,肿瘤药物从第一阶段到第三阶段的时间为9。6年。从第一个专利申请到市场时间,需要10。5年。 2018年,每种新型肿瘤药物的平均成本达到26亿美元,研发成功率降至8.0%。

“精准治疗时代的到来,临床试验的难度,入组患者的难度,药物研发的时间成本和经济成本都显着增加,药物应用的患者人数非常细分和分散,临床诊断和治疗的难度越来越大,管理难度越来越大,此外,竞争发展和商业竞争的竞争正成为两个平行的主战场,直接影响到中长期的商业发展潜力。

可以说,重大疾病药物研究需求的快速增长带来了对专业疾病数据库的巨大需求。

在美国,ASCO促进和促进了北美多种肿瘤RWD数据平台的开发,例如CancerLinQ和Flatiron。国际制药巨头罗氏分别以21亿美元和24亿美元收购了Foundation和Flatrion,以促进在医学研究和开发中使用真实世界的数据。从中可以看出。

中国也一直在积极探索建立科研医学数据库。例如,中国群组联盟,但其开放性很低;国家中央癌症登记处,其数据每年以报告的形式发布,而不是完全临床研究或药物经济学习研究是为此目的而建立的。

总体而言,中国的数据库通常缺乏以患者为中心的全景和长期数据。可用于药物开发的特殊疾病队列要求原始病历的完整性非常高。原始医疗记录不仅包括住院数据,还包括院外数据。院内数据包括院内信息系统数据和部门降水数据;院外数据包括非现场处方数据和后续数据。以NSCLC患者的原始病历为例,有必要包括完整的过程数据,如确诊入院,手术,术后辅助治疗,复发和转移,基因检测,1~n线治疗和生存数据。

“治疗病人的过程就像孩子吃面包和面包屑从地上掉下来一样。有必要一路跟进收集面包屑,以便生成高质量的科研数据。” p>

03

期望与现实之间的差距

因此,当你真正拿起一块“面包屑”时,拼接就完成了,价值也很大。

在2018年的世界肺癌大会上,法国布雷斯特大学医院进行的一项多中心非介入性回顾性队列研究评估了现实生活中使用先前的NSCLC治疗脑转移的实验性navobizumab治疗的颅内功效。该研究的结果表明,免疫治疗在患有脑转移的NSCLC患者中显示出非常有希望的结果。

2019年4月4日,辉瑞的新乳腺癌药物Ibrance被批准用于基于真实世界数据的男性乳腺癌适应症,震动整个医学界。

鉴于2019年5月药物研发领域的实际数据潜力,CDE发布了《真实世界证据支持药物研发的基本考虑》(征求意见稿),确定了RWE治疗罕见疾病,修订适应症或药物组合,以及药物清单评估,应用临床研究和中医院制剂的开发,指导临床研究设计,准确针对目标人群。引起业界热议。

许多人期待真实世界的数据来满足行业需求和痛点。

“但是.期望与现实之间总会有一些差距。”

在理想情况下,通过数据提取,模型构建,直接访问深度学习,人工智能等应用实际数据。现实情况是,应用实际数据需要跨越差距,包括需求讨论,数据提取,数据清理,缺失值处理,特征工程和模型评估.

04

越过沟壑壑

我们如何克服现实数据应用程序中的差距? 大型医疗记录,非结构化,难以跟进,无行业标准和安全性。”

建立疾病模型至关重要。 “为每种疾病设定一个共同的疾病模型。基本模型中有不同的域。每个域都有不同的变量,每个变量都必须设计有相关的约束。“/p>

其次,手动+人工智能的结合可以深入构建海量数据,可以将数据处理速度提高数倍,数十倍甚至数百倍,大大降低了数据处理成本,保证了质量。在极为重要的后续数据集成过程中,如LinkDoc,基于算法分配后续任务,实时打开后续数据和临床数据,患者的个人信息脱敏,隐私得到充分保护,整个过程100%录制,后续成功率高达80%以上。

“做数据结构和后续工作只是出发点。”接下来,我们需要建立一个基于国际临床研究CDISC标准的数据处理过程,最后将现实世界的原始医学数据转化为科学研究标准。数据库。

同时,在数据库的应用过程中,必须严格遵守“数据物理隔离,访问权限控制,应用数据分层管理,患者知情授权”的标准化路径。

基于这样的真实数据库,可以完全实现数据的价值。

高质量的数据库可以应用于大规模的临床研究,以帮助中国的新癌症药物研发;通过创新模式,帮助创新药物开展药物监测;建立一个多中心数据平台,帮助专家在顶级学术期刊上发表高质量的学术论文等等。

最后,张天泽认为,现实世界的数据库是基于临床医疗记录,但远远超出了临床医疗记录。 “真实,可靠,可用的临床数据库需要明确的目标,整体设计和可靠的质量控制。这三者是不可或缺的。“或许是回答那些”灵魂折磨“的唯一方法,让现实世界的证据真正用于临床诊断,药物开发和制药行业,使真实世界的研究真正实现。