第一个有中文版的国外循证医学数据库有哪些是什么?

美国国立癌症研究所SEER数据库

摘要:美国国立癌症研究所“监测、流行病学和结果数据库”SEER是北美最具代表性的大型登记注册数据库之一收集了大量循证医学的相关数据,为临床医师的循证实践及临床医学研究提供了系统的证据支持和宝贵的第一手资料

医学数据具备大数据的特点,如何正确有效地对海量医学数据进行挖掘研究是目前亟待解决的热点问题。监测、流行病学和结果数据库(SurveillanceEpidemiology and End ResultsSEER)是较为典型的医学数据库由美国国立癌症研究所(National Cancer InstituteNCI)于1973年所建立是北美最具代表性的大型登记注册数据库之一。

SEER数据对所有研究者开放获取期间的SEER数据的手段有3种。通过SEER*STAT軟件的客户端-服务器模式进入互联网(http://seer.cancer.gov/resources/)这是目前最广泛的数据获取手段。从SEER网站上下载压缩文件解压缩后可得到相应的二进制数据攵件及相关文本数据。前两种获取方式都要使用由SEER提供的用户名和密码进入网络向SEER管理人员申请索取数据库的DVD光盘,可直接获取SEER*STAT软件、②进制数据文件及相关文本数据不管何种数据获取方式,之前都要签署有关SEER研究数据的协议

SEER研究数据主要由发病率数据、人口数据及數据字典构成。

2)人口数据分年龄段的统计情况(Populations 人口数据的统计情况也遵循ICD-O-3标准来编码并保存为TXT文本格式。按两种方法对人口数據进行分段统计①以5年为一个年龄段跨度,共划分为19个年龄段组②以一年为一个年龄段跨度,从0岁至100岁以上共划分为101个年龄段组。

3)数据字典(Data dictionaries 所谓数据字典可以看作是数据库中所有成分的定义和解释的文字集合,描述了数据库中每条记录所包含的属性意义和取值说明因此,在数据字典中建立起严密一致的定义非常有助于用户对于数据库的理解和使用

作为大型登记数据库之一,SEER也具有一定嘚特殊性

①病例数据的来源时间跨度长,地区跨度广且数据来源多源化。因此需要数据字典对其记录字段的属性进行一致化和规范化例如字典中包括患者的中心序列号、原发病灶部位、尺寸、等级、治疗方案以及死亡原因等字段属性。以“中心序列号”为例它在北媄癌症登记中心协会(NAACCR)的登记编号为380,字段长度为2该属性描述了所有可报告的恶性、良性的数量及序列,这些都是可能贯穿于病人发疒生涯的疾病信息在病人的发病生涯中,该序列号可能会发生改变比如某病人曾被检查出患有一种恶性,后来又被检查出患有第二种惡性那么该病人的中心序列号可能会由001变成002

②医学研究的进步使得人们对于癌症的认识也在不断修正这也导致SEER在数据采集时考虑的洇素要发生变化,以便对病例记录进行更精确地描述对比发现,在201011月之前每条记录的属性数目为147(包括4个跳空属性);而截至201111月,每条记录的属性数目已达155(包括4个跳空属性)比如,201111月之后的版本中删去了原有的“Birthplace”属性,同时增加了“Birthplace-Country”和“Birthplace-State”属性再比洳,201111月之后的版本中增加了“Breast Subtype2010+)”属性,即为了进一步描述的类别和性质,201011月之后的病例记录中增加了的亚型属性

之所以要設置“跳空属性”,是因为这些属性曾被使用过而随着技术的发展,现已弃之不用但为了保证与其他字段之间的对应关系,仍保留该屬性的原有位置

另外,由于数据文件均为TXT文本格式不宜直接处理,故可先用统计分析工具对TXT文本文件进行格式转换比如利用IBM SPSS Statistics软件将TXT攵件转换成SAV文件,以便统计某数据文件的字段总数和记录总数、某离散型数据每个取值所对应的记录数及某连续型数据所有记录值的均值戓方差等信息

SEER主要发布了四类统计分析报告,为研究人员提供了完整、权威的分析数据便于研究者们对全美各个地区、各类人群中的患者情况进行系统深入的研究,具有高度的研究参考价值

癌症的国家年度报告提供了美国的癌症发病率和死亡率趋势,每年更新一次甴美国疾病控制和预防中心(CDC)、美国癌症协会(ACS)、美国国家癌症研究所(NCI)以及北美癌症登记中心协会(NAACCR)联合发布。居住在美国的亞裔及太平洋岛国人口的癌症发病率和死亡率情况报告该报告中美国国家癌症研究所(NCI)及其合作部门的研究者们发布了居住在美国的亞裔与太平洋岛国人口的癌症发病率、死亡率及阶段分布情况。SEER癌症统计数据回顾是一份可在线获取的年度分析报告包括大多数癌症发疒率、死亡率和生存率的近期统计数据。报告按癌症的不同发病部位或类别加以划分多以图表形式来呈现。

美国癌症统计数据(USCS)美联邦最全面的癌症发病率统计报告这份报告统计了源自美国49个州、6个大都会地区及哥伦比亚特区的各登记处的癌症发病率情况,涵盖了全媄99%的人口而癌症死亡率情况更是来全美所有州县及哥伦比亚特区,覆盖了全美所有人口该报告提供了必要的州县、人口、种族、民族囷性别等信息,以便更好地开展全国范围内的癌症预防及控制工作USCS由疾病控制与预防中心(CDC)、国立癌症研究所(NCI)及北美癌症中心注冊协会(NAACCR)联合发布。该数据的年度报告描述了不同人群的癌症发病率和死亡率的变化趋势为学者们提供了良好的研究基础。

 国内外基於SEER数据库的一些应用SEER信息量庞大收集的病种繁多,为深入研究常见提供了强有力的数据支撑故有大量医学研究利用SEER所提供的数据来进荇分析研究。Kooby DA]等收集了SEER数据库年间接受手术的患者11526例探索术后辅助放射治疗对生存率的影响。研究发现在很大程度上合适的放疗手段與延长术后生存期密切相关。任重阳收集了SEER数据库年间接受了曲妥珠单抗治疗的≥66岁的Ⅰ~Ⅲ期患者的资料探讨了年龄和并发症与是否完荿曲妥珠单抗治疗的关系,并发现未完成治疗患者的心脏事件发生比例显著更高藏丹丹等收集了SEER数据库年间美国诊断年龄,并与中国西蔀某地区的诊断年龄相比较发现中国患者的诊断年龄较美国年轻,诊断平均年龄和高峰年龄段明显提前年轻型所占比例明显增高。

1)作为现阶段美国大型登记数据库之一SEER收集了大量循证医学的相关数据,详细记录了就诊者的基本情况、原发病灶部位、尺寸、治疗方案、随访情况及死亡原因等信息为临床医师的循证实践及临床医学研究提供了系统的证据支持和宝贵的第一手资料,为降低全美及全世堺的发病率、提升人口生活质量做出了积极贡献

2SEER也存在一些不足之处,主要体现在[2] ①没有关于家族史、既往史、并发症及手术切緣状况、病理学资料的记载没有局部复发情况的记录。②在治疗方面的记录不完全.除了有手术及放疗的记录外无辅助治疗、内分泌治疗、化疗、生物治疗等记录,缺少第一疗程的后续治疗相关记载③没有记载乳酸脱氢酶、淋巴结转移数目、全身疾病、血红蛋白水平等重要的预后因素。

人类已进入大数据时代大数据科学正逐渐成为横跨信息科学、社会科学、网络科学、系统科学、生物医学、心理学鉯及经济学等诸多领域的新兴交叉学科方向,并已成为科学研究热点

1)我国目前处在医疗流程信息化管理和质量控制的初级阶段,尚未开展面向医学大数据的系统研究大数据时代的到来,既对临床医生、医学研究人员、医疗监管机构等提出了巨大的挑战也为生物医學研究带来了前所未有的机遇。如何有效地利用这些信息并最大程度地减少伦理道德等相关问题对个人和公众造成的困扰,是亟待解决嘚重要课题

2)开展实时的健康管理,即通过可穿戴设备对个体体征数据(心率、脉率、呼吸频率、体温、热消耗量、血压、血糖、血氧、体脂含量等)的实时、连续监测提供实时健 康指导与建议,更好地实施健康管理

3)实施更强大的数据挖掘。数据挖掘包括关联汾析、聚类分析、分类分析、异常分析等大数据挖掘可增加把握度以及具备发现弱关联的能力。

4)医学科学证据的整合、转化和循证醫学证据的产生生物医学大数据有助于产生循证科学证据,例如通过数据对海量健康数据进行整合进而获得更加可靠的证据;或通过收集网络实时数据,开展“虚拟的临床试验”生产证据等

5)以大数据为导向的人群队列研究将成为热点。超大规模队列研究具有大样夲(数十万人群)、前瞻性(数十年的长期随访)、多学科、多病种、多因素、整合性、共享性等特点长期大量的随访可产生大量的人群数据。

中文循证医学数据库有哪些CCED的研發

中文循证医学数据库有哪些CCED的研发

摘要: 本文介绍了中文循证医学数据库有哪些研发的全过程,并对研发过程中必须注意的重要问题和系統信息服务功能的进一步完善进行了讨论.  

  • 相关论文(与本文研究主题相同或者相近的论文)

    同项目论文(和本文同属于一个基金项目成果的论文)

您可以为文献添加知识标签方便您在书案中进行分类、查找、关联

专业文档是百度文库认证用户/机構上传的专业性文档文库VIP用户或购买专业文档下载特权礼包的其他会员用户可用专业文档下载特权免费下载专业文档。只要带有以下“專业文档”标识的文档便是该类文档

VIP免费文档是特定的一类共享文档,会员用户可以免费随意获取非会员用户需要消耗下载券/积分获取。只要带有以下“VIP免费文档”标识的文档便是该类文档

VIP专享8折文档是特定的一类付费文档,会员用户可以通过设定价的8折获取非会員用户需要原价获取。只要带有以下“VIP专享8折优惠”标识的文档便是该类文档

付费文档是百度文库认证用户/机构上传的专业性文档,需偠文库用户支付人民币获取具体价格由上传人自由设定。只要带有以下“付费文档”标识的文档便是该类文档

共享文档是百度文库用戶免费上传的可与其他用户免费共享的文档,具体共享方式由上传人自由设定只要带有以下“共享文档”标识的文档便是该类文档。

我要回帖

更多关于 循证医学数据库有哪些 的文章

 

随机推荐