注册 登录
爱吱声 返回首页

gordon的个人空间 http://www.aswetalk.net/bbs/?663 [收藏] [复制] [分享] [RSS]

日志

大数据与 医学统计的未来 (转)

已有 323 次阅读2015-1-5 21:39 | 统计, 医学

       现代生物医学的方法论基础即将出现重大变革,从基于假设检验的统计分析演化为基于数据挖掘的知识发现。20世纪80年代以来,在“循证医学”(evidence-based medicineEBM)研究范式的引领之下,医学取得了许多重大进展,推动了临床实践的规范化。EBM的哲学根基是临床医生从经验、观察提出各种假设和猜想,并经由假设—演绎法来做检验。EBM所强调的方法论基石之一是随机对照试验(randomized control trialRCT),其步骤可概括为:猜想搜集数据假设检验得出结论。但是,这种方法论在面对疾病,尤其是癌症等一系列有着异常复杂内在机制的疾病时,其内在缺陷也是不可忽略的。由于试图通过随机分组方式来简化影响干预效果的复杂性,从而可以使用简单的统计学手段来考察很少的一些影响因素对临床结局的作用。但是,这就使得RCT本质上成为一种“黑箱研究”,即忽视因果关系而将相关性作为评价干预对临床结局的效果。研究者未尝不知道相关性与逻辑因果有区别,但由于有各种应用上的便利性,研究者往往在结果解释时故意混淆概念,化相关为因果。以RCT为支柱的循证医学,使得临床实践几乎被大型RCT的结论主导,但当出现结果相反的RCT时,就会给临床医生造成极大困惑。Meta分析作为一种解决此类挑战的方法已经十分流行,Meta分析从诞生开始就被异质性挑战缠身,对所得结论十之八九还要乞灵于“更多、更大样本的RCT”,从而进入了一个死循环。破解这一难题,需要另觅蹊径

       随着计算机科学的大发展,近几年来,研究者们在临床上第一次有可能、也有能力去考察数据全集。传统的临床研究设计方法产生的前提, 就在于以前无法处理海量的临床数据,无法考察数据全集而必须抽样。无论RCT还是队列研究,究其根本,其核心技术都是围绕恰当的抽样设计。但由于各类疾病本身的复杂性和患者之间巨大的内在差异性,RCT以及队列研究所能揭示的真相是有限的。当然,可以通过扩大样本量来减少异质性,但随着样本量扩大而带来的异质性减少却是边际递减的,而成本却呈数量级上升的。


        随着计算机科学的进步,我们对临床数据的记录和处理能力已经远非20世纪80年 代的研究者所能想象。利用计算机工具对海量的数据进行数据清洗、建模和计算,是旧有的、适用于传统临床设计的统计工具不堪胜任的,这需要由功能更为强大的 计算机语言来实现。这种语言不仅仅可用于假设和猜想的验证,还可以在没有假设和猜想时,通过对数据进行模式识别,将存在于海量临床数据中的重要信息提取出 来。这种模式识别分析方法对分析工具的灵活性要求很高,传统固定的分析软件难于实现。因此,R比已有的商业化软件如SPSSSAS更适用于临床数据挖掘的新分析模式。


       海量数据的产生,还对计算机统计算法提出了新的要求,即统计分析的参数选择从基于研究者/统计学家的主观经验逐渐过渡到客观的智能化、自动化选择,这就为临床数据分析引入了一个全新的计算机研究领域——机器学习。 Tom Mitchell[7]1997年对机器学习曾经进行了如下的定义:“Machine Learning is the study of computer algorithms that improve automatically through experience(机器学习是对能通过经验来自动改进的计算机算法的研究)。”机器学习不仅要求对已经存在的数据进行分析和知识挖掘, 还要求计算机能够通过对已有数据的学习来实现临床上对各种趋势的预测。研发临床机器学习系统,其核心技术是构建有效的、可自动更新的临床知识库。开发此类 具有自动优化功能的机器学习系统,其工作量极其庞大,任务具有碎片化性质,现有的商业开发模式无法完成。显然,只有功能异常强大、用法灵活、且有众多专家 活跃的在线社区的支持下才能完成上。


******************************************************************************

         在计划经济时代,中国和苏联的调查方法就有很大差别。

         中国由于能力的限制,主要是抽样调查。

         而苏联是全面调查、当然也更僵化。


        1980图灵奖的 CAR Hoare   最为人知的是1959快速排序算法, 当时作为交换生在莫斯科州立大学跟随Kolmogorov(1903-1987)搞机器翻译


        牛逼人就是因为跟对了大牛,呵呵

******************************************************************************

回顾一下 ”临床医学“  的历史,对发展脉络的预测是有所帮助的。


 自古希腊以来,生物学家们就发现,若要把握纷繁芜杂的生命现象,理解生命近乎无限的多样性,首要的是按照相似性形成“类别”观念,从相似中去查见差异, 这样就建立了以研究生物多样性和独特性为基础的分类学,它的另一个为现代生物学家所熟知的名称是“系统学”。由于“有机体只有在某种分类学建立了之后才能 按科学方法加以研究和处理”,并且由于“分类学的各个分支集中了、运用了、概括了有关有机体的一切已知知识”[2],系统学因之成为一切生物学学科最基本 和范围最广泛的部分,并因而对生物学发展产生巨大影响的学科。毫无疑问,林奈使分类学对生物学的影响在1760年代达到顶峰,他创设的双名法严谨实用,为 更严格统一的命名奠定了基础,他对易于混淆的同义词进行标准化,使生物学家开始使用同一套语言交流,一句话,他使生物学“如何说”不再成为问题。


 分类学的巨大影响波及生物科学的几乎所有领域,作为生命研究范畴组成部分的医学也不例外。分类医学从而成为这一时期的主流,疾病被认为是具有独立地位的 实体,病人的身体因而成为外在于疾病的无干物和阻碍医生发现真相的障碍。从对疾病所具有的此种概念出发,福柯发现,对分类医学而言,“人们所面对的(疾 病)是一些既是自然、又是理念的类型。”与“自然”概念相联系的本质使不符合疾病所具有的分类学地位的干预成为“反自然”,从而也是有害的。因此,观察和 期待,以及在恰当时候“帮助”疾病完成它的自然过程就成为理所当然。对达到这一目的来说,既然家庭是疾病发生和出现的空间,因此对促进疾病消亡显然具有特 殊意义。由此,“(疾病的)这种结构就与政治思考中对救助问题的思考完全契合了。”


 既然家庭成为促进疾病康复的最好场所,原本由济贫院转变成为专门收治贫穷患者的医院也就没有存在的理由,而将用于建立医院的基金直接给予病人家庭也将更 为合理。经济学家们在此找到了与分类医学家的共同话语:18世纪的经济学家早已认为医院因其固定性和资产的非流动性而无法适应贫穷需求变化,这种性质与捐 赠财产作为公共财产的本质相违背——“这种独特而神圣的基金应该融化在一般性救助空间里,社会是其中唯一的管理者和无差别的收益者。”由于生老病死是人人 面对的问题,直接救助又必须依赖社会结构来支撑,因此医疗必定需要与国家相结合并成为一种国家任务。显然,这里已经出现一种促成近代医疗卫生体系的思想, 但若要实现这一社会对健康进行操作的过程,还需要另一种推动力——瘟疫或我们称为传染病的一类特殊疾病。


 由于传染病发病迅速,每次流行时总导致相似症状和高度一致的病程,但当在不同时间和地区流行时,其强度和特点又差别甚大,因此它不具有一般疾病所有的独 立本质,采用分类医学赖以建立的单个观察、记录和分类的方法也就无法加以认识。它是一种集体现象,并总是具有某种历史独特性,所以“需要从其特殊的、偶然 的、意外的特质来描述。”换言之,需要灵敏的发现和全面充分的记录,这就导致了“流行病监测体系”雏形在18世纪末得以建立。由于认为流行病在本质上是由 当时当地特殊的气候、水土、社区条件和人的行为方式所导致的综合症状过程,因此,对流行病的控制只有通过社会干预和一系列强制手段才能实现。所以,福柯指 出,虽然“流行病学在所有方面都与分类医学相反,但一旦涉及对疾病、医疗经验以及医生对社会结构的监控进行分配这些第三级构型,流行病病理学和分类疾病病 理学就会碰到相同的要求:确定医学的政治地位,建构国家层次的医学意识。”正是这些要求促进了医学学科结构的改造,并在此后社会变革中催生出新的医学观念 和体系。


 1790年代成为分水岭,社会的动荡和重组导致了对医学实践的新要求,而一般政治观念和信条又给医学观念造成持久影响并改变了医学观察的模式,最终,分类医学观念被我们称为现代医学观的“生理-病理医学”模式所替代。


 大革命使人类解放的观念深入人心,天赋人权的理念促进人们思考不平等与疾病的关系,健康成为验证社会公正的天平。于是医学的政治使命不言而喻,医生的首要任务也因此而具有政治性:“与疾病作斗争必须首先与坏政府作斗争。人必须先获得解放,才能得到全面彻底的治疗。”


 虽然这一理想最终被证明为不切实际,但重要的是,通过这一过程,它终于实现了医学与国家命运的结合,并经由随后的一系列政治实践彻底改造了临床医学。废 除旧的医学教育体制和医生执业制度是这些改革的第一步。但是,对行医资格限制的取消和旧有医学教育的关闭并未辅以有效的新制度,结果江湖医生大行其道,加 之战争带来的流血,创立新医院和医学成为必须解决的问题。重新建立的医学院开始出现,并在新环境中运行:这时的管理者和监督者由行会变成了国家。由于古典 大学教育已被废除,新医学院的教育在经过重建的诊所进行。不同的是,前此仅仅实施医学教育的诊所此时已肩负起治疗责任,因此医学生的学习是基于实实在在呈 现于眼前的病例的,对分类理论的学习已退居次要地位。患者的症状取代疾病实体而成为引导临床判断的指南针。分类医学由此嬗变为症状医学。


 “我们应该尽可能地使科学视觉化”是症状医学时期最有代表性的箴言,“目视”成为这一时期医学的核心观念,它对诊断技术和概念的形成具有决定性意义。医 生只有借助于如炬的目光才能发现深藏于身体之中的疾病,恰如黑暗空间中的包含物只能由白昼之光来揭示。不难发现,这一认识其实正体现着“启蒙”的时代精 神。对疾病的这种感知依赖于对疾病症状和征候的认识,换句话说,“疾病是以症状和征候的方式呈现给观察者的” 。在这里,福柯区分了症状(symptome)和征候(signe)。症状是更具有本质性的表象,或者说,它表现着疾病本身。“在症状之外不再有什么病理 本质:疾病中的一切本身都是一种现象;就此而言,症状扮演着一个纯朴的、最自然的角色:‘它们的集合体构成了人们所谓的疾病’。”因此,疾病的本体被取消 而代之以症状的集合。征候则略有不同,如果说症状本身反映着疾病本身的存在,那征候就是为医生所感知的疾病的间接物。


 症状和征候概念的形成对现代医学有着极其重要的作用。今天,所有的医生在其临床医学教育的第一课都会被教导牢记和理解症状和体征(现代医学对signe 的译名)的概念。现代诊断学将症状定义为“为患者感知并表达的不适或异常”,体征是“由医生通过客观检查发现的异常机体现象”。通过把医生置于客观和中立 的观察地位,体征在今日的诊断中获得了较症状更为显著的位置。由于症状医学关注的焦点是医生目光的直接和间接,而现代医学关注的是对异常过程感知的客观性 和主观性,所以,对症状和征候给以不同地位就不足为怪了。由于症状直接代表着疾病给患者造成的痛苦,因而是疾病存在的证据,而体征反映着已经存在的异常, 因此也表现着疾病。所以,无论是症状还是征候都可以是疾病的同一物,它们“诉说着相同的事物”。


 在对症状-征候进行深入分析的基础上,福柯进一步运用符号学方法考察症状医学的观念结构,并将一对声名显赫的概念引入到对疾病认识的结构分析中,这就是 所指和能指。简单来说,前者可以理解为我们感知并企图加以把握的存在物,而后者则是我们加诸这一存在物的名称(或者按索绪尔的说法,所指和能指分别代表存 在物的概念和音响形象),而事物的整体,也即所指和能指的复合体就构成了一个可以为人所把握的符号。这样,由于症状构成了疾病表象,因而也就成为疾病的能 指。同时,因为症状的集合就是疾病本身,它也是所指并因为这种二重性成为叙述疾病全部事实的符号。由此,病理过程理当成为充分言说的对象,所以“疾病存在 的真实性是完全可以说明的”。如同语言的表达需要时间,症状的显现也是动态演变的过程,所以,疾病应当是包含时间维度的概念,分类医学中静止的疾病因而流 动起来。


 症状理念指引着18世纪最后几年中的医学家们。但是,人们很快发现,症状和征候是如此纷繁,不确定性又是如此令人绝望的无处不在——“不确定性既是对象 复杂性的特征,又是科学不完善性的特征;除了自身的极端狭窄与资料的过分丰富之间的关系外,医学的推测性质没有任何客观基础。”不和谐的偶然性变得越来越 引人注目,人们迫切需要能够处理这一新问题得新方法和新观念。正当其时,一门新数学的出现为解决概率问题提供了绝佳视角——统计学由此开始了融入医学方法 的过程,并最终成为医学科学化的重要支柱。


 伴随工业革命的进程,近代国家开始形成,如何衡量国家实力成为政治计算的重大任务。专门调查机构应运而生,人口、土地、出产以及疾病的数目字随之如雪崩 般涌现,1660年前后,统计学作为“政治算术”登上了历史舞台。扩张的野心、对利润的渴求以及实现“最大幸福”的理想把欧洲国家集体推上数字化管理进 程,统计学也迅速成为一门显学。“每个国家,幸福的还是不幸的,都以其自己的方式在统计学上表现出来。”[3] 这是一个统计学家大显身手的时代,拉普拉斯(Laplace)、泊松(Poisson)开创性的工作奠定了统计学作为一门科学的基础,而孔德从对数目字的 测量中引发出“实证” 概念,此后的历史表明,它对近代科学、哲学乃至一般社会思想都发生了深远影响。


 在这一观念背景下,现代临床医学的结构得以建立:“通过引进概率论思想,医学就彻底更新了其领域的感知价值……医学不再试图观看有感觉的个体背后的本质真实;它所面临的任务是,理解一个开放领域的事件,以至无穷。这就是临床医学。”


 但是,症状医学的观念依然存在认识的迷雾:疾病被看作语言的类似物,没有本体,只有作为符号的症状在运行,医生的目光仅仅停留于身体的表面。显然,这是 缺乏深度的目视,机体的迷宫仍然保持在黑暗之中。要揭开迷雾,就必须打开身体,用洞察入微的光亮照进暗藏疾病的阴暗角落。瞥视(glance)取代目视成 为下一时期临床实践的核心观念,解剖学也取代症状成为解析疾病的利刃:“症状医学将逐渐消退,直到在关于器官、病灶和病因的医学面前,在完全按照病理解剖 学组建起来的临床医学面前最终消亡。”


 经典医学史在论述这一临床医学向现代转变的时期时,总乐于强调存在于病理解剖学家与社会保守力量之间的戏剧冲突,并进而证明正是由于旧的社会势力的阻挠,医学才会在长达百年的时间中无 所进步,而冲破对尸体的禁忌才为临床医学带来了发现真理的希望。然而,福柯通过对历史文献的细致考证发现,这些叙述并非历史的本来面目,至少从18世纪中 期以来,为医学目的进行的解剖不存在障碍。之所以会出现这些虚幻的历史书写,乃是因为编撰者往往从日后对临床医学和解剖学紧密关系的解读出发去找寻历史发 展的痕迹,并根据预先形成的结论对历史文献做选择性编排,忽略乃至无视与自己观念不相吻合的记录,从而颠倒因果的建构了一部有关英雄与愚人,进步与退步的 历史。


 早在17世纪,维萨里留斯就已经发表了解剖学巨著《论人体的结构》,1760年莫尔加尼的《病变的位置与原因》已经把疾病与病理解剖学联系起来。由于占 支配地位的观念并不关注病人身体的结构与疾病发生的关系,所以“在四十年间阻止医学听取莫尔加尼的教诲的,正是临床医学的思想。冲突不是发生在新知识与旧 信仰之间,而是发生在两种不同类型的知识之间。”


 比夏(Bichat)的著作是这一时期最有代表性和最重要的医学文献。他将“组织”作为机体构成的最基本单位,并认为疾病最终可以还原为组织的损伤过 程,因此每一疾病都被给以一个解剖学地位。通过考察“每一系统内普遍的变化史”,病理解剖学最终建立了一套身体结构的疾病分类体系。所以,在某种意义上, 分类医学的基本观念通过病理解剖学获得了新生。毫无疑问,在这里“每个系统内普遍的变化史”具有极其重要的价值,这一认识促使人们去发现不同器官中类似的 发病过程,并成为今日病理学“运用基本病理过程及其发生发展的基本规律去深刻发现和认识各种疾病的特殊规律和本质”[4]的观念来源。


 在解剖-病理医学中,死亡的地位也发生了转变:尸体成为关于生命和疾病的真理的来源,死亡也就不再仅仅是一个消极的终结者,而成为“获得关于生命的实症 真理的唯一可能途径”。死亡从一个突兀而来的事实变成了一个绵延于生命之中的过程,所以,“生命、疾病和死亡由此组成了一种在技术上和观念上的三位一 体。”正如一位研究者指出的,在这里,福柯发现了“死亡在医学感知中承担的新角色,成为疾病和生命关系的澄清者…死亡过程变成了一种特殊的生命过程,先于 病人的实际死亡而存在,而且在实际死亡瞬间之后依然存在。死亡提供了认识疾病和生命的最佳视角。”[5]


 虽然透过病理-解剖医学对已有观念的整和、改造与重建,现代临床医学的疾病观已初具雏形,但仍然有一类疾病无法被纳入它的框架之中,早期的解剖学家们无 法给它们确定位置,这就是“热病”——一类包含甚广的炎症性疾病。“红、肿、热、痛”是这类疾病的共通特点,但常常无法发现发热与具体器官的联系,困惑的 医生们热烈的讨论,有时甚至发生激烈的争执,然而问题终于没有得到解决,直到1816年。这一年,布鲁塞发表《公认学说之考察》,明确指出,要理解炎症, 就必须认识到这是一种在不用解剖刀就可以用肉眼看到的生理学现实,因此就需要用一种“生理医学”的观察方法来把握。炎症首先是一种“机能失调”,所以疾病 的本体性再一次被取消,有关生理反应的观点取得了支配性的解释地位。人们需要的是“在生理学里寻找疾病的特征,并且通过娴熟的分析来分辨患病器官常常混为 一团的呼喊。”


由此,界定“正常”成为实现疾病生理分析的首要任务。不知道正常就无法了解异常,从这一思路出发,我们不难理解,为什么整个19世纪医学史会在克劳德贝尔 纳和路易巴斯德处达到颠峰。所以,福柯的下述结论就显得尤其令人信服“疾病医学已到了尽头;现在出现了一门病理反应医学。这种经验结构主宰了19世纪。因 为它还将包容致病媒介医学,因此虽然它也不免在方法论上有所修正,但还是在某种程度上支配了20世纪。”


        恩斯特迈尔在其巨著《生物学思想发展的历史》中写到:“在一般人心目中发现就是科学的标志。新事实的发现一般是容易报道……然而把科学仅仅看作是收集事实 则是很大的误解。在生物科学中,绝大多数的重要进展是由引入新概念或改善现存的概念而取得的……通过概念的改善比经由新事实的发现能更有效的推进我们对世 界的了解,虽然这二者并不是互相排斥的。”


注:这种认识超越了经验科学,新概念的引入确实很牛叉。


        但作为一个保守主义者,还是觉得英国人的经验主义 牢靠。




膜拜

鸡蛋

鲜花

路过

雷人

开心

感动

难过

评论 (0 个评论)

facelist doodle 涂鸦板

您需要登录后才可以评论 登录 | 注册

手机版|小黑屋|Archiver|网站错误报告|爱吱声   

GMT+8, 2024-5-17 01:21 , Processed in 0.027873 second(s), 17 queries , Gzip On.

Powered by Discuz! X3.2

© 2001-2013 Comsenz Inc.

返回顶部