P20:20.Precision Medicine - 大佬的迷弟的粉丝 - BV1oa411c7eD
今天我要讲的是精准医学,我们对什么是精准医学并没有一个非常精确的概念,所以我要先谈谈这个问题,大卫,谈疾病亚分型,如果你想想你怎么知道,一种疾病的亚型是什么,你通过某种聚类来做到这一点。
在一堆不同种类的数据上,所以我们有像人口统计这样的数据,共病,生命体征,药物程序,疾病轨迹,不管这些图像相似性意味着什么,今天我主要集中在遗传学上,因为这是人类基因组计划的巨大希望。
随着我们对基因对疾病影响的了解越来越多,它将帮助我们创造出对付各种疾病的精确方法,为他们找到正确的治疗方法等等。
所以我想先回顾一下,一项由国家科学院国家研究委员会进行的研究,它被称为二字精准医学,这是一个相当近的二十七年,他们有一些有趣的观察。
所以他们一开始,他们说好,为什么以前可能不相关,现在却相关,当然还有,最大的是汇编患者分子数据的新能力,以20年前难以想象的规模,所以人们估计获得第一个人类基因组花费了大约30亿美元,今天。
获得人类基因组的成本不到1000美元,我在以后的谈话中有一些数字,展示人们正在运行的一些广告,在利用分子信息改进诊断和治疗方面越来越成功,我们将讨论它的一些进步,这样我们就有更大的能力处理所谓的大数据。
利益相关者之间的完美风暴,这使得他们更容易接受这种信息,所以事实上,美国医疗保健系统的费用,我们一直在上升,但质量并没有一直按比例上升,使每个人都不顾一切地想出新的方法来处理这个问题。
所以看起来你知道下一个伟大的希望是如何做到这一点,以及公众对分子数据态度的转变。
有多少人看过这部电影?加塔卡,有几个,所以你知道,这是对当人们被基因分型时会发生什么的反乌托邦观点,因此可以通过它们的遗传学来跟踪,确实会有恐怖故事发生,但尽管如此。
今天人们似乎对允许收集这种数据更加放松,并被使用是因为他们看到潜在的好处大于成本,不是每个人,但你知道这仍然是一个严重的问题,所以这份报告继续说你知道,让我们思考如何集成关于个人的各种不同数据。
他们开始,他们说你知道,谷歌地图就是一个很好的例子,所以谷歌地图有一个坐标系,基本上是地球上每一点的经度和纬度,它们可以利用这个坐标系互相叠加,有关邮政编码的资料,建筑物,人口普查区,土地利用,运输。
一切,他们说哇,这真的很酷,要是我们能在医疗保健中做到这一点就好了,所以他们的愿景是在医疗保健方面做到这一点,他们说,与经纬度相对应的是个别患者,这些病人有各种各样的数据,包括它们的微生物群。
他们的表观基因组,他们的基因组,临床体征和症状,曝光,他们接触到什么,所以有一个真正的尝试出去创建大量的数据集合,汇集了所有这些信息,其中一个值得注意的是井部,nih,基本上在一年半前开始了一个项目。
叫我们所有人听起来有点威胁性,但我们真的有一百万人,他们已经要求美国各地的机构招募志愿者,做志愿者,提供它们的遗传信息,他们的临床数据,他们生活的地方,他们在那里通勤。
这样他们就可以获得关于它们的环境数据,然后它意味着一个持续的数据收集,大约一百万人被认为是美国的代表性样本,所以你会在今天晚些时候我谈论的一些项目中看到,许多研究是在欧洲血统的人群中进行的。
因此它们可能不适用于其他种族的人,这是试图准确地取样,所以非洲的一部分,美国人、亚洲人和西班牙裔人等等与样本相对应,在美国人口中,有很长的历史,你们中有多少人听说过弗雷明汉心脏研究,很多人。
所以弗雷明汉,在20世纪40年代同意成为一项长期实验的主题,我想它现在是由波士顿大学经营的,每隔一两年他们就会出去,他们调查,我不记得有多少人开始的时候大概有五万人,关于他们的习惯,他们是否吸烟。
他们的体重和身高是多少,以及任何临床问题,他们做了外科手术,等等,他们现在一直在收集数据库,几代人的后代,他们也开始收集基因数据,所以我们所有人都在大规模地这样做,现在。
这项研究的愿景是说我们要建立这些信息,公地,它收集所有这类信息,然后我们将从这些信息或数据中发展知识,这些知识将成为生物医学研究的基础,所以说,如果我们发现显著的关联,那么这表明一个人应该做研究。
这不一定会得到他们收集的数据的回答,你可能要成长,击倒老鼠什么的,以测试一个想法是否真的有效,但这是一种集成所有此类信息的方法,当然它会影响诊断,治疗和健康结果,这是你想在医学上做什么的圣杯。
现在有一个有趣的问题,所以重点是分类学,萨姆·约翰逊是一位非常著名的17世纪英国作家,是诗人、评论家和评论员,做各种花里胡哨的事,他的一句名言是我的疾病是哮喘和水肿,什么是不太治愈的,七十五岁。
所以他现在也很有趣,如果你查字典,你们中有多少人听说过浮肿,一对夫妇,你是怎么听说的?是啊,是啊,我是说,我是通过和十八九世纪的人一起看杰作剧院了解到这一点的,在你知道的地方。
祖母会和浮肿的人一起躺在床上,结果不是很好,但那些人花了很长时间才死,所以水肿是水病,肿胀,水肿,等等,其实不是病,这是一大堆疾病的症状,所以可能是肺病,心力衰竭,肾病,等等,而且很有趣。
我回想起这件事,我找不到它来整理这个讲座,但在某一点上,我确实发现上一次,水肿被列为美国一患者死亡原因-中新网,是在一千九百四十九,所以从那以后,它作为一种疾病从分类学中消失了,如果你和肺部的人交谈。
他们怀疑哮喘,在我们现在的词典中仍然是一种疾病,可能很像浮肿。
这不是病,这是一系列潜在原因的症状,这个想法是,我们需要做得足够好足够精确才能弄清楚这些是什么,几周前,我和我在哈佛的朋友扎克·科哈纳谈过,当我开始准备这个讲座的时候,他有以下想法。
我要给你们看的例子来自他,所以他说,好吧,看,我们应该有这个精准医学模态空间,包含所有这些信息,这是在NRC的报告中,然后我们要做的是,如果我们幸运的话,我们要找到一组数据,所以这种情况总是发生。
如果你拿一个非常高维的数据集,并把它放入它非常高的维表示空间,几乎从来都不是这样,数据均匀地分散在空间中,如果那是真的,这对我们没有多大帮助,但一般来说这不是真的,你会发现数据往往在低维流形上。
所以它在空间的子集中,所以分析这类数据的很多技巧是,弄清楚那些低维流形是什么样子的,通常你会发现在一个非常大的数据集中,有一群像这样的病人,然后扎克的方法是说好,如果你有耐心,很难把三个维度表示为两个。
但是如果你的病人掉在这样一个集群的中间,那么这可能意味着它们对那个星系团来说是正常的,而如果它们落在这样一个星系团的边缘,这可能意味着有一些奇怪的事情发生了,值得调查,因为它们不寻常。
所以他给我举了一个他的病人的例子,让我给你一分钟读这个,是啊,是啊,都在材料里,哪里写着武器库,哦耶,所以军械库在历史上是军队可以使用的一套武器,所以这是一套医生可以使用的治疗方法。
这是你唯一不知道的词吗,很好地理解,你可能知道抗生素是什么,和免疫抑制剂,你可能听说过,无论如何,这是一堆不同的疗法,这就是所谓的生病的小狗,是一个做得不好的孩子,三岁时因溃疡性结肠炎开始生活。
这是由他们通常给患有这种疾病的人服用的药物控制得很好的,然后突然之间,十年后,他突然腹痛腹泻,他的大便里有血,他们尝试了一堆他们认为应该有效的东西,它不起作用,面临一些相当激烈的选择。
比如切除他结肠发炎的部分,所以你的结肠是消化道的重要组成部分,所以失去它并不好玩会对他的余生产生不好的后果,嗯,但他们所做的是他们说,嗯,嗯,为什么他对这些治疗都没有反应,和。
你能想象的点云图中的困难是,你如何判断这个人是否是局外人,或者在这些集群之一的中间,在这个孩子的情况下,这取决于很多事情,它所依赖的,最重要的是,是他经历的最后六个月,在他接受标准治疗之前。
所以云可能代表了溃疡性结肠炎的人,在标准治疗下得到很好控制的人,现在他突然成了局外人,在这种情况下发生的事情是,他们说,嗯,可能溃疡性结肠炎患者有不同的群体,所以也许有些人在治疗后终身缓解。
用一种常用的单克隆抗体,这就是集群,星系团的中心,也许有些人有多年的缓解,但对这些药物产生耐药性,他们必须接受的其他治疗,这就是切除结肠,还有一些人最初得到了缓解,但没有标准的治疗方法有效。
这就是这个孩子在这个集群中的情况,把这当成机器学习问题,从拥有许多不同病人的大量数据的角度来看,和挑战,当然啦,包括你的距离函数是多少,在做人们通常做的那种集群时,你如何定义,什么是离群值。
因为总有一个连续体,它变得越来越分散,时变数据的最佳表示形式是什么,这是至关重要的,在这种情况下,尺寸的最佳加权或归一化是什么,那么在这个非常高的维空间中的每一个维度都是相同的吗。
还是某些维度上的差异比其他维度上的差异更重要,事实上,这是否因问题而异,答案很可能是肯定的,那么我们如何为病人找到邻居,嗯,我要给你一些线索,从遗传学的浅尝辄止开始,所以如果你上过分子细胞生物学课。
这对你来说应该不是新闻,我会很快地浏览一下,如果你没有,那我希望你至少能学会一些词汇,所以一位聪明的生物学家说生物学是例外的科学,关于两个几乎没有规则,五年前,这里的生物系为工程系教授了一个特殊的课程。
试图向我们解释他们在教什么,在他们的生物分子生物学入门课上,我记得我坐在杰瑞·苏斯曼旁边,我的一个同事,在我们听了一些关于一些理论不适用的四七方法的讲座后,在很多很多情况下,杰瑞转向我。
他说你知道这个领域的问题是,有太多该死的例外,没有理论,都是例外,自从人类在地球上行走以来,人们就观察到了,孩子们往往在许多方面与他们的父母相似,直到格雷戈·孟德尔,这是一个很大的谜。
为什么你像你父母一样,我是说,你一定从他们那里得到了一些东西,让你和他们相似,所以孟德尔有一个概念,即有离散的继承因素,他称之为基因,他不知道这些是什么,但在概念上,他知道它们一定存在。
然后他在豌豆植物上做了一堆实验,表明有皱纹的豌豆往往会有后代,同样起皱的豌豆,他研究出了我们现在所说的孟德尔遗传的遗传学,即显性与隐性遗传模式,几年后出现了,他在细胞中发现了一种叫做核子的奇怪东西。
现在被称为DNA,嗯,但直到1952年好时和蔡斯才,说嘿,正是dna代代相传地携带着这种遗传信息,然后呢,当然啦,沃森,克里克和富兰克林,第二年破译了DNA的结构,它是双螺旋,然后想出了机制一定是什么。
允许DNA传递这些信息,所以你有一个双螺旋,你匹配一个,四个字母a c,T G彼此相对,你可以复制这个DNA,把它分开,再长出另一条链,这是第一个的补充,现在你有两个。
你可以让孩子们把这些信息传递给他们,所以这是一件大事,所以基因是由国家生物技术信息中心定义的,作为遗传的基本物理和功能单位,那是DNA序列,位于特定地点,在染色体上,它编码一个特定的功能产品。
即RNA或蛋白质,我一会儿再来讨论这个问题,未解之谜,仍然很难弄清楚DNA编码基因的哪些部分,所以你会认为我们可能已经解决了这个问题,但我们还没有完全,其余的呢,这是绝大多数的DNA,如果不是。
然后折叠和几何学是如何,的拓扑,所以我回去了,我读了弗朗西斯·克里克在20世纪50年代的一些作品,非常有趣的是,这个假说在当时被认为是有争议的和试探性的,所以他说,一张核酸的特异性。
仅仅通过它的碱基序列,这个序列是特定蛋白质氨基酸序列的简单代码,有人争辩说他完全错了,这不是真的,当然事实证明他是对的,然后中心教条是,信息从核酸到核酸的传递,或者从核酸到蛋白质是可能的。
但是从蛋白质到蛋白质或从蛋白质到核酸的转移是不可能的,这并不完全正确,但这是一个很好的第一近似值,这就是六十年前的情况,后来又获得了几个诺贝尔奖,我们开始理解这是如何工作的一些机制。
当然还有它是如何工作的,你有DNA,就是这四个底座,双链RNA在转录过程中产生,所以这件事展开了,一条rna链,是沿着DNA建立的,并与DNA分离,创造一个单链RNA,然后它去连接核糖体。
核糖体接受RNA,并以三胞胎的形式接受代码,每个三重态代表一种特定的氨基酸,然后它按顺序组装并产生蛋白质这些蛋白质是氨基酸序列,因为它是三维的,而且涉及到时间,有速率常数,这是化学,毕竟,所以再一次。
后来又获得了几个诺贝尔奖,我们有转录,将dna转化为RNA的过程是由启动子调节的,阻遏子,基因组上的增强子区域,蛋白质通过与dna结合来介导这一过程,并导致转录的开始或使其运行得更快。
或者导致它跑得更慢,或者他们干扰它,等等,还有这些增强剂,其中一些非常遥远,这对RNA的多少有很大的影响,因此有多少蛋白质是由,目前对此的理解是,如果这里有基因,可能是DNA链环绕着,和增强器。
即使它在遗传单位上很遥远,实际上是非常接近的,因此可以鼓励更多的转录发生,顺便说一句,当然,如果你对这些东西感兴趣的话,麻省理工学院教了很多如何做到这一点的课程,戴夫·吉福德和马诺利斯·凯利斯。
两者都教授如何应用计算方法的计算课程,试图破译这种活动,所以阻遏剂阻止活化剂结合,或更改激活剂以更改速率常数,所以这是另一个,其中一个问题是,如果你看看你体内的DNA总量,在,你的基因,在你的牢房里。
只有大约1。5%是外显子,哪些是编码的部分,mrna和最终的蛋白质,所以问题是其他98。5%的人是怎么做的,在生物界有一种不幸的倾向,称之为垃圾,dna,这当然是一个可怕的想法,因为进化肯定会摆脱它。
如果它真的是垃圾,因为我们自己花了很多精力建造这些东西,每次细胞分裂,它重建了所有所谓的垃圾DNA,所以不可能是垃圾,但问题是它是做什么的,我们真的不知道很多,所以有内含子,我给你看一张照片。
编码区域的某些片段不会上发条,作为RNA的一部分,它们是拼接出来的,我们不知道为什么,有这些调节序列,只有百分之五左右,就是那些推动者和阻遏者,和,然后呢,有一大堆重复的DNA,包括转座元素,相关序列。
最重要的是,我们不明白这一切是做什么的,假设或类似的事情,也许这是一个潜在有用的DNA仓库,所以如果环境条件变化很大,那么细胞就不必从头开始重新发明东西,它把它从进化的前几个时代拯救了出来。
当这可能有用的时候,但在这一点上,这几乎纯粹是猜测。
就在最近,基利安的演讲是由杰拉尔德·芬克做的,谁是这里的遗传学家,他声称基因不是DNA的任何片段,产生RNA或蛋白质,但它是DNA的任何片段被转录成rna。
有一定作用的,随便啦,它不一定是构建蛋白质,但只是任何事情,我认为这种观点正在被接受,所以我答应你一点点,呃,更复杂,所以当你观察像我们这样的真核生物的DNA时,嗯,这是发起人,然后是基因组序列。
当这被转录时,它被转录成一种叫做前mrna信使rna的东西,然后是这个替代拼接的过程,它拼接出内含子,只留下外显子,但有时它并没有留下所有的外显子,只剩下一些。
所以同一基因在不同的情况下可以产生不同的mrna,然后产生不同的蛋白质,关于这一切到底是如何工作的,还有很多谜团,然而,这是基本机制,然后这里我刚刚列出了,一些复杂的问题。
所以像rna这样的东西可以转化为dna,这是病毒经常使用的伎俩,rna的dna补体,然后用它来生成更多的病毒,所以这是典型的病毒感染,我们也不太了解朊病毒,这就像疯牛病。
这些蛋白质能够在不通过rna的情况下引起其他蛋白质的变化,dna介导机制,有DNA修饰蛋白,其中最重要的是九号面包里的东西,这是一个相对较新的发现,关于细菌如何利用,他们从病毒中窃取的机制。
自身的遗传互补,更重要的是,攻击它们的其他病毒,所以它是一种抗病毒防御机制,我们现在正在研究如何用它来进行基因编辑,你可能读过这个中国人,他们实际上出去编辑了几个出生在中国的女孩的基因组。
在它们的基因组中,当然,在人类身上做实验可能还为时过早,因为他们还没有证明这是安全的,但也许这会被接受,哈佛大学的乔治·丘奇一直在四处走动,他喜欢把人们的锁链弄得嘎嘎作响,他到处说,那家伙。
你知道他不道德,是个邋遢鬼,但他所做的是一个非常好的主意,所以我们看看会发生什么,好的,然后是这些复古转座子,并将自己插入基因组的其他地方,在植物中,这种情况经常发生,例如,也许它只有一个。
但它是通过这种机制复制的,各种RNA,有很长,非编码rna,它似乎参与了基因调节,它实际上会抓住标准遗传机制产生的RNA,并防止它转化为蛋白质,这是几年前的另一个诺贝尔奖,几乎这个领域的一切。
如果你是第一个,你因此获得诺贝尔奖,它们的降解程度不同,所以细胞中有不同的机制破坏某些蛋白质的速度比其他蛋白质快得多,所以生产率并不能告诉你会有多少,在任何特定时间,然后是第三级,中学,和第三级结构。
那里实际上是什么样子的,你每个细胞里一英里的DNA,所以它不适合,所以它被包裹起来,一次又一次,我们不太明白这一切是如何运作的,因为你会认为如果你把东西包成这样,它将变得无法转录,因此。
不清楚它是如何表达的,但不知何故,细胞能够做到这一点,所以在这方面还有很多东西要学。
我们对这一切感兴趣的原因是因为,如果你根据摩尔定律计算出计算机每项性能变得便宜的速度有多快,你绘制基因测序的成本,它一直往下走,它下降的速度甚至比摩尔定律快得多,所以这是相当了不起的,这意味着你知道。
就像我说的,30亿美元的第一个基因组现在只需要几百美元。
事实上,如果你只是对整个Exome感兴趣,所以只有大约2%的基因,产生遗传编码的DNA,你现在可以去这家公司,与我无关,我刚从网上找到这个,但你知道只要299美元,他们会给你50倍的覆盖大约6G。
如果你多付他们一百美元,他们会以100倍的覆盖范围来做这件事,所以这些技术很吵,所以得到大量的复制是很重要的,为了重新组合你认为正在发生的一个稍微近一点的现象。
是人们说好,我们不仅可以测序你的DNA,但我们可以对从DNA转录的RNA进行测序,实际上你可以花360美元买到一套,它将从单个细胞中提取RNA,所以这些就像皮科升,东西的数量。
它会给你三百六十美元的rna序列,最多可容纳100个细胞,对呀,所以三块钱,每个牢房3。5美元,所以人们都很兴奋。
现在也有公司会卖给你高级分析,因此,它们将把您获得的数据与不同的数据库相关联,并弄清楚这是否代表,你知道的,显性、隐性或X连锁模型,如果你有家族数据和候选基因的功能注释等等,例如,从大约三年前开始。
如果你带着新诊断的癌症走进达纳·法伯,实体瘤癌,他们会提取癌症的样本,把它送到像这样的公司或他们自己的实验室,做测序和分析,并试图弄清楚到底是哪些受损的基因导致了癌症,也许更重要的是。
因为这仍然是一个相当经验主义的领域,你基因的哪些不寻常变异,表明某些药物可能比其他药物更有效地治疗癌症,所以这在癌症护理中已经成为完全常规的,在其他一些领域,好了,现在我要换一套更有技术含量的材料。
所以如果你想用基因表达阵列来表征疾病亚型,微阵列,这里有一个办法,这是阿里扎德的一篇著名论文,这基本上是这类论文的第一篇,回到2001年,我觉得,是啊,是啊,二千一,从那以后。
可能有数万或数十万篇其他论文发表,做类似的分析,关于其他数据集,所以他们所做的是,他们说,好的,我们要提取,我们将使用一种技术来放大它,因为我们从很小的数量开始,然后我们要拿一个微阵列。
它要么像一个有十个的玻璃滑梯,或者上面成千上万的斑点DNA,或者是一个有井的硅片,那DNA是从哪里来的,最初,它只是从基因组中随机收集的基因片段,从那以后,他们变得更加复杂,但我的想法是。
我要把扩增的CDNA,我要用这些水母蛋白做标记,在光下发光,然后我要把它流过这个滑梯或这个井,这套井,互补DNA的互补部分会粘在,在这口井里的DNA样本的部分,合乎情理。
另一种选择是你取正常组织和癌组织,你用绿色荧光水母的东西标记正常组织,你用红色标记癌症,然后你把它们等量地流动,在允许您测量比率的数组上,你没有那么多的校准问题,关于试图计算出确切的价值。
然后根据接近度和表达式空间对这些示例进行聚类,你通过样本之间的表达相似性对基因进行聚类,所以它以前是通过聚类来调用的。
我将在几分钟后讨论这样做的一种特殊技术,这是一个典型的微阵列实验,rna变成了它的互补,dna漂浮在微阵列芯片上,你会得到一堆不同程度的绿色和红色的斑点,然后你计算它们的比例,然后通过群集来实现这一点。
你得到的是基因的层次聚类,和乳腺癌的分层聚类,活检标本,所以这是相当革命性的,因为答案是有意义的。
所以当他们在19个细胞系和65个乳腺肿瘤样本上做这个实验时,和一大堆基因,他们得出了一个群集,说,嗯哼,看起来有些样本有内皮细胞簇,所以这是一个特殊的问题,你可以把它和病理联系起来。
从肿瘤幻灯片和不同的亚类,然后呢,这是你在这类研究中看到的一种非常典型的热图。
另一项来自65个乳腺癌样本的研究,使用他们以前策划的基因列表,看起来它把表达级别聚集成这五个集群,有点难看,我是说,当我盯着这些,对我来说并不明显,为什么数学会产生这些集群,而不是其他一些。
但你可以看到这是有意义的,所以在这里你可以看到它的尽头有很多绿色,在这一端不是很多,反之亦然,所以这些集群之间有一些区别,是啊,是啊,他们是怎么想出基因清单的。
有没有人做过这种聚类分析而没有先提出基因列表,是呀,我一会儿要讲的是现代基因广泛关联研究,基本上你说,我要看看人类已知的每一个基因,所以他们还有一个名单,但名单是,你知道的,两万或两万五千。
这是我们所知道的一切,这是另一种方法,那么这项工作引人注目的是什么,这个小组的工作,后来的分析表明,这五个亚型实际上有不同的存活率,在p等于零的地方,一级统计显著性,你见过这些生存曲线。
当然是在大卫的演讲之前,但这是相当令人印象深刻的,做一些与病人的临床状况无关的事情,这纯粹是基于他们的基因表达水平,你可以找到在临床上表现不同的集群,所以他们中的一些人比其他人做得更好,所以这张纸。
这种工作方法,引发了一系列巨大的额外工作,这又回到了阿洛萨达的报纸上,他们做了类似的关系,96个正常和恶性淋巴细胞样本之间,他们得到了相似的结果,在哪里,嗯,他们在这里识别的集群对应于某种很好理解的。
现有类型淋巴瘤,所以这又给了你一些信心,你从这些遗传相关性中提取的东西是有意义的,在处理淋巴瘤的人对这个话题的思考中,但它当然可以给你更多的细节,因为人们的直觉可能不如这些大规模数据分析有效。
所以要回答你关于概括这一点的问题,我是说,这是我看待这件事的一种方式,如果我列出所有的基因,我现在列出了所有的表型,我们更确定基因是什么,比表型是什么,所以这是一个有趣的问题,然后我可以做一堆分析。
所以你知道什么是表型,嗯,这可能是一种诊断疾病,比如乳腺癌,也可以是淋巴瘤的类型,从这两个例子中,我刚刚给你看了,它也可以是定性的或定量的特征,可能是你的体重,可能是你眼睛的颜色,可能是,你知道。
几乎所有临床上知道的关于你的事情,甚至可能是行为,可能是这样的,你知道,你每天的Twitter帖子输出是多少,那是一个完全合理的特征,我不知道这在基因上是否可以预测,但你会看到一些令人惊讶的事情。
那么你如何很好地分析这个,如果你从一个特定的表型开始,并说什么基因与此相关,那么你就在做所谓的GWAS或基因广泛关联研究,所以你寻找与特定表型差异相对应的遗传差异。
通常你会看到像单核苷酸多态性这样的东西,所以这是你的基因组与参考基因组不同的地方,人类中最常见的基因组,在一个特定的位点,所以你用C代替G什么的,你基因中的一个地方,拷贝数变化,有一段DNA有重复。
重复的次数是可变的,所以其中最著名的一个,是与亨廷顿病有关的,事实证明,如果你有20多个,DNA某一段的重复,你非常健康,但如果你三十岁以上,那你就会死于亨廷顿病,我们也不太了解这些机制。
但这些都是经验上已知的,所以拷贝数变异是重要的基因表达水平,我一分钟前已经谈过了,但GWAS的诀窍是观察一组非常广泛的基因,而不仅仅是你知道你感兴趣的有限的样品,现在另一种方法正好相反,也就是说。
让我们研究一个特定的基因,找出它与什么相关,所以这被称为Fias Phenome广泛关联研究,现在你要做的是列出所有不同的表型,你说,嗯,我们可以做同样的分析说。
其中哪些在有这种基因变异的人中不成比例地存在,这是典型的G黄蜂的样子,这被称为曼哈顿阴谋,我觉得这很有趣,但它看起来确实有点像曼哈顿的天际线,所以这是你所有的基因沿着你的染色体按顺序排列。
患有这种疾病的人之间表达水平的比例有什么差异,没有这种疾病和类似这种基因的人,不管它是什么,它的表达水平显然有很大的差异,所以你会很惊讶,如果这个基因与疾病无关,同样地,你可以计算出不同的显著性水平。
你必须做一些像Bonferoni纠正的事情,因为你同时测试了这么多假设,所以通常这些线的顶部是邦费罗尼校正阈值,然后你说,好吧这家伙,这家伙,这家伙,这家伙和这家伙超过了那个门槛。
所以这些是很好的候选基因可能与这种疾病有关,现在你能出去根据那口井开始治疗人们吗,这可能不是个好主意,因为这个分析可能失败的原因有很多,你所听到的关于混杂剂的所有教训在这里都非常强烈。
所以生物学家通常所做的,他们做这种分析,然后他们,有某种类似疾病的击倒小鼠菌株,是你在学习,他们看看,事实上,敲除某种基因,就像你知道的,这家伙治愈了,或者制造你在这个老鼠模型中感兴趣的疾病。
然后你有一个更机械的解释,好的,所以基本上你看的是患这种疾病的几率的比例,如果你有一个片段,或者如果你有这种疾病的基因变异,如果你没有基因变异,是啊,是啊,最后一面好奇,波诺尼的预测似乎会在这里承认。
潜在保守,我很好奇,如果有适合这种情况的特定计算技术,让你可以更多地了解我,是啊,是啊,所以如果你和统计学家谈谈,嗯,他们比计算机科学家更擅长这一点,如果你能在基因集上施加某种结构,你在测试。
那你就可以作弊了,你可以说好,你知道这75个基因,嗯,实际上都是同一个机制的一部分,我们真的在测试机制,而不是单个基因,因此,它没有与奥尼建立联系,我们只需要为一个人做。
所以你可以通过这种方式减少邦费罗尼校正,当你这么做的时候人们会紧张,因为,你知道吗,作为一名研究人员,你的动机是展示统计上显著的结果,但是整个P值的问题一直在讨论中。
所以大约十五年前美国统计协会的负责人,斯坦福大学教授,他出版了一本臭名昭著的书,文章说,你知道吗,我们全错了,在标准英语中这个词的意义,所以他呼吁各种其他的方法,更同情贝叶斯推理之类的东西。
所以可能会有一些渐进的运动,但这是一个巨大的蠕虫罐,对此,我们没有一个很好的机械答案,如果你做这些动作,这才是他们真正的问题,你看到的大部分都在下面,但它们的效果尺寸很小。
当你观察它们对特定疾病的影响时,所以我前面提到的扎克·科哈纳,一直在挑战做这种工作的人,说着,你看,比如说,我们做了一个赔率,我们和廖凯做了一个gewas,他是这里的嘉宾受访者。
当我在学期早些时候讲课的时候,她是风湿病专家,我们做了一项全基因关联研究,我们发现了一堆具有,就像一个点一对一,一点二比一,它们在统计学上是显著的,因为如果你收集了足够的数据,一切都有统计学意义,好的。
但它们在另一种意义上是否重要,嗯,所以扎克的论点是,如果你看看肺癌的几率比,对于吸烟和不吸烟的人来说,赔率比是八,好的,所以当你比较1点1到8,你应该感到羞耻,你在阐明真正的影响方面做得不太好。
所以扎克实际上非常强烈地认为,而不是把我们所有的注意力都集中在这些基因因素上,这些因素与,相反,我们应该更多地关注临床上的事情,这些事情通常有更强的预测关系,和一些组合,当然是最好的,现在。
我们确实知道,一大堆高度渗透的孟德尔突变,所以这些是你知道的,你基因组的一个变化,突然间你得了某种可怕的疾病,我认为当基因组计划在20世纪90年代开始时,有一种期望,我们会找到一大堆。
更多类似的事情而这种期望破灭了,因为,我们发现的是,我们的前辈实际上很擅长识别这些疾病,你知道的,从孟德尔到皱巴巴的豌豆,如果你看到一个有种族隔离模式的家庭,在那里你可以看到谁得了这种病,谁没有。
他们的关系是什么,你可以很好地了解什么基因,或者什么基因变异与这种疾病有关,事实证明,我们几乎找到了所有的人,所以没有更多的,这是高度渗透性的孟德尔突变,所以我们得到的主要是这些常见的变体,用小的。
真正有趣和值得研究的是这些罕见的小效果变体,所以你知道的事情,神秘的孩子就像那个孩子,我给你看的那个病例可能有一些有趣的遗传学,那是很不常见的,很明显很长一段时间都有很小的影响,但突然发生了一件事。
有一个叫做未知疾病诊断的领域,你知道的,当一个怪人从街上走进来,你不知道发生了什么,现在有公司,四五年前我是挑战赛的评委,我们带着八个这样的孩子,我们对它们进行了基因分型。
我们对他们的父母、祖父母和兄弟姐妹进行基因分型,我们取了他们所有的临床数据,这是在他们父母的同意下,当然,我们把它作为一个比赛,我们有来自世界各地的20多名参与者。
他们试图想出一些关于这些孩子的有用的话,你通过管道,我们分两轮做的,第一轮,管道看起来都很不一样,几年后的第二轮,管道几乎汇合了,我现在明白了有一家公司在这些挑战中做得很好,现在把这个作为一项服务出售。
就像我在不同的公司给你看的那样,所以你把,一些孩子的基因组成,患有奇怪的疾病和他们家族的基因组成,它试图猜测哪些基因可能与,导致这个孩子的问题,那不是答案,当然啦,因为这只是对问题的一种怀疑。
然后你必须出去做真正的生物学工作,试图重现这种情况,看看真正的影响是什么,但至少在这八个案例中的几个案例中,那些暗示,事实上,从而更好地理解了是什么导致了这些孩子的问题,顺便说一句,这很有趣。
我的名字是作家,在这些看起来像高能物理实验的东西上,是论文的前两页,只是作者列表,所以这有点有趣,最近的一项研究是II型糖尿病的基因广泛关联,这不是很广泛的基因,因为他们没有研究每一个基因座。
但他们研究了100个基因座这些基因座在之前的研究中与II型糖尿病有关,所以说,当然啦,如果你不是第一个做这种工作的人,你可以依靠文献其他人已经提出了一些有趣的想法。
所以他们最终选择了94种与二型糖尿病相关的变体,所以这些是血糖特征,你知道的,空腹胰岛素,空腹葡萄糖,等等,关于你身体的事情,你的体重指数,高度,重量,圆周,等各种脂质水平,与不同疾病的联系。
冠状动脉疾病,肾功能,等等,让我回到这个,所以他们所做的是,他们说,好的,我们是这样建模的,我们有一个关联矩阵,也就是由94个遗传因素组成的4个7个性状,所以我们用它做一个矩阵。
然后他们做了一些有趣的事情,所以他们把性状加倍了,矩阵分解技术称为非负矩阵分解,因为其中许多联系是负面的,他们所做的是针对每一个既有积极价值又有消极价值的特征,他们复制了那列。
他们创建了一个有积极联系的专栏,还有一个专栏,它否定了其他地方与零的负关联,他们就是这样处理那个问题的,然后他们说好,我们将把因子x的矩阵因式分解应用到两个矩阵中,我把它们画在黑板上,所以你有一个矩阵。
这是你最初的47x94矩阵,问题是,你能找到两个较小的矩阵吗,是47乘K和94乘K,当你把这些相乘在一起的时候,你现在得到了矩阵的近似值,如果你一直在看文献,有各种各样的想法,比如自动编码器,你知道。
所有这些基本上都是相同的潜在想法,这是一种无监督的方法,说,我们能通过做某种降维在数据中找到有趣的模式吗,这是降维的方法之一,所以这一个的好处是,当他们得到他们的W和H,然后他们知道,当然错误是什么。
他们说好,最大限度地减少误差是我们的目标,所以这也让他们得到了什么是正确的K的问题,这是一个重要的问题,因为通常像层次聚类这样的聚类方法,您必须指定,你要找的集群数量是多少,这很难先验地做到。
而这种技术至少可以建议哪一个最符合数据,所以损失函数是重建之间的正则距离,w乘以h和x,以及一些基于W和H大小的惩罚条款,再加上这些相关性权重,你可以看看论文,我想我在这里提到了,我让你读。
然后他们做吉布,采样和一大堆计算技巧来加快这个过程,所以他们从四个不同的研究中得到了大约17000人,他们都有欧洲血统,所以有一个通常的概括问题,你如何将这一点应用到来自世界其他地方的人身上。
在所有2型糖尿病患者中,结果是,他们出现在八十二点,3%的迭代,所以他们,顺便说一句,总随机撇开,加州理工学院有一段精彩的视频,他刚刚制作了黑洞阴影的照片,她的论点很像这样,你知道的。
我们尝试了很多不同的方法来制作这张照片,我们决定的是真的,几乎所有不同的重建方法中都出现了什么,所以这是一个类似的论点,或者其中一个与细胞的变异有关,这些是胰腺中制造胰岛素的细胞。
其中一个是胰岛素原的变异,它是胰岛素的前身,那是在不同的控制下,另外三个与肥胖有关,你的脂质代谢和肝功能的负面影响,如果你看看他们的结果,上面的蜘蛛图,所以解释这些的方法是中间的圆八角形。
中间的那个是负数据的那个,在那和外面之间的那个,相关性为零,与外部呈正相关,你可以看到不同的因素对这些不同的集群有不同的影响,所以这些是最有信息的因素,某人所属的集群,它们看起来确实有很大的不同。
我不想让你读这个,但它现在会在幻灯片上,有一件事很有趣,再说一次,这不会出现在期末考试中,但看看这些数字,它们都很小,你知道吗,我随便,那就是贡献点零,五个单位就有这种疾病的细胞型,以6点的p值。
六乘十的负三十七,所以它肯定在那里,这绝对是一种效果,但效果不是很大,每次都让我印象深刻的是,我看着这样的研究,这些影响是多么小,你是否在预测一些产出,比如病人体内的胰岛素水平。
或者你是否在预测类似类别成员的事情,如本表所示,好的,就像我说的,FIAS是一个反向gewas,第一篇介绍这个术语的论文是由乔希·丹尼和他的同事写的,2010年在范德比尔特。
所以他们没有一个非常广泛的联系,但是他们说我们要,来自范德比尔特生物库的25000个样本,我们将采集第一批6000名欧洲裔美国人的样本,没有其他选择标准,为什么欧洲裔美国人。
因为所有的GWAS数据都是关于欧洲裔美国人的,所以他们希望能够与之相比,然后他们说我们不要选一个SNP,但是我们感兴趣的五个不同的片段,所以他们挑了这些,已知与冠状动脉疾病相关,和颈动脉狭窄,心房颤动。
多发性硬化症和狼疮,类风湿性关节炎和克罗恩病,所以这是一个很好的抓斗包,他们所做的艰苦工作是,他们检查了成千上万种不同的账单代码,他们手工将他们分成744个病例组,然后说,好的,这些是我们感兴趣的表型。
好的,顺便说一句,该数据集仍然可用,它被很多其他人使用过,因为没有人想重复那个分析,所以现在你看到的和你在格黄蜂身上看到的非常相似,除了这里,我们有的是ICD九码组,我想当这篇文章发表的时候。
它高达一千,这些是相同的赔率比,那些标记的,你会发现这是p等于零5,那是邦费罗尼更正的版本,只有多发性硬化症出现在这个特殊的片段中,这是他们希望出现的问题之一,但他们感兴趣的是当你做这种分析时。
还有什么会发光,他们发现直肠恶性肿瘤,消化道良性肿瘤,所以癌症是怎么回事,这与单核苷酸多态性有关,没有达到统计上足够高的水平,但仍然有点耐人寻味的是,那里可能有一些关系,是啊,是啊。
所以这些数据是公开的吗,还是在某个特定的医院,或者谁有这些数据,比如当他们结合,是啊,是啊,我不相信你能得到他们的数据,除非你我想,如果我的意思是,他们很擅长与人合作,所以如果你愿意,你知道吗。
成为范德比尔特的志愿雇员,他们可能会带你去,但那是我编造的,但现在每个医院都有很强的控制,可用的是NCI有GEO,基因表达综合,它有巨大的数量,就像我认为数千亿的样本数据。
但你通常不知道样本到底来自什么,所以它有一个加入号,和它是什么样的数据的英文描述,实际上有很多文件,人们对这些英语描述进行自然语言处理,为了弄清楚这是什么样的数据,然后他们可以利用它,所以你可以聪明。
外面有大量的数据,但这不是精心策划的数据,现在有趣的是你并不总是得到你所期望的,所以说,比如说,选择了该片段,因为它被认为与多发性硬化症和狼疮有关,但实际上与狼疮的联系并不显著,它是点五的p值。
这不是很令人印象深刻,与多发性硬化症的联系是显著的,所以他们在这项特殊的研究中发现,有几件事是意料之中的,但没有成功,与冠状动脉疾病相关,被认为与颈动脉斑块有关,你颈动脉的淤积,p值不是82点吗?
一点都不令人印象深刻,好的继续,所以这是为snps做的,现在,今天一个非常流行的想法是观察表达水平,部分是因为我给你看的那些价格,在那里你可以非常便宜地从大量样本中获得表达水平,所以表达的整个概念。
数量性状,表示“嘿”的基因座或eqtls,而不是像范德比尔特的人那样努力工作,弄清楚这数百种疾病,让我们把你的基因表达水平,并用这些来定义我们感兴趣的特征。
所以现在我们正在研究你的基因组和表达水平之间的关系,所以你可能会说,嗯,那应该很容易,因为如果基因在那里,它会得到表达,当然这不是告诉你,基因是否被激活、抑制或增强,或者我前面提到的其他并发症是否存在。
所以这是一个有趣的经验问题,所以人们说,嗯,你知道吗,也许一个微小的遗传变异会导致一些不同的表达水平,我们可以测量这些,然后用这些来做这种分析,所以在不同群体中的差异表达,有证据表明,比如说。
如果你拿16个非洲人后裔来说,在一个16人的小样本中,这些基因在这些个体中的表达水平不同,和类似的两个,在这个亚洲人口中占6%,在hapmap样本中17%到29%,嗯,当然啦。
其中一些差异可能是由于环境等混杂因素造成的,这些表达水平与疾病表型的相关性有限,然而,这种类型的分析揭示了这些eQTL之间的关系,哮喘和克罗恩病,所以我让你们读一下其中一项研究的结论。
这就是我之前说过的我们可能知道所有的孟德尔疾病,所以我们感兴趣的疾病,今天理解得更好的是那些不是孟德尔式的,但它们是一些复杂的组合,不同的基因,这使得它,当然啦,一个更难的问题,不是最近的2005年。
贝叶斯网络技术试图得到这一点,所以他们说好,如果你有一些数量性状基因座,你把rna表达水平看作是表达数量性状的位点,然后你把C作为某种复杂的特征,这可能是一种疾病,也可能是对某事的倾向。
也可能是乔希·丹尼的类别或其他什么,然后有许多不同的贝叶斯网络风格的模型,你可以建立,所以你可以说,啊,遗传变异导致基因表达的差异,这反过来又导致了疾病,或者你可以说嗯,遗传性状导致疾病。
这反过来又导致了基因表达的明显差异,也可以说,导致表达水平和疾病,但他们不一定是耦合的,因此,它们可能是条件独立的,给定给定的遗传变异,或者你可以有更复杂的问题,就像你可以有基因。
导致一大堆不同rna的表达水平发生变化,它们结合在一起会导致一些疾病,或者你可以有不同的基因变化,影响导致疾病的某些RNA的表达,或者只是等待,你可以有这样的模型说,你知道我们有一些环保贡献。
和一堆不同的基因,影响一堆不同eQTL的表达,这导致了一系列临床特征,这导致了一系列反应性RNA的变化,所以他们采取的方法是说好,我们可以生成一大组这样的假设,然后计算数据的可能性。
给定这些假设中的每一个,而无论哪一个分配,数据的最大可能性,最有可能是接近正确的,所以让我把剩下的都说完,快速扩大基因组表型关联研究,英国生物银行有点像这样,我们所有人都投射。
但他们确实提供了他们的数据,我们所有人也会,但它还没有被收集,英国生物库有大约50万完全外显子组测序的de识别个体,尽管他们现在只有他们想要的10%左右,他们中的许多人会戴着两个四小时的活动监视器。
这样我们就有了行为数据,他们中的一些人进行了重复测量,他们做在线问卷,大约五分之一的人会有成像,它与他们的电子健康记录有关,所以我们知道如果他们死了,或者他们是否患有癌症或各种医院发作,等等。
有一个正在进行的,这里有一个网站发布最新的分析,所以你在四月看到,预防肥胖和II型糖尿病的18个基因变体,发现中度肉食者有患肠癌的风险,研究确定了睡眠不足的遗传原因,所以这到处都是。
但这些都是由这个做的研究,我就跳过这个,但是在MGH有一个小组,利用这些数据进行大规模研究的人,很多,许多基因广泛关联研究,嗯,我答应过你的一件事,有趣的是从这些研究中,他们说,嗯。
身高的遗传力还是比较好的,大约四六,p值是10的负109,所以你的身高很大程度上取决于你父母的身高,但有趣的是,不管你有没有大学学位,取决于你的父母是否有大学学位,这可能不是遗传的,或者只是部分遗传。
但它显然有金钱和社会地位的混淆,诸如此类的事情,然后我觉得有趣的是,即使是看电视,知道,幸运的是,我父母经常看电视,我最后想提的是,但我没有时间去讨论它,基因集富集分析的概念,这是我之前说过的。
基因通常不会自己起作用,所以如果你回想一下高中生物,你可能了解到克雷布斯循环为细胞机制提供动力,所以如果你打破了这个循环的任何一部分,你的细胞得不到足够的能量,所以按理说如果你想了解这种新陈代谢。
你不应该看一个单独的基因,但你应该关注参与这一过程的所有基因,所以有很多尝试试图做到这一点,布罗德研究所在这里有一套最初100个生物学定义的基因集,它们相互作用控制着身体中的一些重要机制。
现在有多达一万八千个,比如说,参与氧化磷酸化的基因,糖尿病患者肌肉组织表达减少,虽然每个基因的平均减少只有20%,所以他们有这些套件,从这些中,有一个非常好的技术,能够拉,嗯。
它本质上是一种加强基因广泛关联的方法,让你把它们和这些基因联系起来,他们采取的方法很聪明,他们说,如果我们把一个基因集中的所有基因,我们根据它们与我们感兴趣的任何特征的相关性对它们进行排序。
那么更接近开始的基因更有可能参与,因为它们是最密切相关的,所以他们有一个随机行走的过程,找到最大的地方,在那里你可以说任何事情之前,这可能与你感兴趣的疾病有关,他们取得了许多成功。
我想说的最后一件事有点令人失望,我真的在找杀手级的报纸来谈论它的用途,一些非常复杂的深度学习机器学习,据我所知,它还不存在,所以这些方法大多基于聚类技术,论聪明的想法,比如基因集富集分析。
但它们不是神经网络类型的技术,他们不是很老练,接下来你会看到贝叶斯网络和聚类,矩阵分解等等,听起来像是10个15-20年的技术,我还没有看到例子,联合国日刊,你知道的,从印刷机上热下来。
我们建立了一个83层的神经网络,它的性能优于这些其他方法。
我怀疑那是来的,它只是还没有击中,据我所知,如果你知道有这样的文件,无论如何,告诉我好吗。
P21:21.Automating Clinical Work Flows - 大佬的迷弟的粉丝 - BV1oa411c7eD
所以今天的主题是工作流,然后呃,这是一件,当我开始在这个领域工作时,我没有意识到这个话题的存在,但我已经埋头苦干了几十年,所以最后,对我来说,这很明显是需要注意的事情。
所以这里有一个有趣的问题,假设你的目标,我们在这门课上所做的工作就是改善医疗保健,不是一个不合理的目标,那么你怎么做好呢,我们在20世纪70年代有一个想法,当我开始做这个的时候。
那就是我们想了解世界上最好的专家做得最好的是什么,并通过封装他们关于,如何做诊断,如何做预后和治疗选择,为了提高其他不是世界级专家的医生的表现,通过允许在计算机系统中捕获世界级的专业知识。
帮助人们找出如何做得更好,所以为了让他们更准确,诊断学家,更有效率,治疗师,等,这里的目标真的是,提高医疗保健系统中每个人的平均表现,所以我们经常说,把大家都带来,呃,行医更接近世界一流专家的执业水平。
现在事实证明这并不是最重要的,所以后来有了另一个想法,说得好,你知道,并不是医生的平均表现不好,真正糟糕的是低于平均水平的表现,所以如果你的表现低于平均水平导致你的病人死亡。
但你高于平均水平的表现只会在他们的结果中产生适度的差异,那么关注那些最糟糕的医生显然更重要,并让他们以更好的方式行事,因此诞生了一个协议的想法,该协议说,让我们用相似的方法治疗相似的病人。
它的价值是减少方差,因此,提高平均值与减少方差,那么这些中哪一个更好呢,嗯,这取决于你的损失函数,正如我所建议的,如果你的损失函数是不对称的,所以做得不好或低于平均水平比做得高于平均水平要好得多。
那么减少方差的协议思想真的很重要,这几乎是医疗系统所采用的,所以我想试着帮你想象一下,假设在某种任意的尺度上,你知道从零到八,我们有一个通常的正态分布,在左边,呃卑鄙的行为。
所以这就是人们通常的行为方式,我们假设有一个正态分布,这是你的世界级专家,他的表现在,你知道六七个,这是一个医生的哑弹,他的表现在零到一之间,而一般的医生只是一个害羞的,不到四个,所以这里有两种情况。
第一种情况是我们把这些家伙的表现提高了一点点,所以我们通过改进,你知道吗,第一点表现点,我想这是我在这个模型中所做的与另一种方法的比较,假设我们可以显著地减少方差,使这个相同的正态分布变得更窄。
它的平均值仍然在完全相同的地方,但现在有遥远的离群值,所以没有医生表现得更糟,也没有医生表现得更好,在那种情况下会发生什么,嗯,你得看看成本函数,所以如果你有一个像这样的成本函数,也就是说。
在零水平上表演的人有一个成本,而一个在八级水平上表演的人的成本几乎为零,它像这样呈指数级下降,使平均性能的成本比平均性能低得多,在最差的表现和最好的表现之间,所以这表明。
如果你能把人们聚集在这个表演领域,你的总成本会下降,事实上,如果这是我建立的一个纯粹假设的模型,但如果你做计算,您发现对于基本分布,这是成本的分布,对于稍微改进的分布,你得到了一个成本。
是一千六百九十四对七百八十一,又是任意单位,但如果你设法缩小分布,你可以通过提高平均水平来将总成本降低到比你所做的更低的水平,现在,这并不能证明这是正确的想法,证据可能在于这样一个事实。
即医疗系统已经采用了这一点,并决定让所有的医生表现得更像普通医生,是改善医疗保健的最佳实际方法,嗯,如何缩小绩效分布,所以一种方法是制定指导方针和协议,在那里你有一个博学的身体。
谁规定适当的方法来诊断和治疗病人,所以发生的事情是,比如说,这里的文章来自2018年11月,美国心脏病学会的一份报告,美国心脏协会临床实践指南特别工作组,这已经被这个聚宝盆三和四个字母缩写的组织采用了。
这是血液胆固醇管理的指南,如你所知,高胆固醇是危险的,它会导致心脏病发作和中风,因此,人们一致认为,降低人们的这一水平是好的,所以这些人到处走,到处走,把一群世界专家聚集在一起说,嗯,我们怎么做。
我们颁布了什么来照顾患有这种疾病的病人的适当方法。
他们做的第一件事是,他们想出了一个颜色编码的概念,说明推荐有多强烈,某个建议应该是,和另一种颜色编码或阴影,呃,水平。
例如,如果你说某样东西在一班,所以强烈推荐,然后你使用像推荐或指示有用这样的词,有效,有益的应该执行等等,如果是在第二类,好处远远大于风险,然后你说这是合理的,它可以很有用等等。
如果收益可能等于或比风险好一点,你说像华夫饼这样的词可能是合理的,可以考虑,如果,如果没有好处,呃,换句话说,如果它大致等于风险,那你说不推荐,如果风险大于收益,然后你说这有潜在的危害,造成伤害等等。
所以如果你给一个关于,是否向肺部喷洒消毒剂,你可能会把它放在红色,说这是不推荐的,然后这里这个,这个底纹编码是,基本上,这项建议的证据有多好,所以最好的证据,那个呃,呃,一级。
是来自多项随机对照临床试验的高质量证据,或一组高质量rts um或rct的元分析,得到高质量登记研究的证实,然后我们下到C级,这是基于临床经验的专家意见共识,但没有任何形式的分析。
所以如果你看看这个特定的文件,胆固醇,它说很好,以下是关于测量低密度脂蛋白和非高密度脂蛋白的建议,呃,胆固醇,他们在这里说对推荐的信心,呃是呃,呃是一个,嗯和嗯,这是基于证据水平。
它说在20岁或以上的成年人中,而不是在降脂治疗上,空腹或非空腹血点的测量,所以你可以在以后的笔记中读到这一点,但请注意,有一些高质量的高强度推荐,有较低的力建议,每个建议也是阴影。
编码来告诉你证据的力量是什么,对于这种推荐,这里只是另一个例子,呃,这是继发性动脉粥样硬化性心血管疾病的预防,呃,所以这是给已经生病的人的,这是一堆建议,如果你超过七十五岁或更小。
与冠状动脉疾病的临床病例比高强度,高强度,应开始或继续他汀类药物治疗,目标是减少50%或更多的低密度脂蛋白等,所以再一次,一大堆不同的建议,顺便说一句,推荐的力度,这只是几页中的第一页证据的质量。
所以说,这在很大程度上是学术团体现在试图影响医学实践的方式,为了减少差异,让每个人,嗯,以正常的方式行事,你可能看过关于阿图尔德的文章,他是波士顿的外科医生,他因提倡核对表而声名鹊起,他说,比如说。
如果你是外科医生,你应该表现得像个飞行员在你起飞前,你要通过一个理智检查表来确保所有的系统都正常工作,所有的开关都设置正确,呃,在外科手术中就是你有所有必要的设备,你知道在各种潜在的紧急情况下该怎么办。
等,所以这是他们带回家的信息,这在这里是有道理的,我从一篇有所有这些细节的论文中摘录了这些,所以呃,呃,第一名,你走得很好,嗯,在所有人中强调心脏健康的生活方式,在生命历程中,这似乎没有太大的争议。
然后呃,在已经生病的人身上,呃,降低低密度脂蛋白,呃,高强度治疗,呃,他汀类药物,而且风险很高,ascbd,使用每分升70毫克的阈值,等,所以这些是总结建议,希望医生阅读这些文章,离开他们。
确信并将记住他们应该这样做,当他们和病人互动时,呃,这又是一个流程图,他们从那篇论文中抽象出来的,上面写着,呃,你知道,各位,你应该强调健康的生活方式,然后根据你的年龄,取决于。
但你对一生风险的估计是你最终会被分为不同的类别,这些不同的类别对你想对你的病人做什么有不同的建议,呃,这是二级预防,所以对于已经生病的人来说,这是一个类似的流程图,不仅仅是处于危险之中。
嗯,然后对于未来事件风险非常高的人来说,这是由这些历史和这些高风险条件定义的,呃,这些人陷入了第二个流程图,现在应该这样对待,顺便说一句,嗯,我没有做民意调查,但是呃,所以我会给你答案,但这样问很有趣。
当这样的论文发表时,医生实际上坚持这些有多好,结果答案不是很好,它需要很多,在这些建议被社区的大多数人接受之前的许多年,建议,呃,比如说,我觉得,呃,二十年前,呃,有一个建议说。
任何心脏病发作的人都应该接受治疗,即使他们现在没有症状的受体阻滞剂,因为呃,在各种审判中,他们显示有一个三,重复心脏病发作减少5%,由于这种治疗,它花了,呃,我觉得。
在大多数医生意识到这一点之前的十几年,并开始向他们的病人提出这种建议。
有一种叫做AHRQ的东西,卫生局,研究与质量,在本届政府之前,他们经营着一个国家指导方针交换所,这些指引由不同当局公布,并可供市民下载及使用,指导方针中心试图接管其中的一些角色,自从政府关闭以来。
政府运行一个,他们的网站上发布了大约2000条指导方针。
这些是一些例子,因此,通过药物或营养补充剂降低前列腺癌的风险,干细胞移植治疗多发性骨髓瘤,骨髓增生异常综合征和急性髓样细胞的干细胞移植。
髓系白血病,等等,然后他们还发布了一堆风险计算器,说,我不知道,肝素诱导血小板减少症的四个T评分是多少,但也有很多这样的,所以这些东西有一个交换所,而你,作为一个执业医生可以去这些。
或者你的医院可以决定他们将向他们的医生提供这些指南,并鼓励或,在某些情况下,强迫他们使用指导方针,以确定他们的活动,现在注意到这是一种非常自上而下的活动,所以这通常是由这些有学问的社会来做的。
将专家们聚集在一起思考正确的做法是什么,然后他们告诉世界其他地方怎么做,但也有一种自下而上的活动,所以嗯,有一种叫做护理计划的东西,护理计划实际上是一个护理术语,所以如果你在医院闲逛,你发现医生消失了。
它们出现又消失,你知道它们就像基本粒子,他们不是一直在身边,真正照顾你的人是护士,所以,护士们开发了一套方法,如何确保他们照顾好你,其中之一是制定这些护理计划,然后临床途径是什么。
是试图将护士在照顾个人时使用的护理计划,从这些中概括并说好,我们照顾特定队列中的病人的典型方式是什么。
所以我要谈谈这个,我给你的一篇论文作为今天的选读,是关于牛道的,这些是建立护理计划普遍性的尝试,这是密歇根护理中心的护理计划,这是一个教育组织,试图帮助护士找出如何成为好的,护士,我很开心。
当我在找这个的时候,我偶然发现了一段视频,这是一个有经验的护士在谈论你如何建立这些护理计划,她说嗯,你知道的,当你在护士学校的时候,你学会了如何建造这些非常精细的,精心构建的护理计划。
当你真正当护士的时候,你永远不会有时间做这件事,所以你要做一个粗略的近似,别担心,但就目前而言,正确地做这些练习使你的教授满意,所以你知道,看看这个,所以有一堆柱子,最左边的写着评估,所以这是客观的。
主观和医学诊断数据,客观数据是这个病人的左脚感染了坏疽,不是好事,开放性伤口等等主观数据,病人说走路和转身时疼痛更严重,她害怕理疗,她希望自己不必在这种情况下感到惊讶,但那绝对是主观的。
你看不到外部证据,护理诊断是这个病人的组织完整性受损,关于伤口,和感染的存在,这种诊断实际上伴随着一种关于如何做出诊断的指南,换句话说,为了能够把它写在护理计划上,她必须确保病人的特征符合某些标准。
这些是诊断的定义,病人的结局,所以这是护士试图实现的目标,注意这里有五个目标,一个是病人会报告任何疼痛感觉的改变,在1月2日、3日和2月4日之间的组织损伤部位,所以这是一个非常具体的目标,对呀。
上面写着,病人会告诉我他们感觉好多了,他们的感情发生了变化,在他们感染的左脚,愈合组织和防止损伤的计划,所以有一个病人教育的部分,他们将描述保护和治愈组织的措施,包括伤口护理。
请注意这是病人在向你描述你打算为他们做什么,换句话说,展示对计划的理解,他们可能会发生什么,经历伤口缩小,大小减小,肉芽组织增加,并实现功能疼痛零的目标,根据病人的言语,所以当他们进来用疼痛量表问你。
你是零分还是十分,或者介于两者之间,目标是病人会说我在零,换句话说,现在不痛了,干预措施是什么,嗯,这些都是护士为了达到这些目标而计划做的事情,然后原理是解释为什么。
期望这些干预措施实现这些目标是合理的,成果的评价,说什么标准,或者我们试图实现的实际结果是什么,所以以后会填满,显然比计划制定时,所以如果你看这样的网站,对许多人来说,有某种模板化的护理计划,很多条件。
你可以看到我只到C,在这个网站的A到Z列表中,还有很多其他人,但你知道有一个入院护理计划,成年未能茁壮成长,酒精戒断,我不知道什么是阿纳卡,贫血和凝血剂护理,等等,所以不同的病人有很多不同的情况。
这是一种尝试列出模板护理计划的方法。
现在,张和他的同事们对这篇论文很感兴趣,他们所做的是,他们说好,让我们把所有这些护理计划,让我们尝试建立一个机器学习系统,这些护理计划中嵌入的典型模式是什么,但他们没有从计划开始,这是回顾性分析。
所以他们从对每个病人所做的实际记录开始,所以这个想法是你从电子健康记录中获得治疗数据,然后从这些数据中识别患者亚组,然后你挖掘常见的治疗模式,你让医学专家评估这些然后这些成为临床途径。
这是护理计划对特定亚人群患者的概括。
所以他们的想法是定义一堆抽象,所以他们说,看一个事件就是一次访问,所以说,比如说,对于门诊来说,在一次就诊中发生在你身上的任何事情,去看医生或去医院,所以这是一套程序,一套药物,一组诊断,顺便说一句。
他们关注的是患有肾病的人,作为他们观察的目标人群,所以他们说,好的,单个事件将被抽象到这些超级节点中,它捕捉到了联想的独特组合,与某些访问有关的事件,所以你可能会担心这会是组合的,对呀。
因为有很多可能的组合,这实际上有点问题,我想在他们的分析中,所以现在你有了这些超级节点,然后每个病人都有一个就诊顺序,这是这些超级节点的时间顺序列表,所以每次你去看医生,你有一个新的超级节点。
所以你有一个时间序列,然后他们做下面的事情,他们说,哎呀,当我们和我们的医生和护士交谈时,他们告诉我们他们最关心的是病人最后一次就诊时发生了什么,但他们也不太关心,但他们仍然关心之前的访问发生了什么。
但不是关于更远的历史,所以他们说,在马尔可夫链中,我们只有依赖于马尔可夫链中最后一个节点的东西,所以让我们改变这里的模型,以便我们将访问对组合成节点,这样马尔可夫链中的每个节点都将代表最近两次访问。
病人没事。
所以这可能会再次导致一些组合问题,但这是他们想出的图像,所以有单独的项目,是去医院吗,参观办公室,以教育为目的的访问,做了超声波吗,你被注射了ACE抑制剂吗,你吃过利尿剂吗,等等。
所以这些都是我们提到的数据,他们把它当成一个袋子,然后他们说,好的,我们要找出所有袋子里的东西都是一样的,他们没有看,比如说,在给你的药物剂量下,只知道是哪种药物,所以那边有一些坍塌。
那么超级节点是这些组合,我们说,好的,你有一个特殊的目的,特殊的诊断,一套特定的干预措施,一套特定的程序,我们再次列出了这些的所有可能组合,然后这个序列代表你的序列。
这些节点被聚合成表示访问顺序的超级节点,然后这些超级对是这个黑客,让你回到马尔可夫链的两步,所以他们最终得到了大约3500个不同的超级对节点,所以它是组合的,但在他们的数据中,这并不是很好的组合。
每对访问序列之间公共子序列长度的最大值,所以他们要把这些序列聚集在一起,它们定义了一个距离函数,即它们共享的共同序列越多,它们之间的距离就越小,他们使用的特定距离函数是每个序列的长度。
减去它们公共子序列长度的两倍,最长公共子序列,这似乎很合理,然后分层聚类成不同的子组,他们为这组病人想出了三组,他们在这里,你所看到的,他们中的一些人彼此之间没有太大的不同,例如。
这两种不同的只是病人得到了一些药物和利尿剂,在一个案例中,另一种情况下只是药物,所以这些是,你知道的,它是一个分层集群,群中较低的东西可能彼此相当接近,然而。
然后他们能做的就是估计这些超级之间的转移矩阵,节点对状态,他们可以根据数据的支持程度来观察不同的轨迹,所以你可以设置不同的阈值,在一个特定的州有多少病例,以便您认真对待到或从该状态的转换。
我对这项研究的批评之一是他们的数据太少,他们想出的许多团体,里面的病人数量相对较少,一旦你有了这些转换矩阵,然后你可以说,好的,第二组,这个集群,所以在这个集群中总共有14个病人。
他们都处于慢性肾病四期,如此严重,他们都有高血压,他们都在服用ACE抑制剂和他汀类药物,所以如果你看那里,然后你可以说,好的,对于我们所知道的关于那个病人的一切,它们之间的概率关系是什么我们发现。
我看不懂这些,所以这些节点暗示了其他节点,箭的强度与宽度成正比,所以这是我们所了解到的关于这个星系团的一切的代表,但只记得那十四个病人,所以我不确定,我会把这个带到银行,太依赖它了。
但他们会手工抽象并说好,让我们来看看对此的解释,所以如果他们以他们在集群中看到的典型模式观察,他们说,嗯哼,我们看到病人在办公室就诊,病人正在服用这些药物,并进行这些程序,然后他们就住院了,否,对不起。
什么,黄色,是啊,是啊,黄色纸条是办公室访问,所以他们住院了,然后他们接受教育访问,所以这通常是和护士或护士在一起,从业者向他们解释他们应该做什么,他们有另一家医院,2。他们又去了一趟办公室,2。
他们去医院看病,2。他们又去医院看了一次病,然后他们就死了,好的,所以不幸的是,是一个非典型的模式,你在患有严重慢性肾病的病人身上看到的,从这张图中我们不知道这个过程需要多长时间,它需要发生。
所以我有一些问题,有很多子组,他们中的一些人和其他的人相当相似,他们在每个亚组中有10到158名患者,这样我会感觉好多了,如果他们每组有1000到15000个病人,或者每组十五万病人。
我会更相信他们发现的陈述,另一个问题是,即使在一个单独的亚组中,你可以发现非常不同的模式,例如,这里有一个模式,一个人有几次办公室访问,他们去医院,或者他们带着一个,略有不同。
啊,是呀,这是这个人在急性肾损伤的时候,所以你可以直接从办公室到那里,是之前的住院治疗,然后他们就死了,所以这是模式的一部分,但这里有另一个从完全相同的亚组中挖掘出来的模式,现在这个分组有122个病人。
所以有更多的异质性,但你在这里看到的是一个病人在两次教育访问之间来回,和医生出诊,在医生出诊和住院之间来回,然后住院,然后再住院,但他们活了下来,所以有点棘手,但我认为这是个好主意。
但在这里使用的技术上可能会有改进,当然还有,更多的数据会很有帮助,为了真正描述这些病人的情况,这里有一个类似的想法,我参与了杰夫·克兰,他在里根礁的博士学位,这是一个非常著名的。
印第安纳州最早采用计算机化信息系统的人。所以他一开始,他说,嗯哼,你知道亚马逊的推荐系统说,你知道吗,你刚买了这个相机镜头,和其他买了这个相机镜头的人,还买了清洁工具和相机配套的电池等等,所以他说。
我们为什么不把同样的想法应用到医疗订单上呢,所以他记录了里根街的所有命令,他基本上建立了一个亚马逊推荐系统的近似值,说嘿,其他要求进行以下一系列测试的医生也要求进行这项额外的测试,你没有点。
也许你应该考虑做这件事,或者反过来,其他要求做这一套测试的医生从来没有额外要求过另一套,你确定你真的需要它吗,所以这就是我的想法,他所做的是他专注于四个不同的临床问题,其中一次是去急诊科看背痛。
急诊科高血压,所以紧急访问诊所是这些较低级别的诊所之一,非急诊科,更便宜,较低的护理水平,但仍然是紧急护理类诊所,许多医院已经建立了,为了不让病得不重的人去急诊科,在这个低强度的诊所里。
嗯和高血压和高血压,然后在重症监护室改变了精神状态,所以重症监护室的人经常服用药物,他们变得古怪,所以这是试图照顾这样的病人,他们使用了里根街三年的遭遇数据,以及对于每个域。
他们将自己限制在40个最频繁的订单和低粒度,例如,一种,但不是药物的剂量,和十种最常见的共病。
共现诊断,所以这是人群智慧的一个例子,一种说得好的方法,你的同事所做的可能很好地代表了你应该做的事情,现在这种方法的一个明显的陷阱是什么,只是看看你是否醒着,是啊,是啊,你只是加强,是啊,是啊。
如果他们都是笨蛋,他们会把你训练成一个笨蛋,我也是,所以你知道,医学上有很多东西,没有很好的证据支持,事实上,人们已经形成了以某种方式做事的传统,那可能不是正确的方法,这只是强化了,另一方面。
它可能确实减少了方差,就像我们一开始谈到的那样,因此,这可能是一个合理的方法,如果你愿意容忍一些例外,你知道的,我最喜欢的故事是Semmelweis发现,嗯,在维也纳的医院生孩子对母亲来说是极其危险的。
因为他们会死于所谓的儿童热,基本上是一种感染,Semmelweis发现也许在巴斯德之前就有了,但他发现也许有什么东西在传播,从一个女人到下一个女人,导致了这种儿童热,他当然是对的,他做了一个实验。
在他的产科病房里,他让所有年轻的医生洗手,用某种酒精之类的东西来杀死他们传播的任何东西,在那里,这种儿童热的死亡率几乎降至零,他去找他的同事,他说,嘿伙计们,我们真的可以让世界变得更美好,停止杀害妇女。
他们看着他,他们说你知道,这些是治愈的手,他们不杀人,你知道的,他们中的许多人是从事这一职业的上流社会或贵族,他们不知何故负责传播细菌的想法,对他们来说是不可能的,塞梅尔韦斯结束了。
结束他在精神病院的日子,因为他疯了,他无法改变练习,尽管他做了一个实验来证明它是有效的,所以说,这是一个群众智慧不太好的案例,导致了不好的结果,好的,所以它就像亚马逊的推荐系统,它自动。
决策支持规则的学习,这一点的吸引力在于,因为它是从真实数据中诱导出来的,它倾向于处理更复杂的案件,而不是那种简单的刻板印象案件,人们可以为此制定指导方针,比如说。
在那里他们可以预测在各种情况下会发生什么,所以他使用了贝叶斯网络模型,可能的命令和证据,这是已经完成的订单的结果,匹兹堡大学有一个系统,叫做四分体,它实现了贪婪等价物搜索的一个很好的版本。
这是一种在贝叶斯网络空间中搜索的更快的方法,用于表示数据的适当网络,所以说,你知道这是一个高度组合的问题,其中的聪明之处在于它计算出了贝叶斯网络的类别,根据定义,这将同样适合数据。
它是按类而不是按单个网络来做的,所以它得到了一个很好的组合还原,怀孕网络中的,这些节点对应于各种干预措施和各种条件,这是贝叶斯网络,最适合这些数据,这相当复杂,这里还有一些其他的,这是急诊科的。
所以你看到你知道你有胸痛和腹痛,提出诊断,然后进行各种手术比如腹部CT或盆腔CT,或者胸部CT或者头部CT,或者一个基本的代谢面板,等等,这就给出了它们之间的概率关系。
所以他们能做的就是把这个贝叶斯网络表示,然后如果你把一个特定病人的数据放在那个代表上,这对应于固定某些节点的值,然后你做贝叶斯推理,计算未观测节点的概率,你推荐尚未做过的最高概率的干预措施,所以有点像。
如果你还记得我们说过顺序诊断,这有点那种精神,但这是一个复杂得多的贝叶斯网络模型,而不是天真的贝叶斯模型,所以界面看起来像这样,你有它被称为迭代治疗建议算法,它向医生表明这些是,你知道的。
病人的问题和当前的命令,你可能会问,你可以要求做这些订单中的任何一个,他们能够证明的是,这做得相当好,很明显它不会被出版,如果他们不能证明这一点,所以你看到的是,比如说,在住院妊娠中完成的下一个订单。
所以他们判断这个算法的标准是,它是否将人们实际做的事情提升到了推荐列表的首位,您考虑执行的推荐操作集,你看,在住院怀孕中,平均排名第四,大约六个在重症监护室,大约六个在急诊科,大约五个在紧急护理诊所。
所以这很好,因为这意味着即使你在看iPhone,你知道有足够的屏幕房地产,它会出现在所谓的谷歌点击的第一页,这是人们唯一关注的事情,事实上,它们可以显示平均列表位置对应于按频率排列的顺序。
但他们的模式做得相当好,让你保持在,你知道的,在这个范围的大部分时间里,前十个左右,好了,现在。
我又要换挡了,所以亚当,赖特,你见过的,他是我们早先一节课的讨论者,亚当一直在积极尝试部署决策支持系统,他有一个有趣的插曲,二十六,所以一定是在二十一点十六分之前。
他去展示他们在布里格姆实施的这个伟大的决策支持系统,他装了一个假箱子,在那里警报应该响了,服用某种药物超过一年的病人,需要有促甲状腺激素,为检查长期使用胺碘酮的潜在副作用而测量的。
以及他们的ALT作为肝脏测试,肝酶试验,所以他们需要这两个测试,他在演示这个奇妙的系统,他把一个有这些情况的假病人放进去,警报没有响,所以他去,嗯哼,发生什么事了?他们回去发现,在2009年。
该系统的胺体酮内部代码已从40改为70。九十九,谁知道为什么,但是系统中的规则逻辑从未更新以反映这一变化,所以,事实上,如果你看看,胺碘酮的使用历史,顺便说一句,这是一个有趣的图表,蓝点是工作日。
黑点是周末,所以周末医院里没什么事,但你看到的是我不知道以前发生了什么,大约在2009年底,他们可能没有执行那个规则什么的,但你看到的是这个规则的使用逐渐增加。
然后你会看到从2010年到2013年的大幅下降,当他们发现这个问题时,为什么减少了,我是说,这不是突然跳到零,好的原因是它的出现首先是逐渐出现的,因为服用这种药物的人,在软件的变化得到旧代码之前。
它还在触发规则,只是随着时间的推移,越来越多需要测试的人得到了带有新代码的药物,有了新的代码,它不再触发规则,然后这就是他们发现bug的点,然后他们把它修好了,当然,它又回来了,哦好吧。
我也要谈谈其他人,所以这是,所以当一些病人停药时,它微妙地下降了,其他的是用这个新的内部代码开始的,正如我所说警报逻辑是在2013年修复的。
是啊,是啊,所以我不知道医院的IT系统是如何工作的,在我的奶牛场里,但是有没有一个概念像这台电脑和你被更新的软件,但那个已经更新了,还是都同步了,这样它们都能同时更新,它们往往会同时更新。
在这个更新过程中发生了一些灾难,著名的是,贝斯以色列号沉没了大约三天,他们的电脑系统崩溃了,他们发现他们有一个非常复杂的网络,以便启动不同的系统,所以必须启动一些系统,为了让其他系统启动。
为了让第一个系统启动,它必须启动,当然在正常运行中他们不会破坏整个系统,所以没有人发现这一点,直到有思科搞砸了他们,路由器上有一些修复程序导致一切崩溃,然后他们就不能再把它带回来了。
所以这是一个很大的恐慌,约翰,哈拉科是那里的首席信息官,是我以前的一个学生,在这一切结束之后,我问,我问约翰,发生这种事的时候你做的第一件事是什么?他说我派了几辆卡车去斯台普斯的仓库,去买纸垫。
这是相当聪明的,好的,这里有另一个例子,这是铅筛选,所以,这是一个对两岁儿童有铅筛查规则的案例,还有一比一,三四岁的孩子,对一个的筛查没有变化,三四岁的孩子,但是对两岁孩子的筛选从,你知道的。
每天三四百人下降到零几年后他们才注意到,然后又回到了之前的水平,他们从来没有完全弄清楚这里发生了什么,但是有什么东西在规则中增加了两个不完整的条款,与性别和吸烟状况有关,但条款不完整。
所以他们实际上是在寻找,没有指明性别或吸烟情况的个案,所以两岁孩子的吸烟状况,你可以想象并不经常指定,但性别通常是,所以规则从来没有因此而被解雇,他们不知道这些变化是如何发生的。
有一个复杂的日志系统记录所有的更改,它崩溃了,丢失了日志数据,你知道这是一个,这是一个平淡无奇的故事,所以他们最终,他们很快就发现了这个,因为他们有一个两个月大的男孩,和胆固醇筛查。
并建议开始给病人服用各种药物,他们很快就找到了那个,所以我是说这很有趣,但有趣的是,这些人接着说,嗯,我们如何以某种持续的方式监控这一点,所以他们说好,有一个变点检测的概念,这是一个有趣的机器学习问题。
所以他们说好,假设我们建立了一个包括季节性的动态线性模型,因为我们要处理,事实上,周一到周五发生了很多事情,周末什么也没发生,所以他们创建了一个模型,说你的输出是某个函数,你的输入的f,加上一些噪音。
噪音是高斯的,有一定方差的资本v,X是根据某种进化而进化的,这意味着它取决于x的前一个值,加上一些其他的噪音,也是高斯的,所以这是人们通常采用的时间序列建模方法,然后他们说好,我们必须处理季节性。
所以我们要做的是定义一个周期,也就是一个星期,然后我们将在一周的不同日子把各州分开,为了让我们能够模拟季节性,我在一个不同的项目上工作,与…有关,在那里,周期是一年,因为像流感这样的事情是每年发生一次。
而不是每周发生一次,所以这个想法很常见,然后他们建立了一个多过程动态线性模型,基本上是一个,想象一下,我们的数据是由一组动态线性模型中的一个产生的,所以我们每次都有一个额外的状态变量,说明在这一点上。
哪个模型在控制生成数据,嗯和所以嗯,如果你有到一段时间t的一组观察,那么你就可以计算出模型i在这一点上驱动发电机的概率,所以你可以有三个基本的模型,你可以有一个模型说它是一个稳定的模型,换句话说。
你所期望的是稳态,所以这将是正常的每周体积变化,对于这些警报中的任何一个,您可以有一个模型,它是一个附加的离群值,所以这是突然间说的,发生了一些事情,比如衣原体屏幕,或者其他快速出现的东西。
或者你可以换一个等级,就像发生在,当胺碘酮的筛选规则或警报规则停止发射时,因为它从一个层次到了一个非常不同的层次,在相对较短的一段时间内,然后呢,你能做的就是计算这些模型控制的概率,下一次。
这就是所谓的变化点得分,你可以根据你得到的数据来计算,当然,他们有大量的数据。
这是一家大医院,很多这样的警报都在继续,如果你策划这个,有一个时间序列的数据,所以你可以看到每周的变化,但你看到的是稳定的概率,挺高的,除了在某些时候它突然下降。
所以在这些地方你会怀疑发生了一些有趣的事情,在这些不同的点上上升,在这一点上,水平移动的概率上升,你确实可以看到,有一个水平的变化,从本质上的零上升到这个周期性的行为,在原始数据序列中向上。
所以他们实际上在医院里实施了这个,所以现在你得到的不仅仅是警报,但你得到的消息说,你知道的,这孩子应该接受铅含量筛查,但铅含量筛选规则也没有像我们预期的那样频繁,开火,是啊,是啊,所以报纸上有很多细节。
如果你有兴趣,可以查一下,他们发现如果你观察延迟下的区域,假阳性率曲线,所以你在交易,确定其中一种情况发生需要多长时间,与你喊狼来了的频率相比,你会看到他们的算法比,他们试图对抗的一堆其他东西。
这些都是早期的尝试,这些都具有高度的统计学意义,所以他们去拿了一份很好的报纸,好的,在剩下的时间里,我想谈谈其他一些与工作流有关的问题,所以我们已经讨论过提醒,但是关于这些警报系统实际上是如何工作的。
有一系列有趣的研究,所以贝丝·以色列女执事有一个很酷的想法,波士顿的医院,在那里他们说好,我们真正需要做的是升级警报,例如,在医院里,如果你有,如果你是医生,你有一个病人,你刚刚把他们的血液送到实验室。
假设他们的血清钾含量是七八,好的,那个病人有很高的心律失常和死亡的风险,所以你的寻呼机在那些日子里响了,你读到这条短信说先生,琼斯的血清钾含量是8,你最好去看看他,所以他们做的很聪明,他们说好。
问题很忙,医生可能会忽略这一点,所以我们会启动倒计时,我们会说琼斯博士,史密斯博士真的来看看琼斯先生,你知道吗,二十分钟,如果答案是否定的,然后他们给医生的老板发了一个页面,说嘿,我们给这家伙发了一页。
不到二十分钟,他就没有去看病人,然后他们启动另一个计时器,他们说,如果老板在一小时内没有回应,然后他们给医院的负责人发了一个页面,说着,你知道的,你的传染病科的人做得很糟糕,因为他们不是。
或者在这种情况下,你的内分泌或其他什么做得很糟糕,因为他们对这些警报没有反应,你觉得医生怎么会喜欢这样,不多,过度警觉是一个真正的问题,也没有一般规则说,你多久能用这样的警报窃听医院的负责人一次。
在他或她只是说好之前,把这该死的东西关掉,我不想清楚地看到这些,如果你在不同的地方设置阈值,你会得到不同的结果,例如,我记得塔夫茨实施了一个这样的系统,早在二十世纪八十年代。
但他们会在每一个订单上发一个页面,任何实验室结果都不正常,这太过分了,因为你知道很多这样的测试产生了20个结果,正常值定义为95%的置信区间,在20个测试中,不是真正独立的,但如果他们是。
他们中的一个肯定会,对大多数病人来说超出了范围,所以基本上每一次测试都会向医生发出警报,医生们确实威胁要杀死实施这个系统的人,它关闭了这样的系统,如果将阈值设置为不异常,但危及生命的异常。
如果你设置了费率和持续时间,这样人们对它的反应是合理的,那也许可以接受,呃,当我们做这个项目的时候,嗯,急诊科如何预测大量的病人,因为看起来流感季节开始了,比如说。
我们问的问题是你们一个月能忍受多少次假警报,他们想了想,Ed医生聚在一起说一个月三次,你可以喊狼来了,因为我们真的想知道它什么时候真正发生,我们宁愿做好准备,我们可以容忍这个预测有10%的错误率。
但我不知道这里面是什么,在这个领域,另一个有趣的研究是,你知道的,它变得相当流行,就像我今天收到了一堆医生的电子邮件,因为我按处方点了续杯,他想知道进展如何,和废话,废话,废话,所以BI问了这个问题。
有多少,这些信息中有哪一部分从来没有被发送给他们的病人阅读过,这是一个重要的问题,因为,如果你依赖这种交流方式作为你工作流程的一部分,你希望它是零,结果只有百分之三,这是非常好的。
意味着大多数人实际上都在关注这些信息,然后我想说几句关于沟通的重要性,然后最后提到到目前为止的一些,试图很好地集成所有不同数据源的失败尝试,就像我说的,BI始于1994年,它的系统说。
如果你正在服用肾脏排泄或外露毒性药物,然后我们要警告人们,如果肌酸水平上升,这表明你的肾脏功能不太好因为,当然啦,如果药物是肾脏排泄的,这意味着如果你的肾脏没有排泄东西,以他们应该的速度。
你最终会在体内积累越来越多的药物,这可能会变得有毒,所以他们看到了两个一个小时,所以几乎一整天的降价,给出这些警报的医务人员的反应时间与以前发生的情况相比,真了不起,我是说。
节省了一天时间来应对这样的情况真的是一个令人印象深刻的结果,他们也看到了,就临床结果而言,肾损害的风险降低到前的一半左右,干预水平,所以早期的反应实际上是在挽救人们的肾功能,通过让人们早点干预。
我觉得有趣的是,他们说,44%的医生发现这些警报很有帮助,28%的人觉得他们很烦人,但65%的人希望他们继续使用,在一项调查中,恩里科·科伊拉是我心目中的英雄之一,他曾在英国呆过。他现在在澳大利亚。
他在20世纪80年代有一个非常深刻的洞察力,他说,你知道你们这些在医学领域踩着电脑的人,认为所有的行动都是关于决策的,但并不是所有的动作都是为了交流,医疗保健基本上是一项团队运动。
除非我们花更多的时间研究交流中发生的事情,我们要赶不上船了,然后我们大多没有注意到他们,但他一直在努力,所以他说,嗯,通信空间有多大,所以他引用了1985年的一项研究,是人们问同事要的信息。
而不是两个六个,他们在自己的笔记中查找,所以如果医生在查房,走进病人的房间说,你知道的,我想知道,这家伙的体温是忽高忽低的吗?四分之一的时间他会看笔记,有一半的时间他会转向护士说。
这个病人的体温是上升还是下降,好的,所以他说这很有趣,嗯,保罗·唐在90年代做了一项研究,What’在诊所里是这么说的,大约60%的时间花在工作人员之间交谈上,什么都不做。
说几乎100%的非病人记录信息,换句话说,那几乎是同义反复,因为你还能从哪里得到它,然后BI的查理·萨弗隆做了一项时间和运动研究,看着,我觉得,护理行为,说他们大约一半的时间是面对面的交流。
大约10%有电子病历,还有很多电子邮件、语音信箱和纸质提醒,作为人与人之间交流的方式,这是科伊拉和坟墓的98研究,他们在找一个顾问,家庭办公室或其他顾问,这些是英国的头衔,因为这是在澳大利亚做的。
护士等等,他们说,好的嗯,在医院工作人员中,我想这是在,呃,在一个班次,我想我应该把它放在幻灯片上,这是他们发送和接收的页数,所以它们的范围从零到大约四,拨打和接听的电话数目,从零到十三不等,哦。
这是观察的长度,所以这对每个病人来说都是在大约三个小时的时间里,这是事件的总数所以想想在三个半小时内,高级内务官员有24个不同的沟通事件发生在那个人身上,所以这意味着什么,就像七个,呃,是啊,是啊。
每小时7个,所以这就像一个,每一次,十分钟,大概,这里有一个特殊的主题,他们观察了三个三又一刻钟的观察,这个人花了86%的时间说话,百分之三十一被两个,八次中断,所以即使是中断也被打断了。
25%的人在两次或两次以上的对话中同时处理多项任务,87%面对面或通过电话或寻呼机,所以大部分时间是谈话时间13处理电脑和病人笔记,所以沟通功能真的很重要,我的意思是,我对此没有什么深奥的话要说。
除了我会在这些文件上贴一个指针,但他们正在考虑的事情,或者嗯,我们可以引入新的渠道或新类型的信息或新的通信政策,你知道的,你不能打断一个照顾病人的人,当他们在做的时候,或者类似的东西。
然后从同步方法转移到异步方法,像语音信箱或电子邮件或松弛,或者你知道一些现代的交流机制,嗯,让我跳过这些,所以说,嗯,快速到最后一个话题,你怎么不丢球,所以有很多分析说,医疗保健中最大的错误是犯的。
不是因为某人做了错误的决定,但这是因为有人没有做出决定,他们只是忘记了一些事情,他们没有跟进他们应该耐心等待的事情,你觉得一切都很好,你不处理它,部分灵感来自我在贝斯读到的传呼机的升级,以色列,我说。
嗯,听起来我们真正需要的是一个工作流引擎,那大约是一个离散的事件模拟器,那么有没有人在这个类中建立了一个离散事件模拟器,这是一个相当标准的编程问题,它在模拟各种涉及离散事件的事情时很有用。
这个想法是你有一个时间表,你沿着时间线运行,执行下一个出现的活动,这种活动做了一些事情,它发送电子邮件或它,你知道发射火箭或其他领域,你在做模拟,但最重要的是,它所做的是它所做的最后一件事。
它会在时间线的晚些时候安排其他事情发生,例如,为了每天发生一次的事情,当它发生的时候,运行的任务,安排第二天再次发生,这意味着它将一直持续运行,所以我的想法是,你想做的是说,如果在某个时候。
我没有一个任务说做X,或者让Z做Y,或者两者兼而有之,那么最后一件事应该是在未来时间表的某个时候,另一个说Y完成的任务,如果没有,然后去通知某人或者去提醒某人,据我所知。
没有医院和电子记录系统有这样的能力,但我仍然认为这是个好主意。
然后我想用一个指针结束,一个仍然困扰着我们的问题,所以在1994年,我和一些同事写了这个东西,我们称之为守护天使宣言,这个想法是我们应该让病人更多地参与他们自己的护理。
因为他们可以跟踪很多系统没有做的事情,很好地跟踪,这个想法是,你将有一个计算过程,从你父母怀你的时候开始,一直跑到你死后的尸检,在此期间,它将负责收集所有关于你的相关医疗保健数据。
所以它将是你的电子病历,但它也会是活跃的,所以它会帮助你和你的提供者沟通,它会帮助你了解,你有什么条件,它会提醒你一些事情,它会为你安排事情,等等,所以这是一个很好的科幻愿景,在两千年中期。
亚当·博斯沃思是谷歌的副总裁,他来找我,他说你知道我读了你的东西,这是个好主意,我要做这件事,所以谷歌启动了一个叫做谷歌健康的东西,它更侧重于至少是个人健康记录。
他们在克利夫兰诊所做了一个100人的试点,然后他们作为测试版上市,嗯,三年后他们杀了它,他们有一群搭档,所以他们有,你知道,所有脚本,和贝丝,以色列和马萨诸塞州蓝十字,和克利夫兰,诊所和CVS,等等。
所以他们做了他们的工作,试图联系一群重要的球员,但当然他们没有所有人,所以,比如说,我当然立即注册了一个账户,也是我打过交道的唯一一家公司,在那一套里是沃尔格林,我在那里买了一个护肤霜,一次是皮疹。
所以我的总病历包括皮疹,还有我买的护肤霜,不是很有帮助,因此,除了这些合作伙伴之外,没有人可以自动输入数据,这意味着你必须比我更有肛门强迫症,为了坐在那里把我的整个病史输入系统。
尤其是因为如果我这么做了,没有人会看它,如果我去看医生说,嘿医生,这是我医疗记录的谷歌URL,这里有一个密码,你可以通过它访问它,你认为他们真的会看起来像,零,好的,所以这件事绝对是一个可悲的失败。
人们一直在尝试,到目前为止还没有人想出怎么做,但这仍然是个好主意。
P22:22.Regulation of Machine Learning - 大佬的迷弟的粉丝 - BV1oa411c7eD
对呀,让我们开始吧,今天欢迎女士们先生们,我很荣幸向大家介绍两位演讲嘉宾,谁来谈人工智能和机器学习的监管,联邦食品和药物管理局一级的监管和关于机构内监管的IRB问题,首先发言的是安迪·卡拉多斯。
安迪是ElectroLabs的首席执行官和创始创始人,这是一家为医疗保健做数字生物标志物的小公司,研究所数据和软件工程师,在纽约西奈山为下一代医疗保健,今天能来和我们说话真是太好了。
所以我要介绍他们坐下来享受,谢谢。谢谢。谢谢你邀请我们,是的,所以我在研究数字生物标志物,我也是哈佛大学的研究合作者,麻省理工学院监管科学中心,然后我也是def con生物黑客村的顾问。
我们可以多谈谈我的背景,我是一名软件工程师,曾与美国食品和药物管理局合作,以前是企业家。
在数字健康单位居住,然后在公司土地上呆了一段时间,我是马克·谢里,我在西奈山下一代医疗保健研究所工作,我在那里已经三年了,我的背景是软件和数据工程,主要来自银行和媒体,所以这是一个新的地方。
我的大部分职责都集中在数据安全、IRB和道德责任上,我们也知道人们通常有多喜欢监管对话,所以我们会试着让这对你来说非常有趣和刺激,如果你有问题,因为规定很奇怪,它们在不断地变化。
你也可以在推特上给我们发一张纸条,我们会回应的,如果你有事情发生,还有推特上的监管社区,太神奇了,当有人拿出,就像,现实世界的数据到底意味着什么,每个人都在互相交谈,所以一旦你开始进入。
这是一个非常好的,数字健康部门在FDA OK免责声明上发了很多推特,这些是我们的意见,你将在这里看到的信息不一定反映了美国。
政府或我们所属的机构,政策和法规不断变化,所以当我们把这个呈现给你的时候,很可能有一部分是错的。
你的律师可能会说不要这么做,肯定有不同的方法,我们可以讨论你想怎么做,但尤其是作为一个软件工程师,在数据方面开发任何东西,如果你花了太多时间开发一个永远无法通过的产品,这真的是浪费了一段时间。
正如你在报纸上看到的,这将是很重要的,马克和我经常谈论的最后一件事,这些定义和框架中的许多实际上还没有发生吗,所以当有人说生物标志物,它们实际上可能并不意味着生物标志物,他们可能需要一个测量。
我相信你知道这一点,当有人说,我在AI工作,你就像,这到底是什么意思,所以你应该问我们问题,你真的是,你想一想,你所拥有的知识类型,与这个国家的几乎所有人相比,这是一套非常特殊的罕见知识。
如何规范和监督这些技术,你可以有一个非常大的。
我们要做的是一些关于监管的枯燥的东西,然后我要恳求你,也教你如何提交公众评论,这样你就可以成为这个监管过程的一部分,然后我会谈谈机构审查委员会,这里有多少人和IRB一起工作过或知道他们,好的,好。
这是一个很好的组合,所以这将是一个快速的事情,只是在回顾什么时候让IRB参与进来,如何让IRB参与,你需要IRB的事情,还有一些你不知道的事情,作为采取FDA方法的替代方案,所有的权利,好的好的。
然后我先去,然后我们再通过IRBS,然后我们把最后一部分留给你对论文的印象,好的,所以在我开始之前,我会给我们一些关于算法驱动的保健产品的想法。
嗯,如你所知,这些可以有广泛的范围,他们可以做什么,我喜欢使用的一般框架,来考虑它们是测量诊断或治疗的产品,所以测量,产品可能包括数字生物标志物或临床决策支持,诊断可能会采取这种测量。
然后说某人是否有某种情况,考虑到这些指标,然后围绕数字治疗学来处理我们的想法。
这里有多少人认为软件可以治疗一个人,我认为人们不会总是想到的一件事,当他们有这些工具的时候,你们可能都在想这个,更多的是像步数这样简单的事情是一种算法对吧,所以它需要你的陀螺仪加速度计,高度。
体重和年龄,然后它预测你是否迈出了一步,如果你想想人们所做的不同步骤,老年人比年轻人拖拖拉拉的,所以步数算法看起来与年轻人的步数算法非常不同,所以所有这些工具都有一定程度的误差,它们都是有效的算法。
我最喜欢的框架之一,当你开始思考,很多人对周围的测量方面很感兴趣,所谓的数字生物标志物,结果食品和药物管理局意识到许多人甚至在他们自己的机构里,不知道什么是生物标志物,每个人对这个词的使用略有不同。
可能人们对待你的方式与机器学习的方式略有不同,所以有一个非常好的框架,我强烈推荐的七种不同类型的生物标志物,如果你走进这个区域,你会读到,和数字生物标志物只在我的定义中,以及其他人是如何开始使用的。
这是收集测量值的方式,所以你可能有一个监测生物标志物或诊断生物标志物,但它是在流动医院收集的,正在收集数字的远程方式,这种类型的数据非常棘手,并给你一个例子来说明为什么这特别难以监管。
所以想想几个产品看看简单的东西,像AFIB,所以谎言是一种不正常的心脏疾病,你可能在新闻里看到过,许多不同的公司正在推出AFIB产品,简单地说,显然有一大堆不同类型的数据。
一个人的原始数据是另一个人的过程数据,所以说,你在这个图表上看到的,是五个不同的公司的名单,他们都在开发蚜虫产品,他们是否在内部开发产品,就是绿色的部分,与他们是否可能使用第三方产品的关系。
所以在别人的产品上开发一个应用程序,所以在一个广泛的方面,考虑从操作系统到传感器数据,所以有人可能会使用PPG传感器之类的东西,他们手表上的数据,然后做某种信号处理,然后制作另一个算法,进行某种诊断。
然后你在上面有某种用户界面,所以如果你是FDA,2。你的底线在哪儿?这个产品的哪一部分,当有人说我的产品经过验证时,是否应该实际验证,然后思考这到底意味着什么,如果某件事被验证而不是被验证。
如此验证就像,如果我走一百步,这东西有一百步长吗?然后验证做了一百个步骤,对我的病人来说意味着什么,或者对于我的临床用例,所以食品和药物管理局已经开始考虑的一件事是,如何将硬件组件与软件组件解耦。
在那里你考虑一些硬件组件,就像你想要的那样,一个有效的类似于收集数据的供应链,然后你会在上面用一些东西,所以,也许,你有某些类型的公司可能会做某种验证或验证,降低堆栈,然后你可以在更高的地方创新。
所以这些这些这些测量有非常有意义的影响,所以在过去,很多这些工具你真的必须去诊所,进行这种测量是非常昂贵的,越来越多的不同公司正在批准他们的产品在,在一些护理环境中与医生,或者可能是在家里做决定好吧。
所以在最后一个例子中,是关于数字治疗的,所以我和一家公司合作,这家公司使用的是基于UCSF的技术,正在有效发展的,儿童多动症电子游戏,所以当孩子们玩游戏的时候,他们减轻了多动症的症状。
这个游戏很令人兴奋的一点是,这是一个30天的协议,不像利他林或Adderall,在那里你必须在你的余生中每天服用这种药物,当你减轻症状时,这似乎有一个影响,三十天后是更长期的,当你在几个月后测试某人时。
他们仍然保留着治疗的效果,所以这项技术是从加州大学旧金山分校拿出来的,授权给一家叫阿奇尔的公司,他决定我们应该像制药公司一样组织自己,所以他们像制药公司一样筹集风险投资,他们像制药公司一样进行临床试验。
他们现在向食品和药物管理局提交,可能是第一个处方药,所以任何被告知或电子游戏可能会腐蚀你的大脑的人,你现在有一个,所以食品和药物管理局一直在研究越来越多的这些工具,我不必告诉你,你可能想了很多。
FDA已经批准了许多不同类型的算法,出现的一个问题是,你应该考虑代理的哪一部分,当你使用这些算法时,你声称什么,一个人应该清除什么,什么不是,我们应该如何真正考虑对他们的监管监督。
许多这些技术也使事情变得非常令人兴奋,所以这不仅仅是测量的问题,但你能用它们做什么,所以有一件事让很多人非常兴奋,是一个关于分散临床试验的想法,这里没有区块链,你也许可以用区块链构建它,但没有必要。
所以在Y访问上,你可以考虑,收集的数据在哪里,那么它是在临床现场收集的吗,还是远程采集,然后方法是如何收集,那么你需要一个人来做互动吗,还是完全虚拟,所以在顶部,你可以想象有人在做远程医疗。
他们打电话给家里的人,然后他们可能会填满,问一些问题,并在底部填写一份调查,你可以想象在一个研究机构里,我使用了许多不同的仪器,也许我正在研究帕金森病,你在用某种加速度计测量我的震颤。
所以正在发生的挑战,很多人把所有这些术语用于不同的事情,当它们意味着分散审判时,是远程医疗吗,是不是有人用很多可穿戴设备,你怎么知道数据是准确的。
但这是我认为在许多情况下真的很令人兴奋,因为人们不想参加临床试验的首要原因,就是服用安慰剂,我想没有人真的想参与研究,如果你没有得到真正的药物,另一个原因是人们不想开车进去,找到停车场,喜欢参与。
这允许人们在家参与,FDA一直在做很多工作,如何重新思考临床试验设计过程,并将一些现实世界的数据纳入决策。
就在我跳到一些监管的事情之前,我只想建立一个框架来思考这些工具能做什么,以下是在临床研究中如何使用软件的三种不同场景,所以想象一下有人得了帕金森病,你想测量他们的帕金森病是如何随着时间的推移而变化的。
使用基于智能手机的测试,你有一种标准的帕金森药物,他们会使用,然后收集端点数据,这就是你所看到的,如果这种药物是用一个软件进行的,说你有胰岛素泵,然后你有一个CGM来测量你的血糖水平。
你想根据这些读数给胰岛素剂量,您可能在介入端和端点端都有软件,或者像我们谈到的公司,它有一个数字产品,他们说我们在这项研究中唯一想改变的是干预是数字化的。
但我们希望你把我们和其他治疗儿童多动症的干预措施进行比较,所以我们希望使用标准端点,而不是让这成为一种创新,这里的挑战是,第一个最有可能的是食品和药物管理局的方面。
第二个将涉及食品和药物管理局的药物和设备方面,作为组合产品,最后一个会进入通常处理软件的设备,我们从来没有真正的产品在食品和药物管理局,依我看,就像,我们没有,可以测量、诊断、治疗和改变所有不同的方式。
所以你现在让软件攻击系统的多个不同部分,它甚至可能是相同的产品,但在一个例子中,它被用作干预,另一个实例,它被用作诊断,另一个是通知或扩展标签,所以关于你将如何管理这个产品的台词就不再那么干净了。
那么你是如何管理这些的呢,有几个机构负责考虑,并监督医疗保健软件,我们花大部分时间研究的大问题是食品和药物管理局,但也值得思考它们是如何与其他一些相互作用的,包括嗯,oh和c,FCC和FTC。
所以FDA负责安全性和有效性,以及促进医疗产品创新,并确保患者获得高质量的产品,O,c负责卫生信息技术,你可以想象存储数据之间的线,你是否对这些数据做出了诊断开始变得非常模糊。
它真的可能是完全相同的产品,但只是改变了你对该产品的要求,这些产品中的大多数都与它们有一定程度的连接,所以他们也在与联邦通信委员会合作,必须遵守,这些工具是由这个机构监管的,最后。
也可能是最有趣的是围绕联邦贸易委员会,它真正专注于告知消费者的选择,如果你想想FDA和FTC,他们其实很相似,所以这两个机构都负责消费者保护,FDA真的从公共卫生的角度来看待这一点,所以在很多情况下。
如果你看到一些对有欺骗性做法的人的惩罚,实际上不是FDA介入的,是联邦贸易委员会,我想有些经纪公司在考虑他们的路线在哪里结束,其他人从哪里开始,在许多情况下,正如我们可能已经看到的。
在科技行业发生的许多可能不好的行为,很多地方都有空隙,没有人介入,所以一个重要的是关于标准和技术,可能一直在考虑互操作性,以及是否可以实际导入数据,有些人花了很多时间思考标准。
是促进创新的一项非常痛苦和非常重要的工作,好的,所以FDA有多个中心,我要用很多缩写词,所以你可能想把这个写下来或者拍张照片,我会尽量减少我的首字母缩写,但有三个中心对你来说最有趣,所以雪松是用来的。
这是一个你会有一个普通的药物,并可能使用软件产品来查看药物的性能,cdh用于设备,cber用于生物制品,我可能会以非常相似的方式使用药物和生物制品,我们会花大部分时间研究的区别是存在的。
药物与器械,即将出台的一系列政策,这既令人兴奋又让事情发生变化,所以其中一个大的是关于两个一个世纪的治疗方法,这加速了医疗保健的许多创新,它也改变了设备的定义,这对软件有相当有意义的影响。
FDA一直在考虑如何,你实际上会把这些产品,我想有很多人对他们真的很兴奋,有很多创新,那么我们如何创建标准来扩展标签,能够实际摄取数字数据,拥有这些实际上在FDA监督下的数字产品。
不仅仅是像应用商店里奇怪的蛇油。
但什么是医疗器械,几乎一个设备就像任何不是其他中心的东西,它有一个很大的陷阱,所有其他组件,所以对人们来说最大的挑战之一是思考设备是什么,如果你想想FDA的一般工作,它并不总是确保你的产品是安全有效的。
他们检查你是否声称它们是安全有效的,所以这真的是关于索赔管理,你声称这个产品能做什么,并为营销评估这一点,很明显,如果你的产品造成了非常严重的伤害,这是个问题,但挑战真的碰巧是,当有人喜欢产品时。
可以做一些它不一定声称要做的事情,但你可以暗示它做了其他事情,大多数人并不真正很好地理解,区别在于通知产品和诊断产品,所以我认为在许多情况下对公众来说,它变得有点混乱,就像我们之前说的。
食品和药物管理局一直在考虑如何将硬件与软件解耦,他们提出了一个关于软件作为医疗设备的概念,所以被有效定义为没有硬件组件的软件,在那里你可以评估,就这个产品,这个发音是Sandy。
有些很有趣,这是一张很难读懂的图表,但我直接从法律文件中提取的,所以你知道我不会改变它,桑迪很有趣,所以如果你一直走到最后,所以如果你有电子医疗保健数据,那只是存储健康数据,那不是沙子。
而且经常可以直接进入市场,并且不受美国食品和药物管理局的监管,如果你有一个嵌入到系统中的软件,所以像起搏器血液输液泵这样的东西,那就是医疗设备中的软件,那不是沙子,所以在这些功能之间有一条线。
产品正在做的,然后有多严重,这就说明了该产品将如何评估您,如果你没有注意到,我尽量不使用设备这个词,所以当我谈到这些连接的可穿戴设备和其他类型的工具时,我将使用工具这个词,而不是设备。
因为这对FDA有一个非常特殊的含义,所以如果你好奇,无论您的产品是设备还是算法是设备。
我们会玩一个小游戏,所以这里有两个产品,一个是苹果产品,一个是Fitbit产品。
哪一个是设备,我要随机拜访某人,或者有人举手致敬,好的,谁认为这里是苹果五十,苹果手表,但我不确定Fitbit,但如果是其中之一,那很锋利,所以我们来谈谈这个,苹果确实向FDA提交了许可。
他们重新提交了,很像一个510K,他们提交了两个产品,两个桑迪的一个是基于他们PPG的信号,第二个在应用程序上,所以它有两个设备,都不是硬件,Fitbit今天没有设备,现在怎么样它是一个设备吗。
或者它不是一个装置。
很明显,这是一个诡计问题,因为那里有两个设备,然后一些不是设备的东西,所以这真的取决于你声称什么。
产品有,回到那组模块化,产品到底是什么,产品也是,信号处理算法是产品,应用程序是产品,整个系统,所以人们在战略上坦率地思考,比如哪些部件是设备,因为你可能有,您可能希望其他人在您的系统上构建。
所以也许你想让你的硬件成为一个设备,然后其他人可以以此为基础,所以有战略性的思考方法,所以这里疯狂的是,如果你能想象这个,完全相同的产品可以是一个设备,也可以不是一个设备,只需改变文字。
不改变硬件或代码,所以如果你想想我的产品是不是一个设备,实际上不是最有用的问题,更有用的问题是产品的预期用途是什么,你是在用你的产品做医疗设备索赔吗。
显然这有点势不可挡,我觉得,试图弄清楚如何导航这一切,美国食品和药物管理局认识到,他们的目标是增加创新,尤其是对于像软件这样不断更新的产品,如果你不断地找出所有不同的单词,这似乎有点困难。
以及如何将这些产品推向市场,所以我认为食品和药物管理局正在试点一些真正创新的东西,这是他们正在考虑的一个程序的例子,它与九家不同的公司合作,这个想法是。
你能预先认证一个正在开发软件的整个公司是一个优秀的公司吗,跨越一系列目标,然后允许他们发布额外的更新,所以今天如果你有一个更新,你想做一个改变,你必须经历一个完整的510K或从头开始的过程。
或其他类型的过程,挺狂野的,如果你想象一下,我们只会让Facebook每年发布一次更新,那就太疯狂了,我们不指望Facebook喜欢,维持或维持人的生命,所以能够以更定期的方式进行更新是非常重要的。
但你怎么知道这种变化会不会产生巨大的影响,我会暂停这个,但你们都看了文件,事实上,我很高兴你不和我们说话就看了这份文件,因为你是那些不一定有背景的人的观众,所以它需要以一种人们可读的方式来表达。
他们正在开发这些类型的产品,知道如何并进入它们,在讨论结束时会节省一些时间,因为我很好奇你是怎么看待这件作品的,但你绝对应该相信你的第一次阅读是诚实的好阅读,你也可能比任何正在阅读它的人阅读得更强烈。
所以你做的笔记是有效的,我很好奇你看到了什么,好的,另一件能让你在鸡尾酒时间保持冷静的事情,FDA批准。
和FDA批准的不是一回事,好的,所以四个设备,有三条途径需要思考,一个是五十个K,下一个是从头开始,下一个是上市前批准,也被称为PM MA,他们通常根据某件事是否有风险来分层,以及必须提交的数据类型。
获得这些许可的风险各不相同所以你的风险越大,您必须拥有的数据类型越多,德诺博斯被授予,但人们经常会说清除了五个十个K清除了,你见过的产品很少。
经历一个和一个PMA过程,告诉我你知道苹果为什么选择做NOI步骤五十吗,我不是苹果,但如果让我猜,一旦你重新创建了一个,然后你可以成为其他事情的谓词,所以如果他们想创建一个新的谓词类,随着时间的推移。
他们可以在此基础上再接再厉,他们不想喜欢,陷入一种旧类型的谓词系统,我从战略上考虑,事实上,他们选择了一个PPG和他们的应用程序,我不知道随着时间的推移他们最终会做什么。
但我认为这是他们长期战略的一部分,大问题,这些工具是安全有效的,可能取决于提交的数据数量,但是从工具中收集的信息呢,所以今天我们的医疗保健系统对生物标本有很强的保护,你的血液,你的大便,你的基因组数据。
但我们对数字标本真的没有任何保护措施,你可以想象我们经常有多少数据泄露,Facebook上有什么广告,其中很多被认为是健康数据,实际上不是健康数据,但在许多情况下,你会发现相当多的健康信息从某人那里。
我还有很多我们可以永远学到的东西,但总的来说,有几件事是很好的,有了这些数据,你再也无法识别它了,谁认为我可以识别我的基因组,你不能写得像我的基因组对我来说是独一无二的,也许你可以去掉个人身份信息。
但你不会真的去识别它,我可以用30秒的步行数据唯一识别,所以所有这些生物特征都是非常具体的,今天有一些机构正在考虑如何处理这些工具,但最终我认为有一个相当大的差距,所以总的来说。
FDA真正关注的是安全性和有效性,安全被认为更多的是身体安全,而不是像,我们作为人类是非常可编程的,以及我们看到的信息类型或更改安全类型,所以我们收集的数据和FTC在这里可能有很大的力量。
但他们是一个小得多的机构,资源不足,有几个不同的组织正在试图思考,如何为物联网制定规则以及如何使用这些数据,但总的来说在我看来,我们可能需要国会围绕数字样本数据的非歧视采取某种行动。
这将需要一个能够思考的国会,我认为一个非常困难的问题是如何处理数据权限和管理,好的,所以我将通过几个例子来说明政府机构是如何互动的,与公众人士,我想你可能会感兴趣,其中许多公司,许多政府机构。
他们真的在思考,意识到他们不一定是他们领域的专家,他们如何获得他们需要的数据,所以有几件你会感兴趣的作品,我想一个是食品和药物管理局和杜克大学有一个联合小组,他们在思考所谓的新端点。
所以如果你今天在做一项研究,在那里你意识到你测量的东西比金本位制更好,金本位制实际上是一个相当糟糕的金本位制,如何创建和开发一个新的度量,可能没有参考标准或遗留标准,这是一种思考的方式。
第二个是选择一种移动技术,这种技术过去被称为移动设备,他们改变了它,因为同样的原因,不把东西称为设备,除非它是一个设备,所以这些人在思考什么样的连接技术,您想用来生成您可能在研究中使用的患者数据吗。
所有的权利,这里有谁知道什么是防御,你们三个好的,所以def con在一个黑客会议上,这可能是最大的黑客会议之一,这是一个会议,如果你真的有兴趣去,你不应该带手机也不应该带电脑。
你绝对不应该连接到互联网,因为有一个叫羊墙的团体,他们会直接流你所有的Gmail,密码,纯文本和您的帐户登录,你放在互联网上的任何东西,你可能也听说过他们因为他们去年买了很多投票机,黑了他们。
找到了投票记录,并将他们送回国会,说嘿,你可能应该修复这个防御系统,有许多村庄位于主防御系统下,其中一个叫生物黑客村,还有一些生物黑客,比如做RFID芯片公民科学,但生物黑客村也有一群人在做什么。
所谓的白帽子黑客,所以对于知道这件事的人来说,有黑猫在那里你可能,嗯,你知道的,比如加密某人的网站,或者为了赎金扣留他们做一些破坏性的事情,白帽黑客被认为是有道德的黑客,他们在对一种产品进行安全研究。
所以生物黑客村的黑客,开始在起搏器上做很多工作,这些都是相互联系的技术,很多心脏起搏器公司有一个简单的方法来思考他们是如何看待这个问题的,就是,起搏器公司通常试图优化电池寿命。
他们不想做任何计算上昂贵的事情,原来加密东西在计算上是昂贵的,他们做了一个有规律的微不足道的利用,在那里他们能够对协议进行逆向工程,起搏器尽可能长时间地保持低功率模式,如果你按它,就会变成大功率模式。
这样你就可以抽干一个多,起搏器的齿轮电池在几天或几周内,和,他们还能够进行逆向工程,心脏起搏器对心脏事件的冲击,所以这很重要,对这种利用可以对任何正常的科技公司做什么的影响,当您有这种类型的漏洞时。
你可以去Facebook,你可以去亚马逊,有一种叫做协同披露的东西,你可能会有虫子赏金,然后共享更新,您可以提交更新,然后你就和设备公司玩完了,通常的情况是研究人员会去设备公司,嘿,我们发现了这个漏洞。
设备公司在说谢谢,我们现在要告你,安全搜查就像,你为什么要告我们,他们说你在篡改我们的产品,我们受机构监管,我们不能随时发布更新,所以我们必须看到,你发现那不是真的,FDA发现了这件事,他们就像。
你不能就这样起诉安全研究人员,如果您有安全问题,你得把它修好,所以FDA做了一些相当大胆的事情,那是三年前的事了,他们进入了防御状态,如果有人真的去了防御,你就会知道你不去防御,如果你是政府的一部分。
因为有一个游戏叫找到美联储,你不想被发现,当然还有,你知道吗,我和国安局中情局,就像,许多政府成员将进入戒备状态,但它通常不是一个特别友好的环境,生物黑客村说嘿,我们会保护你。
我们会给你一个扬声器的位置,我们真的很想和你一起工作,所以在过去的三年里,该机构一直在与安全研究人员密切合作真正思考最好的方法,UM网络安全,特别适用于连接设备,所以如果你看看过去的几个指南。
有一个上市前和上市后的指导,他们一直在合作,他们是非常好和强有力的指导,食品和药物管理局做了一些非常有趣的事情,那是在一月份,他们宣布了一项新的倡议,我觉得这很神奇,称为标签,我们心脏黑客。
如果你去WehardHackers,www。icj-cij。org,FDA一直在鼓励美敦力和BD等设备制造商,飞利浦和热力,费舍尔和其他人带着他们的设备,与安全研究人员一起工作。
另一个可能值得了解的群体是,如果你想想,很多这些连接的产品,他们,在许多情况下可能会增加或改变临床医生的工作方式,所以今天,如果你是一名临床医生,你从医学院毕业,你会像希波克拉底一样发誓不做伤害。
软件工程师和这些产品的制造商应该,也发誓不做伤害,那个誓言看起来相似还是不同,这种思路帮助人们意识到,有完整的专业社区和协会为从事这种工作的人服务,对于他们专业的医生来说,所以神经肿瘤学协会。
美国放射学会,但是对于从事数字医学的人来说,真的没有社会,所以现在有一个小组正在开始,大家可能都想加入,因为我想你们都会是这种社区的一部分,这是一个社会,因为它被称为一毛钱社会,所以如果你在想。
我如何对这些数字产品进行知情同意,我需要思考监管的新方法是什么,我将如何与我的IRB一起工作,这个社会可以成为你的资源,那么你如何参与规则制定过程,一个是我非常鼓励,如果你有机会,你在政府工作一段时间。
有更多的机会通过像总统这样的组织来做到这一点,创新研究员,成为企业家居民,成为美国数字服务的一部分,CMS的支付系统就像数百万行钴,所以这显然需要一些修复,所以如果你想做一项服务。
我认为这是一个非常重要的方式,你可以做的另一种方法是提交给公共目录,所以这是我要求你做的事情,我们之后再谈,你如何把你在白皮书中学到的东西,以及你可以与机构分享的方法,你将如何使用该产品。
你会考虑围绕人工智能机器学习制定规则和规律,有一个更长的资源,你可以看看我的朋友米娜写道,也就是,嗯,有几件事要知道,所以任何人都可以评论,你会被听到的,如果你写了一个很长的评论。
机构里可能有很多人必须阅读你评价的每一件事,所以请明智地做这件事,但你会被听到,大多数时候评论来自大组织和聚集在一起的人,而不是从体验和使用大量产品的人那里,所以在我看来。
我认为像你这样的人对中情局来说是一个非常重要的评论和声音,并有技术视角,你可以做到这一点的另一种方法,我要把艾琳放在一个位置上,我们需要新的监管范式,所以当你出去喝啤酒或吃冰淇淋的时候。
或者你为了好玩而做的任何事情,你可以通过新的模型来思考,所以我们在考虑一个想法,你能用一个临床试验框架来思考人工智能吗,因此,算法在不同的患者群体和不同的群体上表现不同,您需要包含排除标准。
这应该是什么吗,也许我们甚至超越了医疗保健算法,你如何决定某人是否获得保释或教师福利,然后把你的想法放在网上的有趣之处在于,如果你这么做了,人们就会开始来找你,我们意识到意大利有一个团体。
他提出了一个版本的FDA算法,你开始收集那些思考或思考你正在思考的事情的人,现在我们将深入挖掘你最有可能花更多时间的东西,比政府,也就是你的IRB。
把剩下的演讲,如果你只是跟着底部的东西走,如果你不知道你是否在做人类研究,人体研究。
我或者B问你的教授,问问别人,我觉得,我要说的大部分都会柔和得多,比安迪跑来跑去的更湿,它真的只是试着让你的思维过程通过你的大脑,你知道的,如果我们在做真正的人体研究,嗯,IRB必须参与。
人类研究的实际构成,为了确保你知道那里发生了什么,无时无刻不在,系统的调查以发展或贡献可推广的知识,所以你可以在岩石上做到这一点,嗯,人类受试者研究的重要之处在于人们的生命处于危险之中,嗯。
最容易知道的是,如果有任何可识别的信息,使用您正在处理的数据,这将落在,不会公开的东西,匿名数据,有,你知道的,有各种各样的成像训练数据集,你可以使用,都是,什么是可接受的水平,但对安迪来说。
真的没有办法真正去识别一个数据集,我们现在处理的数据量,世界上,识别任何数据集变得不可能了,如果您有任何其他参考数据集,所以任何时候你和任何人一起工作,嗯,你几乎肯定会再次让IRB参与进来。
那么为什么IRB在那里,不是专门拍你的手腕,你知道,这并不是说任何事情都被期望故意做错什么,虽然已经发生了,这是一个如此小的数额,它只是,认为每个人都是没有帮助的,所以你不会做任何特别错误的事情。
但有些事情你可能不知道,这不是B的千分之一牛仔竞技会,所以如果你向他们提出什么,他们几乎马上就会知道,嗯,参与者正在放弃他们的时间和信息,所以IRB不仅仅是保护机构免受伤害,真的是先保护病人。
和机构同时,但主要作用是保护参与者,嗯,特别是,这里有些东西可能不是每个人都能想到的,嗯,可能有问题或过度操纵的研究,这是对学习的补偿,你可以想象一个贫穷国家的某些地方,你说我们会做的。
我们将支付每人五万美元来参加这项研究,嗯,你可以想象人们想参加那个研究,这可能会成为一个问题,所以IRB也是,嗯,确保,这些研究实际上并没有对任何人产生负面影响,在那种意义上,嗯,在我做之前。
下一张幻灯片会变暗一秒钟,所以我们会试着穿过它,但它谈到了IRB是如何产生的,嗯,所以我们从纽伦堡密码开始,对囚犯和其他人进行的人类研究,滑雪实验,人们不是的另一件事。
所以他们不知道他们实际上在接受什么测试,所以他们不可能同意,这项研究进行了四十年,而不是六个月,即使在建立了护理标准之后,研究继续进行,这基本上是国家保护人类受试者委员会的开始,嗯,导致了IRV的存在。
嗯,对研究的要求,五年后,贝尔蒙特报告出来了,只要不造成伤害,不要抽太多的血,如果这样更方便的话,如果你只是想看看会发生什么,不要添加额外的药物,嗯,然后确保参与者在外面是安全的,嗯。
你能造成的任何其他伤害,嗯,所以我们跟随贝尔蒙特报告,这基本上是我们现在所拥有的最先进的技术,这不是真正需要担心的事情,但是HHS有一个很棒的网站,有一个流程图,对于你能想到的任何情况。
来决定你是否真的在做,人体受试者,研究与否,这是最基本的一个,你可以自己经历,只是为了突出,嗯,我想你们可能会担心的主要事情是,你将收集可识别的数据,这马上就把你放在IRB的土地上,嗯所以任何。
任何你能识别的时候,这就是正在发生的事情,你只是,你在那里,所以你真的不必经历,这一切,什么是健康数据,所以你有名字,很明显,其中大多数要么是身份证明,要么是,你知道某种识别的东西,两个人的一件事。
我想很多人可能会掩盖,不那么明显的,是邮政编码吗,嗯,您必须将它们限制在邮政编码的前三个数字,它给出了一个可推广的区域,而实际上,嗯,拨入某人的位置,嗯,日期是一个极其敏感的话题。
所以任何时候你和实际的约会对象一起工作,我假设在,你知道吗,可穿戴技术,你将处理时间序列数据,诸如此类的东西,有不同的方法来摆脱,让它不那么敏感,但任何时候你在处理研究。
我们多年来处理电子健康记录的任何时候,不在实际日期,这可能会造成问题,如果你试图对某人的整个健康记录进行时间序列分析,在这种情况下,您可以获得进一步的许可来处理更多可识别的数据,但这是进步的。
如果你不这样做,就没有理由从那种数据开始,所以总是有必要知道,终于,如果你和90岁以上的病人一起工作,它们只是被概括为一个大于九十的范畴,嗯,剩下的这些,我认为是公平的,相当可猜,所以我们不必通过它们。
但那些是那种,嗯,那些是一些人再也抓不到的棘手的东西,只要尽可能严格地限制PHI的收集,如果你不需要,如果你在分享数据,就不要明白,而不是共享整个数据集,如果你有很强的PHI,嗯。
限制你给或分享给另一个研究人员的东西,那只是卫生问题,我们会得到它真的限制,可能发生的错误数量,那么为什么这一切都很重要,所以IRB再次特别在,嗯,对保护病人感兴趣,嗯,并确保对病人造成尽可能少的伤害。
嗯,只是一般的人类尊严和尊重,存在制度风险,如果某事是在没有IRB的情况下完成的,嗯,如果你在没有IRB的情况下做了人体研究,你就不能发表,所以这两个是棍子,但胡萝卜真的应该是人类尊严的前两名。
并确保你保护了任何病人,或者你参与研究的任何参与者,嗯,这是几个违规行为,我们不必走得太远,但他们都是,呃,据称在没有任何IRB批准的情况下进行的,可能涉及欺诈,这毁了他们两个的职业生涯。
但它使人们面临巨大的风险,这可能是一个更大的,常见的问题是PHI数据泄露,他们经常发生吗,它们通常不是来自外部的漏洞,都是意外,有人会在机器上设置一个Web服务器,发现有一天在家工作更容易了,嗯。
可能只是,他们不知道软件是如何设置的,所以任何时候你和PHI一起工作,它是,你真的得做过头了,确切地知道你是如何使用它的,嗯,其他漏洞正在丢失未加密的计算机,把数据放在拇指驱动器上然后丢失它。
仅因疏忽而发生的数据泄露总量,没有像你想的那样小心,所以记住总是好的,嗯,我猜,IRB和数字研究的一个新事物是,现在情况一直在变化,从面对面,招聘和研究能够在线同意,能够到达,你知道的,全世界数百万人。
嗯,并允许他们自己同意,所以这就变成了,显然是贝尔蒙特报告以来的一件新鲜事,这是我们正在与IRB密切合作的事情,以确保我们尽可能尊重病人,但也要确保我们可以开发不伤害任何人的软件解决方案。
发展成一种泳道,所以我们想出了一个框架,有一个项目是,你知道我们在研究所有的癌症,所以我们可以你可以发布关于不同研究的报告,这是怎么回事,看起来很重要的事情,学习是一个真实的人,同意协议的国家,嗯。
这是人类研究,受IRB的约束,那么我们就会有一个平台,用户将使用,这就像一个网站或iPhone应用程序,嗯,他们可以得到,你知道的,关于项目正在进行的文献信息,然后我们会有一个参与者。
他实际上是一项研究的一部分,他又一次通过同意覆盖了一只烘干机蜜蜂,所以从老的角度来看为什么这种发展很重要,软件开发的旧方法是瀑布方法,你在那里工作三个星期,工作三周。
在软件中实现我们已经转向敏捷方法的东西,因此,虽然敏捷使我们的生活在开发方面变得容易得多,它不是,我们不能肯定,在某些情况下,我们所做的不会影响病人,所以在一项研究中,敏捷领导是没有意义的,或者是。
我们想和IRB合作批准事情,但IRB批准需要,你知道的,两到四周的快速事情,当我们谈论项目之类的东西,这就是我们希望在敏捷环境中安全工作的地方,并试图找出IRB不一定要参与的地方,或者不想参与。
在那种环境中工作不会增加病人的风险,所以它几乎起作用了,它是用软件产品和研究来工作的,因此与IRB合作,以确保我们能把这些东西分开,并确保事情尽可能顺利地向前发展,任何额外的伤害,那就是这些,再次分类。
因此,一个项目活动将是,你知道的,社交媒体外联,嗯,共享您知道与项目相关的内容,只是告诉一个大致的想法,学习活动是你通常会习惯的同意数据共享,实际参与研究,不管是,通过佩戴可穿戴设备回答问题。
然后在这个过程中退出,这就是学习活动是百分之百的IRB,与研究没有直接关系的项目活动,嗯,如果你不知道,真的或只是三个外卖,问,尽可能严格地限制PHI的收集,在敏捷开发中工作很棒。
但在很多人类研究中它是不安全的,所以我们必须专注于哪里可以使用,哪里不能使用。
就是这样,谢谢。我有一个关于它实际上是如何做到的问题,作为IRB的讽刺,你如何确保你的研究人员是顺从的,比如写报告,做PDF,还是里面有第三方服务,是啊,是啊,是啊,是啊。
所以我们认证我们所有的研究人员都符合人类研究和HIPAA,只是毯子,如果你提供了,你有,你知道的,您的认证是最新的,那种,这是一种理解,即他们知道他们应该注意什么,IRB明白,哦,是啊,是啊,是啊。
是啊,我们使用第三方,你可以,你可以拥有,我不我们使用第三方,所以我可以加上,是啊,是啊,所以在麻省理工学院,有一个叫KO的东西,是关于将人类用作实验对象的委员会,他们是我们的官方IRB,以前都是纸。
现在有一种电子方式,你可以申请奎的协议,这是一份相当长的文件,你在其中描述了实验的目的,你要做什么,你打算招募什么样的人,你打算用什么招聘材料?您将如何处理数据,你们有什么安全措施,当然啦。
如果你在做像给人注射毒素这样的事情,那就更严重了,你必须描述关于,为什么你认为这是安全的等等,这基本上是在三个级别中的一个进行审查,有豁免审查,那就是你不能免除自己,但他们可以豁免你,他们会说。
这是一个风险最小的问题,假设你正在用模拟数据做一项仅有数据的研究,你做过城市训练,你已经签署了数据使用协议,你应该得到IRB的许可,教室里的学生有一个例外,在这种情况下,我有责任而不是让你负责。
但如果你搞砸了,我有责任,嗯,呃,第二层是,嗯,呃,啊嗯,快速批准,这是一种低风险的批准,通常只研究数据,但它可能涉及到像嗯这样的事情,使用有限的数据集,比如说,如果你想研究疾病的地理分布。
那么你显然需要比三位数邮政编码更好的地理标识符,或者如果你像马克所说的那样试图研究一个时间序列,你需要实际的日期,所以你可以得到批准使用这种数据,然后是完整的回顾,这需要更长的时间,他们做的地方。
实际上带人来评估,到目前为止你所提议做的事情的安全性,我的经验是,我们所做的研究,代表了我们在课堂上学习的材料,我们不必进入第三类,因为我们实际上没有做任何可能伤害单个病人的事情。
除了在声誉或面向数据的意义上,这不需要全面的审查,这就是当地的情况,哦耶,谢谢。是啊,是啊,是啊,是啊,我想我误解了这个问题的全部内容,嗯是的,这和我们的事情大致相同,艾迪·戈尔登是我们的研究项目经理。
3。办公室里我最喜欢的人是谁?她把这种东西放在一切上面,并确保合适的人被列入研究名单,人们不再喜欢那种东西,但和IRB之类的关系很好,因为有人不熟悉高水平的敏捷软件开发实践,它只是更并行。
你必须更频繁地,是啊,是啊,是啊,是啊,我不知道我是不是把幻灯片拿出来了,但有些地方,你知道的,亚马逊将每年部署5000万次更新,或者类似的东西,所以它一直在更新频率上,而不是,是啊,是啊。
就像把一切都建立起来然后把它扔掉一样,这只是软件的一个新发展,我们能问这个问题吗,是啊,是啊,你能告诉我们更多关于电子实验室的信息吗,我只是我不能完全理解,你们更像是,就像,所有这些工具公司。
还是更像是游说之类的事情,然后就像,我问这个的原因也是因为我想知道你对,就像第三方来源一样,嗯,一种决定,不管这些事情是好是坏,那种东西,因为食品和药物管理局似乎会理解它。
所以如果你有一些有机认证的东西,那是一个有用的解决办法吗,或者哪里出了问题,是啊,是啊,那么我们用讲座建立的是什么,实际上是连接技术的药房,所以更像今天的方式,药房里有各种药物的处方。
这实际上就像一个数字药房,就像一本凯利蓝皮书,里面有所有不同的工具,然后我们为他们每个人建立一个标签,基于尽可能多的客观数据,这样我们就不会得分了,事情是好是坏,因为在大多数情况下,事情没有好坏之分。
绝对,它们的好坏是有目的的,所以你可以想象一些,也许你需要非常高的准确性,所以你需要知道,该工具是否在某些情况下得到验证和验证,在某些患者群体中,你知道工具是否准确,如果你要一直给它充电。
或者你不能在淋浴时穿它,你不会有可用性,或者API真的很难使用,然后是安全配置文件,他们是否有协调披露,他们是如何处理事情的,就像工具公司一样,嗯,一种软件,材料清单,以及使用什么样的软件。
然后即使工具是准确的,即使它相对可用,即使它是安全的,这并不能解决剑桥分析的问题,那么工具做得怎么样,第三方转让,所以我们的哲学之一是,我们不得分,但我们正在构建数据集,所以当你评估某个工具时。
你这就像营养标签,就像有时你需要更多的糖,有时你需要更多的蛋白质,也许你需要更多的安全措施,也许你真的需要考虑数据权限,也许你可以在一些准确性水平上休息一下,所以我们正在建立这种能力,评估工具。
然后像这样部署它们,药房部署它们的方式,我想和团队一起做的一件事,如果你们都愿意,出于公民义务,我是认真的,尽管我投票很重要,把你的意见提交给公众登记册是非常重要的,我读了你所有的评论。
因为艾琳发给了我,他们很好,我知道来这里的人可能想喜欢波兰语,一切,让他们完美,你可以准确地提交它们,我非常希望,我们有95%的人提交,你们中的5%不喜欢你的互联网坏了什么的,嗯,你今晚可以提交。
我会给艾琳发电子邮件,因为你已经完成了这项工作,你可以提交它,但我想听听你的一些想法,所以我要做的是用同样的框架,你会留着什么,你会改变什么,然后改变也可以包括在那里如此令人困惑的事情。
就像它甚至没有真正的意义,部分混乱可能是在,你知道的,有些规定令人困惑,但令人困惑的是这份文件的一部分不是由,有些人有技术背景,有些没有,所以有时有些语言可能实际上并没有被使用,以今天工业使用的方式。
所以提炼语言,然后你看到了什么,所以我们要做的是,然后像开始或者加,在我问你之前,我想让你认真地看着你旁边的人,如果你们有三个人,那很好,我想让你告诉他们你什么时候提交评论,是明天晚上吗?或者你选择不。
就看着他们说话,会有一个链接,我会把所有的链接发给你,我会让这变得很容易,所有的权利,谁想开始,我们在黑板上有三件事,所以有一件事我不知道这是否令人困惑,或者只是一个,你知道我们故意。
但是对于质量体系和机器学习实践,或者谁制定了这些标准,以及如何适应或改变它们,嗯嗯,我也不知道答案,所以我想让你提交一个很好的东西,那就是你必须回应,是啊,是啊,我想这也有点令人困惑,甚至语言。
所以人们用不同的东西,所以就像,好人称之为GXP,良好制造规范,良好的临床实践,这些都得到了维护,我想在某些情况下,不同的机构,我想知道好的算法练习差距,还是好的,嗯,机器学习实践,比如谁,是啊,是啊。
那是件好事,那么谁拥有,gxp,你没有问题,否,是呀,我想要一个我觉得很有用的东西,钥匙,嗯,是附录中的例子,嗯,我不知道,建筑本身更像是,广义,所以这些例子对,比如什么是分析的具体情况,像这样,是的。
例子很有帮助,是的,你知道,细节,我想的是透明度,他们本可以更具体,好像是,我们一般应该遵守指导方针,与之相反的是进入这个算法的精确数据集,到底从里面出来了什么,正是这样的事情帮助人们,而不是你知道的。
不透明有很多诱因,所以如果这些不是那么具体,我不会在那里读那么多,我想到的模拟有点像,当Facebook问我你的数据时,他们会说,以下是我们需要的东西,或者我们正在使用它是非常明确的,然后你可以选择。
就像,不管你是否真的想那样,好的,你见过类似的东西,所以它的一部分就像透明度,也喜欢用户选择,和在数据选择方面,或者我认为这对我来说更像是一种模拟,因为医疗环境中的选择更多的是莱科斯,是呀。
某人在这种情况下没有能力或知识来做出选择,是啊,是啊,我想至少说这个算法使用了这个,你知道的,也许是某种选择,所以你可以和某人一起工作,也许有一些参数关于你什么时候会或不会有,是呀,哦。
我想补充的另一件事是关于偏见,因为我知道对于很多其他行业来说,就像包含在里面,像法律制度,然后也在,所以我认为按人口分类,我不知道我睡得够不够,所以如果我举这个例子。
但是我的一个朋友上周打电话给我要PPGS,所以这些是背面的传感器,她在问我,如果它对所有肤色都有效,以及它的反应是否不同,如果它的反应不同,不管某人是否有纹身,因此,对于一些正在做的大型注册机构来说。
自带设备数据,您可能会在数据集中产生意想不到的偏差,只是因为它是如何处理的,所以是的,你觉得怎么样,你怎么,有什么方法,我是说,我想艾琳和其中一些人合作过,怎么会,你怎么想某件事是不是,对于机构来说。
围绕偏见考虑什么是一个好的系统,我想也许考虑一下可能是GMLP的一部分,但我认为设计师有责任,然后我知道我,必须知道公平是我们的下一课,所以任何可能感到困惑或想更多地谈论它的人,我们下次会有很多素材。
加上另一个地方,所以看起来有一段时间向食品和药物管理局提供定期报告,关于更新,一切也可能有,有点像亚种群偏见的记分卡,你见过做这种事的地方吗?我记得当我从凯茜那里读到那次毁灭的时候,她提到了某种公平。
但我真的不记得了,当你提交你的评论时,如果你有想法或链接,也可以是帖子或博客,什么的,就像把它们连接在一起一样,因为你会发现一件事,你知道,我们我们读了很多东西,可能推特上也有同样的事情。
但其他群体不一定看到所有这些,所以我认为凯西·奥尼尔真的很有趣,但是是的,就像标签一样,它不必被惊人地格式化,我关注的一些社区,不是在推特上,但是在电子邮件和网络上。
有很多关于医院信息系统糟糕设计的讨论,以及这些是如何导致错误的,我从你的幻灯片上知道,安迪,食品和药物管理局已经定义了这些不在其职权范围内,但在我看来,此刻可能有。
鼓励真正不良行为的信息系统造成了更多的伤害,或者允许不良实践,你知道的,视网膜病变,AI犯错误的机器学习技术,所以就在今天早上,比如说,有人发布了一条关于一个心率为12000的病人的消息,是啊,是啊。
问题是,当您开始自动化流程时,基于这些系统中收集的信息,当你得到垃圾数据时,事情可能会变得非常糟糕,是啊,是啊,你有没有,你用你的系统想过,我们不能得到好的数据,我是说你不会从这些系统中得到好的数据。
你所看到的是全面的,你对此无能为力,除了验证良好的范围,然后从那里开始,我能想到要做的事情,比如说,如果FDA有兴趣监管此类设备,很抱歉,这样的工具,嗯,他们会调节设备。
食品和药物管理局有趣的事情之一是,我应该提到,这是FDA不规范医学实践,所以医生可以为所欲为,他们调节得很好,我是说你应该抬头看,我的理解是,他们规范营销,嗯,制造商会这样做。
我真的想知道Ehrs是否会被认为是医学实践,或者是EHR公司的营销,也许这就是为什么它可能在权限范围内,是啊,是啊,是啊,是啊,那是耶,我想我很惊讶没有看到的事情,关于隐私问题,我知道。
有一些方法可以训练机器学习模型并提取数据信息,它被训练在,至少存在的创作,这不是我的专长,我在学类似的东西,有人试图提取,你能经常谈论这个吗,你是狗的,我不记得了,现实地。
你们中有多少人认为你们会真正提交评论,一对夫妇,所以如果你,如果你认为你不会提交评论,只是出于好奇,我不跟你争,我只是好奇,什么会阻止你提交评论,你现在没有举手,我很冷,打电话给你,是呀,哈里森。
我们正在谈论,我是说,我们大多数人现在都开着电脑,你真的想让我们提交它,你可以把它挂起来,好的,好的,好的,哇哦,所有的权利,嗯,我来看看,所以当安迪在查的时候,我应该说,当HIPAA规定。
隐私条例是最早提出的,最初的版本得到了七万条公众评论,那样的话,是卫生和公众服务部,必须根据法律对每一个做出回应,所以他们出版了,你知道,关于回应所有这些请求的大量文件,所以他们会认真对待你的评论。
因为他们必须,有没有办法匿名评论,还是一定要从你的屁股里绑在我们身上,我不知道,我想一般情况下,我想是的,我不知道,我得再看一遍,我想大部分都是公众评论,我是说我想如果你想,也许你可以协调你的评论。
你可以你会吗,是啊,是啊,好的,艾琳愿意集体评论,所以你也可以发送,如果你想那样做,它可以像一组类评论,如果你愿意,大写的M I T所有小写的爱FDA会把你送到,我很惊讶那一点还没有被拿走。
扎尔在工作中睡着了,你们还有什么问题,是呀,那么两者之间的线是什么,就像EHR和理智,因为上面说人力资源是豁免的,但它也说,哦,例如,沙子可以是,你知道,收集生理信号。
然后他们可能会发出声音警报来指示原始临床工作,我的理解是有些人会这么做,因此,它们需要追溯批准,部分你的鲑鱼统一了,或者是的,所以我不是一个监管者,所以你应该问问你的监管者,一些资源可以帮助你决定。
这又是,是关于你所声称的,产品有,也许不是它实际上做的,嗯,接下来的事情,我不认为,我是说,我想如果它真的这样做,你应该喜欢,也声称它做了它所做的,尤其是当人们感到困惑的时候,有几条规定可能会有帮助。
一种叫做临床决策支持,如果你读到任何FDA的东西,他们喜欢他们的算法,我是说他们喜欢他们喜欢他们的算法,但他们也喜欢他们的首字母缩写,所以临床决策支持,cds,然后是病人的决策支持。
有一个关于两种类型的决策支持工具的指南刚刚发布,我想这可能是支持一个决定,那个EHR,所以它实际上可能被认为是受监管的东西,也有很多奇怪的,我们没有深入讨论,但在许多情况下。
某些东西实际上可能是一个设备,FDA说这是一种设备,但它会做一些叫做执行自由裁量权的事情,上面说这是一个设备,但我们不会这样监管它,这对制造商来说实际上有点风险,因为你是一个装置。
但你现在可以直接去市场了,在某些情况下,您仍然必须注册并列出产品,但你不必一定要接受审查,它最终也可能被审查,所以这一行是一个设备是一个设备,你必须注册,它是一个你必须得到批准或批准的设备吗。
这就是为什么你应该早点而且经常,我喜欢你和苹果的游戏,我对此有一个问题,我知道你也不是苹果,但你认为为什么苹果选择了一些没有,我有动机和公司去做,会说,嗯,在公开文件中。
Fitbit表示有兴趣与美国食品和药物管理局合作,我不知道他们在什么时候决定了他们提交的东西或他们的包裹,他们也在与保护计划合作,我想我不知道幕后发生了什么,是啊,是啊,它给商业带来了商业气息吗。
也许是为了得到,我想说,一般来说,人们希望使用值得信赖的工具,开发更多有证据的工具是一件非常重要的事情,我认为食品和药物管理局是获得证据的一种方式,我认为还有其他方法可以终结设备继续建立证据。
我希望随着时间的推移,我们认为是健康的许多事情,工具周围也有证据,比如,也许在某些情况下,我们并不总是调节维生素,但就像你仍然想相信,你的维他命里没有像锯末一样的东西,对吧,它就像一个真正的产品。
所以我认为我们越是推动公司有证据,我们使用这样做的产品,我希望随着时间的推移,这对我们有帮助,把它归类为食品和药物管理局的设备会给他们任何法律保护吗,我不太确定,和,历史上,它帮助偿还了。
所以二级产品更容易报销,这也在普遍改变,但这有助于围绕,我非常感谢你们两位,那真的很有趣,我鼓励你们所有人通过提交你们的意见来参与这个监管过程,我很喜欢这些演示文稿,谢谢。谢谢。
P23:23.Fairness - 大佬的迷弟的粉丝 - BV1oa411c7eD
所以一年多前,我接到一个电话,来自这个委员会的NASM是国家科学院,工程与医学,所以这是一个庄严的老人的身体,有很多花白的头发,他们做了足够重要的事情,被选入这些学院。
他们的研究机构被称为国家研究委员会,有一堆不同的委员会,其中之一是科学委员会,技术与法律,这是一个非常有趣的委员会,它由大卫·巴尔的摩主持,他曾经是麻省理工学院的教授,直到他成为加州理工学院的校长。
他口袋里碰巧也有诺贝尔奖,你知道他是个很有名的人,是U的成员,s,哥伦比亚特区巡回上诉法院,所以这可能是最重要的巡回法院,比最高法院低一级,他碰巧坐在鲁斯·巴德·金斯伯格占据的座位上。
在她被提升到最高法院之前,从上诉法院,所以这是一件大事,所以这些都是重击手,来谈谈我在这里列出的一组主题,所以区块链和分销商,信任,人工智能与决策,这显然是我被邀请谈论隐私和知情同意的部分。
在大数据时代,法学院科学课程,新出现的科学问题,技术与法律,利用诉讼针对科学家的问题,有你不喜欢的观点的人,你如何交流的更普遍的问题,对持怀疑态度的公众来说,生命科学的进步。
所以这是处理时代的反科学基调,所以我们这组讨论人工智能和决策的人,我对焦点有点惊讶,因为汉克·格里利是斯坦福大学的法学院教授,他做了很多工作。
Charisse Birdie在一个叫做审前司法研究所的地方,她的问题是法律问题,那就是现在有很多公司有软件可以预测,如果你在等待审判期间获得保释,你有可能不保释吗。
所以这对法官决定多少保释金是有影响的,以及是否让你保释,或者把你关在监狱里等待审判,matt lundgren是斯坦福大学的放射学教授,并在构建卷积方面做了一些非常酷的工作,神经网络模型检测肺。
embi,E和其他各种东西,成像数据,你知道的,下一个家伙和苏雷什·曼·文卡塔·苏布拉马尼安作为教授,他最初是犹他大学的理论家,但也开始思考隐私和公平,这就是我们的小组,我们每个人都做了简短的谈话。
然后进行了非常有趣的讨论,我非常惊讶的一件事,有人提出了不应该taal的问题吗,作为巡回法官,上诉法院,聘请像你们这样的人在他的法庭上做书记员,所以像你们这样的人,他们也碰巧在法学院上学。
其中现在有许多人接受过,计算方法和机器学习,但也有法律背景,他对我说了一些很有趣的话,他说不行,他不希望那样的人,这让我有点震惊,所以我们问了他们一点为什么,他说好,因为他认为法官的角色,不是专家。
但作为一名法官,平衡问题双方的论点,他担心如果他有一个有很强技术背景的职员,那个人会有很强的技术意见,这会使他的决定产生这样或那样的偏见,所以这提醒了我,我妻子是个律师,我记得她在法学院的时候。
她会告诉我她正在上的课,很明显,学习法律就是学习如何获胜,不学习如何找到真相,法律中有一个哲学概念,它说真相会从问题双方的激烈争论中出来,但作为一名律师,你的职责是尽你所能努力辩论,支持你的论点。
事实上,在法学院,他们教他们,在辩论中,你应该能够站在任何案件的任何一方,并能够为它提出令人信服的论点,所以Tadel在他所说的中强化了这个概念,我觉得很有趣,嗯,只是想谈谈司法领域。
因为这是最受公众关注的一个,决策自动化,用于确定各种服务的资格,评估在何处部署卫生检查员和执法人员,划定选区界线,所以你听到的所有关于不公正选区划分的讨论都是关于使用计算机的,实际上是机器学习技术。
试图找出如何,你知道的,这取决于谁负责重新划分选区,然后你定制这些不公正的地区,为了最大限度地提高你获得多数的可能性,人们赞成这些想法,在某种程度上,它们为保释注入了清晰度和精确度,假释和判刑决定。
算法技术可以最大限度地减少人类判断的产物,所以我们知道人们实际上是有偏见的,所以法官有偏见,以及参与法律体系决策的陪审团,所以通过将其正式化,你可能会赢,然而,反过来说,利用技术确定谁的自由被剥夺。
以及根据什么条件引起对透明度和可解释性的重大关切,下周我们将讨论透明度和可解释性,但今天的比赛是关于公平的,嗯,这里有一篇去年十月的文章,去年9月说到今年10月,如果你在加州被捕,你是否获得保释的决定。
将由计算机算法制作,不是被人,不是百分之百,这位县官员有一定的酌处权,谁来推荐,法官最终决定,但我怀疑在这样做有一些令人震惊的结果之前,它可能会很常用,现在对这些保释算法的批评是基于许多不同的因素。
一个是,例如,如果你是两个一模一样的人,但你们中的一个碰巧是白人,你们中的一个碰巧是黑人,你被保释的机会要低得多,如果你是黑人比如果你是白人,现在你说好,如果我们是通过算法学习这个,这怎么可能呢,嗯。
这是一个复杂的反馈回路,因为算法是从历史数据中学习的,如果历史上法官不太可能允许非裔美国人保释,比对一个高加索美国人,那么算法就会知道这是正确的做法,并将很好地结合这种偏见。
然后是第二个我认为非常可怕的问题,在这个特定的领域,这些算法是由私人公司私人开发的,它不会告诉你他们的算法是什么,你可以付钱给他们,他们会告诉你答案,但他们不会告诉你他们是如何计算的。
他们不会告诉你他们用什么数据来训练算法,所以它真的是一个黑匣子,所以你不知道盒子里发生了什么,除了看它的决定,嗯,所以。
数据收集系统的缺陷与司法系统本身的缺陷相同,所以不仅有算法来决定你是否能获得保释,也就是,毕竟,在你的审判到来之前,这是一个相对暂时的问题,虽然那可能是很长的时间,但也有算法对量刑等问题提出建议。
所以他们说,这个病人是惯犯的可能性有多大,当他们出狱的时候,他们又要冒犯了,因此,他们应该被判更长的监禁,因为你想让他们远离街道,这是一个关于威斯康星州一个特定的人的特殊故事,令人震惊的是。
州最高法院做出了不利于这家伙的裁决,说对算法输出的了解是足够的透明度,为了不侵犯他的权利,我想很多人认为这是一个令人愤慨的决定。
我肯定会上诉的,而且有可能被推翻,反过来说,我一直在做,你知道的,一方面算法可以帮助人们远离监狱,所以不久前有一篇有线文章,我们可以用算法来分析人们的案件,然后说,哦,这个人看起来真的需要精神治疗。
而不是需要坐牢,所以也许我们可以把他从,从刑罚系统转入精神病治疗,让他远离监狱,让他得到帮助等等,所以这是能够使用这些算法的积极一面。
现在不仅仅是犯罪,也有很长时间的讨论,你可以在网上找到这个,比如说,算法能比人类雇佣得更好吗,所以如果你是一家大公司,你有很多人你想雇佣他们做各种工作,很容易说,嘿,我做了很多很多的招聘决定。
我们有一些结果数据,我知道,哪些人被证明是好员工,哪些人被证明是糟糕的员工,因此我们可以,关于使用这种算法,并将其用于申请工作的人,然后说,好的,这些是我们要采访的人,可能更高。
因为他们看起来是更好的赌注,现在我得告诉你一个个人故事,当我在加州理工学院读本科的时候,加州理工学院的教职员工决定他们想让所有教职员工委员会的学生成员,所以我很幸运,我服役了三年。
作为加州理工学院本科招生委员会的成员,在那些日子里加州理工学院只花了大约二十二万,每年有230名学生,这是一所很小的学校,我们会在全国各地飞行,并面试申请人池中所有申请人的前一半。
所以我们不仅会和学生交谈,也对他们的老师和辅导员,看看当时的环境是什么样的,我想我们很清楚一个学生可能会有多好,基于此,所以是的,录取决定做出后的一天,其中一位教授,就像一个思想实验说的。
我们应该这样做,我们应该把二百三十人,我们刚刚提供了入场券,我们应该把他们都拒之门外把接下来的二百三十人,然后看看老师们是否注意到了因为现在似乎是一个相当平坦的分布,当然。
我和其他人认为这是不公平和不道德的,而且会是,你知道的,浪费了我们挑选这些人的所有时间,所以我们没有那样做,但后来天空熄灭了,他看了我们关于人们排名等级的数据,SAT平均成绩,他们推荐的勾号。
关于他们是真正非凡的还是仅仅杰出的信件,他建立了一个逻辑回归模型,否,这是一个线性回归模型,预测这个人大二的平均成绩,这似乎是一件合理的事情,他得到了一个相当好的适合,但令人不安的是,在加州理工学院。
学生人数,呃,原来你的测试版,好的,所以如果你的英语在sat考得特别好,作为加州理工学院的大二学生,你可能会做得更糟,如果你做得不好,所以我们想了很多,但当然,我们认为那真的很不公平,惩罚某人擅长某事。
尤其是当学校有这样的哲学取向说,我们应该寻找受过广泛教育的人。所以这只是一个例子,嗯,和更多的科学星期五有一个很好的节目,你可以听关于这个问题,所以我问你,你说公平是什么意思,你知道。
如果我们要定义这个概念,什么是公平的,您希望算法具有哪些特性,为了某种特定的目的而评判你吗,是啊,是啊,无法确定,至少在我看来,一个具体的定义,但因为预审成功了,比如说,我想我的意思是。
不同人群的错误率相似,你可能关心的协方差,比如说,良好的开端,好的,所以说,相似,错误率绝对是人们谈论公平的标准之一,稍后你会看到艾琳,艾琳在哪,就在那里,艾琳是公平概念的大师,是啊,是啊。
当模型说某种因果关系不应该是真的观察时,我希望社会是什么样子,我不知道如何用一个简短的短语来描述这一点,但这很棘手,对呀,我是说,假设我希望是这样,不同种族的罪犯应该有同样的权利。
这似乎是一个公平的好目标,我如何做到这一点,我是说,我可以假装一切都一样,但客观上今天不一样了,数据不支持这一点,所以这是个问题,是啊,是啊,相似的人应该受到相似的对待,在独立于敏感属性的情况下,化妆。
我知道,这是另一个,这是另一种典型的公平观念,这给距离函数带来了很大的压力,两个人在哪些方面相似?哪些特征你显然不想使用,敏感特性,禁止的特征以确定相似性,因为那样人们就会以你不想要的方式不同。
但是定义这个函数是一个挑战,所有的权利,嗯,让我向你展示一个更技术性的方法来思考这个问题,所以我们都知道像选择偏见这样的偏见,采样偏差,报告偏差,等等,这些是传统意义上的偏见。
但我会给你看一个我参与的例子,HSD学生,他开始研究遗传学的问题,以确定某人是否有心脏疾病的风险,用于心肌病,肥厚型心肌病,这是一个很大的词,这意味着你的心脏变得太大变得有点松弛,它开始停止抽水。
最终你会在相对年轻的时候死于这种疾病如果你真的患有这种疾病,一项主要针对欧洲人的研究,他们发现许多患有这种疾病的人都有某种基因变异,他们说这一定是这种疾病的原因,因此,如果你有这种基因变异。
这就成为了公认的智慧,人们会劝你不要打算长寿,你知道这有各种各样的后果,想象一下,如果你想要个孩子,当你四十出头的时候,你的预期寿命是五岁,当你有一个十几岁的孩子时,你想死吗,你留给你的配偶。
所以这是人们必须做出的一系列重要决定,现在发生的事情是,在美国,有这样的测试,但问题是,很多非洲人和非洲人,美国人经常有这种基因变异,却没有患上这种可怕的疾病,但他们都被告知他们基本上要死了。
只是在多年后,当人们注意到这些本应在基因上死亡的人,他们说不会死,嗯哼,也许我们误解了什么,他们误解的是用来开发模型的人口,A是欧洲血统的人口,而不是非洲血统的人口,所以你走得很好,我们一定吸取了教训。
所以这篇论文发表于二十六年,这是这个地区的第一个,这是三周前发表在《自然》杂志上的一篇论文,科学报告说,嗯哼,欧洲血统人群中发现的遗传风险因素,不能提高骨质疏松的预测,中国人群骨折与骨密度。
所以这是同样的故事,完全一样的故事,不同疾病,后果可能不那么可怕,因为被告知你老了会骨折,并不像被告知你的心脏要停止工作那么糟糕,当你五十多岁的时候,但我们有了,所以从技术上来说,偏见是从哪里来的,嗯。
我提到了标准来源,但这里有一个有趣的分析,这来自几年前的康斯坦丁·阿尔费里斯,二千零六,他说,嗯,你看,在一个完美的世界里,如果我给你一个数据集,有一个不可数的,无限多的模型可能解释数据中的关系,好的。
我无法列举出无数的模型,所以我要做的是,选择一些模型家族来尝试适合,然后我要用一些试衣技巧,像随机的,梯度,血统,或者一些可能会找到全局最优的东西,但也许不是,也许它会找到一个局部最优。
如果你把o算作所有可能的模型族中的最优可能模型,如果你把我算作最好的模特,这是可以通过特定的学习机制学习的,你调用,你称之为学过的实际模型,那么偏差基本上是o-l,因此。
与目标模型相关的学习方法存在局限性,方差是l减去a,错误是由于你学习事物的特定方式造成的,比如取样等等,好的,你可以通过排列数据来估计不同模型之间差异的重要性,从本质上随机化关系和数据。
然后你会得到这些模型的性能曲线,如果你在95%的置信区间之外,然后你有一个p等于零5,这个模型不是随机的结果,好的,这是典型的处理方式,现在你可能会说,但是,难道不是歧视吗?我们做机器学习的原因。
法律意义上的歧视,而是区分不同人口意义上的歧视,所以你可以说好,是呀,但是区分的一些基础是合理的,一些区分的依据是不合理的,我们为社会目标决定,我们希望它们无关紧要,我们不会考虑他们。
所以从研究了一段时间的人那里得到的一个教训是,歧视是特定领域的,所以你不能定义歧视意味着什么的普遍概念,因为它与这些问题密切相关,实际上是什么,在你所做的决定中,道德上是无关紧要的。
所以在刑法中会有所不同,比在医学上,比在招聘方面,比在其他各个领域,大学录取,比如说,而且它的功能也是特定的,所以你必须考虑到各个特征,从历史上看,政府试图规范这些领域,因此。
信贷受到《平等信贷机会法》的监管,《民权法》规定的就业,公平住房法规定的住房,《民权法》规定的公共住宿,最近,婚姻由《婚姻保护法》原规定,你可以从它的标题中看出,反对人们可以结婚。
他们不是他们想捍卫的传统婚姻,但大约六年前被最高法院驳回,具有歧视性,如果你回头看,这很有趣,可能在你们1967年出生之前直到1967年,对一个非洲人来说是非法的,美国人和白人结婚,在弗吉尼亚。
如果你去领结婚证,这实际上是非法的,你被拒绝了,如果你在州外结婚回来,你可能会被逮捕,这件事发生得很晚,特雷弗·诺亚,如果你在每日秀认识他,写了一本书叫《天生犯罪》,我觉得,他父亲是瑞士白人。
他的母亲是南非黑人,所以他在种族隔离法律下的存在是非法的,他不得不假装他的母亲是他的看护人,而不是他的母亲,以便能够在公共场合出去,否则他们会被逮捕,所以这个最近,当然啦,也消失了。
但这些是一些监管问题,所以这里有一些法律承认的受保护的阶级,种族,颜色,性,宗教,国籍,公民身份,年龄,怀孕,家庭状况,残疾,退伍军人身份,和,最近,某些司法管辖区的性取向,但不是全国各地。
关于歧视有两种法律学说。其中一个谈到了不同的待遇,这和这个有点关系,另一个谈论不同的影响,并说不管机制是什么,如果不同种族群体的结果有很大不同,典型或性别群体,那么就有初步证据表明有什么不对的地方。
有某种歧视,嗯,现在的问题是你如何为自己辩护,反对,比如说,当你说的时候,一个完全不同的影响论点,为了成为一个不同的影响,这是非法的,它必须是不合理的或可以避免的,例如,假设我在雇人去爬五十层的大楼。
正在建设中,你申请,但事实证明你有健康状况,你有时会头晕,我可能会说你知道吗,我不想雇用你,因为,我不要你,从一栋在建大楼的五十层扑通一声摔下来,这可能是一个合理的辩护,如果我起诉你,说嘿,你在歧视我。
基于这种医疗残疾,一个完美的防御是,是啊,是啊,这是真的,但这与工作有关,所以这是处理它的一种方法,现在你如何很好地证明不同的影响,法院已经决定你需要能够证明大约20%的差异,为了称之为不同的影响。
所以问题是,当然啦,就是,我们能改变招聘政策吗,或者我们为了实现同样的目标而使用的任何政策,但少了一个,影响的差异,所以这就是挑战,现在,有趣的是,不同的待遇和不同的影响真的是相互冲突的。
你会发现这在这个领域的几乎所有事情上都是正确的,所以不同的影响是关于分配正义,尽量减少结果的不平等,不同的待遇是关于程序的公平和机会的平等,那些并不总是吻合的,换句话说。
很可能机会平等仍然会导致结果的差异,你不能轻易地把那个圆平方,嗯,有很多歧视一直存在,文献中有大量的证据,其中一个问题是,比如说,像这样的问题,不同的种族或不同的民族,事实证明。
我们没有一个很好的平衡集,欧洲人的数量,血统等于非洲人的人数,美国人,或者西班牙裔,或者亚洲人,或者你选择的任何人口血统,因此,我们对多数阶级的了解往往比对少数阶级的了解要多得多,只是额外的数据。
这些额外的知识可能意味着我们能够降低错误率,仅仅因为我们有更大的样本量,好的,所以如果你想把这个正式化,这是莫里茨·哈特教程的一部分,这是大约一年半前在KDD给出的,我觉得,莫里茨是伯克利的教授。
所以这里有很多材料,所以他这样把问题形式化,他说,看一个决策问题,我们的一个模特,在我们的条件下,我们有一些X,这是我们所知道的个人特征集,我们有一些,它是受保护的特征集,就像你的种族,或者你的性别。
或者你的年龄,或者我们试图防止歧视的任何东西,然后我们有一个分类器或一些分数或预测函数,在任何一种情况下,这都是x和a的函数,然后我们有一些Y,这是我们有兴趣预测的结果。
所以现在你可以开始区分一些不同的公平概念,通过观察这些元素之间的关系,所以文献中出现了三个标准,其中之一是评分功能独立于敏感属性的概念,所以这表明r独立于,换句话说,记得上一张幻灯片上。
我说r是r的函数,作为x和a的函数,所以很明显,这个标准说它不可能是,空函数,另一个概念是分数的分离和给定结果的敏感属性,所以这是一个说不同的群体将受到类似的待遇,换句话说,如果我告诉你小组的结果。
你知道的,工作表现好的人和工作表现差的人,则评分函数独立于受保护的属性权,这样就有了更多的回旋余地,因为它说受保护的属性仍然可以预测结果,只是你不能在评分功能中使用它,给定个人属于哪个结果类别。
然后充足是相反的,它说给定评分功能,结果独立于受保护属性,所以说,我们能不能建立一个公平的评分函数,将结果与受保护的属性分开,所以这里有一些关于这些的细节,如果你看独立,这也被称为各种其他名称。
基本上它说的是一个特定结果的概率是相等的,一个是一样的,不管你在上课,受保护属性中的A或类B,好的,那么这告诉了你什么,它告诉你评分功能必须在整个数据集上是通用的,而且不能区分A类和B类的人。
那是个很强的要求,然后你可以操作不公平的概念,要么通过寻找这些概率之间的绝对差异,如果它大于某个ε,那么你就有证据表明这不是一个公平的评分函数,或者比率测试说我们看比率,如果它与一个显著的不同。
那么你就有证据表明这是一个不公平的评分函数,顺便说一句,这与四五规则有关,因为如果你让Epsilon占20%,那就和四五法则一样了,现在的问题是,这种独立的概念有问题。
所以它只需要同等比例的决定来雇佣或给某人一个肝脏,为了移植,或者你感兴趣的任何话题,如果招聘是基于一个好的评分组A,但是在b中是随机的所以,比如说,如果我们对A组的了解比对B组的了解多得多呢。
所以我们有一个比B组更好的得分方法,所以你可能会遇到这样的情况,你最终雇佣了同样数量的人,两组人中的相同比例,但在一组中,你在挑选好的候选人方面做得很好,在另一组中,你基本上是随机做的。
A组的结果可能比B组更好,这意味着你正在为未来开发更多的数据,这表明我们真的应该雇佣A组的人,因为他们有更好的结果,所以有一个反馈循环,或者,当然也可能是恶意造成的,所以你知道。
我可以作为招聘经理来决定,我没有雇佣足够的非裔美国人,所以我要随机抽取一些非裔美国人,雇佣他们,然后也许他们会做得很糟糕,然后我会有更多的数据来证明这是个坏主意,好的,所以那是恶意的,嗯。
还有一个技术问题,这是有可能的类别,该小组是结果的完美预测者,在这种情况下,他们当然不能分开,他们不能相互独立,现在,你如何实现独立,嗯,有许多不同的技术,其中一个,也就是X和A的某种组合。
你通过最大化x和z之间的互信息来做到这一点,通过最小化a和z之间的互信息,这是我在机器学习中看到的一个想法,为了健壮性而不是公平,人们说你知道问题在于给定一个特定的数据集,您可以过度适应该数据集。
所以其中一个想法是做一个类似甘的方法,你说我想训练我的分类器,让我们说,不仅要很好地得到正确的答案,但也要尽可能地努力识别哪一部分数据集,我的例子来自,所以这是同样的想法,这是一种表征学习的思想。
然后根据这个表示建立预测器R,这可能不是完全独立于受保护的属性,但它尽可能独立,通常这些学习算法中有旋钮,取决于你如何转动旋钮,你可以影响哪个效果,你是否会得到一个更好的分类器,那更有歧视性。
或者更糟糕的分类器,它的歧视性较小,所以你可以这么做,在预处理中,你可以在损失函数中做某种合并,依赖概念或独立概念,说我们要在一个特定的数据集上训练,强加这种想要A和R之间独立的概念。
作为我们愿望的一部分,所以你又一次在与其他特征进行权衡,也可以做后期处理,所以假设我建立了一个最优R,不担心歧视,然后我可以做另一个学习问题,我现在要建立一个新的F,它考虑了r和受保护的属性。
它将最大限度地减少错误分类的成本,还有一个旋钮,你可以说,我想在多大程度上强调错误分类,对于受保护的属性,所以这仍然是在谈论独立,下一个概念是分离,它说,考虑到结果,我想把A和R分开。
以便图形模型向您显示,受保护的属性仅通过结果与评分功能相关,所以你不能从一个学到另一个,除了通过结果,因此,这承认受保护的属性可能,事实上与目标变量相关,所以一个例子可能是不同种族的药物试验成功率不同。
在哪里,制造商已经确定这种药物在某些亚人群中效果更好,比其他人群,FDA实际上已经批准向这些亚人群销售这种药物,所以你不应该向人们推销它,它对谁不起作用,但你可以专门为那些它确实有效的人推销它。
如果你想想我们之前谈到的个性化医疗的想法,我们感兴趣的种群变得越来越小,直到可能只有你,所以可能有一种药物对你有效,不是为了班上的其他人,但这正是适合你的药,我们可能会达到这样的地步。
在那里我们可以制造这样的药物,在那里我们可以批准它们在人类中的使用,这里的想法是,如果我有两个种群,蓝色和绿色,我画了这两个种群的ROC曲线,他们不会一样的,因为这种药物对这两个人群的作用不同。
但另一方面,我可以把它们画在同一个轴上,我可以说看这个有色区域的任何地方都可以是一个公平的区域,因为我将对两个人群得到相同的结果,所以我不能为蓝色人群实现这个结果,或者绿色人口的这一结果。
但我可以同时为两个人群实现这些结果中的任何一个,所以这是满足这个要求的一种方法,当它不容易满足的时候,所以分离相对于独立的优势在于它允许r和y之间的相关性,即使是完美的预测器。
所以Y R可能是Y的完美预测,它激励你学会减少所有组的错误,所以关于随机选择少数群体成员的问题在这里不起作用,因为这会抑制ROC曲线,到了没有你想要的可行区域的地步,所以说,比如说,如果是抛硬币。
然后你就有了对角线,唯一可行的区域是在对角线下面,不管预测器对其他班级有多好,所以这是一个很好的特点,最后一个标准是充分性,它翻转r和y,所以它说回归器,预测变量可以依赖于受保护的类。
但是受保护的类与结果是分开的,例如,在二元情况下,Y的真实结果的概率,给定r是某个特定值,R和A是一个特定的类,与相同结果的概率相同,给定相同的r值,但是不同的阶级,好的,所以这与,所以说,它需要。
不同组的正预测值和负预测值的奇偶性,好的,所以这是另一种流行的看待这个的方式,例如,如果得分函数是概率,或分配分数的所有实例的集合,其中r有r部分的正实例,那么评分函数就被说成是校准得很好的。
我们以前在课上讨论过这个问题,如果事实证明R没有得到很好的校准,你可以黑它,你可以通过逻辑函数来很好地校准它,然后将接近适当校准的分数,然后你希望这个校准会给出校准的程度。
会给你一个很好的近似这个充足的概念,教程中的这些家伙还指出,一些数据集实际上导致了很好的校准,甚至不需要非常努力,例如,这是UCI人口普查数据集,这是一个二元预测,是否有人年收入超过5万美元。
如果你有任何收入,如果你超过十六岁,和特征有十四个特征,年龄,工作类型,样品重量,人口普查局的一些统计黑客,你的教育水平,婚姻状况,等等,你看到的是雄性和雌性的校准相当不错,它几乎正好沿着四度五度线。
没有做任何特别戏剧性的事情来实现这一点,另一方面,如果你看看白人对黑人的种族校准曲线,白人并不奇怪,校准得相当好,黑色没有校准好,所以你可以想象建立某种转换函数来改善校准,这会让你们分开。
现在有一个可怕的消息,就是你可以证明,就像他们在本教程中所做的那样,不可能共同实现这两个条件中的任何一对,所以你对公平意味着什么有三个合理的战术概念,他们互不相容,除了一些琐碎的情况,我没时间细说了。
但是谷歌有一个非常好的东西,他们说明了,采用这些公平概念中的一个或另一个,关于综合人口,你可以看到权衡是如何变化的,选择不同的公平概念的结果是什么,所以这又是一种很好的图形黑客,它会在幻灯片里。
我敦促你去看看,但我不会有时间去讨论它,他们指出了另一个问题,有趣的是,所以这是一个场景,你试图雇佣计算机程序员,你不想考虑性别,因为我们知道女性在计算机人员中的代表性不足。
所以我们不希望这是一个允许的属性,为了决定雇人,所以他们说,嗯,有两种情况,其中之一是性别A影响,不管你是不是程序员,这在经验上是正确的,做程序员的女性较少,事实证明。
访问Pinterest在女性中略多于男性,然后访问GitHub在程序员中比非程序员中更常见,那个很明显,所以他们说,你知道的,如果你想要一个关于某人是否会被雇用的最佳预测。
它实际上应该同时考虑到Pinterest和GitHub的访问,他们不喜欢这种型号,所以他们说,嗯,我们可以使用最优的分离分数,因为现在作为一名程序员,你的性别与评分功能分开了。
所以我们可以创建一个不同的分数,这和最优分数不一样,但被允许,因为它不再依赖于你的,关于你的性别,关于你的性别,这是另一个场景,再次从性别开始,说,哦快看,我们知道获得计算机科学大学学位的男性比女性多。
所以那里有一种影响,计算机科学家比非计算机科学专业的学生更有可能成为程序员,有人参观过格蕾丝·默里·霍珀会议吗,你们中的几个,是啊,是啊,所以这是一个非常酷的会议。
格蕾丝·默里·霍珀发明了虫子的概念或术语,是一个非常著名的计算机科学家,从20世纪40年代开始,当时他们很少,为了纪念她,每年都有一个女计算机科学家会议,所以很明显。
你参加格蕾丝·霍珀会议的可能性取决于你的性别,这也取决于你是否是一个计算机科学家,因为如果你是历史学家,你不太可能有兴趣去参加那个会议,所以在这个故事中,最佳得分将取决于。
基本上取决于你是否有计算机科学学位,但分开的分数只取决于你的性别,这有点有趣,因为这是受保护的属性,这些家伙指出的是,尽管你有这两种情况,很可能是数字数据,你估计这些模型的统计数据是绝对相同的。
换句话说,相同比例的人是男性和女性,同样比例的人或程序员,它们与其他因素有相同的关系,所以从纯粹的观察角度来看,你分不清哪种样式的模型是正确的,或者您的数据的公平性版本,所以这是个问题。
因为我们知道这些不同的公平概念是相互冲突的,所以我想通过给你们看几个例子来结束,所以这是一篇基于艾琳工作的论文,所以艾琳喊,如果我是,美国医学协会伦理杂志,我不知道它的存在,我决定不只是膨胀。
我想展示一些真正的作品,艾琳一直在做一些真正的工作,所以玛西娅,他是我的一个学生,我说服她参与进来,我们开始研究这些机器学习模型如何识别,也许可以减少一般医疗和精神健康方面的差距,为什么这两个区域。
因为我们可以访问这些地区的数据,所以普通医学实际上并不那么普通,这是来自模拟和精神健康中心的重症监护数据,是我们从大众那里获得的一些数据,波士顿的麦克莱恩综合医院,两家都有大型精神病诊所,是啊,是啊。
这就是我刚才说的,所以我们问的问题,是否存在基于种族的偏见,性别和保险类型,所以我们对社会经济地位很感兴趣,但我们的数据库里没有,但你的保险类型与,无论你是富有还是贫穷,如果你有医疗补助保险,例如。
你很穷,如果你有私人保险,你很有钱,所以我们就这么做了,然后我们看了看笔记,所以我们想看到的不是编码数据,但你在医院时护士和医生对你的评价,预测再入院30天,你是否有可能回到医院。
这些是我们使用的一些主题,LDA标准主题建模框架,和往常一样,主题包括一些垃圾,但也包括许多公认有用的主题,所以,例如,与癌症明显相关的肿块癌转移,心房纤维,香豆素,与心功能相关的纤颤,等等。
在重症监护室领域,在精神病学领域,你有躁郁症,锂,躁狂发作,与慢性疼痛相关的药量,等等,所以这些是我们使用的主题,所以我们说当你看着,怎么,不同的主题,不同的主题在不同的亚人群中出现的频率。
所以我们发现,比如说,白人患者有更多丰富焦虑和慢性疼痛的话题,而黑色,西班牙裔和亚裔患者对精神病有更高的热带丰富度,有趣的是男性患者有更多的药物滥用问题,女性患者一般抑郁和耐药抑郁较多。
所以你知道如果你想创造一个刻板印象,男人,女人抑郁,保险种类怎么样?私人保险患者焦虑和抑郁程度较高,较贫穷的病人或公共保险的病人再次有更多的药物滥用问题,你可以形成的另一个刻板印象,然后你可以看看。
那是在精神病患者中,在重症监护室人口中,男人仍然有药物滥用问题,嗯,我们在猜测这与,关于按种族分列的妇女鳕鱼诊断不足的已知数据,亚洲病人对癌症有很多讨论,黑人病人对肾脏问题有很多讨论。
肝脏问题的西班牙裔,白人有房颤,所以再一次,在这些不同的群体中最常见的刻板印象,和保险类型,那些有公共保险的人往往有多种慢性病,所以公共保险患者有心房,纤颤,起搏器,透析,这些是,心脏病和慢性肾脏疾病。
和私人保险患者对骨折有更高的主题丰富值,所以也许他们更富有,他们做更多的运动,摔断了胳膊什么的,只是报告数据,只是事实,所以这些结果实际上是一致的,通过对这类数据的大量分析,现在艾琳想看的是这个问题。
我们能得到类似的错误率吗,或者我们得到的错误率有多相似,答案不是那么多,比如说,如果你看看ICU的数据,我们发现零一损失指标的错误率对男性来说要低得多,比女性更适合,统计上显著降低。
所以我们能够更准确地,模型男性反应或男性预测30天再入院比我们没有遗憾,如果重症监护室的死亡率比我们女性的死亡率高,私人保险患者的结果比公共保险患者的结果,它们之间的置信区间有巨大的差距,所以这表明有。
事实上,我们拥有的数据和我们正在建立的模型中的种族偏见,这些都是特别简单的模型,当你看不同种族人口的比较时,你会看到相当多的重叠,我们推测的一个原因,就是,我们关于精神病患者的数据少得多。
比我们对重症监护室病人所做的,所以模型不会给我们准确的预测,但你仍然看到,比如说,a具有统计学意义,种族,虽然这里有很多重叠,嗯,再次在雄性和雌性之间,我们在预测男性时得到的错误更少。
但没有百分之九十五,私人保险与公共保险,我们确实看到了分离,在哪里,因为某种原因,事实上,我们能够为医疗保险的人做出更好的预测,比我们或医疗补助,比我们对病人和私人保险,所以把它包起来。
这不是解决问题的办法,但这是对问题的检查,和这本伦理学杂志,几个月前,我觉得它很有趣,所以出版了,我最后想说的是一些威利的作品,所以我冒着风险在真正在这里工作的人面前发言,让自己难堪。
所以这是模拟临终护理中的不信任,它是根据威利的硕士论文改编的,然后一些由此产生的论文,有趣的数据,如果你看看非裔美国人的病人,这些是模拟数据集中的病人,嗯,你发现的是,用于机械通风。
黑人使用机械通风的平均时间比白人长得多,在p等点处有一个相当不错的分离,零零五级,所以这两个人群之间的0。5%水平,所以有一些事情发生了,黑人病人被保持机械通气,比现在的白人病人长。
我们当然不知道确切的原因,我们不知道这是不是因为生理上的差异,或者是因为和他们的保险有关,或者因为上帝知道这可能是许多不同因素中的任何一个,但事实就是如此,我们提到的EICU数据集。
这是一个更大但不太详细的数据集,也是重症监护病人的,菲利普斯公司捐赠给罗杰马克实验室的,在那里我们再次看到,机械通气持续时间的分离,与我们在模拟数据集中看到的大致相当,所以这些是一致的,另一方面。
如果你看看血管升压剂在黑人和白人中的使用,在p等点十二电平上,你说好,有一点点证据,但不足以得出任何结论,或者在ICU的数据中,p等于四二显然是微不足道的,所以我们不在那里提出任何要求。
所以威利问的问题,我认为这是一个很好的问题,不是生理上的差异,甚至这些社会经济或社会差异,而是病人和医生之间信任程度的差异,好吧,这是个有趣的想法,我当然不会告诉你这件事,如果答案是否定的。
所以他采取的方法是寻找案例,那里显然有不信任,所以有危险信号,如果你读了笔记,比如说,如果病人违背医嘱离开医院,是一个很好的迹象,他们不信任医疗系统,如果家人,如果这个人死了,而家人拒绝让他们做尸检。
这是另一个迹象,也许他们不信任医疗系统,所以有这些不信任的红字指标,比如说,病人拒绝签字,我看到你同意并表示希望成为,不要复苏,不要插管,似乎对医疗保健系统非常沮丧和不信任,也有不良用药史。
遵守和后续行动,所以这是一个很清楚的迹象,你可以建立一个相对简单的,这就是我所说的尸检,所以问题是,当然,并不是每个病人都有如此明显的标签,事实上他们中的大多数人都没有,所以威利的想法是。
我们能从这些明显的例子中学到一个模型吗,然后将它们应用于不太明显的例子,为了得到一种青铜标准或远程监督,更多人口的概念,根据我们的模型,有不信任的倾向,没有像这些例子中那样明显的不信任。
所以如果你在mimic中查看图表事件,比如说,你会发现与这些明显的不信任案例相关的是,就像那个人被束缚了一样,对呀,他们真的被锁在床上,因为护士们害怕他们会站起来做坏事,不一定像攻击护士。
但更像是从床上摔下来或从地板上游荡,或者类似的东西,如果一个人在痛苦中,这也与这些不信任措施有关,反过来,如果你看到有人洗头,或者有一个关于他们的地位和舒适的讨论,那么他们可能不太可能不信任这个系统。
所以威利采取的方法是说,嗯,让我们对这六百二十个信任的二进制指标进行编码,并对标记的示例建立Logistic回归模型,然后将其应用于未标记的示例,我们没有如此明确的迹象的人。
这给了我们另一群可能不信任的人,因此有足够的人我们可以对它进行进一步的分析,所以如果你看看不信任指标,你有这样的东西,你知道的,如果病人在某种激动程度上激动,他们更容易不信任,反过来说,他们很警觉。
他们不太可能不信任,所以这意味着他们的精神状态更好,如果他们不痛苦,他们不太可能不信任,等等和,他们有一个发言人,他是他们的医疗保健代理人,或者有很多家庭交流,但反过来,如果约束,如果必须重新施加约束。
你知道其他各种因素,那么他们更有可能不信任,所以如果你看看这个预测,你发现了什么,对于预测机械通气和血管升压剂的使用,黑人和白人病人之间的差距,实际上不如高信任度人群和低信任度人群之间的差距重要。
信任病人,所以这表明这里可能导致这种差异的基本特征是,事实上,不是种族,而是与种族相关的东西,因为,黑人比白人更不信任医疗系统,为什么这可能是你对历史的了解,是的我是说你参加了城市培训课程。
你看过贝尔蒙特的报告,谈论像塔斯基吉实验这样的事情,你知道的,我相信这会给人们留下深刻的印象,关于医疗保健系统将如何对待他们种族的人,我是犹太人,我母亲几乎没有经历过奥斯威辛,所以我明白。
由于这些历史事件而产生的一些强烈的家庭情感,也有医务人员在集中营的囚犯身上做实验,所以我希望像我这样身份的人,可能也有类似的不信任问题,现在你可能会问–嗯–是不信任,事实上,只是严重程度的代表。
人们只是更不信任,这就是我们所看到的,只是反映了他们病得更重的事实,答案似乎没有那么多,如果你看看这些严重程度评分,比如绿洲和树液,看看它们与不遵守和尸检的相关性,这些相关性值很低,所以他们不是。
他们没有解释这种现象,然后在人群中你又看到了这一点,笔记中表达的情绪有显著差异,尸检得出的不信任指标没有显示出强烈的关系,他们之间的强烈差异,所以我没时间了,我把最后一句话留给你。
在这方面还有很多工作要做,这是一个非常丰富的地区,既是为了技术工作,也是为了试图理解需求是什么,以及如何将它们与技术能力相匹配,有各种各样的会议,活跃在这一领域的人之一,其中一对人迈克。
宾夕法尼亚大学的卡恩斯和亚伦·罗斯将出版一本书,叫做道德算法,今年秋天就要上市了,这是一本很受欢迎的报刊杂志,我没有读过,但看起来应该是,应该挺有意思的,然后我们开始公平地看到整个班级。
出现在不同的大学,所以宾夕法尼亚大学有数据伦理学,我已经在伯克利的机器学习班上提到过这种公平。
这实际上是我们讨论过的话题之一,我是一个委员会的成员,该委员会正在计划,新施瓦茨曼计算学院的活动,和,在技术课程中注入公平和道德观念的概念,是我们一直在讨论的事情之一,大学显然还没有开学。
所以除了这节课,我们没有别的东西了,还有其他一些类似的事情正在进行中。
P24:24.Robustness to Dataset Shift - 大佬的迷弟的粉丝 - BV1oa411c7eD
好的,那么今天的课将是关于数据集转移的,特别是如何对数据集移位鲁棒性,这是我们整个学期都在讨论的话题,我想让你考虑的设置如下,你是一个数据科学家,让我们说,大众综合医院和,在设置机器学习任务时非常小心。
以确保数据被很好地指定,您试图预测的标签是很好指定的,你在一个,根据训练数据进行训练,你在一个伸出的布景上测试它,你看这个模型很好地概括了,你做图表回顾,以确保你所预测的实际上是什么,你以为你在预测。
你甚至做前瞻性部署,然后让你的机器学习算法驱动一些临床决策支持,你看现在一切都很好,这个阶段之后会发生什么,当您进行部署时,当您的相同模型将被使用时会发生什么,不仅仅是明天,也是下周,下一周,第二年。
如果你的模型在这家医院运行良好会发生什么,然后就想,然后还有另一个机构,说也许把妇女医院,或者你看到SF或美国的一些农村医院,想用同样的型号,它在短期内会继续工作吗,今后一段时期,或在新的机构。
这就是问题所在,我们将在今天的课上讨论,我们将谈论,如何处理两个不同品种的数据集转移,第一种是对数据的对抗性扰动,第二种是数据,由于数据现在因自然原因而变化,为什么一点也不明显。
您的机器学习算法在这种设置下仍然可以工作,是因为当我们进行机器学习时,我们所做的首要假设,你的培训分配,您的训练数据来自与测试数据相同的分布,因此,如果您现在转到数据分布已更改的设置。
即使你用你的数据计算了你的准确性,看起来很不错,没有理由穿上新衣服继续好看,在数据分布发生变化的新设置中。
下面是一个简单的例子,说明数据分布发生变化意味着什么,假设我们有作为输入数据的,我们试图预测一些标签,这可能意味着像Y这样的东西是,如果病人有或将被新诊断为2型糖尿病,这是我们的一个例子。
当我们引入风险分层时,我们谈到了这一点,你学习一个从x中预测y的模型,现在假设你去了一个新的机构,他们对2型糖尿病的定义发生了变化,你知道的,也许他们的数据中实际上没有编码二型糖尿病。
也许他们的数据中只编码了糖尿病,它聚集在一起,一型和二型糖尿病,1型通常是青少年糖尿病,它实际上是一种与二型糖尿病截然不同的疾病,所以现在对糖尿病的概念是不同的,也许用例也略有不同,没有理由,很明显。
你用来预测二型糖尿病的模型,会为那个新标签工作,这是一个非常类型的数据集移位的例子,这对你来说可能很明显,在设置正确的情况下什么都不起作用,因为这里给定x的y的分布会改变,意思是即使你有同一个人。
你的分布py给定x,假设分布p为零,和y的分布p给定x p 1,这里是,假设一个机构,这是另一个,现在是两个不同的分布,如果标签的含义发生了变化,所以对于同一个人来说,在y上可能有不同的分布。
所以这是一种类型的数据集移位,另一种非常不同的数据集移位是我们假设这两者相等,所以这会,比如说,排除这种类型的数据集移位,而是从一个位置到另一个位置的变化是x的p,这是数据集移位的类型。
这将是今天讲座的重点,它的名字是协变量移位,让我们来看看两个不同的例子,第一个例子是对抗性的扰动,和,所以说,你们都看到了,卷积神经网络在图像分类问题中的应用,这只是这样一个架构的一个例子。
有了这样的架构,人们可以尝试做各种不同的物体分类或图像分类任务,你可以把它作为输入,这张狗的照片显然是一只狗,对呀,你可以稍微修改一下,只要加入少量的噪音,我要做的是现在我要创造一个新的形象。
也就是现在的原始图像,用每一个像素,我要在噪音的方向上加上一个非常小的epsilon,你得到的是这个新的图像,你可以盯着它看,你想呆多久就呆多久,你将无法区分,基本上对人眼来说,这两个看起来一模一样。
当你拿着你的机器学习分类器,它是在原始的无扰动数据上训练的,现在将其应用于,这个新图像被归类为鸵鸟,这一观察发表在2014年的一篇论文中,叫做神经网络的有趣特性。
对机器学习社区的兴趣激增,论机器学习的对抗性扰动,所以问问题,如果你稍微干扰输入,这如何改变分类器的输出,这能用来攻击机器学习算法吗,顺便说一句,一个人怎么能防御它呢,作为旁白。
这实际上是一个非常古老的研究领域,甚至回到线性分类器的土地上,这些问题已经研究过了,虽然我不会在这门课上深入讨论它,所以这是一种数据集移位,从某种意义上说,我们想要的是,这仍然应该被归类为鸵鸟。
作为一只狗,对呀,所以实际的标签没有改变,我们希望这种分布在标签上,考虑到它的扰动略有不同,除了现在输入的分布有点不同,因为我们允许在每个输入中添加一些噪声,在这种情况下,噪音实际上不是随机的。
这是对抗性的,今天的讲座快结束时,我给你举个例子,一个人如何真正产生敌对的形象,它现在可以改变分类器,我们为什么要关心这些类型的事情,在这门课程中,是因为我希望这种类型的数据集转移,这一点也不自然。
这是对抗性的,也将开始出现在计算机视觉和非计算机视觉问题中,在医学领域,萨姆·菲林森有一篇很好的论文,安迪·比姆和扎克·科恩最近,那个,它提供了几个不同的案例研究,这些问题可能在医疗保健中真正出现。
例如,这里我们要研究的是皮肤病学引起的图像分类问题。
你会得到一个图像作为输入,比如说,您希望此图像被归类为个人,有一种特殊类型的皮肤病,另一个图像黑色素瘤,我们可以看到,随着输入的微小扰动,一个可以完全交换将分配给它的标签。
从一个到另一个,在本文中,他们讨论了如何恶意使用这些算法来谋利,例如,想象一下,一家健康保险公司现在决定,为了报销病人昂贵的皮肤活检费用,临床医生或护士必须首先拍摄疾病的照片。
并将该照片与该程序的账单一起提交,我想现在保险公司有了机器学习算法,是一种自动检查,在这种情况下,这个程序实际上是合理的吗,如果不是,它可能会被标记,现在,恶意用户可能会扰乱输入,使其。
尽管病人的皮肤看起来甚至完全正常,尽管如此,机器学习算法还是可以将其归类为在某种程度上不正常的,因此,也许可以通过该程序获得偿还,显然这是一个邪恶环境的例子,我们希望这样的人会被警察抓住送进监狱。
但尽管如此,我们希望能够做的是建立,将制衡纳入系统,以至于这甚至不可能发生在正确的地方,因为对一个人类来说,很明显,你不应该欺骗,嗯,用这么小的干扰欺骗任何人,那么你如何构建不那么容易被欺骗的算法。
因为人类不会被骗,那个问题,是啊,是啊,对于这些示例中的任何一个,攻击者是否需要访问网络,有办法吗,所以问题是,攻击者是否需要了解有关该函数的一些信息,那是用来分类的,有白盒和黑盒攻击的例子,其中。
在一个设置中,您可以访问该功能,而在其他设置中,您不能访问该功能,所以两者都在文献中被研究过,有结果表明,在任何一种情况下都可以攻击,有时候你可能需要知道更多,比如说,有时您需要能够查询函数一定次数。
所以即使你不知道函数是什么样的,你不知道神经网络的权重,只要你能足够多次地查询它,你将能够构造对抗性的例子,这将是一种方法,另一种方法是,哦,也许我们不知道函数,但我们对训练数据有所了解。
所以有很多方法可以做到这一点,即使你不完全知道函数,这回答了你的问题吗?那么自然扰动呢,所以这个数字是从第五讲提取的,当我们在风险分层的背景下谈论非平稳性时。
只是想在这里提醒你,x轴是时间,Y轴是不同类型的实验室测试结果,可以订购,颜色表示什么,在某个时间点,在某个人群中订购了多少这些实验室测试,所以我们希望看到的是,如果数据是静止的,每一行都是均匀的颜色。
但相反,我们看到的是时间点有,例如,在这里每隔几个月,突然间,一些实验室测试似乎从未进行过,嗯,这很可能是由于数据问题,或者实验室测试提供商的数据丢失了,系统出了点问题,但也会有一些设置,比如说。
一个实验室的测试是永远不会使用的,直到它突然被使用,这可能是因为这是一种新的测试,刚刚发明或批准,在该时间点偿还,所以这是一个非平稳性的例子,当然,这也可能导致数据分布的变化,就像我在那边描述的那样。
第三个例子是当你跨越机构,什么时候,当然啦,两种可能使用的语言都想到了美国的医院,相对于中国的一家医院,临床记录将用完全不同的语言书写这将是一个极端的情况。
一个不那么极端的例子可能是波士顿的两家不同的医院,在哪里,用于某些临床术语的首字母缩写或速记实际上可能不同,因为当地的做法,那么我们该怎么办,这就是所有的设置,在剩下的演讲中,我首先要简短地谈谈。
人们如何建立人口水平检查发生了什么变化,然后今天讲座的大部分内容,我们将讨论如何开发迁移学习算法,以及如何思考对抗攻击的防御。
在我给你们看第一张幻灯片之前,我想讨论一下,你突然做了学习机器学习算法的事情,和你的机构,你想知道,这个算法在其他机构行得通吗,你拿起电话,你打电话给,你在另一个机构的合作数据科学家。
你应该问他们什么问题,为了试图理解,你的算法也能在那里工作吗,他们定期收集什么样的实验室测试信息,看看他们是否这样,他们有什么样的病人数据,他们是否有类似的数据类型或特征可用于他们的患者群体,其他想法。
前两节课都没说过话的人,也许后面的某个人,把电脑拿出来的人,也许你的手在你的嘴里,就在那里,带着你的眼镜在想法上,你想让我重复这个问题吗,问题如下,你在某个机构学习机器学习算法。
你现在想在一个新的机构应用它,你对那个新机构有什么问题要问,尝试评估您的算法是否会推广新的机构,我是说我想这取决于你的问题,就像,你们的人口可能有差异吗,如果您使用特定的工具获取数据,或者人们的差异。
您想要为您的机器校准的视觉数据,他们是否使用不同的技术来获得所有的权利,所以让我们分解你给出的每一个答案,你给出的第一个答案是,人口有差异吗,现在别人会是什么,一个群体差异的例子是什么。
年轻人的年龄分布以及与性有关的费用,波士顿可能会有年轻人和老年人,或者在马萨诸塞州中部,年龄分布的变化会如何影响算法的泛化能力,年轻人的健康模式可能与老年人有很大的不同。
也许有些疾病在年龄较大的人群中更流行,谢谢。所以说,有时我们可能会期待一系列不同的疾病发生,对于较年轻的人口和较年长的人口,对呀,所以我是二型糖尿病高血压,这些疾病通常是在病人,当个人四十岁时。
五十岁及以上,如果你有一套,如果你有20多岁的人,你通常不会在年轻人群中看到这些疾病,所以这意味着,如果你的模特,比如说,是在一群非常年轻的人身上训练的,那么它可能无法假设你在做这样的事情。
预测未来成本,或者与疾病本身没有直接联系的东西,在非常年轻的人群中预测未来成本的特征,可能与老年人群的成本预测特征非常不同,因为这些人现在的条件不同,给出的第二个答案,与仪器校准有关的事情。
你能详细说明一下吗,是啊,是啊,所以我在想,尤其是在结肠镜检查领域,但就像如果你在收集,所以在那个空间里,就像你在收集冒号的视频,所以你可以有非常不同校准的机器,让我们说,不同相机设置的不同曝光。
我们也有那个,美国兵和内科医生有不同的技术,他们是如何探索,所以视频数据本身将是,所以给出的例子是结肠镜检查,以及可能作为其中一部分收集的数据,和,可以收集的数据可能是不同的因为两个不同的原因。
一是因为收集数据的实际仪器,比如说,成像数据的校准可能有点不同,第二个原因可能是,因为每个机构用于进行诊断测试的程序可能不同,每一个都会导致对数据的偏差略有不同。
目前还不清楚一个算法是在一种类型的过程上训练的,或者一种仪器会推广到另一种仪器,嗯,所以这些都是很好的例子,所以说,当一个人读到一篇来自临床社区的关于开发一种新的风险分层工具的论文时,你将永远看到的。
这张纸就是所谓的第一张表,所有的权利,第一桌看起来有点像这里,我从我自己的报纸上,发表在2016年的《美国医学会心脏病学》上。
在那里我们研究了如何找到住院的心力衰竭患者,我只是要走过这张桌子是什么,这张表格描述了研究中使用的人口,上面说这些是四万七千名住院病人的特征,那么我们所做的就是利用我们的领域知识。
我们知道这是一个心力衰竭的人群,我们知道有许多不同的轴来区分病人,因心力衰竭住院的人,所以,我们列举了许多我们认为,对确定人口特征至关重要,我们给出了你通常开始使用的每一个功能的描述性统计数据。
比如年龄,性别和种族,所以这里,比如说,平均年龄是61岁,顺便说一句,这是,纽约大学医学院,呃,五十,百分之八,女性,十一点,百分之二,黑色,非洲,美国人,十七点,6%的人接受医疗补助。
这是一个国家为残疾人或低收入个人提供的健康保险,然后我们观察了药物的数量,比如40岁的病人服用了什么类型的药物,四十的百分之一,2%的住院病人服用了一种叫做受体阻滞剂的东西,三十一分。
6%的门诊病人服用受体阻滞剂,然后我们看了一些东西,比如,实验室测试结果,所以人们可以看看平均值,创建Anine值,这个病人群体的平均钠值,以这种方式描述正在研究的人口是什么,那么当你去新机构的时候。
新机构接收的不仅仅是算法,但他们也收到这张桌子,一个描述算法在其上学习的群体的群体,他们可以利用这些知识和一些领域知识来思考问题,就像我们在听的,在我们的讨论中我从你那里列出了什么,对呀。
这样我们就可以思考,它真的做到了吗,这个模型将推广到这个新机构是有意义的,它可能不会的原因是什么,你甚至可以在对新人口进行任何前景评估之前就这样做,所以在你们的项目中。
几乎所有人都应该有类似于表1的东西,写对了,因为这是该领域任何研究的重要组成部分,你正在研究的人口是多少,你同意我的看法吗?皮特,是啊,是啊,我只想加上1号桌,如果你在做病例对照研究。
我们将有两列显示这两个关系中的分布,然后是这些差异显著的可能性的p值,你,我会,只是我只是重复皮特的回答录音,如果你是,这个表是用于预测问题的,但是如果你在考虑一个因果推理类型的问题。
有不同干预小组的概念,你会被期望报告同样的事情,但对于病例群体,接受的人,让我们说,治疗一,接受治疗的人,然后你会看到这些群体之间的差异以及个体特征水平上的差异,作为该研究描述性统计数据的一部分。
只是为了识别,就像医院之间的团结,做T测试就足够了吗,或者那些桌子,看看它们是否不同,否,所以他们总是不同的,对呀,你去一个新的机构,它总是会看起来不一样,所以只是看看事情发生了什么变化并不是。
答案总是肯定的,但这真的,它使对话能够思考,好的,这个,然后你可能会看,你们可能会用到皮特下周要讲的一些技巧,关于可解释性,试图很好地理解,模型实际使用的是什么,然后你可能会问,哦,好的,嗯。
模型正在使用这个东西,这在这个群体中是有意义的,但在另一个人群中可能没有意义,这两件事加在一起使谈话,近年来,这个问题确实引起了人们的注意,我与皮特上周讨论的话题密切相关,论公平与机器学习。
因为您可能会问分类器是否构建在某些群体中,它会推广到另一个人群吗,如果它所学习的人群非常有偏见,例如,可能都是白人,你可能会问,这个分类器在另一个人群中会很好地工作吗,这可能包括不同种族的人。
所以这导致了一个概念,最近发表了这个,这个工作草案,我展示的摘要是几周前,称为数据集的数据表,这里的目标是标准化描述,引出关于,是什么数据集真正影响了你的嗯,是啊,是啊,你的模特。
所以我要简单地向你们介绍一下,只是通过一个例子的几个元素,数据表的数据集可能类似于,这太小了,你看不懂,但我会在一秒钟内炸毁一个部分,这是一个叫做研究人脸识别的数据集的数据表,在不受限制的环境中。
这是为了解决计算机视觉问题,会有很多问卷,我给你们看的这篇论文概述了,而你作为模型开发人员,仔细检查问卷并填写答案,所以包括动机,用于数据集的创建组成等,所以在这个特殊的例子中。
这个数据集被称为标记人脸,在野外被创造出来是为了提供研究人脸识别的图像,在不受限制的环境中,图像特征如姿势,照明,分辨率和焦点无法控制,所以它旨在成为现实世界的设置,现在,本报告中最有趣的部分之一。
应该与数据集一起发布,与,数据是如何预处理或清理的,例如,对于此数据集,它将经历以下过程,首先,从数据集获得原始图像,然后嗯,它由图像和标题组成这些图像和标题是与图像一起发现的,在新闻文章或网络上。
然后有一个人脸探测器在数据集上运行,以下是使用的面部探测器的参数,然后记住这里的目标是研究人脸检测,所以嗯,所以人们必须知道,怎么样,标签怎么样,确定,一个人怎么会,比如说,如果这张图像中没有脸。
则消除,所以他们描述了一张脸是如何被检测到的,以及一个地区是如何被确定不是一张脸的,在不是的情况下,最后描述了如何删除重复项。
如果你回想一下本学期早些时候的例子,从医学成像,比如说,病理学和放射学,必须在那里进行类似的数据集构造,比如说,一个会去PAC系统,那里存储放射学图像,一个会一个会决定哪些图像会被拉出来。
一个会去放射学报告,来弄清楚我们如何从图像中提取相关的发现,这将给标签,为了那个预测性,为了那个学习任务,每一步都会产生一些偏见,有些需要仔细描述,为了理解学习的分类器的偏差是什么,我现在就不详细说了。
但这也将是,这是一个快速阅读,我鼓励你经历它,得到一些直觉,对于什么是问题,我们可能想问,我们创建的数据集,在这学期剩下的时间里,在今天讲座剩下的时间里。
我现在要继续讨论一些更技术性的问题,所以,我,我们必须做到这一点的权利,我们在做机器学习,现在,种群可能不同,我们该怎么办,我们能不能改变学习算法,希望你的算法能更好地转移到一个新的机构。
或者如果我们从那个新机构得到一点数据,我们能利用新机构的少量数据吗,或者未来的一个时间点,重新训练我们的模型,使其在略有不同的分布中表现出色,这就是迁移学习的整个领域。
所以你有从x和y的p上的一个分布中提取的数据,也许我们有一点数据来自不同的分布,x y的q,在协变量移位假设下,我假设q x逗号y等于,给定x,y的p,即给定x的y的条件分布没有改变。
唯一可能改变的是你在x上的分布,这就是协变量移位假设所假设的,所以假设我们从新的分布中提取了一些少量的数据,q,我们如何利用它,为了重新训练我们的分类器,让它为新的机构做得很好。
所以我将通过四种不同的方法来做到这一点,我将从最容易理解的线性模型开始,然后我将继续深深的模型,第一种方法是你已经见过几次的东西,在本课程中,我们将把迁移看作是一个多任务学习问题。
其中一个任务的数据比另一个任务少得多,所以如果你还记得当我们谈到疾病进展模型时,我们引入了正则化权重向量的概念,这样他们就可以互相靠近,当时我们谈论的是权重向量,预测未来不同时间点的疾病侵蚀。
我们可以在这里使用完全相同的想法,你把你的分类器,你的线性分类器是在一个非常大的语料库上训练的,我要把它叫做,我要把那个分类器的权重称为w旧,然后我要解决一个新的优化问题,也就是最小化重量w最小化损失。
所以这就是你训练的地方,你的新训练数据进来了,所以说,我假设新的训练数据d是从q分布中提取的,然后呢,我将增加一个正则化,要求w应该保持在,老了,您拥有的数据量,如果那个新机构的数据非常大。
那你就不需要这个了,你就可以,您可以忽略以前学过的分类器,把一切都修改到新机构的数据上,像这样的东西特别有价值,如果有少量的数据集移动,你只有来自那个新机构的非常少量的标记数据。
这样你就可以稍微改变一下你的重量矢量,对呀,所以如果这个系数很大,它会说新的W不能离旧的W太远,所以允许你稍微改变一下事情,为了在你拥有的少量数据上做得很好,比如说,如果有一个特征是以前预测的。
但这一特征在新的数据集中不再存在,例如,它都是等于零,然后SP是新的权重向量,该特性的新权重将被设置为零,和重量,你可以考虑的重量,正在被重新分配到其他一些特性,这是有道理的,有什么问题吗?
所以这是最简单的迁移学习方法,在你尝试更复杂的事情之前,总是尝试这个,所以第二种方法,也有线性模型,但在这里,我们不再假设这些特性仍然有用,所以当你从,当你从你的第一个机构,比如说MGH,在左边。
你学习你的模型,你想把它应用到一些新的机构,说UCSF,在右边,可能是功能集有了很大的变化,使原始特性对新特性集毫无用处,一个非常极端的例子可能是我之前给出的设置,在那里我说,你知道你的模特是学英语的。
你在中国人身上测试,对呀,那将是一个例子,如果你用一袋话,模型,这将是一个例子,在那里嗯,你的模型显然根本不能推广。
因为,因为你的特征完全不同,那么在那种情况下你会怎么做,什么是,你能做的最简单的事是什么?所以你拿的是用英语学的文本分类器,你想在语言是中文的环境中应用它,你会怎么做,翻译,你说过,还有另一个答案。
训练一个RNN做什么艺术训练,哦好吧,所以假设你有一些机器翻译的能力,你是从英语翻译过来的,从汉语到英语,它必须在那个方向,因为最初的分类器是用英语训练的,然后你的新功能是翻译和原始功能的组成。
然后你可以想象做一些微调,如果你现在有少量的数据,如果最简单的翻译函数可能是,你只要查字典就可以了,如果这个词在另一种语言中有类比,你说,好的,这是翻译,但在你的语言中总会有一些词,没有很好的翻译。
所以你可能会想象最简单的方法是翻译,但把没有很好类比的词去掉,并强制分类器使用,让我们说,只是共享的词汇,我们在这里讨论的一切都是手动选择决策的例子,所以我们将手动为数据选择一个新的表示形式,这样。
我们在源数据集和目标数据集之间就有了一些共享的特性,让我们来谈谈电子健康记录一。
电子健康档案二,顺便说一句,我将在这里展示的幻灯片来自一篇发表在KD的论文,作者:简·特里斯坦,你的导师,皮特和约翰·古塔格,所以你有两个电子健康记录,电子健康档案一,电子健康档案二,世事如何才能善变。
可能电子健康记录中的同样概念,一个可能映射到不同的编码,这就像是电子健康记录2中的英语到西班牙语的打字翻译,另一个改变的例子可能是说一些概念被删除了,比如你在电子健康记录一号里有实验室测试结果。
但不是电子健康记录二,所以这就是为什么你看不到任何优势,另一个变化可能是,可能会有新的概念,因此,新机构可能拥有旧机构所没有的新类型的数据,那么你在那种环境下做什么,一种方法会说好。
我们从二号电子健康记录中获得了一些少量数据,我们可以用它来训练扔掉电子健康记录一号中的原始数据,当然,如果您只从目标分布中获得少量数据,这将是一个非常糟糕的方法。
因为你可能没有足够的数据来学习一个足够合理的模型,第二个明显的方法是可以的,我们将在电子健康记录1上进行训练并应用它,对于那些已经不存在的概念,就这样吧,也许事情不会很顺利,我们之前提到的第三种方法。
当我们谈到翻译的时候,就是在这两个特征的交汇处学习一个模型,这项工作所做的是,他们说我们要手动重新定义功能集,为了找到尽可能多的共同点,这确实涉及到很多领域知识,我将用这个作为一个对比点。
从我十分钟或十五分钟后将要谈论的内容来看,在那里我谈到了如何做到这一点,如果没有我们将要在这里使用的领域知识,他们看到的环境是预测结果,比如在医院,死亡率或逗留时间,将要使用的模型是一袋事件模型,因此。
我们将记录病人的纵向病史,直到预测的时候,我们将看看发生的不同事件,这项研究是用理疗等方法进行的,所以在模仿中,比如说,事件用一些数字编码,像五个,八,一个四可能对应于CVP警报,一零。
四六可能对应着疼痛的存在,两个五可能与给的肝素药物相对应,等等,所以我们将为每个事件创建一个功能,它有一些数字,它是用一些数字编码的,我们就说一个,如果该事件发生为零,否则,这就是病人的代表。
因为当一个人去这个新机构的时候,小时二,事件的编码方式可能完全不同,一个人不能仅仅使用原始的特征表示,这是我给出的英语到西班牙语的例子,但人们可以尝试做的不是想出一个新的功能集。
其中该特征集可以从每个不同的数据集导出,例如,因为mimic中的每个事件都有相应的文字描述,事件一对应于缺血性中风,事件二出血性中风,等等,人们可以试图用英语对FE的描述。
想出一种方法把它映射成一种共同语言,在这种情况下,通用语言是U,Pete前几节课讲的联合医学语言系统是什么,所以我们现在要说好,我们有一个更大的功能集,我们现在把缺血性中风编码为概念。
这实际上是同样的缺血性中风,也作为这个概念和那个概念,是原始版本的更一般的版本,对呀,所以这只是一般的中风,可能是多种不同类型的中风,希望即使在,即使模型没有,即使。
其中一些更具体的数据没有出现在新机构的数据中,也许更多的一些更一般的概念确实出现在那里,然后你要做的是,你现在要在这个扩展的翻译词汇表上学习你的模型,然后翻译,在新的机构里。
你也将使用同样的通用数据模型,通过这种方式,人们希望在你的功能集中有更多的重叠,所以要评估这一点,作者观察了拟态中两个不同的时间点,有一次伯特利迪肯医疗中心使用电子健康记录,称为关怀视图。
第二个时间点是医院使用一种不同的电子健康记录叫做metavision,所以这实际上是一个非平稳性的例子,现在,因为他们使用了两种不同的电子健康记录,然后涂层是不同的,这就是为什么这个问题出现了。
所以我们要用这种方法,然后我们将在这个新编码的基础上学习一个线性模型,我刚才描述的,我们将通过观察损失了多少性能来比较结果,由于使用这种新编码,我们从一个概括得有多好,从一个,从一个。
从源任务到目标任务,所以这是第一个问题,这就是我们使用这种新编码损失了多少,因此,作为预测医院死亡率的比较点,我们将看看预测的性能是什么,如果你只是使用一个现有的非常简单的风险评分,称为SAP评分。
这是一条红线,Y轴,这里是ROC曲线下的区域,x轴是提前多少时间,你在预测预测差距,所以用这个非常简单的分数,萨吉特,在设定点75到80之间的某个地方在ROC曲线下的区域。
但是如果你要使用所有的事件数据,这比简单的SAP评分要丰富得多,你会得到紫色的曲线,也就是紫色的曲线,也就是行动,加上事件数据,或者蓝色的曲线,这只是事件数据,你可以看到,通过使用更丰富的特性集。
您可以获得更好的预测性能,最高分的好处是更容易概括,因为它是如此简单,这些特征元素可以简单地转化为任何新的EHR,手动或自动,因此,这将永远是一条可行的路线,而这条蓝色的曲线。
虽然它得到了更好的预测性能,你必须真正担心这些概括问题,同样的情况发生在源任务和目标任务中,现在第二个问题,第二个要问的问题很好,发生了什么事,当您使用数据的新表示形式时,您损失了多少。
所以在这里再看一次,这两个都是我们所看到的,第一个红色的是相同的红色曲线是相同的蓝色曲线,我在上一张幻灯片中显示过,它在用树液,加上项目ID,所以使用所有的数据,然后这里的蓝色曲线,有点看不清楚。
但这是对的,要低得多,如果您现在使用这个新的表示形式,就会发生这种情况,你会发现你确实失去了一些东西,因为你试图找到一个共同的词汇,表演确实受到了一点打击,但特别有趣的是,当你试图概括,你开始看到交换。
所以如果我们现在所以现在颜色会很相似,所以红色是使用数据的原始表示,在它处于最顶端之前,如图所示,这是这个机构护理视图上的训练错误,你看,原始功能集中有这么多丰富的信息,它能够做非常好的预测性能。
但一旦你试图翻译它,所以你接受同行评议的训练,但你在元视觉上测试,那么这里这条实心红线显示的测试性能,实际上是所有系统中最糟糕的,性能大幅下降,因为并不是所有这些功能都出现在新的人力资源中,另一方面。
翻译过来的版本说,尽管它有点糟糕,嗯,在源上评估时,它概括得更好,所以你会看到一个明显更好的表现,这是由这里的蓝色曲线显示的,嗯,当你使用这个翻译词汇时。
有一个问题,是啊,是啊,所以当你用更多的功能训练时,那又怎样,你如何应用这个模型,如果有,如果对方,所有的功能,你只是这样,你是,您假设您已经想出了一个映射,从两个人力资源中的功能到这个共同的功能。
Q的词汇,以及在本文中进行映射的方式,是基于,事件的,因此,您将获取基于文本的事件描述,你得到了一个到这个新U的确定性映射,基于S的表示,然后这就是被使用的,在这个特定的例子中没有进行微调。
所以我认为这是一个非常幼稚的转移应用,结果正是你所期望的结果,显然要做很多工作,有一点创造性的想法是你应该使用英语空间,描述特征,提出自动映射,但故事到此为止,所以你们可能会有一个问题。
你怎么能自动地尝试这样的方法,我们如何自动找到表示,数据的新表示形式,这些表示形式可能会泛化,从下水道分布,去测试,目标分布,所以说到这一点,我们现在要开始通过表示来思考,基于学习的方法。
其中深层模型特别能够,让我们说,深度神经网络将只是切断网络的一部分,并重用这个新位置中数据的一些内部表示,所以画面看起来有点像这样,所以数据可能会在底部提供,可能有许多卷积层,一些完全连接的层。
你决定做的是,你要把这个在一个机构训练过的模型,你把它切成几层,例如,它可能在最后一个完全连接的层之前,然后你要把数据的新表示形式,现在,数据的表示是你会得到的,在做了一些卷曲之后。
然后是单个完全连接的层,然后你要把你的目标分布数据,你可能只有少量的,你在新的表示形式上学习一个简单的模型,例如,您可能会在新的表示形式之上使用支持向量机学习浅分类器,或者你可以添加更多的深度神经网络。
然后从头到尾微调一下,所以这些都试过了,在某些情况下,一件作品比另一件作品更好,我们已经在。
嗯,在本课程中,那是亚当·耶拉在第十三讲的时候,在他的方法中,他说他两者都试过了,分类器,并将其与,如果您用一个众所周知的imagenet初始化会发生什么,基于深度神经网络的问题。
他在他的案子里讲了一个非常有趣的故事,他有足够的数据,他实际上不需要初始化,使用Imagenet的这个预先训练的模型,如果他只是做了一个随机的初始化,最后这个和这个就像我记不清了一样。
也许是几个小时的训练或时代,我不记得了,是时候了,最终随机初始代理得到非常相似的性能,但为了他的特殊情况,如果要使用imagenet进行初始化,然后微调,你到那里要快得多。
所以正是由于计算的原因,他发现它很有用,但在医学成像的许多其他应用中,这些同样的技巧变得必不可少,因为您在新的测试用例中没有足够的数据,所以一个人利用,比如说,从Imagenet任务中学到的过滤器。
这与医学成像问题截然不同,然后使用同样的过滤器,加上一套新的顶层,以便对您关心的问题进行微调,所以说,这将是试图希望有一个共同的转移表示的最简单的方法,在一个深邃的建筑中,但你可能会问。
你如何用时间数据做同样的事情,非图像数据,可能是来自语言的数据,也可能是来自时间的数据,健康保险索赔系列,为此,你真的想考虑递归神经网络,所以只是想提醒你,递归神经网络是一种递归体系结构。
在那里你把一些向量作为输入,比如说,如果你在做语言建模,那个矢量可能只编码了一个热的,该位置的单词的编码,例如,这个向量可能都是零,除了四维空间,这是一个表示这个词是class这个词的词。
然后它被输入一个循环单元,它将之前的隐藏状态,将其与当前输入组合,给你一个新的隐藏状态,这样你就读进去了,您对完整的输入进行编码,然后你可能会预测,根据最后一次步骤的隐藏状态进行分类。
这将是一种常见的方法,这里是一个非常简单的循环单位的例子,这里我用s来表示隐藏状态,我们经常寻找H用来表示隐藏的状态,这是一个特别简单的例子,只有一个非线性,所以你把你以前的隐藏状态。
你用一些矩阵W打它,就像,你把它添加到被不同矩阵击中的输入中,您现在有一个输入加上以前隐藏状态的组合,你对它应用非线性,你得到了你新的隐藏状态,所以这将是一个典型的循环单位的例子。
一个非常简单的循环单位,现在,我讲这些细节的原因是想指出,WSX矩阵的维数是隐态的维数,s的维度词汇量,如果您使用输入的一个热编码,所以如果你有大量的词汇量,矩阵WSX也将同样大,这带来的挑战是。
很快就会导致对稀有单词的过度适应,所以这是一个可以通过,而是使用wsx矩阵的低秩表示,特别是,你可以考虑引入一个低维瓶颈,在这张图片中,我注意到它是xt素数,它是原始的XT输入。
这是一个热编码乘以一个新的矩阵,我们,然后你的循环单元只接受隐藏的输入,xt素数,为k的维度,它可能比V小得多,然后你可以考虑中间表示的每一列,WWE作为单词嵌入,这是一种,这是皮特经常谈论的事情。
当我们思考自然语言的时候,当我们谈论自然语言处理时,还有很多,你们中的许多人可能在单词到VEC的上下文中听说过,如果一个人想做一个设置,比如说,其中一个数据,你有大量的数据,跑。
在该机构的数据上学习递归神经网络,然后推广到一个新的机构,尝试做到这一点的一种方法,如果你想想你砍的东西是什么,一个答案可能是,你所做的一切,你保留嵌入这个词,所以你可能会说,好的,我要留下韦斯一家。
我要把它翻译成我的新机构,但我会让循环单位参数,循环参数,比如说,你可能允许为每个新机构重新学习的WSS,所以这可能是如何使用我们从,从…,递归设置下的前向神经网络,现在所有这些都很普遍,嗯。
我接下来要做的是对它进行一点实例化,在保健方面,所以自从皮特提出,单词对VEC的扩展,比如伯特和埃尔莫,我也不打算,我现在不打算谈他们,但你可以回到几周前皮特的演讲,提醒你们自己。
从你们在讲座上介绍的时候起,这些是什么,实际上有三篇新论文试图将这一点应用于医疗保健领域,其中一个来自麻省理工学院,所以这些论文都有同样的想法,他们要拿一些数据集,这些论文都用了模仿。
他们会拿走文本数据,他们将学习一些单词嵌入,或者词汇表中所有单词的一些低维表示,在这种情况下,他们不是在学习每个单词的静态表示,而是,这些伯特和埃尔莫的方法将学习什么,你可以认为是动态表示。
所以它们将是这个词的一个函数,以及它们在左手边和右手边的上下文,然后他们会做的是,然后他们会接受这些表示,并试图用它们来完成一项全新的任务,这些新任务可能是在模拟数据上,例如。
这两个任务都是模仿上的分类问题,但它们也可能在非模拟数据上,所以这两个任务是临床试验中的分类问题,它根本不是来自模仿,所以说,这真的是一个翻译你所学到的东西的例子,从一个机构到另一个机构。
这两个数据集非常小,实际上,与最初的模拟规模相比,所有这些数据集真的真的很小,所以可能有一些希望,人们可以学到一些真正提高泛化的东西,事实上,这就是结果,所以这个,所有这些任务都是一个概念检测任务。
给出临床说明,标识注释中引用,比如说,疾病或治疗,或者别的什么,然后你在第二阶段可能会正常化到U,s,那么这些结果真正引人注目的是什么呢,当你从左列转到右列时会发生什么,我一会儿就解释。
当你从上到下处理这些不同的任务时会发生什么,所以左栏是结果这些结果是我们的F或F分数,嗯,如果使用在非临床数据集上训练的嵌入,结果会如何,或者说得不同,不是在模仿上,但是在其他一些更一般的数据集上。
第二列是会发生什么,如果你在临床数据集上训练这些嵌入,在这种情况下,模仿,你会看到很大的改进,从一般嵌入到基于模拟的嵌入,更惊人的是,是随着越来越好的嵌入而发生的改进,所以第一行是结果是什么。
如果您只使用Word到VEC嵌入,所以,比如说,参加2010年的挑战赛,你得了82分65分,使用逐字逐句到VEC嵌入,如果你使用一个非常大的bert嵌入,你得了九十二分,它要高得多。
在不同的任务中一次又一次地发现了相同的发现。
现在,我发现这些结果真正引人注目的是,几年前我尝试过很多这样的东西,不使用伯特或埃尔莫,但是用文字来真空,手套和快速文本,我发现使用单词嵌入方法解决这些问题并没有,即使你把它作为其他最先进的附加功能。
概念提取问题的方法,没有提高预测性能超过现有的技术状态,然而,在本文中,这里,他们使用了最简单的算法,使用递归神经网络,输入条件随机场,以便将每个单词分为这些类别中的每一个和特征。
他们使用的特性只是这些嵌入特性,所以只要用VEC这个词嵌入功能,表演很烂,你不会更接近艺术的状态,但是有了更好的嵌入,他们实际上获得了状态,实际上他们在每一个任务中都改进了最先进的技术。
P25:25.Interpretability - 大佬的迷弟的粉丝 - BV1oa411c7eD
这门课的最后一个主题是可解释性,很难理解所以,如果我给你一些像GPT 2型号的东西,我们在自然语言处理中谈到过,我告诉你它有一点,50亿个参数,然后你说,嗯哼,它为什么起作用了。
答案显然不是因为这些特定的参数有这些特定的值,没有办法理解,所以今天的话题是我们提出的,在关于公平的讲座中,其中一个问题是,如果你不能理解模型,你看不出来,如果模型通过检查它而产生了偏见。
所以今天我们要看看人们开发的不同方法,试图克服高深莫测的模型的问题,有一段非常有趣的历史,你们有多少人知道乔治,米勒七正负二结果,只有几个,米勒是哈佛的心理学家,我想在二十世纪五十年代。
他在1956年写了这篇论文,叫做神奇的数字,七正负二,对我们处理信息能力的一些限制,这是一篇相当有趣的论文,所以他从我忘记的东西开始,我在很多很多年前读过这篇论文,我已经忘记了,他从一个问题开始。
你能感觉到多少不同的东西,你能感觉到多少不同层次的东西,所以如果我给你戴上耳机,我要求你用1到N的比例告诉我,我在你耳机里播放的声音有多大,当你超过5英尺6英尺7英寸时人们会感到困惑,不同程度的强度。
同样,如果我给你一堆颜色,我请你告诉我不同颜色之间的界限在哪里,人们似乎想出了七个,正负二,作为他们能分辨的颜色的数量,所以有很长的心理学文献,米勒继续做实验,在那里他要求人们记住一系列的事情。
他又一次发现,你可以记住大约七个,正负两件事,除此之外,你再也记不起名单了,所以这告诉了我们人类大脑的认知能力,这意味着如果我给你一个有20个东西的解释,你不太可能理解它。
因为你不能同时把所有活动的部分都记在脑子里,现在这是一个棘手的结果,因为他确实指出,即使在1956年,如果你把东西分成更大的块,你能记得其中的七个,即使它们大得多,所以很擅长记忆的人,比如说。
他们记得那些模式,这样他们就可以记住更多的原始对象,所以你知道,我们仍然不明白记忆是如何工作的,但这只是一个有趣的观察,我想,在…的问题上发挥了作用,你如何在复杂的模型中解释事物。
因为这表明你无法解释太多不同的事情,因为人们不会明白你在说什么,是什么导致了复杂的模型,就像我说的,过拟合肯定会导致复杂的模型,我记得,在二十世纪七十年代,当我们开始研究医疗保健中的专家系统时。
我参加了统计学家和人工智能研究人员的第一次联席会议,统计学家们都在你知道的,理解方差和理解统计显著性等等,我一直在努力模拟一个病人身上发生的细节,在我演讲后的一些讨论中,有人挑战我,我说好。
我们AI人真正做的是合身,你们认为是噪音,对呀,因为我们正试图对我们的理论进行更详细的改进,在我们的模型中,比典型的统计模型,当然,我被大声嘘出了大厅,在会议的剩余时间里,人们避开了我。
因为我做了件蠢事,承认我是我在适应噪音,当然,我并不真的相信我在适应噪音,我相信我适合的是,一般的统计学家只是把噪音归因于噪音,我们对机制的更多细节感兴趣,通过正规化,我们有一个很好的处理。
这样你就可以,你知道的,在整个课程中,你已经看到了很多正规化的例子,人们不断提出如何应用正规化的有趣想法,为了简化模型,或者让它们合身,对模型应该是什么样子的一些先入为主的概念。
在你开始从数据中学习它之前,但问题是这些模型真的很复杂,不管你是否安装噪音,世界是一个复杂的地方,人类不是被设计出来的,它们进化了,所以我们的进化遗产留下了各种各样奇怪的东西,所以它很复杂。
很难简单地理解如何做出有用的预测,当世界真的很复杂的时候,那么我们该怎么做才能处理好这个问题,一种方法是编造我所说的,这些故事简单地解释了一件复杂的事情是如何运作的,你们中有多少人在小时候读过这些故事。
没有人,我的天啊,好的,一定是一代人的事,所以鲁德亚德·吉卜林是一位著名的作家,他写了一系列的故事,比如狮子是怎么得到鬃毛的,骆驼是如何驼峰的等等,当然,他们都是彻头彻尾的公牛,我是说,它不是。
为什么雄狮有男人,只是编出来的故事,但它们真的很可爱的故事,我小时候很喜欢,也许你也会,如果你的父母,如果你父母读给你听,所以我的意思是我用这作为一种贬义词。
因为遵循这条调查路线的人所做的是他们采用一些非常复杂的模型,他们对它做了一个局部近似,这不是整个模型的近似值,但它是在特定情况附近的模型的近似值,然后他们解释简化的模型。
我会在今天的课上给你们看一些例子,另一种方法,我也会向你们展示一些例子,你只是为了一个模型而牺牲了一些较低的性能,这很简单,可以解释,像决策树和逻辑回归等等,通常表现得不如最好的,最复杂的模型。
尽管你已经在这门课上看到了很多例子,事实上,他们确实表现得很好,在那里他们没有被花哨的模特超越,但总的来说,你可以通过调整一个花哨的模型来做得更好一点,但后来就变得难以理解了,所以人们愿意说,好的。
我要放弃百分之一或百分之二的业绩,为了有一个我能真正理解的模型,它之所以有意义是因为这些模型不是自动执行的,它们通常被用作对一些做出最终决定的人的建议,你的外科医生不会看这些模型中的一个。
把他的左肾拿出来说,好的,我想他们会很顺利的,这有道理吗,为了回答,这有道理吗,知道模型是什么真的很有帮助,模型的推荐是基于什么,它的内在逻辑是什么,所以即使是一个近似值也是有用的,信任的需要。
ml模型的临床应用,在这篇论文中,我将讨论两种方法,他们说,好的,您想做的是查看特定案例的预测,所以有一个特定的病人在特定的状态下,你想了解模型对病人的描述,然后你也想对整个模型有信心。
所以你希望能够有一个解释能力,上面写着,这里有一些有趣的代表性案例,以下是模型对它们的看法,浏览它们,并决定你是否同意这个模型所采取的方法,现在,还记得我对随机对照试验的批评吗,人们做这些试验。
他们选择最简单的情况,为了达到统计显著性,他们需要的最小数量的病人,最短的随访时间,等,然后这些试验的结果应用于非常不同的人群,大卫谈到了队列转移,作为那个想法的概括。
但同样的事情也发生在这些机器学习模型中,你在一组数据上训练,然后,典型的发布将对相同数据的一些保留子集进行测试,但这并不是对现实世界的非常准确的描述,如果您尝试将该模型应用于来自完全不同来源的数据。
很可能你会以某种方式把它专业化,你不欣赏,你得到的结果不如你得到的好,拿出的测试数据,因为它更异构,我想我提到过杰夫·德雷克,《新英格兰日报》的主编大约一年前开了一次会,他在信中争辩说。
该杂志永远不应该发表一项研究,除非它已经在,发表最终被撤回的研究,因为不是因为调查人员的任何公开的坏行为,他们做的正是,你们在这门课上学到的东西,但是当他们把这个模型应用到不同的人群中时。
它只是不像出版的版本那样工作得很好,当然,还有所有关于出版偏见的问题,你知道的,如果我们50个人做同样的实验,偶然的机会,我们中的一些人会得到比其他人更好的结果,这些是将要出版的。
因为结果不好的人没有什么有趣的东西可以报告,所以有整个出版偏见的问题,这是另一个严重的,所以我想花一分钟说,你知道的,解释不是一个新想法,所以在专家系统时代,我们谈到了一点,在我们早期的一堂课上。
我们谈到了我们将采取医疗措施的想法,人类,医学专家,向他们汇报他们所知道的,然后尝试将它们编码为模式,或在规则中,或者以各种方式在计算机程序中复制它们的行为,所以梅森是其中一个项目。
特德·肖特利夫在1975年的博士论文,他们发表了一篇很好的论文,这是关于霉素系统的解释和规则获取能力,作为一个例子,他们举了一些例子来说明你可以用这个系统做什么,所以他们争论的规则是完全可以理解的。
因为他们说如果一堆条件,那么你可以得出以下结论,对呀,所以考虑到你可以说好,当节目回来的时候,并根据获得培养物的地点和收集方法说,你觉得检测到了大量的有机体吗,获得了,换句话说。
如果你从某人的尸体上取了样本,你在寻找感染,你认为你的样本里有足够的有机体吗,用户说,嗯,你为什么问我这个问题,就系统运行的规则而言,答案是相当好的,上面写着,找出答案很重要,是否有治疗意义的疾病。
与这种生物体的发生有关,一个我们已经建立的,培养物不是通常不育的培养物,采集方法是无菌的,因此,如果观察到大量生物体,然后呢,有强烈的证据表明,那个,有治疗上重要的疾病,与这种生物体的发生有关。
所以如果你在仔细收集的地方发现虫子,那么这表明你应该治疗这个病人,如果有足够多的虫子,和,也有强有力的证据表明这种生物体不是污染物,因为采集方法是无菌的,你可以继续这个,你可以说好。
为什么为什么这个问题,它可以追溯到这些规则的演变,上面写着好,为了找出感染的部位,已经确定文化遗址是已知的,获得标本后的天数少于7天,因此,有治疗上重要的疾病与这种生物体的发生有关,所以有一些规则说。
如果你有虫子,而且发生在过去的七天内,病人可能真的感染了,所以说,我的意思是,我有很多这样的例子,但你可以继续前进,为什么你知道,这是两岁的,但是为什么爸爸,但是为什么,但为什么。
为什么找出感染源很重要,嗯,有一个原因,那就是有一个规则会得出结论,例如,腹部是感染的部位,或者骨盆是病人的感染部位,如果您满足这些标准,所以这是一种基本的解释,这直接来自于这些基于规则的系统。
所以你可以回放规则,我喜欢的一件事是,你也可以在1975年问自由形式的问题,自然语言处理不太好,所以这大约五分之一有效,但你可以走到它跟前打一些问题,和,比如说,你开过卡宾尼西林治疗假单胞菌感染吗。
上面写着好,在我的规则数据库中有三条规则可以得出与这个问题相关的结论,那么你想看哪一个呢?如果你说我想看第六十四条,它说很好,这条规则说,如果确定该生物体是假单胞菌,正在考虑的药物是戈霉素。
那么更合适的治疗方法是戈霉素和卡宾尼西林的结合,再次,这是1975年的医学知识,但我猜真正的潜在原因是,可能有假单胞菌对,到那时到戈霉素,所以他们使用了联合疗法,现在顺便注意一下。
这个解释能力并没有告诉你这一点,因为它实际上并不理解这些单独规则背后的基本原理,当时也有研究,比如说,我的一个学生关于如何通过编码来更好地做到这一点,不仅仅是规则或模式,也是它们背后的理由。
这样解释就更合理了,标准的爷爷,今天解释复杂模型的故事方法来自这篇论文,在一个叫做莱姆局部可解释模型的系统中,不可知论的解释,只是给你一个例子,你有一些复杂的模型。
它试图解释为什么医生或人类做出了某个决定,或者为什么模型做出了某个决定,所以它说得很好,这是我们掌握的关于病人的数据,我们知道病人在打喷嚏,我们知道他们的体重和头痛,和他们的年龄,他们没有疲劳的事实。
所以解释者说,为什么模型判断这个病人得了流感,嗯,积极的是打喷嚏和头痛,而负片就是不疲劳,对呀,所以它进入了这个复杂的模型,上面写着好,我无法解释神经网络中发生的所有命理,或贝叶斯网络。
或者它正在使用的任何网络,但我可以具体说明,看起来这些是最重要的,正负贡献者,是啊,是啊,这不仅是为了,还是为了那个,我会给你看一些其他的数据,一分钟后我想他们最初是为了笔记而设计的。
但它也用于图像和其他类型的数据,他们提出的论点是,这种方法也有助于检测数据泄漏,比如说,在他们的一个实验中,数据的标题有,与结果高度相关的信息,我想我不记得是不是这些人了。
但有人给每个病例分配了学习身份证,他们用一种愚蠢的方式做了这件事,所以所有的小数字都与患有这种疾病的人相对应,大数字与没有的人相对应,和,当然,最节俭的预测模型只是使用身份证号码,并说,好的,我拿到了。
所以这将帮助你识别,因为如果你看到最好的预测器是ID号,然后你会说嗯,这里有点可疑,嗯,所以这里有一个例子,这种能力非常有用,这是新闻组的,他们试图决定一个帖子是关于基督教还是无神论,现在看这两个模型。
所以有算法一和算法二,或者型号一和型号二,当你解释一个特定的案例时,它说很好,我认为重要的词是上帝,意思是任何人这个考雷什和通过,有人记得大卫·考雷什是谁吗,他是个邪教领袖,我不记得谁了。
如果他杀了一堆人或者发生了不好的事情,哦,我想他是德克萨斯州韦科的那个人,联邦调查局和ATF进去放火烧了他们的地方,一大群人死了,所以在这种情况下的预测是无神论,你注意到上帝、考雷什和卑鄙都是负面的。
任何人都是这样的,通过或积极的,你走了,这很好吗,但你看算法二,你说这也做出了正确的预测,这篇文章是关于无神论的,但积极的一面是这个词不是很具体,消极的是像NP这样的东西,你知道那是什么。
那是网络时间协议,这是一些技术上的东西,发帖和主持,所以这可能是进入文章标题或其他东西的元数据,所以碰巧在这种情况下,根据他们提供的测试数据,算法二比算法一更准确,但没有任何好的理由。
所以解释能力允许你了解这样一个事实,即使这件事得到了正确的答案,不是为了,那么你想从一个解释中得到什么,他们说你希望它是可解释的,因此,它应该提供对输入变量和响应之间关系的定性理解。
但他们也说这将取决于观众,我之前提出的乔治·米勒的论点需要稀疏性,你不能把太多的事情记在心里,你所解释的一定有道理,例如,如果我说好,这决定的原因是因为第一个主分量的特征向量是,下文。
这对大多数人来说意义不大,然后他们还说,嗯,它应该有局部的保真度,所以它必须与模型的行为相对应,在你试图解释的特定例子附近,及其第三项标准,我觉得这有点不确定,它必须是模型不可知论的,换句话说。
你不能利用任何东西,你知道吗,这是关于模型结构的特定内容,你训练它的方式,任何类似的东西,它必须是一个通用的解释器,适用于任何复杂的模型,是啊,是啊,所以那是那是,我觉得,他们的推理。
他们为什么坚持这个,因为他们不想为每个可能的模型写一个单独的解释,所以如果你能把这件事做完,效率会高得多,但我实际上质疑这是否总是一个好主意,但这是他们的假设之一,好的,这是他们使用的设置,他们说。
所有权利,x是定义原始数据的D维空间中的向量,我们要做什么才能让数据变得可解释,为了使数据不是模型可以解释的,我们要定义一组新的变量x素数,它们都是二进制的,在某个维d素数的空间里,它可能低于d。
所以说,我们正在简化我们将要解释的关于这个模型的数据,然后他们说,好的,我们要建立一个解释模型,g,其中g是一类可解释模型,那么什么是可解释的模型呢,嗯,他们不会告诉你,但他们说好,示例可能是线性模型。
加法得分,决策树,下降规则列表,我们将在后面的讲座中看到,它的域是这个输入,简化的输入数据,d素数维中的二元变量,模型复杂度将是决策树深度的某种度量,非零权重数与Logistic回归。
下降规则列表中的子句数,等等,所以这是一种复杂性度量,您希望最小化复杂性,然后他们说好吧,真实模型,多毛的复杂,一个全孔模型是f,它将原始数据空间映射成某种概率,例如,对于分类f是x属于某一类的概率。
然后他们还需要一个接近度测量,所以他们需要说,我们必须有一种方法来比较两个案例,说他们有多亲密,原因是因为记住,他们会给你一个特定的案例的解释,最相关的有助于解释的东西是那些靠近它的东西。
在这个高维输入空间中,所以他们根据实际的A决策算法定义他们的损失函数,基于简化的和基于邻近度的,他们说好,最好的解释是G使损失函数最小化,加上g的复杂度,很简单,所以这是我们最好的模型。
这里聪明的想法是说,而不是使用我们开始使用的所有数据,我们要做的是对数据进行采样,这样我们就可以在我们感兴趣解释的点附近取更多的样本点,我们将在可解释的简化空间中取样,然后我们建立G模型。
来自该数据样本的解释模型,我们通过接近函数等待,所以更接近的东西会对我们学习的模型产生更大的影响,最接近这个简化表示的点,我们可以计算出它的答案应该是什么,这就成了那个点的标签,所以现在。
我们训练一个简单的模型来预测复杂模型会预测的标签,对于我们已经取样的点,其他节目在能够,呃,去,呃,距离,呃,它是某种距离函数,我一会儿会说得更多,因为这是对这种特殊方法的批评之一,你如何选择距离函数。
但基本上是相似的,这里有一个很好的图形解释,假设实际模型,决策边界在蓝色和粉色区域之间,所以这是一个可怕的、多毛的复杂决策模型,我们试图解释为什么这个大的红色+会变成粉红色,而不是在蓝色中。
所以他们采取的方法是说,嗯,让我们对一组用最短距离加权的点进行采样,所以我们在这里做了几个点的样本,但大多数情况下,我们是在我们感兴趣的点附近采样点,然后我们学习正负情况之间的线性边界。
这个边界是更复杂的决策模型中实际边界的近似值,好的,所以现在我们可以给出一个解释就像你之前看到的那样,这是一个d素数维空间,所以D素数维空间中的哪些变量会影响你在哪里。
在这个新计算的决策边界的一边或另一边,以及在多大程度上,因此,如果将此应用于文本分类,是呀,我们只是想问,人们担心这种解释不仅仅是虚构的,就像我们能理解它一样,但相信我们应该相信它的理由。
如果这真的是线性所做的事情的真实本质,你知道吗,可以像,好的,我们知道这里发生了什么,但是,嗯,这就是为什么我把它叫做一个普通的故事,对呀,你应该相信吗,嗯,工程学科在近似,线性模型中极其复杂的现象。
对呀,我是说我在电子工程和计算机科学系,如果我和我的电气工程同事谈谈,他们知道这个世界是疯狂的复杂,然而,电气工程中的大多数模型或线性模型,它们工作得很好,人们能够建造非常复杂的东西并让它们工作。
所以这不是证据,那是历史上的争论什么的,但它是真正的线性模型是非常强大的,尤其是当你把他们限制在解释的时候,注意到这个模型对这个决策边界的近似很差,或者这个对,所以它只能在特定例子的附近解释。
我已经选择好了,但在那里确实管用,是啊,是啊,你说那里很好,因为你指向附近,就像一个边界,但是如果你在红色空间的中间选择一个点,他们,他们,他们做到了,所以他们到处取样,但请记住接近函数。
说这个与预测决策边界不太相关,因为这离我感兴趣的点很远,这就是魔力,但在这里他们试图解释大红十字,对是的,就像中间的某个点,红色的空间,基本上附近的都是红色的,成为别人的好,但他们会我的意思是。
假设他们选择了这个点,然后他们会在这一点周围取样,大概他们会找到这个决定边界或这个或类似的东西,仍然能够提出一个连贯的解释,在文本的情况下,您已经看到了这个示例,对于它们的接近函数来说很简单。
他们用余弦距离,所以它是一袋文字模型,他们只是计算不同例子之间的余弦距离,他们使用的单词之间有多少重叠,以及他们使用单词的频率,然后他们选择K和要显示的字数,只是作为一种偏好,所以它有点像超参数。
他们说,你知道的,我有兴趣看看前五个单词,或者对决定有积极或消极影响的前十个词,但不是前万字,因为我不知道用一万个字做什么。
现在有趣的是,你也可以把同样的想法应用到图像解释中,所以这里有一只狗在弹吉他,所以这是这些标签任务之一,你想把这张照片贴上拉布拉多的标签,或者作为木吉他,但有些唱片公司也决定这是一把电吉他,所以他们说。
嗯,赞成或反对其中每一项的因素是什么,他们采取的方法是相对简单的,他们说,让我们定义一个超级像素,作为图像中强度大致相同的像素区域,所以如果你用过Photoshop,魔法选择工具可以调整说。
在这一点周围找到一个区域,所有的强度都在,我选的点,所以它会勾勒出图片的某个区域,他们所做的就是把整个图像分成这些区域,然后他们把那些当成,单词样式中的单词,解释,所以他们说好,对算法来说。
这看起来像一把电吉他,这看起来像一把木吉他,这看起来像拉布拉多,所以有些是有道理的,我是说你知道那只狗的脸确实有点像实验室,这看起来确实有点像身体的一部分,和吉他的一部分烦恼,我不知道这是什么东西。
或者为什么这有助于它,当一只狗,但比如这些模型的性质,但至少它在告诉你。
为什么它相信这些各种各样的事情,所以他们做的最后一件事就是说好,好的,这有助于您理解特定的模型,但你如何说服自己,我指的是一个特别的例子,其中一个模型被应用到它,但是你如何让自己相信模型本身是合理的。
所以他们说好,我们知道的最好的技术是向你展示一堆例子,但我们希望这些例子涵盖所有地方,你可能会感兴趣的,所以他们说让我们创建这个矩阵,解释矩阵,这些是什么情况,这些是各种特征,你知道。
或者上面的像素元素什么的,然后我们填充矩阵中的元素,它告诉我,此特征与该模型的分类相关或反相关,然后它就变成了一种布景覆盖问题,找到一组模型,给我最好的解释覆盖范围,跨越这组特性。
这样我就能说服自己模型是合理的,嗯,所以他们有一个叫做子模选择算法的东西,你知道,如果你感兴趣的话,你应该看看报纸,嗯,但他们所做的本质上是在做一种贪婪的搜索,上面写着我应该添加什么功能。
为了在那个空间的特征中获得最好的覆盖,按文件分列,然后他们做了一堆实验,他们说,好的,让我们比较这些简化模型的这些解释的结果,两千个实例的两个情感分析任务,每一袋单词作为特征,他们把它比作决策树。
Logistic回归,最近的邻居,带径向基函数核的SVM,或者使用Word真空嵌入的随机森林,高度无法解释,有一千棵树,k等于十,所以他们选择了十个特征来解释这些模型中的每一个。
然后他们做了一个侧面计算,每种情况下最具启发性的十个特征是什么,然后他们说这样做,正确识别这些特征,所以他们在这里展示的是,在每一种情况下都比随机抽样,这并不奇怪,或者贪婪的取样,或者党派抽样。
我不知道细节,但无论如何,这张图表显示了什么,是他们认为重要的特征,在这些病例中,他们都在康复,所以他们的召回率很高,你知道的,百分之九十以上,所以其实,算法正在识别正确的案例。
为您提供所有重要功能的广泛覆盖,在对这些案件进行分类时,然后他们还做了一堆人体实验,他们说,好的,我们将要求用户从两个分类器中选择哪一个,他们认为会更好地推广,这就像我给你们看的基督教对无神论的图片。
如果你是一个机械火鸡,有人给你看了一个精确度很高的算法,但这取决于事情,比如在无神论和基督教的分类器中找到NNP这个词,你会说好,也许那个算法不会很好地推广,因为它取决于一些随机的东西。
可能与此特定数据集相关的,但如果我在不同的数据集上尝试,不太可能奏效,所以这是任务之一,然后他们要求他们识别像这样看起来很糟糕的特征,然后他们,并有一个单独的测试集,从这个网站上增加了大约800个网页。
底层模型是一个带有RBF核的支持向量机,对20个新闻组数据进行培训,我不知道你是否知道那个数据集,但它是,这是一个众所周知的公开数据集,他们有一百个机械图尔,他们说,好的。
我们将向他们每个人展示六个文档,每个文档有六个功能,为了让他们做这个,然后他们做了一个辅助实验,他们说,如果你在这个实验中看到不好的词,三振出局,这将告诉我们在这种方法中哪些功能是不好的。
他们发现人类受试者,很擅长弄清楚,哪个是现在更好的分类器,他们的判断更好,所以他们说,好吧,这个子模块选择算法,就是我没有详细描述的那个,但是这种集合覆盖算法比随机选择算法给你更好的结果。
只是说再次选择随机特征,并不完全令人惊讶,另一件有趣的事情是,如果你做特征工程实验,它表明,当土耳其人与系统互动时,系统变得更好了,所以他们一开始在现实世界中的准确率不到60%,利用他们更好的算法。
经过三轮互动,他们达到了大约75%,所以用户可以说我不喜欢这个功能,然后系统会给他们更好的功能,现在他们用图像尝试了类似的事情,所以这个有点好笑,所以他们训练了一个故意糟糕的分类器来分类。
在狼和哈士奇之间,这是一个著名的例子,而且原来哈士奇生活在阿拉斯加,所以狼,我想有些狼会,但大多数狼不会,所以在最初的问题表述中使用的数据集,经过训练的精确分类器,当他们去看它学到了什么。
基本上它已经学会了寻找雪,如果它在照片中看到雪,说是哈士奇,如果它在照片中没有看到雪,它说它是一只狼,所以这对他们的样本来说是非常准确的,但当然这不是一个非常复杂的分类算法。
因为有可能把狼放在下雪的照片里,你的哈士奇在室内没有雪是可能的,然后你就错过了这个分类的船,所以这些家伙建立了一个特别糟糕的分类器,通过让训练中的所有狼在照片中都有雪,没有一只哈士奇,十个平衡测试预测。
但他们在每个类别中放了一个铃声,所以他们放了一只哈士奇和雪还有一只不在雪中的狼,比较实验前后的信任和理解,所以在实验之前,他们说两个七个学生中有十个说他们相信坏人,他们训练的这个坏模型。
后来只有七分之三的人相信它,所以这是一种社会学实验,呃,是呀,我们实际上可以改变人们对一个模型是否是好的想法,是好是坏,基于一项实验,之前只有七分之十二的学生提到雪是这个分类器的潜在特征,然而。
后来几乎每个人都这样做了,这告诉您该方法提供了一些有用的信息。
现在这篇论文引发了大量的工作,包括对这部作品的很多批评,这是几个月前的一个特别的,十二月底,这些人说距离函数,其中包括一个西格玛,这是你愿意去的距离的尺度,在最初作者所做的实验中是相当武断的。
他们把那个距离定为七十,数据集维度平方根的5%,你去,好的,我是说,那是个数字,但并不明显这是最好的数字还是正确的数字,所以这些人认为调整社区的规模很重要,根据你试图解释的点离边界的距离。
所以如果它靠近边界,那么你应该取一个较小的区域来测量你的接近度,如果离边界很远,这解决了你们问的问题,如果你在中间选一个点会发生什么,所以他们展示了一些很好的例子,例如,如果你把这个,解释这个绿点。
你会得到一条很好的绿线,沿着当地的边界,但是解释蓝点,它靠近实际决策边界的一个角,你会得到一条线,它和绿色的没有很大的不同,红点也是一样的,所以他们说,嗯,我们真的需要研究距离函数。
所以他们想出了一个方法,但在这里,他们将取样现有的案例,所以他们要从训练中学习,原来的训练集,但他们会通过接近来取样,他们试图解释的例子,他们认为这是个好主意,因为,比如说,在法律上,先例的概念。
你可以争辩说这个案子和以前判决的案子很相似,因此应该以同样的方式决定,我是说,最高法院的争论总是关于这一点,下级法院的辩论有时更多地受到法律实际规定的驱动,但是判例法在英国法律中已经得到了很好的确立。
然后在美国法律中通过继承,许多世纪以来,所以他们说,嗯,基于案例的推理通常包括检索相似的案例,调整它,然后以此为新的先例,他们还主张对比论证,这不仅是你选择X的原因,但是你为什么选择X,而不是Y。
作为给予,对某些模型是如何工作的更令人满意、更有洞察力的解释,所以他们说,好的,类似设置f解决分类问题,其中x是数据,y是一些二进制分类器,你知道零或零一,如果你喜欢这套训练套装。
一堆x的y子为真的是实际的答案,y的预测值就是f在x上的预测值,并解释z的f等于某个特定的结果,你可以把一个案子的盟友定义为那些想出相同答案的人,你可以把敌人定义为一个,那些想出不同答案的人对吧。
所以现在你要对盟军和敌人都进行采样,根据一个新的距离函数,他们的直觉是,距离函数在原始石灰工作中的原因,效果不太好,是因为它是n维空间中的球面距离函数,所以他们会偏向它,说距离。
这个B将是线性预测差异的某种组合,加上这两个点的差值,第一项的等高线是这些圆形等高线,这就是莱姆在做的,第二项的等高线是这些线性梯度,他们把它们加起来,得到椭圆形的东西,这就是你想要的特征,对。
这一点离决策边界有多近,有很多相对毛茸茸的细节,我今天要把它省略在课堂上,但他们肯定在报纸上,所以他们还对一些非常简单的预测模型进行了用户研究,这就是你的房子值多少钱根据房子有多大,它是哪一年建的?
对它的主观质量判断是什么,所以他们展示的是你可以找到例子,他们是这座房子的盟友和敌人,为了做预测,所以他们应用他们的算法,如果成功了,它给你更好的答案,我得去找那张幻灯片好的,关于这件事。
我要说的就是这些,在个案的局部邻域中使用简化模型的想法,为了解释某事,我想谈谈另外两个话题,这是我的一些学生最近的一篇论文,他们在看医学图像,并试图从这些医学图像中生成放射学报告,对呀,我是说。
你知道的,机器学习可以解决所有问题,我给你一组图像和一组放射学报告,应该是直截了当的,建立一个模型,它现在拍摄新的放射学图像,并产生新的放射学报告,这些报告是可以理解的,精确等等。
但他们采取的方法有点有趣,所以他们用一个标准的图像解码器,然后在池层之前,它们本质上是一种图像嵌入,从这个图像编码算法的下一层到最后一层,然后他们把它输入单词解码器和单词生成器。
这个想法是让出现在图像中的东西,与报告中出现的词语相对应,在同一个地方结束,在嵌入空间中,所以又有很多头发,这是一个基于LSTM的,它被建模为句子解码器,里面有一个单词解码器。
然后有一个生成器生成这些报告,它使用强化学习,你知道,成吨的头发,但这是我想给你看的,有趣的是,所以编码器取了一堆空间图像特征,句子解码器使用这些图像特征,除了语言特征,输入到其中的单词嵌入,然后呢。
它们还使用远程注释方法,就是这个专家程序,这是一个基于规则的程序,出了斯坦福,读取放射学报告并识别报告中的特征,它认为重要和正确的,所以它并不总是正确的,当然啦,但是,但那是用来引导发电机的。
所以这里有一个例子,所以这是一个胸部和地面真相的图像,这是实际的放射学报告,说基底动脉中度心肌肥大是轻微的,没有气胸,部分可见下颈椎融合,愈合的右肋骨骨折顺便注意到,我看过上百张像这样的放射影像。
我永远也想不通,但这就是为什么放射科医生为许多人培训,多年来变得擅长这种东西,所以以前有一个别人做的程序叫TAT,它生成以下报告,上面写着,AP便携式胸部直立视图,没有,无焦点合并。
成像的骨结构完好无损,所以如果你把这个和那个比较,你说好,如果心内膜轮廓正常,然后呢,下颈椎融合的部分可视化,因为那是沿着中间的,所以这些不太一致,所以学生们建立的系统说,心脏轮廓轻微增大。
没有多发积液或气胸,没有急性骨异常,所以它也漏掉了愈合的右肋骨骨折。
但不管怎样,这是一个,你知道的,一只会唱歌的狗的非凡之处不是它唱得有多好,但它唱歌的事实,我把这个作品包括在内的原因,并不是让你相信这会很快取代放射科医生,但它有一个有趣的解释能力。
而解释设施利用注意力,这是它模型的一部分,嘿嘿,当我们得出一些结论时,我们可以指向图像,并说出图像的哪一部分对应于结论的那一部分,所以这很有趣,你说胸部的直立和侧视图是红色的,嗯,那是红色的胸部。
有中度心肌肥大,所以这里的绿色肯定向你展示了,你的心在哪里,大约在那里,再向左一点,没有多发积液或气胸,这个有点好笑,那是蓝色区域,那你怎么告诉我没有什么,我们很惊讶,其实。
当它向我们展示没有什么值得强调的时候,你可能感兴趣的东西之外的一切,这并不能完全令人信服地证明没有复数积液,这是另一个例子,没有相关的改变技巧,他必须把管子就位,所以粗略地显示有点太宽了。
但它大致显示了气管切开管可能在哪里,双侧胸腔积液和压迫,atleis和lcsis是指你的肺组织粘在一起,所以这种情况经常发生在肺的下部,再一次,底片向你展示了一切不属于行动的部分。
是啊,是啊,但就火车而言,真正好的是自己预测,而不是我的意思,就像一个模特,否,它试图预测整个模型,整个节点,就像他们掉下来一样并不容易,是啊,是啊,但这些人雄心勃勃,你知道吗,他们,是什么,杰夫。
辛顿几年前说过,他不想让他的孩子成为放射科医生,因为那个领域将被计算机取代,我觉得这么说很愚蠢,尤其是当你看到这些东西工作得有多好的艺术状态时,但如果那是真的。
那么你实际上会想要一些能够产生完整的放射学报告的东西,所以动机现在就在那里,在这项工作完成后,我们偶然发现了一份来自东北的有趣的报纸,上面写着,但是听着伙计们,注意不是解释,所以说。
注意力显然是一种机制,在各种机器学习方法中都非常有用,但你不应该把它和解释混为一谈,所以他们说好,假设,这是假设输入单元受到高度关注,受到高度重视的,权重负责模型输出,那可能不是真的,所以他们所做的是。
他们做了一堆实验,在那里他们研究了注意力权重和,模型参数的梯度,以查看是否,事实上,高关注度的话,是在模型中做出决定时最果断的人,他们发现直觉特征重要性之间的相关性衡量的证据,包括梯度和特征擦除方法。
所以这是消融研究,学习到的注意力权重很弱,所以他们做了很多实验,关于这项特殊的研究有很多争议,但你会发现,如果你计算一致性,你知道在不同的数据集上使用不同的模型,你看这个,比如说,一致性不是很高。
还不到一半,你知道的,有些在零度以下,因此,与此数据集相反的是,这些来自模拟数据的数据比其他一些数据的界限更窄,所以他们似乎有一个更明确的结论,至少为了研究,让我最后谈谈相反的想法。
所以与其建立一个复杂的模型然后试图用简单的方法来解释它,如果我们只是建立一个简单的模型,还有辛西娅·鲁丁,他现在是公爵,以前在麻省理工学院的斯隆学校,多年来一直支持这个想法,所以。
她想出了一堆关于如何建立简单模型的不同想法,权衡可能是一点点准确性,以便于解释,她最喜欢的是一个叫做下降规则列表的东西,所以这是一个例子,上面写着,如果有些肿块形状不规则,病人超过60岁。
那么有百分之八十五的机会患恶性肿瘤,有230个案例发生了这种情况,如果不是这样,那么如果肿块有推测的边缘,所以它有小尖刺从里面出来,病人已经四十五岁了,那么有78%的机会是恶性肿瘤,否则。
如果边缘有点模糊,它的边缘有点模糊,病人六十多岁了,那就有六十九的机会,如果它有不规则的形状,那么有百分之六十三的机会,如果是小叶状的,密度很高,那就有三九的机会,如果它是圆的,病人超过60岁。
那么有两个6%的机会,否则有百分之十的机会,好的,论点是对决策模型模型的描述足够简单,连医生都能理解,现在仍然存在一些问题,所以其中之一是通知,其中一些人的年龄超过了60岁,4岁以上,六十岁以上五岁。
不太清楚这定义了什么类别,原则上,不同的人可以有不同的年龄,但他们是这样建造的,所以这是一个非常简单的模型,是由一个非常复杂的过程建立的,简单的模型就是我刚才给你们看的,有一个贝叶斯方法。
贝叶斯生成方法,他们有一堆超参数,下降规则列表参数,θ,他们计算出一个可能性,给定一个特定的θ,你得到数据中实际答案的可能性有多大,给定您生成的A模型,他们从一组可能的,如果条款。
所以他们经常进行子句挖掘,以说明什么条件,数据库中经常出现的二进制条件是什么,这些是唯一会考虑的,因为,当然,可能的条款数量是巨大的,他们不想重复这些,然后对于每一组对于每一个子句。
它是由A由概率分布生成的,在下一个条款的风险评分较低的约束下,或等于前一条款的风险评分,好的,有很多细节,所以有一个频繁的项集挖掘算法,原来选r子,l成为实数乘积的日志是重要的一步。
为了以一种简单的方式保证单调性约束,l子句数取自泊松分布,你给它一个刻度,大致上说,在你的下降规则列表中,你愿意容忍多少条款,嗯,然后这里有很多计算,他们得到了平均的后验概率估计,生成一些子句。
然后他们用交换,替换,添加,并删除运算符,以便尝试不同的变体,他们在那个空间爬山,也有一些吉布斯采样,因为一旦你有了这些模型中的一个,简单地计算它的精度,并不直接,没有一种封闭的方式来做这件事。
所以他们正在取样,试图生成,所以它是一束头发,论文再次描述了这一切,但有趣的是,在一个为期30天的医院再入院数据集上,大约有8000名患者,他们使用了大约34个特征,比如精神状态受损,困难行为。
慢性疼痛,感觉不安全,等等,他们介意规则或条款,支持超过5%的数据库,并且不超过两个条件,他们将决定清单的预期长度设定为八个条款,然后他们将他们得到的决策模型与SVM的随机力进行了比较。
Logistic回归车与归纳逻辑规划方法,对我来说令人震惊,他们的方法,下降规则列表方法得到了大约8的auc,而其他人都喜欢第七点,九点七,五个逻辑回归像往常一样表现略好于他们得到的一个,但这很有趣。
因为他们的论点是,模型的这种表示更容易理解,对于大多数人类用户来说,甚至比逻辑回归模型还要好,如果你看看,这些只是各种运行,以及不同的型号,他们的模型有一个相当不错的A,你看上面。
我想绿色的是逻辑回归的,它稍微好一点,因为它的性能超过了他们最好的型号,在低假阳性率区域,可能是你想操作的地方,所以这可能是一个更好的模型,上面写着如果病人有褥疮,并且有不赴约的历史。
那么他们在三十天内被重新接纳的可能性是三三,如果我认为一些纸条上写着预后不良和最大限度的护理,等等,这就是他们现在得出的结果,顺便说一句,我们已经谈了30天了,再入院预测和超过70%在这个领域还不错。
因为这不是那么容易预测的,谁会在三十天内回到医院,所以这些模型实际上做得很好,当然可以理解,在这些术语中,他们还试穿了加州大学的各种,欧文机器学习数据集,这些只是随机的公共数据集。
他们试图建立这些下降规则列表模型来预测,你看到的是Aucs很好,所以垃圾邮件检测数据集,他们的系统大约有91,逻辑回归又得到了97,所以你知道,我们在几乎每一个例子中都教给我们的不幸教训的一部分。
在这个班上,像Logistic回归这样的简单模型通常做得很好,但请记住,这里他们是为了可解释性而优化的,得到正确的答案,所以他们愿意牺牲模型的一些准确性,为了开发一个容易向人们解释的结果,所以再一次。
这种类型的工作有许多变化,人们对什么是简单的可解释模型有不同的概念,但这是一种与莱姆方法非常不同的方法,上面写着建立毛茸茸的模型,然后提出当地的解释,解释为什么它对特定的案件做出某些决定,所有的权利。
关于可解释性,我想我要说的就这些,这是目前非常热门的话题。所以有很多论文,我想我刚刚看到一个关于,这方面的工作越来越多,这样我们的课程就结束了,我只想,我刚浏览了课程网站的首页,列出了所有的主题。
所以我们讨论了很多东西,你知道的,医疗保健的不同之处,我们讨论了临床护理是什么,临床数据是什么样的,如何在几堂课中解释临床文本,将技术转化为临床,斜体的是客座讲座。
所以心脏病学的机器学习和鉴别诊断的机器学习,病理学机器学习,大卫做了几次关于因果推理和强化学习的讲座,大卫和一位客人,我在这里没有注意到,疾病进展与亚型,我们谈到了精准医学和遗传学的作用。
自动化临床工作流程,规管讲座,然后最近,公平,对数据集的鲁棒性,移位和可解释性,所以那是相当多的,我想我们是我们,教职员工对课程的进展很满意,这是我们第一次作为这个团队来教它,我们希望再来一次。
向艾琳和威利表示感谢,4。没有他,我们可能早就没有希望了。
我也想承认大卫的远见,把这门课放在一起,几年前,他教了一个类似这样的班级的半尺寸版本,我想把它扩展到一个完整的学期是个好主意,常规课程,让我和他一起工作,我想感谢你们所有人的辛勤工作。
P3:3. Deep Dive Into Clinical Data - 大佬的迷弟的粉丝 - BV1oa411c7eD
上次我们谈到医学的作用,今天我想深入研究一下医学数据,我要举个例子,模拟数据库中的很多东西,这是我们将在这门课上使用的数据库之一,你们中的一些人可能很熟悉,你们中的一些人不是。
我希望从这次讨论中可以吸取一些教训,例如,几年前,当《模仿III》即将上映时,我在玩数据,我在CareView中查看了心率的分布,数据库的一部分,对你们这些不知道的人来说是如此的模仿。
贝斯以色列女执事医疗中心重症监护室的入院情况,在大约十二年的时间里,我们遇到的技术困难之一是在这段时间的中间,医院从重症监护室使用的一个信息系统转移到另一个,Careview是旧的,元视觉是新的,当然。
它们并不完全兼容,所以我们会说我们会看到一些例子,所以这是旧数据,这是来自CareView的,你看着它说好,心率从,你知道,大概四两百,就可以了,但有一件有趣的事,有两个山峰,那么在哪里。
你是否在生理数据中看到过两个高峰,哈哈哈,所以我仔细看了看,我说,嗯哼,从这两个系统来看心率是什么样子的,如果你看CareView,你看我刚才给你看的照片,如果你看元视觉,你看到另一张照片了吗。
这看起来更像你通常所期望的,所以我坐在那里挠头,好的,这些肯定有区别,与医院的转换不是同时进行的,从一个信息系统到另一个信息系统,人的生理改变了,突然间,一些人的心率开始加快,对但如果你仔细想想。
哪一部分人的心率更快,所以我说,嗯哼,有趣,所以无论如何,如果你看看统计数据,你看Careview中的平均心率是108,平均心率和转位率是87,但当然手段没有那么有意义,当你观察这些双峰分布时。
所以我说好,如果我们只看成年人呢,所以我们观察年龄从一岁以上到九十岁的人,我一会儿就说一句,我看了看这两个分布,他们看起来很接近,他们看起来很相似,这意味着成年组中不同年龄的患者数量相似。
在两个数据集中,但如果我不排除非常年轻或非常年老的人,然后我看到这个有趣的分布,我已经抑制了,九十岁以上,但不是年轻人,您在CareView中看到的是,零岁时有一个巨大的尖峰,对呀。
所以在医院发生的事情是,在旧的系统下,它也被用于重症监护室,新生儿重症监护室,新系统没有在重症监护室使用,因此他们没有捕捉到婴儿的数据,对事实上如果你观察整个人口的年龄和心率,你看到两个非常奇怪的东西。
这是我们一直在谈论的成年人,这是婴儿,果然,他们的心率更高,然后这些是300岁的老人你会说哇,我不认为我会有一个心率,当我三百年的时候,那么那些人是谁,有人有线索吗,他们人太多了,是啊,是啊。
输入错误总是有可能的,但那里有相当多的数据点,是啊,是啊,我五个,差不多三百了,它并没有完全丢失数据,所以海帕,健康保险,可携带性和责任法案定义了一套关于保护个人健康信息的标准,你不允许做的事情之一。
是指定一个90岁或以上的人的年龄,原因是97岁的老人数量很少,所以如果我告诉你威利已经97岁了,那么你就可以相对容易地从种群中挑选出它们,所以禁止说,所以说,结果。
每个90岁或以上的人都被贴上了300岁的标签,在数据库中,这是神器对吧,就像回到我年轻的时候,我在加州大学洛杉矶分校的一个健康科学计算设施做计算机程序员,我们曾经有一个惯例,丢失的数据用999。9表示。
当然还有,如果你把它平均到一个真实的数据集,你得到垃圾,人们经常这样做,所以这个有问题,我们遇到了其中一个,如果你看看成年人,这两个系统实际上看起来很相似,所以蓝点和红点,我已经画出了它们之间的趋势线。
你可以看到他们很相似,所以看起来随着年龄的增长,你的心率下降得很轻微,但在两个数据集中,它的作用是相等的,是啊,是啊,在前面三百以上,就像那里,嗯,那是因为那里的年龄是计算出来的,在测量心率的时候。
所以如果他入院时你已经300岁了,如果你在医院住六个月,那么到测量的时候你已经三百五十岁了,所以这就是为什么在三百的右边有数据点,是啊,是啊,好的好的,好的,然后这就是婴儿的样子,当然。
他们的心率确实更高,这里是老人,所以实际上有310岁的人,因为也许他们出院了,然后在一百岁的时候他们回来了,你知道的,也许他们最初被录取时已经90岁了,十年后他们回来了,我们记录了更多关于他们的数据。
所以这都是相对于三百,好的,这只是一个例子,其中的教训是,当你查看数据时,要小心,因为它真的很容易愚弄你,因为有各种各样有趣的事情,它收集了关于这些人工制品的东西,像三百岁的病人等等,好的。
所以这里是我们可以获得的数据类型的目录,所以我们有一种典型的来自医院的电子健康记录数据,保险类型,语言,宗教,生活状况,家庭结构,地点,工作,等等,我们有生命体征,你的体重,你的身高,你的脉搏。
呼吸速率,体温,等,所以这些是典型的事情,如果你去医生的办公室,或者你去医院,护士会把你带到一边称你的体重,测量你的身高和血压,量体温之类的这些都是标准的生命体征,所以我们有很多记录,非处方药。
非法药物,如果你愿意不对你的医疗保健提供者撒谎,再次,我最早的日子之一,我和塔夫茨医疗中心的心脏病专家在一起,我们看到这位老太太看起来有点可怕,我们和她谈得很好,医生在和她说话,我尽量不碍事,他这样说。
你知道吗,你喝酒吗,她说,哦不,千万不要碰这些东西,然后我们再谈,我们走出病人的房间,医生在病人听不见的情况下转向我说,哦,她是个老酒鬼,我说好,你怎么知道,他说,嗯,从实验室测试,从她皮肤的外观来看。
从她的一般举止,从各种无法言喻的因素,所以病人撒谎,好的,他们真的有,因为他们不想告诉你事情,嗯好的,顺便说一句,药物是一件大事,所以有一个叫医疗娱乐的领域,药物调节,哪个是医院的办公室。
哪个是医生的办公室,试图弄清楚你实际上在服用什么药物,所以我是麻省理工学院健康计划的成员,如果我登录我的健康计划账户,它告诉我,我正在服用一些我十二年前得到的药丸,但我们是,你知道的,我吃了两片药。
据说会有一些生理作用,然后他们测量了,从那以后,我再也没吃过药,也没吃过一片,对我来说也不是特别好,但它仍然在我的记录中,它从来没有停止过的通知,这是一个真正的问题,因为如果你在照顾一个病人。
你想知道他们实际上在服用什么药物,很难知道,嗯,好的,然后实验室测试,这就是你想象中我们经常做的事情,这些是血液和尿液的成分,主要是,还有大便,唾液,脊髓液,从腹部取出的液体,关节液。
骨髓的东西从你的肺里出来,一切都好,任何你能生产一些的地方,一些标本,他们可以把它送到实验室,测量里面的东西,它们测量很多很多不同种类的东西,这些通常是有用的病理,任何身体组织的定性和定量检查,比如说。
活检样本或手术残渣,你知道的,如果他们做手术,他们从你身上切下了一些东西,通常会被放在病理学家的长椅上,然后他试图弄清楚它的特征是什么,这又是有用的信息,自从巴斯德,我们知道生物体会引起疾病。
所以我们很有兴趣知道什么生物体在你体内生长,通常测试不仅仅是为了识别生物体,还要弄清楚哪些抗生素,它既敏感又麻木不仁,所以你会看到像灵敏度测试报告这样的东西,在各种稀释下,换句话说。
他们试图给大剂量的抗生素,较弱的剂量,较弱的剂量,较弱的剂量,较弱的剂量,看看哪一个是最低水平的剂量,那足以杀死细菌,那里少了一个逗号,但是液体的输入输出是另一件重要的事情,因为人们,尤其是在医院里。
经常脱水或水分过多,这两个对你都没有好处,所以试图跟踪你体内的东西,从你身上出来的是什么,很重要,然后是成吨的音符,所以我们要看的一个重要的,这堂课是出院总结,这些是住院结束时写的典型的长纸条。
这是你进来的原因的总结,他们对你做了什么,他们发现的关于你的主要事情,然后计划出院后做什么,1。你打算到哪儿去?你要吃什么药,你什么时候回来跟进,等等,我会给你看一个令人痛苦的长,今天讲座后面的一个。
但我们也有主治医生的笔记,在居民下面,护士,各种专业,咨询人,转介医生,如果有人送你去医院,那个医生通常会写一张纸条,说这是我感兴趣的,这就是为什么我要把病人送进来,有给转诊医生的信,说好。
这就是我们发现的,这是问题的答案,你在问急诊科的记录,所以这通常是病人和医疗保健系统之间的第一次接触,所以这些都很重要,然后是成吨成吨的账单数据,它们是为了计费而设计的,所以。
我们捕获了大量关于描述病人状况的形式化方法的数据,对病人做了什么,为了提交正确的法案,你显然想要尽可能多的账单,但你必须能够证明你提交的账单是合理的,因为保险公司、医疗保险和医疗补助,我没有幽默感。
如果你为你无法证明的事情提交账单,那么你就会受到惩罚,然后是管理数据,比如你在使用哪个服务,所以这偶尔是一件令人困惑的事情,你可以进医院,有心脏问题,但事实证明心脏重症监护室,心脏重症监护室。
挤满了病人,但是肺部重症监护室有一张额外的床,所以他们把你关在那个单位里,但你还在做心脏病治疗,所以有这种混合物,你仍然要处理的案件,转移是指你在医院里从一个地方转移到另一个地方,成像数据。
所以我今天不打算谈那么多,但是有X射线,超声,核磁共振,PET扫描,视网膜扫描,内窥镜检查,像你的皮肤之类的照片,所以这都是成像数据,最近取得了巨大的进展,应用机器学习技术试图解释这些数据的内容。
所以这些也很重要,然后是整个量化的自我运动,我是说,你们中有多少人戴着活动跟踪器,只有大约三分之一,我对像麻省理工学院这样的地方感到惊讶,所以你知道我们测量台阶和海拔,改变和锻炼,你可以记录生命体征。
所有这些正念,心情,睡觉,疼痛,性活动,然后人们发展了一个实验N的想法,例如,几年前我有一个学生患有银屑病,这是皮肤病,问题是没有好的治疗方法,所以患有银屑病的人尝试各种各样的事情。
你知道他们有一段时间不吃坚果了,或者他们用醋浇自己,或者他们有,你知道无论你想到什么疯狂的事,我们没有一个好的理论来治疗这种疾病,但另一方面,有些事情对有些人有用,所以有一个完整的方法已经开发出来。
上面写着当你尝试这些东西时,表现得像个科学家有假设,好好记笔记,收集良好的数据,认识到像发作期这样的事情,你知道你可能要在自己身上滴一个星期的醋,在你看到任何效果之前,所以如果一天后它什么也没做。
不要停下来,而且如果你停下来,那就不要马上开始新的事情,因为你会对,这是不是你之前吃的东西的效果,或者你正在尝试的新事物,所以有各种各样的想法,好的,这是我们在模拟三号上的论文中的一张幻灯片。
它给你一个关于病人情况的概述,所以如果你看看这个,我要用我的手在上面指着这是非常重要的事情,这个病人以满码开始,这意味着如果他有什么不好的事情发生在他身上,他希望尽一切努力救他。
他最终只得到了舒适的措施,这意味着如果他有什么不好的事情发生在他身上,他想和家人一样死去,如果他失去知觉,对呀,关于这个人我们还知道些什么,嗯,GCS是格拉斯哥昏迷评分,这是一种量化人们意识水平的方法。
你可以看到,在一开始,这个病人是面向,然后就迷糊了,最后只是制造难以理解的单词或声音,他能服从命令,最后,只有当你刺激他的肌肉时,他才能弯曲,所以他不再清醒了,嗯高动作,呃,呃,他能自发地跟着你。
他能辨别方向说话。最终完全没有方向,所以这显然是一个迅速走下坡路的人,事实上在这一集结束时就死了,然后我们看实验室,这样我们就可以看到,他们的血小板水平是多少,大约在他们被测量的时候,他们的肌酐水平。
他们的白细胞计数,中性粒细胞百分比,等,这张幻灯片上没有所有可能的数据点,这只是说明性的,下一节是药物,他们在用万古霉素,这是一种抗生素,哌拉西林,我不知道那是什么,有人知道,氯化钠9。
这样可以保持它们的水分,体香酮和葡萄糖,所以右旋给了他一些能量,然后这些是各种测量,所以你看到心率,比如说,上升得很高,接近尾声,氧饱和度开始很好,但现在我们要做的是,你知道吗,百分之六十或百分之五十。
应该在92度以上,为了被认为是合理的,所以再一次,这是一个非常一致的画面,对这个特定的病人来说,事情变得非常糟糕。
所以这是现在数据库中的所有数据,如果你想试着分析这些东西,你可以说好,让我们看看数据库中最后一次实验室测量时的年龄,所以我们有所有实验室测量的时间,所以我们可以看到许多重症监护室的人都很老了。
相对较少的年轻人,然后越来越多的老年人,无论是女性还是男性,如果我们按性别看入学年龄,这是入学时的年龄,在最后一次实验室测量时没有年龄,这是一条非常相似的曲线,所以我们看到女性是64。02岁。
上次测量时一次实验室测量。
入学时63点5分,所以我们可以看看人口统计人口统计通常包括这些因素。
我之前反复提到过,如果我们对这和,比如说,年龄分布,我们看到,如果你看看不同的录取类型,所以你可以因紧急情况入院,为了一些紧急护理,或集体,这似乎没有太大区别,至少在人口的手段上,年龄分布,另一方面。
如果你看看保险类型,说谁买单,现在的年龄分布有很大的不同,你认为为什么私人保险在65岁左右下降了很多,保险总是为每一次州承保吗,是因为医疗保险,所以医疗保险覆盖65岁的人,有一个可怕的故事,我得告诉你。
我和保险公司的人谈过,有点愤世嫉俗,他说,假设你看到一个63岁的病人,谁患了二型糖尿病,你该为他做些什么,对于患有2型糖尿病的人你应该做一些标准的事情,比如让他吃得更好,或者让他减肥,让他多运动。
等等等等,但他愤世嫉俗的回答绝对是什么都没有,好的,为什么好,什么都不做是很便宜的,大多数患2型糖尿病的人在接下来的两年里不会真正生病,当这个病人65岁的时候,他将是政府的责任,不是保险公司,所以说。
当然啦,许多老年人都有医疗保险或医疗补助保险,并不奇怪,自付是一个相当小的数字。
因为支付自己的医疗保健费用贵得离谱,你从哪里来?你是从诊所转来的吗,或者你是急诊室,承认,或者你是从HMO或其他地方推荐的,而不是从熟练护理设施转移到设施内,在医院内,这没什么区别。
那里的平均值和分布看起来适度相似,如果你来自一个熟练的护理机构,如果你在一个熟练的护理机构,你可能老了,因为年轻人通常不需要熟练的护理,我不知道为什么在设施内转移的年龄要小得多。
但从模拟数据来看,这是真的,嗯,按语言划分的入学年龄是多少,所以有些人说英语,有些人说话不方便,有些人说西班牙语等,原来俄国人是最老的,对呀,这可能与移民模式有关,或者我不知道确切的原因。
但这就是数据,数据就是这么显示的,如果你按种族来做,事实证明,总的来说,非裔美国人比白人年轻一些,西班牙裔还有点年轻,比白人早,所以这是一个现在非常热门的话题,在关于偏见如何影响医疗保健的讨论中,是啊。
是啊,无法获得,只是意味着有人拒绝说出他们的种族,是啊,是啊,我想我不肯定,所以我想确认一下,这也代表了波士顿的人口动态,我也是,对呀,它是贝斯以色列女执事医院的集水区,很明显是波士顿,但是但是有。
你知道的,事实证明,像许多北岸的人一样,去马萨诸塞州综合医院,所以不同的医院有不同的集水区,这和喜欢有什么关系吗,这只是重症监护室吗,还是每个去急诊室的人,这些都是在某个时候在重症监护室的人。
所以这些是病情较重的病人,是啊,是啊,所以就这么多,我看到这里的黑人比例也很高,因为红色比其他的高,呃不实际上,呃,我不记得了,如果我有那个图表,我想这是累积的,好的,好的,所以大多数人都是白人。
对于我们使用的白色的任何定义,我想这只是你在上面看到的增量。
所有的权利,婚姻状况如何?嗯,根据这个,单身不好。
所以我可以看到住院治疗,我不知道为什么重症监护室是这样,因为如果你家里没有人照顾你,当你生病的时候,你更有可能住进医院,这似乎是合理的,但我不知道你为什么会进重症监护室,是啊,是啊。
那些不可能也像单身吗,人们可能比,那些可能更年轻,是呀,是啊,是啊,当然啦,是啊,是啊,那可能也是对的,是的,好的,所以这里有一个有趣的问题,与你们在下一个习题集中看到的东西有一点关系。
那么我们能仅仅从这些人口特征来预测医院死亡率吗,所以我在使用一个叫做R的语言工具,这是一个一般的线性模型,我把它设置成基本上是逻辑回归,上面写着我在预测你是否会死在医院里,事实证明。
唯一非常重要的是年龄,所以这并不奇怪,老年人比年轻人更有可能死亡,一般来说是真的,如果我无法获得你的种族,或者我不知道你的种族,那你更有可能死,我不知道为什么会这样,其他事情没有那么重要。
所以如果你说西班牙语或英语,你死的可能性稍微小一点,你在这里看到了一个负面的贡献,如果你说俄语,你死的可能性稍微小一点,但重要的不是在顶峰,零五水平,但它在p等点,零六水平,嗯。
婚姻似乎对预测没有太大影响,不管你是否会死,现在记住这是重症监护室的病人,我们正在研究医院死亡率,是啊,是啊,嗯,是为了毛茸茸的,他们能在白天的任何时候了解到,或者刚开始的时候,还是你知道,因为。
我不知道,我不知道,因为如果可能的话,无法获得意味着他们以前就死了,我们可以问他们不,因为不会有那么多人,我觉得,没有多少人活过入学面试,他们确实问他们,除非他们发现情况不好,是啊,是啊,那就会。
那将是一个例子,但我不认为你会看到足够多这样的人,嗯,所以我已经提到过了,从CareView转移到元视图有一个问题,就在模拟数据库中,但当然这是一个更大的问题在全国和世界各地。
因为每个医院都有自己的记录方式,如果我们有标准不是很好吗,当然还有一个有趣的短语,标准的奇妙之处在于有这么多可供选择的,例如,如果你在模拟数据库中查看处方,这是对5号科目的两种特殊处方七一三九。
入学时被录取,我是一,五,四,七,所以他们有相同的开始日期,但不同的结束日期,一个是泰诺对乙酰氨基酚的处方,另一个是氯贝塔醇丙烷八点零,百分之五的奶油,那是润肤露,因为我想这是类固醇护肤霜。
所以如果你查一下BI的数据库,他们有自己的私人处方代码,这个东西是一套三二五,这个东西是零点五摄氏度三十,如果你看,还有一种叫做GSN的东西,这是一些商业编码系统的药物。
可能与他们在医院的药物供应商有关,它们有不同的代码,有国家药品法规,这是FDA指派的,九位数代码,指定是谁制造了这种药物,它是什么形式的,它的力量是什么,所以你得到了这些,然后有一个人类可读的描述说。
泰诺有325毫克的药片,这种洛贝塔溶胶装在30克的管子里,剂量应该是三,两个,五到六百五十,我是一到两片,以毫克为单位,这里的剂量是一个应用,不管那是什么,我不知道零点1是什么意思,这是一个平板电脑。
那是一根管子,这是口服的,在皮肤上给药的。
对呀,所以这是一个医生的本地数据库,他们只是收集包裹左右,然后这都是在大多数医院,那倒是真的,现在,当模拟数据库开始被收集时,这不是真的,BI在走向这一点上相对较晚,与波士顿地区的其他一些医院相比。
我是说每家医院都有自己的需求,为了它认为最重要的东西,然后呃,我想BI只是没有优先考虑它,和其他一些医院一样多,好的,所以我说好,如果你看处方,他们多久给一次,请记住,我们有大约6万个重症监护室。
所以渗透葡萄糖被给予八万七千次,给各种各样的人,氯化钠点9%冲洗,你知道那是什么吗你做过静脉注射吗,所以周期性地,护士走过来,在静脉注射里喷了一点东西,确保它没有堵塞,就是这样,SW,我不知道盐水。
我不知道是什么,SW是硫酸镁-葡萄糖五在水中,速尿是利尿剂,氯化钾补充人们经常缺乏的钾,然后你去,所以说,为什么有这个D五W和那个D五W,这可能是系统中的一些数据,好的。
他们中的一个有与之相关的MDC代码,另一个没有,但可能应该,是啊,是啊,哦,我真的问,0是否意味着它们是所有医院的标准,或者只是我们没有数据,应该是全国的标准,因为这些是食品和药物管理局分配的代码。
但不是每个医院都用,好的,对于那些说零的,我不知道为什么它们不与代码相关联,在这家医院的数据库里,接下来最常见的是正常生理盐水,9%氯化钠,所以这和冲洗液是一样的,但这次不是用来冲水的。
美托洛尔是一种受体阻滞剂,这是另一种胰岛素,这次用NDC代码等等,我喜欢袋子和小瓶。
好的,所以这些不完全是药物,袋子就像一个松松垮垮的,他们在里面放了一些东西,小瓶实际上是他们把药丸放进去的东西,为什么在数据库里,因为他们可以为此收费,好吧,我不知道收费是多少,但这并不让我惊讶。
如果你花五美元买一个塑料袋来装东西,好的,所以如果我们说好,这家医院每次入院有多少次药房订单,答案是很多,所以如果你看看,这是一个非常长尾的分布,大约有两千五百个,但是你看,如果我把数字放大到200。
有很多人都有两个,然后是相当下降的数字,用更多,然后它是一条很长的尾巴,所以你能想象,你知道吗,住院期间给你开的两千五百样东西。
关于标准的更多信息,所以NDC可能是最好的编码系统,它是由FDA开发的,上面的图片,右边显示前四位数字是所谓的标签器,那通常是生产的人,或者至少是分发它们的人,第二个四位数是药物的形式。
所以不管是胶囊、药片、液体还是其他什么,和剂量,最后两位是包代码,换算成包装中的总剂量对吧,所以这是天赐良机,所有的机器人,药店等依靠使用这类信息,如今,不幸的是,他们用完了四位数,所以现在有一个。
他们加了一个额外的数字,但他们没有系统地这样做,所以有时他们会在标签上加一个额外的数字,有时是产品代码,因此,旧代码和新代码之间的翻译是一场噩梦,你必须有一个代码字典才能正确地做到这一点,等等好吧。
如果这还不够好,国际人用药品技术要求协调理事会,开发了另一个叫做MEDA的编码系统,也用在各种地方,这是国际标准,也就是,当然啦,与NDC不兼容,一个常见的程序术语,我们稍后会讨论。
他们有一个代码的子范围,也对应于药物给药,所以这是另一种编码给药的方式,然后HCPCS是另一组代码,用于指定,你给某人吃了什么药,嗯,然后呃,我提到过这个GSN号码。
显然贝丝·伊斯雷尔把它作为商业编码系统,来自一家名为第一数据库的公司,这是一个试图制定标准的行业,但在这种情况下,他们正在生产与其他现有标准相当多余的标准,但由于历史原因或其他原因人们使用这些好的药物。
那么对病人做了什么手术,如果你在模仿中寻找,有三张桌子,有程序,icd,它有九个ICD代码,用于大约25万个程序,有大约50万的CPT事件,六十万,嗯,在CPT术语中编码的事件。
然后转移两个系统中较新的一个,有大约25万个过程事件被编码在该系统中,所以一些例子,以下是最常见的ICD九号程序代码,所以ICD九号代码三,八九十三,其中有一万四千例静脉导管没有在其他地方分类。
什么是静脉导尿,当有人给你静脉注射时,好的,非常常见,你在他们问你名字之前出现在医院,他们会在你的手臂上打静脉注射,那是收费的活动,我也是,你知道,如果你有这样的问题,他们把它粘在。
把东西塞进你的喉咙里,浓缩营养物质的AL输注,所以如果你不能吃东西,然后他们通过胃管给你喂食,好的,原来是这么回事,嗯,连续少于96小时的有创机械通气,所以这是在呼吸机上,那是为你呼吸,等等。
所以你看到这些有一条很长的尾巴,这些是ICD九号代码,现在CPT有了自己的程序代码,这些代码包含了大量的细节,例如,这是医学部分,它向你展示了你正在服用的药物种类,参与,然后是手术和放射代码。
这些上面有很多很多的细节,是啊,是啊,那么他们怎么把这些代码写成一千到一千零二十二,像这样对任何人来说都很烦人不,这些是类别,所以如果你往下钻,有一个,那棵树上有一个风扇,你可以得到单独的代码。
就像一个讨厌的惊喜,cpt归美国医师学会所有,如果我给你看真正的代码,他们可能会起诉我,因为他们有版权,你得付钱给他们,如果你,如果你使用这些代码,所以这很疯狂,嗯好吧。
所以如果你看看每个入场的所有这些代码的数量,你会看到这样的分布,或者如果我把它们分开,你看到有更多的ICD九码和更少的CPT,和元视觉中的代码,但它们的分布看起来有些相似,OK实验室测量。
所以你把痰送出去,样本,血尿,你大脑的一部分,他们把它粘在黏糊糊的东西里,测量它的一些东西,那么他们测量得很好的是什么,结果发现红细胞压积是最常见的测量,这是你血液中的血红蛋白含量。
或者你血液中的什么部分,对病人很重要,第二个最重要的是钾和肌酸氯化钠,尿素,碳酸氢氮,等等,所以这是一长串不同的东西可以测量。
所有这些东西都在数据库里,例如,数据库里的二号病人,一九三八年七月十七日,这是去身份识别过程的一部分,很难弄清楚病人到底是谁,所以这里有几个有趣的事情需要注意,一个是有些东西有价值,有些东西没有价值。
所以这是一个定性的测量,所以它没有任何价值,只要标签的事实就能告诉你测试的结果是什么,另一件有趣的事情是最后一篇专栏文章,就是链接,我一会儿就说一句,实际上现在,所以Link是逻辑观察标识符。
名称和代码,它是由我们在印第安纳州里根礁诊所的同事开发的,大约十五年前,也许二十年前的这个时候,试图说,每种不同类型的实验室测试都应该有一个独特的名称,他们应该是等级森严的,这样如果你有,比如说。
三种不同的血清钾测量方法,他们是有血缘关系的,但他们彼此不同,因为在某些情况下,你从一种测量中得到的误差与另一种测量中得到的误差,都是不一样的,所以这是标准的方式,如果你把你的血样送到实验室。
他们把这样一根绳子送回医院,或者去你的医生办公室说,嗯,它是在这个OBX编码系统中编码的,这是链接代码,这是斯诺梅特的解释,所以这根弦是你医院的ehr的方式,或者你医生的办公室系统计算出测试的结果。
HL 7是一个30多岁的组织,一直致力于标准化的东西,像这样和链接是他们标准化的一部分,所以如果你看看这些,你又说好,每次入学测试多少次,一条巨大的长尾巴,对于极少数病人来说,最高可达15000英镑。
如果你看看每次入院的实验室测试,你可以做一个日志转换,得到一个看起来更合理的分布,顺便说一句,这是一个非常普遍的教训,当我们要对这些数据进行分析时,是不是经常做某种转换,就像在这种情况下。
日志需要一些看起来有趣的分布,把它变成看起来很正常的东西,这对我们使用的许多技术都更好,是啊,是啊,如此跨越,长代码的意思和是一样的吗,在一二处产生的物质,同样的是,是的,这就是创建标准的全部想法。
这很成功,相当成功地采用了,OK图表事件,所以这些是护士通常在床边进入的东西,所以有五点一,五点,在模拟数据库中测量的200万次心率,卡尔普雷夫耳是一个人工制品,它存在于每一个记录中,这是一些校准。
没有任何意义的东西,我一直搞不清楚到底是什么,spo 2是你血液中的氧分压,如果你用脉搏血氧仪,这就是它所测量的,呼吸频率,心律回到P型点点点点现在,你可能会对这里的心率感到困扰,对。
但我已经给你看过这个了,Careview中的心率和Metavision中的心率被编码在不同的代码下,在我们从这两个数据库中创建的联合系统中,所以你必须弄清楚什么是什么,如果你试图分析这些数据。
我们不仅在两个不同的数据集上有不同年龄分布的问题,但我们也有机械问题会有相同标签的东西,它可能代表也可能不代表系统中不同时间的相同测量,这是在对数刻度上每次入场的图表条目数,所以你看到大约有10到3点。
五个,每次入场的图表条目,所以你知道,每次接纳数以千计的图表事件,我们还跟踪输出,导尿管可以让你的膀胱引流,你没有有意识地去洗手间,所以他们收集这些信息,有一点,九百万个关于你膀胱流出多少液体的录音。
你胸口的东西,如果你有拥堵,尿液是如果你经常尿尿,排便,等等,一次又一次,我不确定我是否明白,尿出福利对福利,它们可能是一回事,但一个来自CareView,一个来自元视觉。
所以再一次,典型的问题,如果你看看每次录取的输出事件的数量,你看到的大约是一百个,大概。
如果你在跟踪输出,您还应该跟踪输入,他们也是如此,所以葡萄糖在水中是5W,百分之零点九,生理盐水,异丙酚是一种麻醉剂,胰岛素,肝素,血液稀释剂,等等,如果我没记错的话,所以这些是给人们的各种各样的东西。
它们影响人的体积,所以这是为了让人保持平衡并跟踪那个元视觉,输入的分类有些不同。
但他们有相似的数据,如果你把它们结合起来,你又得到了一个对数刻度的分布,这表明有大约10到5个输入事件,所以相当多的输入事件,因为这是定期记录的。
现在,那个纸,我是的,输入是什么,就像,当你走进医院,我承认,或者没有,不不不,它是,它是对你的输入,就像你喝了一杯水,护士应该录下来,虽然她并不总是因为她可能没有注意到,但如果他们挂一个静脉注射袋。
给你倒一升液体,他们确实记录了,所以我让你读了这篇有趣的论文,在那份文件之前的讨论,因为其中一个作者是我以前的学生,我很了解其中一个人,和以前的学生,扎克·科哈纳几年前从加利福尼亚的一个会议上回来。
向我解释他遇到了一个风险投资家,他发现了一种有趣的生理变化,在夜间进行的实验室测试的异常中,他怀疑有一个日变化,实验室测试实际上在晚上比白天更不正常,和扎克,他不仅是计算机科学博士,也是执业医生。
转向他说你是个白痴,凌晨三点抽血,通常不是健康人对吧,这是另一个令人困惑的故事,如果你在半夜做测试,这可能表明你的病情加重了,所以他和格里芬招募了他们的第三作者,并对这个问题进行了大规模的研究。
这就是我让你读的报纸上的报道,所以我说,嗯,我想知道我是否能在模拟数据库中复制这项研究,如果你抱有希望,答案是否定的,在很大程度上,因为我们没有正确的数据,所以在模拟数据库中测量的白细胞计数并不多。
比如说,如果你看看,这是模拟数据,如果你说每小时异常白细胞计数值的比例是多少,所以这是午夜到午夜,每小时都有一部分测试结果是不正常的,果然你看到的是在早上5点,他们中更高的比例是不正常的。
然后在下午三点,这与扎克的,关于那家伙是个白痴的专横评论,所以我再一次说,嗯,我们能建立一个非常简单的模型吗,预测谁会死在医院里,在这种情况下,这是最容易预测的,因为我有数据。
我们可以得到三年的生存数据,这就是他们在看的,但这更难,它遇到了审查问题,如果该人在我们的数据收集期结束前不到三年住院,等等,所以我避免了,但这向你展示的是,每小时零到二四,什么是,在每一个小时里。
号码是多少,这些测量中异常的比例是多少,所以我说,嗯,让我们把它扔进一个逻辑回归模型,出来的东西真的很奇怪,那就是几个特定的小时是重要的,但大多数都不是,在我看来,这像是噪音,在早上八点。
你有一些有分寸的东西这一事实很重要,但是在早上九点,这似乎不太明智,所以我不认为这里有足够的信号,事实上,当我在晚上观察白细胞计数的数量时,与死亡率有关的问题,所以虚假意味着人们活着。
真正的意思是他们死了,但你会看到,在分布之间没有太大的差异,但你也可以看到在这个数据库中白细胞计数的数量相对较少,所以我认为我们没有足够的数据来做这件事,另一方面,如果你看一组不同的药物。
你看血液的平均值,尿,氮气或氯化钙,Co two等,你会看到随着时间的推移会有变化,所以有某种差异,这要么是由人体的日生理学引起的,或者通过常规的医学实践,关于人们何时选择进行实验室测量,事实上。
如果你看看高端的比例,实验室值低,它们确实因小时而异,尤其是如果你看白细胞计数,你会看到高值的比例在晚上上升,低值的比例在晚上下降,这也与他们看到的一致,有另一种方法来测量它,也就是不使用正常范围。
实验室实际上会给你一个电话,说这个值正常吗,低或高,我们可以利用这一点,这一点更微妙,因为这取决于设备的校准,并随着校准的变化而更新,所以这可能更准确一点,但你在这里看到了本质上相同的现象。
但是如果你看看测量完成时的分布,原来是正常的,当它们被证明是不正常的时候,的正常曲线和异常曲线之间有很多相似之处,当进行这些测量时,所以我们没有看到,好的,让我跑到最后,这是我手表上的心跳。
你可以下载这些东西,并把它放在你最喜欢的分析引擎中,看一下。
所以我在这里跑过哈佛桥,如果你看我30秒的心率变化,所以你可以看到中间的节拍间隔从大约550,到六百三十个左右,六百或者二十毫秒,所以你可以计算我的心率变异性,这被认为是心脏健康的指标。
以此类推你可以计算出我以大约100英里的速度跑步,我的心脏以每分钟100次的速度跳动,所以你知道现在有各种各样的信息。
正如我所说的,我今天不打算讨论这个问题,但这是最近发表的一篇非常成功的论文,在那里他们可以看到肺部的图像,这是肺部的横向扫描,他们有一个深度学习机器能够识别这两个黄色标记的东西,肺包膜。
而不是这些其他东西,只是组织中的随机斑点。
我不能靠眼睛看,也许一个好的放射科医生可以,但报纸上声称这优于体面的放射科医生,已经,这是杰夫·辛顿的文章之一,做出这个相当愚蠢的声明,告诉你的孩子不要成为放射科医生,因为当他们得到充分训练时。
这个职业就结束了,我不相信他们会做不同的事情,但他们不会离开,嗯,这是布里格姆的罗恩·凯尼斯的幻灯片,他们正在使用自动分析白质的技术,为了识别狼疮病变,狼疮是一种严重的疾病出现在这些磁共振图像中。
在某些方面,今天我想谈的最后一件事是笔记,所以我的学生上学期做了一点练习,我们试图看看普通猿类有多好,我预测死亡率的研究小组成员,所以我们从模拟数据集中取了一堆案例,对这个人是生是死的问题视而不见。
我们用一种可视化工具把数据给人们,有点像我之前给你看的那个,总结了这个案例,然后也让人们可以接触到笔记,关于这些案件的已确定的说明,看看人们是否能比掷硬币更好地预测,不管某人是生是死,答案是肯定的。
稍微好一点,也好不到哪里去,但稍微好一点,此外,通过给他们反馈,所以当他们看这些案子的时候,并试图做出预测,他们做出预测,你告诉他们,如果他们是对是错,我们学习,所以我们得到的比随机的稍微好一点,对呀。
挺有意思的,好的,所以我发现的一件事是,至少当我在这个练习中扮演猴子的时候,我发现这些笔记非常有用,比实验室数据的趋势线有用得多,部分是因为我习惯了读英语,我不太习惯阅读实验室数据的图表。
但部分原因是人类的理解水平,在护理笔记中,在出院总结中,等等,你不能仅仅从原始数据中得到,所以我们要讨论的是,我们如何利用这些信息,把它抽出来,并将其用于我们想要在模仿中做的各种建模中,如果你看。
我们有护理笔记和放射学报告,以及更多护理笔记和心电图报告,和医生记录及出院摘要,如果你看看这些长度的分布,不幸的是,这些规模不一样,但出院摘要是当时写的东西,你离开医院,这是你住院期间发生的一切的总结。
而且很长,所以你知道,它上升到三万个字符,你知道要小,这是一个短篇小说,不要那么短,短篇小说,护理笔记往往较短,它们最多有三千个字符,另一套护理笔记,我认为来自另一个系统的时间有点长,它上升到大约五千。
医生的笔记有点长,但它们通常会上升到一万一万五千个字符,还有各种各样的音符,所以我只是想给你看一些这些,这里有一个简短的护理说明,所以这是一个低血压的病人,但不震惊,病人仍在点滴这种药物。
每分钟每公斤75微克,此时不需要滴定,他们的血压很稳定,一百多,平均动脉压是65,大于六十五,让他们戒掉这种药,如果它能忍受伤口感染,腹股沟前区开放渗出,适量粉红色浆液,病人大便,少量大便在某物上。
危险地靠近开放性伤口,等等,这是护士的快照,她刚进去,顺便看了病人,我说她,但你知道,波士顿地区医院的绝大多数护士可能都是女性,但是有一些男护士,并将记录病人的情况,有什么问题,原则上,这会很有用的。
不仅作为病历的一部分,而且当这个护士下班的时候,下一个护士来轮班,那么这是病人状态的记录,护士最后一次见到他们,事实上,护士们倾向于口头告诉对方,而不是依赖书面版本,我记得有一次和重症监护室的护士聊天。
在这个国家的另一个地方,我说谁读了你的笔记,所以医院有人负责评估护理质量,当有诉讼时,他们会给律师,她很高兴,因为她通过仔细记录为医院节省了一千万美元,对一个病人做了一些手术,结果很糟糕。
并起诉医院忽视了他们没有这样做,而是因为它在纸条上证明了它实际上是这样做的,因此医院没有责任,所以说,但现在这里有很多信息,我要给你们看很多页典型的退伍总结,这是一个手术服务的人进来抱怨腿痛,红肿。
继发于左股骨弹出感染,小旁路,所以她做了手术,我想是女性,她做了手术,愈合得不好,所以主要的外科手术或侵入性手术,切开引流和脉搏,左腹股沟及左膝以上黄体部位冲洗,旁路探查切口,整个左侧移植物和切除。
公共股动脉到膝盖以上之类的,废话,废话,废话废话,这就是他们所做的目前疾病的病史,她是一名四五岁的妇女,接受了左股骨AK手术,医生或其他患有PTFE的人,不管那是一个多月前的某个日期,顺便说一句。
这些带星号的东西是我们去掉的,从记录中识别信息,她手术后一直做得很好,在发病前六天在诊所就诊,在这个时候,她突然感到恶心,呕吐,发烧和渐进性红肿,肿胀,她左大腿痛,等等,所以这只是佩奇,许多页中的一页。
是啊,是啊,问题是这完全是,此信息字段,没有帮助,没有自动完成,如果你输入病人的名字,在这个系统中,有很多人,亨利,湿气,马萨诸塞州将军花了十年时间建立了一个具有自动完成等功能的系统,一些医生喜欢它。
一些医生讨厌它,Mgh扔掉了他们所有的旧系统,为了购买史诗,就这样消失了,就像十年的努力付诸东流,但这并不是一个惊人的成功,因为每当你有自动完成,你必须预测每一个可能的答案,人们很有创造力。
他们总是想打一些你没有预料到的东西,所以很难支撑,什么是史诗,史诗,是一家大公司,它赢得了最近所有安装电子病历系统的竞赛,还记得我上一节课吗,我展示了我们达到了100%的饱和度。
所以他们赢得了很多安装交易,他们得到了很多补贴,我听说的估计是合作伙伴医疗保健,也就是MGH,布里格姆,和其他几家医院,安装系统花费了大约20亿,所以这包括所有的定制和所有的培训。
以及随之而来的所有行政工作,但那是一大笔钱,好的,所以我们有过去的病史,一天一包,但她说她六个月前停止了哮喘,第二类,糖尿病,这些是体检结果,所以它给了你很多关于这个人的信息。
底部缠绕的描述相关的实验室结果,所以这些是从实验室的桌子上复制出来的,是啊,是啊,药物结果,对不起,再核对一下药检结果,向后两张幻灯片,是的,它是,上面有21世纪90年代的假日期,是啊,是啊。
所以21年有一个阳性测试的事实,87意味着一年前,是啊,是啊,是啊,是啊,这里的去识别技术维护相对日期,但不是绝对日期,所以这些结果再次从实验室数据库中复制到出院摘要中,简短的医院课程。
然后对系统进行审查,发生什么事了?神经心血管肺胃肠道等,um传染病,内分泌血液学,预防,在出院时,病人情况很好,无发热,生命体征稳定,忍受有规律的饮食,走动的,走动的,在没有帮助的情况下排尿。
疼痛得到了很好的控制,入院时的药物,所以这是药物和解,出院药物,这就是她被送回家的原因,出院后的处置是到家里进行一些后续服务,她要回家了,出院诊断是感染了,左股骨腘旁路,移植物与病情。
这些是给病人的指示,你知道吗,以下是你在这里可以做的,如果出了什么问题,你应该什么时候回来告诉我们,等等,嗯,这是你应该报告的,如果发生了,呃,你知道的,如果你突然严重出血或肿胀,这样做,与医生跟进。
某人或其他人打这个号码给他的诊所预约,然后和医生随访,两周后有人,嗯,我想这是同一件,所以关于标准的最后几句话,你在大卫的介绍性讲座中看到了,奥德赛的参考,这是编码我们所说的数据的标准方法,今天。
模拟数据库的下一个版本有可能,将采用奥德赛格式,而不是,呃,大卫在摇头,想知道为什么我,我也是,我们显然还没有很好地处理临床笔记,嗯,所以你知道总是会发生什么,你是说我将采用带有以下扩展的标准星号。
这可能就是将要发生的事情,但这意味着中央桌子,你知道的,ICD九码表,和表,像这样的事情很可能会结束,采用奥德赛数据库的格式,你也应该知道这个叫Fire FR的东西,快速健康互操作性资源,所以说,七个。
是标准组织,在20世纪90年代初取得了巨大的成功,在解决,如何允许实验室向医院报告实验室数据的问题,或者订购实验室的诊所,上面有向上箭头和竖线的字符串等等,我之前给你看的,里面有链接编码。
那个标准叫做HL 7版本2吗,它仍在广泛使用,然后他们变得雄心勃勃,患上了第二系统综合症,他们决定建造HL 7版本三,十年前我在这里的一个班教过,我的一个朋友在一家帮助医院的公司工作。
给我一个三分的工具,八兆字节的PDF文件,描述您需要了解的内容,为了实施该制度,结果没有人做这件事,所以火是对它的粗略简化,说如果医生把一个新病人介绍给你,您需要知道的最小数据集是什么,为了照顾那个人。
Fire试图提供所有数据的子集,它已经成为一种标准,主要是因为国会花了四年时间,20亿美元左右贿赂人们购买这些信息系统,他们很生气,因为他们买的信息系统不能相互交谈,所以他们在地毯上喊道。
这些IT公司的负责人,健康IT公司,他们对他们大喊大叫,他们让他们承诺会有互操作性,他们承诺,火从里面冒出来,或者它可能是同时开发的,但他们采用了它,所以现在原则上,不同医院之间交换数据是可能的。
至少达到数据统一的程度,在现实中,公司不希望你那样做,因为他们喜欢那里,不能把你所有的数据带到不同的医院,因为它更有可能把你留在你所在的地方,社会经济问题,但至少标准是存在的。
并且正在得到越来越广泛的部署,只要国会注意,它很丑,这是病人的样子,对呀,这是通常不可读的XML垃圾,但幸运的是,有解析器可以将其转换为JSON,和更简单的表示,所以这很常见,所以存在的术语是和NDC。
i,我今天没有谈到的九个和十个雪人,DSM 5是精神病医生的诊断和统计手册,这是描述精神疾病的常用编码方法,还有更多这样的,有一种叫做统一医学语言系统的东西,来自国家医学图书馆的Methesaurus。
它集成了大约180个不同的术语,所以有一个很好的一站式商店,在那里你可以从他们那里得到所有这些东西,所以外卖课,了解你的数据,还记得心率一次又一次上升的第一个例子吗,对你不了解的数据进行机器学习和分析。
很可能导致错误的结论,统一是困难和耗时的,有很多事情我们没有标准,所以每个人都发展自己的表现。
大约十年前我有一个博士生,他在论文中写道,他花了大约一半的时间清理数据,我把这篇论文给了另一个几年后开始的学生,谁读了,他带着敬畏的神情向我走来,他说他只花了一半的时间打扫,不幸的是。
这大致就是我们在这个领域的位置,很抱歉让人沮丧,但这是目前的技术水平,下次大卫会从看,用这些数据建立一些模型,并向你展示,我们可以完成所有的权利。