帕金森怎么引起的会引起什么病,都有什么种类?

复杂疾病的体外诊断方法

    技术领域 本发明涉及如权利要求 1 所述的复杂疾病或其亚型的体外诊断方法 和如权利要 求 18 所述的执行所述方法的试剂盒。

     在经典患者筛查和诊断Φ 医务人员利用多种诊断工具对患有某种疾病的患者进 行诊断。在这些工具中 对一系列单一常规参数 ( 例如血液样品中的参数 ) 进行测定昰常 见的诊断实验室方法。这些单一参数包括例如酶活力和酶浓度和 / 或诸如葡萄糖等代谢指 示物的检测只要涉及到这样的疾病, 并且这些疾病可通过临床化学简单地并且毫无疑义 地与一种单一参数或若干参数相关联 则这些参数就成为了现代实验室医学和诊断中不可 或缺嘚工具。在能够提供优异的已证实的截断值 (cut-off value) 的情况下 ( 例如在糖尿 病中 ) 就可以在诊断中可靠地使用临床化学参数例如血糖。

     特别是 当研究公知病理生理机制背后内在的病理生理状态并从中得出指导性参 数时, 诸如血液中高葡萄糖浓度通常反映出胰岛素基因的遗传性缺陷 所述单一参数已证 实是 “其” 疾病的可靠生物标志物。

     然而 在诸如癌症或脱髓鞘性病如多发性硬化症等共性为缺乏明确可指定的单一 参數或标志物的病理生理情况下, 目前还难以进行由血液样品或组织样品的差别化诊断

     在癌症预防、 筛查、 诊断、 治疗和预后治疗中, 同時在临床常规上使用一系列均对 特定种类癌症在某种程度上有特异性的所谓 “肿瘤标志物” 来诊断和监测癌病过程的治疗 目前使用的这種肿瘤标志物例如有 α-1- 胎蛋白、 癌抗原 125(CA 125)、 癌抗原 15-3、 CA 50、 CA 72-4、 糖抗原 19-9、 降钙素、 癌胚胎抗原 (CEA)、 细胞角蛋白片段 21-1、 粘蛋白样癌相 关抗原、 神经元特異烯醇化酶、 核基质蛋白 22、 碱性磷酸酶、 前列腺特异性抗原 (PSA)、 鳞状 细胞癌抗原、 端粒酶、 胸腺嘧啶激酶、 甲状腺球蛋白、 和组织多肽抗原。

     虽然 在现有技术中目前已有多种上述肿瘤标志物常规使用, 但极常见的是难以 由单一测定实现可靠诊断仅举一例, CEA 的截断值对不吸煙者为 4.6ng/ml 而 25%的吸 烟者显示在 3.5 ~ 10ng/ml 的范围的正常值, 并且有 1%的吸烟者显示大于 10ng/ml 的正常 值因此, 只有大于 20ng/ml 的值才被解释为 “高度疑似恶性過程” 这留下了很大的灰色区 域, 在这一区域中医生不能依靠在患者样品中测定的 CEA 值

     EP 540 573 B1 公开了对于前列腺特异性抗原 (PSA) 的相似的截断值问題, 其中 通常测定总 PSA 以诊断或排除患者的前列腺癌 如果该值在灰色区域, 则目前的方法是除 了测定总 PSA 外还以对游离 PSA 特异的单克隆抗体测試测定游离 PSA 并计算 2 个参数的比 率从而获得对前列腺癌更准确的诊断方法, 并与良性前列腺增生相区分

     CEA 和 PSA 检测的上述例子充分表明了所囿单一肿瘤标志物共有的情况, 即 一方 面特异性相对较差, 另一方面截断值不确定不可靠 从而难以解读得到的值。

     因此 一般的结果昰, 推荐在重要筛查中考虑使用肿瘤标志物下述情况并不罕 见, 肿瘤标志物水平增加而没有进一步的临床相关性 使患者丧失勇气, 并苴根本不具有任 何诊断价值

     此外, 在恶性疾病的预后治疗中 需要注意的是每种肿瘤标志物都首选需要 “临界

     量” 的癌细胞, 直到其在臨床测试中有阳性响应另外, 不是所有复发肿瘤都必须涉及肿瘤 标志物水平的增加

     总之, 大多数情况中只有在结合其他诊断工具如内窺镜和活检以及随后的组织学 检验的情况下 单一肿瘤标志物才被证实在临床实践中有用, 但在常规癌症筛查中是不可 靠的

     对于单一肿瘤标志物的现有技术, 一个巨大的进步是使用了利用微阵列技术的多 基因表达水平

     例如 WO A2, 公开了用于获得气道上皮细胞 RNA 的侵袭性最小的樣品 获取方法 可通过表达谱 ( 例如通过基于阵列的基因表达谱 ) 来对所述 RNA 进行分析。这 些方法可用于鉴定诊断肺病如肺癌的基因表达模式 從而识别有发展肺病的风险的受试者 和定制开发用于诊断或预测肺病或肺病易感性的阵列, 例如微阵列 出于这一目的, 还公开 了阵列和囿信息的基因

     这种多基因方法比上述单一参数要可靠得多, 但受限于复杂的数学和生物信息学 程序尽管如此, 这些基因表达标记是有湔途的癌症诊断工具 但有时也具有不确定的限 制, 这些限制由于其内在统计学和受到一种核酸的限制有时也会导致不可靠的结果和确认 問题 发明内容 从上述现有技术出发, 本发明的问题是提供一种生物标志物在诊断工具中的应 用 上述诊断工具对于早期诊断以确定患病受试者具有最高可能的灵敏度和特异性, 上述 诊断工具用于患者预选和分组和用于治疗控制是诊断开发中的主要目标 并且还是各种复 杂疾病特别是癌症的紧急需要。

     上述问题通过如权利要求 1 所述的方法和如权利要求 18 所述的试剂盒得以解决

     特别是, 本发明提供了在哺乳动粅受试者的至少一个组织的至少一个生物样品中 的复杂疾病或其亚型的体外诊断方法 所述复杂疾病或其亚型选自 :

     癌症, 特别是急性髓細胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 缺血 特别是中 风、 缺氧、 缺氧缺血脑病、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病, 特别是 白质病、 脑室周围脑白质病、 多发性硬化症 ;

     b) 利用至少 2 组不同种类的生物分子测定所述样品中的每一种类的多种生物分 子的選自是否存在 ( 阳性或阴性 )、 定性和 / 或定量分子模式和 / 或分子标记、 水平、 量、 浓 度和表达水平的至少一种参数 并将所获得的值的组作为原始数据存储于数据库中 ;

     c) 对所述原始数据进行数学预处理从而减少步骤 b) 中所用测定程序固有的技术 误差 ;

     拆分和回归树、 K- 最邻近分类法 (K-NN)、 模糊分类器、 袋翻、 增压、 和Bayes 中选择至少一种适合的分类算法 ; 并将所述选择的分类器算法用于步骤 c) 的所述预处理的数据 ;

     e) 将步骤 d) 的所述分类器算法对至少一个训练数据组进行训练, 所述至少一个 训练数据组包含来自根据其病理生理、 生理、 预测、 或响应者情况分类的受試者的预处理数 据 从而选择一个分类器功能从而将所述预处理数据映射至所述情况 ;

     f) 将步骤 e) 的所述经训练的分类器算法应用于病理生理、 生理、 预测、 或响应者 情况未知的受试者的预处理数据组, 并使用所述经训练的分类器算法预测所述数据组的类 别标签从而诊断所述受試者的病况

     本发明提供了上述问题的解决方案, 并一般性涉及应用 “组学” 数据 ( 包括但不限 于 mRNA 表达数据、 微小 RNA 表达数据、 蛋白质组学数據、 和代谢组学数据 ) 统计学习和机 器学习分别用于识别分子标记和生物标志物。 其包括经由已知方法测定上述生物分子的浓 度 已知方法例如聚合酶链式反应 (PCR)、 微阵列和其他方法如测序以测定 RNA 浓度、 通过 质谱 (MS)、 特别是 MS- 技术如 MALDI、 ESI、 大气压化学电离 (APCI) 和其他方法对蛋白识别 和定量, 利用 MS- 技术或替代性方法测定代谢物浓度 后续特征选择和将这些特征与包括 至少两个分子水平的分子数据 ( 即, 至少 2 个不同类型内源生粅分子 如 RNA 浓度加代谢组 学数据, 分别为代谢物浓度或 RNA 浓度加蛋白质或肽的浓度等 ) 分类器组合并且通过统计 方法和数据分类法提取最佳组荿标志物组

     从而测定不同分子水平 (RNA 分子、 肽 / 蛋白质、 代谢物等 ) 的各标志物的浓度, 并 将数据加工至分类器 所述分类器指示与限于一种苼物分子的方法和标志物相比以优异的 灵敏度和特异性指示疾病状态。

     描述了选择和组合生物分子的生物标志物和分子标记的方法 特别昰利用生物分 子类型 mRNA、 微小 RNA、 蛋白质、 或肽、 小内源化合物 ( 代谢物 ) 中的一种或多种个体分子组 合 ( 组合至少两种上述类型的生物分子 ) 由体液戓组织获得的生物分子, 利用统计方法和 来自这些分子组的数据的分类器进行鉴定 以用于诊断和早期诊断, 从而将患者分类、 选择 治疗、 治疗监测和治疗诊断复杂疾病

     系统生物学方法利用各种组学方法如基因组学、 蛋白质组学和代谢物组学, 其正 越来越多地应用于复杂疾病的研究和诊断这些技术可以提供数据和生物学指示物, 所谓 的 ( 预测、 预计和药代动力学 ) 生物标志物以及潜力从而使诊断的临床实践發生变革

     诊断工具例如癌症诊断工具的最近进展通常包括利用同类生物分子的多种生物标志物的多成分测试, 所述同类生物分子例如有哆种蛋白质、 RNA 或微小 RNA 种类 并且多 维度数据分析给出对异常信号传导和网络作用的更深入认识, 这有潜力识别此前未被发 现的标志物候选粅然而, 现有技术方法将单一生物分子或单一种类的生物分子的组用

Genomics.2006 ; 7: 278 公开了将乳腺癌微阵列标记转为高通量诊断测试的方 法

     虽然這些产品和原型证明了具体诊断领域的显著进步, 但还迫切需要对多种复杂 疾病具有高灵敏度和特异性的可靠的早期诊断 所述复杂疾病唎如有但不限于 :

     癌症, 特别是急性髓细胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 缺血 特别是中 风、 缺氧、 缺氧缺血脑病、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病, 特别是 白质病、 脑室周围脑白质病、 多发性硬化症、 阿尔茨海默病和帕金森怎么引起的病這些诊断工具和生 物标志物还用于选择患者中的响应者, 以评估疾病的复发、 选择治疗方式、 效率、 耐药性和 毒性

     发明提供了产生具有優异灵敏度和特异性的诊断复杂疾病的新型诊断工具的原 理和方法以解决这些问题。

     将各种 “组学” 数据整合以例如识别由变化的 RNA 转录物嘚蛋白浓度的可能变化

     即便如此, 基于统计学应用此处所述各种分类方法 独立于数据整合和对组合诊 断标记 ( 组合多种生物分子 ) 的生物囮学解读, 来自不同类生物分子的生物标志物组的 统计学组合对本领域人员也是非显而易见的和未知的 也未在文献中有记载。其明显不哃 于利用整合多维分析和组合例如基因组学、 表观遗传组学和转录组学的方法 ( 见 SIGMA2 :

     基本上 本发明的方法在统计学基础上组合了统计学显著的至少两种不同种类生 物分子的生物分子参数, 完全与任何种类、 环节或明显生物学理论的已知或未知的生物学 关系无关 从而提供了哆种生物分子组成的组合生物标志物。 本发明的患者情况表明 在测 定分子集合中的最佳描述细胞、 组织、 器官或生物体的不同状态的至尐两种上述生物分子 类型和至少两种的这些组合的生物分子组成的诊断方法和疾病状态特异性分类器优于分 子或标志物的组合和其描绘的汾子标记。其还优于仅一种生物分子的生物分子的分类器 并且如本文所证明在诊断应用中产生了更高的灵敏度和特异性。就此而言 本發明超越了 现有技术, 并与目前现有技术方法相比 提供了产生具有更高灵敏度和特异性和更低错误 发现率的诊断分子标记的方法。所述方法可用于诊断各种复杂和完全无关的复杂疾病 例 如癌症和缺血, 并且具有一般性诊断用途 具体实施方式 定义

     本文中使用的术语 “基洇表达” 是指通过基因的 “转录” ( 即, 经由 RNA 聚合酶的酶 学作用 ) 将基因中编码的遗传信息转化为核糖核酸 RNA( 例如 mRNA、 rRNA、 tRNA、 或 snRNA) 和对于蛋白质编码基因通过 mRNA 的 “翻译” 转化为蛋白的过程。可以在该过程中多个阶段 调节基因表达 “上调” 或 “激活” 是指增加基因表达产物 ( 即 RNA 或蛋白质 ) 嘚产生的调 节, 而 “下调” 或 “抑制” 是指降低产生的调节

     “肽” 是由 α- 氨基酸以确定顺序连接形成的短杂聚物。一个氨基酸残基与下┅个 之间的连接已知是酰胺键或肽键

     蛋白质是是多肽分子 ( 或由多个多肽亚基构成 )。 区别在于肽较短 而多肽 / 蛋白 质较长。有多种不同的規定来确定这些 所有这些规定均有防止误解的说明和细微差别。

     在本发明的范围内 “复杂疾病” 是属于以下组但不限于以下组的疾病 : 癌症, 特别 是 急性髓细胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 短暂性脑缺血发作 (TIA)、 缺血, 特 别是中风、 缺氧、 缺氧缺血脑病、 围产期腦损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病 特别是白质病、 脑室周围脑白质病、 多发性硬化症、 阿尔茨海默病和帕金森怎么引起嘚病。

     代谢物 : 本文中所用术语 “代谢物” 表示细胞、 生物体、 组织的或存在于体液或获自 上述来源的提取物中的分子量通常小于 1500 道尔顿嘚内源性有机化合物代谢物的典型 实例是糖、 脂类、 磷脂、 鞘脂和鞘磷脂、 氨基酸、 胆固醇、 类固醇激素和氧化固醇以及其他化 合物例洳人类代谢物数据库 (http://www.hmdb.ca/) 和其他数据库和文献中收集的化合

     物。这包括通过代谢作用或通过代谢过程产生的任何物质和代谢作用中涉及的任何粅质

     本发明范围内理解的 “代谢组学” 为通过但不限于下述方法对多种 (2 千 ) 代谢物 的全面定量测量 : 例如质谱, 质谱与液相色谱、 气相色譜和其他分离方法色谱的偶联

     “寡核苷酸阵列” 或 “寡核苷酸芯片” 或 “基因芯片” : 涉及 “微阵列” , 也称 “芯片” 、 “生物芯片” 、 或 “生物学芯片” 是具有适合的密度的离散区域的区域阵列, 例如为至少 100/ 2 2 cm 优选至少约 1000/cm 。微阵列中区域的尺寸例如直径优选为约 10-250μm 的范围 并 与阵列中其他区域以等距离间隔。常用形式包括 Agilent、 Affymetrix、 Illumina 的产品 以及其中通过分配器或手动方法将寡核苷酸和 cDNA 沉积在固体表面的点淛造阵列。

     本领域技术人员清楚 可以通过各种方法对核酸、 蛋白质和肽以及代谢物进行定 量, 所述方法包括上述阵列系统 以及但不限於 : 定量测序、 定量聚合酶链式反应和定量逆 转录聚合酶链式反应 (qPCR 和 RT-PCR)、 免疫测定、 利用抗体的蛋白质阵列、 质谱。

     在此上下文中不同种类戓类型或类别的生物分子理解为 : RNA、 微小 RNA、 蛋白质 和各种长度的肽以及代谢物 本文中生物标志物是包含至少 2 个不同种类 (RNA、 微小 RNA、 蛋白质囷肽、 代谢物 ) 的至少 2 种生物分子的数据的特征, 所述特征经测量和评估作为生物过程、 病理过程、 或对 治疗干预的响应的指征 本文所用嘚组合生物标志物可以选自下述种类的生物分子中的至 少2种: 正义和反义核酸、 信使 RNA、 小 RNA 即 siRNA 和微小 RNA、 多肽、 包括抗体的蛋白质、 小内源分孓和代谢物。

     数据分类是为了最有效和高效利用数据而进行的数据归类分类器通常确定的 功能是将生物测量的多维向量映射至二元 ( 或 n 元 ) 輸出变量, 所述输出变量编码临床 相关种类、 表型、 特殊生理状态或特殊疾病状态的有或无为了实现这一目标, 可以使用 各种分类方法 例如但不限于逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 感知器、 缩小矩心正规判别分析 (RDA)、 随机森林 (RF)、 神经网络 (NN)、 贝叶斯网络、 隐馬模型、 支持向量机 (SVM)、 偏一般最小平方法 (GPLS)、 围绕中心点划分 (PAM)、 自组织映

     术语 “结合的” 、 “将结合” 、 “结合” 、 “已结合的” 或其任意衍生词是指两个或更多个 分子间的任何稳定的而非瞬时的化学键, 包括但不限于共价键合、 离子键合、 和氢键键合 因此, 除了两个或更哆个分子间的其他类型化学键合之外 该术语还包括 2 个核酸分子之 间的杂交。

     在本发明的方法中 通过 2 种不同种类生物分子中的至少 2 种不哃类型生物分子 的组合而获得的生物标志物数据和分类器提供了对生理状态的描述并可用作诊断复杂疾 病的极好工具, 其中所述生物分子嘚种类选自根据本发明确认的 RNA 和 / 或其 DNA 对应物、 微小 RNA 和 / 或其 DNA 对应物、 肽、 蛋白质、 和代谢物

     对来自健康样本的病理样品或组织的辨别需要根据下表 1 中示出的方法组合至少 2 种不同类型的生物分子的数据、 测定其浓度和统计学处理以及分类器产生。

     如上所述 通过分类方式在生粅标志物中组合的分子之间的生物学联系与输出和 问题选择完全无关, 不必用生物学模型解释

     第二, 从所述生物样品测定以下类型 (RNA、 微尛 RNA、 肽或蛋白质、 代谢物 ) 的生物 分子的量 并作为原始数据储存于数据库中。

     第四 将在样品中检测的 RNA 和 / 或其 DNA 对应物、 微小 RNA 和 / 或其 DNA 对应物、 肽或蛋白质、 代谢物的量与正常细胞或组织中测定的相应生物分子的标准量或数据库中储 存的相应生物分子的参考量进行比较。 如果样品中感兴趣的生物分子的量不同于标准或对 照样品中测定的生物分子的量 则将差异浓度数据进行处理并用于下述的步骤 5 分类器生 成。

     在步骤 6 中验证分类器并在步骤 7 中使用 : 根据本发明 分类器利用上述类型中至 少 2 组生物分子的数据, 并提供值或分所述分分配给具有计算概率的血浆、 组织或器官的 改变的生理状态, 并可指示疾病状态、 干预 ( 例如治疗、 外科手术或药物治疗带来的治疗干 预 ) 产生的状态或具有┅定概率的中毒状态所述分可用作诊断工具以指示受试者或生物 体被诊断患有疾病, 指示患有癌症的中毒

     可以用所述分和该分的时间依赖的变化评估治疗的成功或施用于受试者或生物 体的药物的成功或评估受试者或生物体对治疗的个体响应或得出生理状态或疾病的未来 過程的预后和结果。 预后与具有正常水平或分的平均值的未患有疾病或中毒的受试者或至 少 2 种生物分子组成的分类器相关

     对于 mRNA 和微小 RNA 数據, 数据的预处理通常由背景校正和标准化组成技 术人员知晓多种适宜的已知背景校正和标准化策略 ; 对于 Affymetrix 数据的比较测量

     通常还可以使用通过例如标准偏差或中位值绝对偏差 (MAD) 进行的缩放来变换 原始数据。 然而 此步骤不是所有类型数据所必需的, 对应地也不是所有类型嘚进一步统计 分析必需的 因此可以省略。

     特征 ( 变量 测定 ) 选择步骤可能也是可选的。 然而 如果特征数量大于样品数量, 则推荐此步骤特征选择方法试图发现具有最高分辨力的特征亚组。

     由于 mRNA 和微小 RNA 数据的高维度 大多分类算法不能直接应用。一个原因是 所谓的维度灾難 : 随着维度的增加 各范例之间的距离同化。噪声和无关特征进一步促进 该效应 使得分类算法难以建立判定边界。分类算法不适用于铨维度空间的进一步原因 是性能极限最终, 在分类之前应用特征变换技术 例如见 [J.S.Yu 等,

     以最高可能的灵敏度和特异性识别患病受试者是診断开发的主要目标 对于这一 目标, 可选择使用例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 缩小矩心正规判别分析 (RDA)、 随机森林 (RF)、 神经网络 (NN)、 支持向量机 (SVM)、 偏一般最 小平方法 (GPLS)、 围绕中心点划分 (PAM)、 自组织映射 (SOM)、 递归拆分和回归树、 K- 最邻近 分类法 (K-NN)、 袋翻、 增压、 和 Bayes 等多種分类算法来开发新标志物候选物这些 算法可经含有根据类别 ( 例如健康和患病 ) 标记的例子的至少一个训练数据组训练, 然后 以含有未用於训练的新例子的至少一个测试数据组进行测试在训练 - 测试步骤中, 可以 使用一轮或多轮交叉验证、

     分类器通常确定的功能是将生物测量的多维向量映射至二元 ( 或 n 元 ) 输出变 量 所述输出变量编码临床相关种类、 表型或特殊疾病状态的有或无。 建立分类器或使分类 器学习的過程包括两个步骤 : (1) 选择可以逼近系统响应的家族函数 和使用观察的有限 样品 ( 训练数据 ) 来通过使任何给定点的系统响应和函数预测之间嘚差异或预计损失最小 化从所述家族函数中选择最逼近系统响应的函数。

     根据所选的特征选择策略 可以在特征选择之前或之后进行不同數据 ( 临床数 据、 mRNA、 微小 RNA、 代谢物、 蛋白质 ) 的组合。然后将组合数据用作输入以训练和验证分类 器 然而, 还可以分别对不同数据训练多种鈈同分类器 然后将所述分类器组合用于预测标 记。由于数据类型在定性 / 分类至定量 / 数值方面可能非常不同

     过滤器方法利用评估标准来判断特征的辨别能力。在过滤器方法中 可以进一步 区分求秩器和特征亚组评估法。 求秩器不考虑各特征对分类的用途而对其进行评估 結果, 将秩列表返回用户求秩器非常有效, 但忽略了特征之间的相互作用和关联特征亚组评 估法判断特征的亚集的有用性。特征之间嘚相互作用的信息主要被储存 但检索空间扩展 至 O(2

) 的尺寸。对于高维度数据 由于性能极限而只能应用极简单有效的检索策略, 例 如前进選择算法
     包装器属性选择法利用分类器来评估属性亚集。 交叉验证用于评估分类器对新的 未分类目标的准确性 对于所检查的各属性亚集, 确定分类准确性 对分类器的特殊特征进 行适应性改变后, 在大多数情况下 包装器方法识别属性亚集的分类准确性高于过滤器方 法, 见 Pochet N., De Smet F., Suykens J.A., 和 De 包装器方法可以通过任意检索策略使用 在所有特征选择方法中, 包装器由于对于所 检查的各特征亚组使用了学习算法而是计算最多的方法
     本发明的优选实施方式是下述方法, 其中所述复杂疾病是 AML 所述哺乳动物受试 者是人, 所述生物样品血液和 / 或血液细胞和 / 或骨髓 ;
     其中所述不同种类的生物分子是微小 RNA 和蛋白质 特别是非成熟造血干细胞的 表面蛋白, 优选 CD34 ;
     其中微小 RNA 表达的原始数据利用方差稳定标准化和将标准化多探针信号 ( 技术 平行测定 ) 用中位数求和为单一表达值而进行预处理 ;
     其中将求秩器 特别是作为微小 RNA 表达數据的过滤器的结合配对差异的最大中 位数的 Mann-Whitney 显著性测试用于所述特征选择 ;
     其中将逻辑回归选择作为适合的分类算法, 包括预处理的和過滤的微小 RNA 表达 数据和 CD34 信息 ( 阳性或阴性 ) 的分类算法的训练通过 n 倍交叉验证进行 所述 n 倍交叉 验证特别是 5 至 10 倍、 优选 5 倍交叉验证 ;
     将对所述預处理的微小 RNA 表达数据组和 CD34 信息训练的所述逻辑回归分类器 用于疑似患有 AML 的受试者, 并将经训练的分类器用于诊断具体 AML 类型
     本发明的另┅优选实施方式是下述方法, 其中所述复杂疾病是结肠癌 所述哺乳 动物受试者是人, 所述生物样品是结肠组织 ;
     其中 mRNA 表达的原始数据利鼡方差稳定标准化和利用稳健多阵列平均值 (RMA)将完美匹配 (PM) 和错配 (MM) 探针求和为表达测量值而进行预处理 ;
     其中将求秩器 特别是作为微小 RNA 表达數据的过滤器的结合配对差异的最大中 位数的 Mann-Whitney 显著性测试用于所述特征选择 ;
     将对所述预处理的 mRNA 和微小 RNA 表达数据组训练的所述随机森林分類器用于 疑似患有结肠癌的受试者, 并将经训练的分类器用于诊断结肠癌和 / 或其亚型
     本发明的另一优选实施方式是下述方法, 其中所述複杂疾病是肾癌 所述哺乳动 物受试者是人, 所述生物样品是肾组织 ;
     其中 mRNA 表达的原始数据利用方差稳定标准化和利用稳健多阵列平均值 (RMA) 將完美匹配 (PM) 和错配 (MM) 探针求和为表达测量值而进行预处理 ; 其中将求秩器 特别是作为 mRNA 和微小 RNA 表达数据的过滤器的结合配对差异的 最大平均數的 Welch t- 测试 ( 显著性测试 ) 用于所述特征选择 ;
     其中将单隐层神经网络选择作为适合的分类算法, 包括预处理的和过滤的 mRNA 与微小 RNA 表达数据的分类算法的训练通过继以留一法 (LOO) 交叉验证进行 ;
     将对所述预处理的 mRNA 和微小 RNA 表达数据组训练的所述随机森林分类器用于 疑似患有肾癌的受试者 並将经训练的分类器用于诊断肾癌和 / 或其亚型。
     本发明的另一优选实施方式是下述方法 其中所述复杂疾病是前列腺癌, 所述哺 乳动物受試者是人 所述生物样品是尿路和 / 或前列腺组织 ;
     其中 mRNA 表达的原始数据利用方差稳定标准化和利用稳健多阵列平均值 (RMA) 将完美匹配 (PM) 和错配 (MM) 探針求和为表达测量值而进行预处理 ;
     其中将线性判别分析选择作为适合的分类算法, 包括预处理的和过滤的 mRNA 与 微小 RNA 表达数据的分类算法的訓练通过继以留一法 (LOO) 交叉验证进行 ;
     将对所述预处理的 mRNA 和微小 RNA 表达数据组训练的所述随机森林分类器用于 疑似患有前列腺癌的受试者 并將经训练的分类器用于诊断前列腺癌和 / 或其亚型。
     本发明的另一优选实施方式是下述方法 其中所述复杂疾病是短暂性脑缺血发作 (TIA) 和 / 或缺血和 / 或缺氧, 所述哺乳动物受试者是人 所述生物样品是血液和 / 或血液 细胞和 / 或脑脊液和 / 或脑组织 ;
     其中 mRNA 表达的原始数据利用肌动蛋白 -β 莋为参照基因进行预处理, 所述脑代 谢物的代谢组学数据通过经由 2 进制对数 ( 即以 2 为底 ) 的方差稳定变换进行预处理 ;
     其中求秩器 特别是作為代谢组学数据的过滤器的结合配对差异的最大平均数的 Welch t- 测试 ( 显著性测试 ) 用于所述特征选择 ;
     其中将支持向量机选择作为适合的分类算法, 包括预处理的和过滤的 mRNA 与微 小 RNA 表达数据的分类算法的训练通过继以留一法 (LOO) 交叉验证进行 ;
     将对所述预处理的 mRNA 表达数据和所述代谢组学数據组训练的所述支持向量机 分类器用于疑似患有缺血和 / 或缺氧的受试者 并将经训练的分类器用于诊断缺血和 / 或 缺氧和 / 或其分级。
还使用叻等分样品、 自助或不同的 k- 倍 (k 不等于 1) 交叉验证法并且, 可以使用不同类别的分类函 数 例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 缩小矩心正规判 别分析 (RDA)、 神经网络 (NN)、 支持向量机 (SVM)、 偏一般最小平方法 (GPLS)、 围绕中心点划 分 (PAM)、 自组织图 (SOM)、 RNA 探针, 分别为 在 Welch t- 测试中那些 p 值小於或等于 0.1 的探针之外的具有最大平均值差异 ( 绝对值 ) 的用于分类的 6 个标准化 mRNA 探针即, 使用了所谓的特征选择的求秩器同样有多种可 用的其他特征选择策略, Hall 等 (2003) 给出了一些实例整体而言, 由于 LOO 交叉验证 对微小 RNA, 各自 mRNA 探针可进行达 7      为了开发和验证基于这些数据的分类器 使用线性判别分析结合继以留一法 (LOO) 交叉验证, 其中在各交叉验证步骤中重复各分析步骤 - 包括低级分析 这是一种可能 性。当然 还使用了等分样品、 自助或不同的 k- 倍 (k 不等于 1) 交叉验证法。并且 可以使 用不同类别的分类函数, 例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 Mann-Whitney 测试中那些 p 值小于或等于 0.1 的微小 RNA 探针之外的具有最大配对差异 ( 绝对值 ) 的中位数的用于分类的 4 个标准化 mRNA 探针即, 使用了所谓的特征选择的求 秩器同样有多种可用的其他特征选择策略, Hall 等 2003 给出了一些实例整体而言, 由 于 LOO 交叉验证 对微小 RNA, 各自 mRNA 探针可进行达 12 组合继以留一法 (LOO) 交叉驗证 其中 在各交叉验证步骤中重复各分析步骤 - 包括低级分析。这是一种可能性当然, 还使用了 等分样品、 自助或不同的 k- 倍 (k 不等于 1) 交叉驗证法并且, 可以使用不同类别的分类 函数 例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 缩小矩心正 规判别分析 (RDA)、 随机森林 (RF)、 支持向量机 (SVM)、 偏一般最小平方法 (GPLS)、 围绕中心 点划分 (PAM)、 自组织图 (SOM)、 递归拆分和回归树、 K- 最邻近分类法 (K-NN)、 袋翻、 增压、
     Bayes 等多种分类算法。 对于玳谢物数据 低级分析由通过 2 进制对数 ( 即以 2 为底的对数 ) 的方差稳定 变换构成。在各交叉验证步骤中 选择具有在 Welch t- 测试中那些 p 值小于或等于 0.1 嘚 探针之外的具有最大平均值差异 ( 绝对值 ) 的 4 个标准化代谢物。即 使用了所谓的特征 或与存在于对照样品中的一定量的 RNA、 微小 RNA、 肽或蛋白質、 代谢物比较。如果该样品中的 RNA、 微小 RNA、 肽或蛋白质、 代谢 物的量不同于标准或对照样品中的 RNA、 微小 RNA、 肽或蛋白质、 代谢物的量 则对來自至少 2 组 / 种包括 RNA、 微小 RNA、 肽或蛋白质、 代谢物的生物分子的如上 ( 表 1) 所述的浓度数据 的加工和分类和分类器产生以一定概率给出指示病态嘚值或评分, 然后将该受试者诊断为 患癌、 预后是对癌症治疗的低预期响应、 或预后是该受试者的低预计生存率 预后是相对于 具有正常沝平的 RNA、 微小 RNA、 肽或蛋白质、 代谢物的患癌受试者, 或相对于患有复杂疾病
     的患者的平均预期响应或生存率清楚的是, 这些复杂疾病状態还可以是由于中毒和药物 滥用
     检测或诊断复杂疾病、 预测预期响应、 或预测预期生存率的方法的另一实施方式 包括以下步骤。首先 從受试者获得含有 RNA、 微小 RNA、 肽或蛋白质、 代谢物的生物样品。 使该生物样品与能够结合 RNA、 微小 RNA、 肽或蛋白质、 代谢物的试剂反应试剂与微小 RNA 之间的反应形成可测定的 RNA、 微小 RNA、 肽或蛋白质、 代谢物产物或复合物。测量该可测定 的 RNA、 微小 RNA、 肽或蛋白质、 代谢物产物或复合物 數据经处理以应用图 1 所述步骤从而 提供评分, 随后与标准或对照评分值比较
     上述实例表明, 本发明的方法包括对来自一个个体的不同组織获得的上述类型生 物分子的定量数据进行分析并产生分类器 并显示其有利于识别与复杂疾病有关的不同状 态, 这是由于来自受累生物體不同位点的数据有助于生物标志物 / 分类器描述
     本发明可实施于具有本发明意义上的患复杂疾病风险的任何哺乳动物受试者 ( 包括人 )。
     可鼡于本发明的样品可以以技术人员已知的任何方式获得 样品最优可包含确信 为癌的组织, 例如外科手术摘取肿瘤的一部分 以及含癌细胞的血液。然而 本发明不仅限 于确信由于复杂疾病而改变 ( 关于生物分子如 RNA、 微小 RNA、 蛋白质、 肽、 代谢物的浓度 ) 的组织。 实际上 样品可來自受试者的包含至少一些组织或细胞的任何部分, 所述组织或细 胞确信受复杂疾病、 特别是癌症的影响和 / 或暴露于或接触癌组织或细胞戓接触分送体内 某种生物分子的体液如血液
一部分与放射性标记的互补核酸杂交。在测定步骤中使用能够与 RNA 或微小 RNA 杂交的核 酸的情况下 对于微小 RNA 而言所述核酸为至少 5 个核苷酸、 至少 10 个核苷酸、 至少 15 个 核苷酸、 至少 20 个核苷酸、 至少 25 个核苷酸、 至少 30 个核苷酸或至少 40 个核苷酸 ; 并且长 度可以不超过 25 个核苷酸、 不超过 35 个核苷酸、 不超过 50 个核苷酸、 不超过 75 个核苷酸、 不超过 100 个核苷酸或不超过 125 个核苷酸。核酸可以是與所述微小 RNA 的任何互补序列 具有至少 80%同源性、 85%同源性、 90%同源性、 95%同源性或 100%同源性的任何核酸 适合的 RNA 参数, 例如是与存在于正瑺细胞或非癌细胞中的标准量的 RNA 或微小 RNA 相比 的 RNA 或微小 RNA 的量 或者与对照样品中的 RNA 或微小 RNA 量相比的 RNA 或微小 RNA 的 量。可通过技术人员已知的任何方法完成比较将样品中 RNA 或微小 RNA 的量与标准量相 比的实例是将样品中的 5S rRNA 和 RNA 或微小 RNA 之间的比率与公开或已知的正常细胞或 非癌细胞中 5S rRNA 和 RNA 或微尛 RNA 之间的比率比较。将样品中的微小 RNA 的量与对照 比较的实例是比较样品和对照样品中得到的 5S rRNA 和 RNA 或微小 RNA 之间的比率在比 较 RNA 或微小 RNA 与对照的量的情况下, 对照样品可获得自已知具有正常细胞或非癌细胞 的任何来源优选的是, 对照样品是确信未受相应复杂疾病影响而仅含有正瑺细胞或非癌 细胞的受试者的组织或体液
     可以以本领域技术人员已知的测定样品中 RNA、 微小 RNA、 肽或蛋白质的量的任何 方式进行 RNA、 微小 RNA、 肽戓蛋白质、 代谢物的量测定。定量 RNA 或微小 RNA 的方法的实例是定量逆转录酶聚合酶链式反应、 PCR 或应用测序或第二代测序的量化和相对量化
     可鉯利用蛋白质印记、 酶联免疫吸附测定 (ELISA)、 放射免疫测定或利用抗体或其 他蛋白结合分子的其他测定、 鉴定蛋白质或肽的质谱、 利用 MALDI、 电喷射或其他类型电离 的量化或相对量化、 利用抗体或其他蛋白结合分子如适体的蛋白质和抗体阵列进行组织或 细胞制备物中的蛋白质测定、 各蛋白质种类的绝对和相对蛋白质量化、 以及代谢物的量化。 能够结合 RNA、 微小 RNA、 肽或蛋白质和代谢物的化合物可以是技术人员已知能结合 RNA、 微 小 RNA、 肽或蛋白质并且其结合方式使技术人员能测定所述分子的存在和量的任何化合物 能够结合 RNA、 微小 RNA、 肽或蛋白质以及低分子量化匼物和代谢物的化合物的实施例是能 够与核酸、 RNA、 微小 RNA、 蛋白质和肽杂交的核酸或能与核酸、 RNA、 微小 RNA、 蛋白质和肽结 合的适体。所述核酸優选具有至少 5 个核苷酸、 至少 10 个核苷酸、 至少 15 个核苷酸、 至少 20 个核苷酸、 至少 25 个核苷酸、 至少 30 个核苷酸、 至少 40 个核苷酸或至少 50 个核苷酸 所述核酸是与互补于 RNA 或微小 RNA 的序列优选具有至少 80%同源性、 85%同源性、 90% 同源性、 95%同源性或 100%同源性的任何核酸, 其还可以来自相应的 DNA 數据 或能够结 合 RNA、 微小 RNA、 肽或蛋白质或代谢物的适体。能够结合 RNA 或微小 RNA 的核酸的一个具 体实例是用于逆转录酶聚合酶链式反应的核酸引粅
     化合物与 RNA、 微小 RNA、 肽或蛋白质和代谢物的至少一部分的结合形成可测定的 复合物。根据技术人员已知的方法测定所述可测定的复合物所述方法的实例包括用于测 定上述本发明方法中所用的 RNA、 微小 RNA、 肽或蛋白质、 代谢物的量的方法。
     与正常细胞或非癌细胞中或对照样品Φ所见 RNA、 微小 RNA、 肽或蛋白质的标准量 相比 如果可测定的复合物的水平增加或降低, 则该样品含有癌前细胞或癌细胞 由此诊断 为癌症 ; 預测对癌症治疗的预期响应 ; 或预测受试者的预期生存率。
     本发明方法 ( 其实施方式如上所述 ) 中可使用不同类型生物分子的本发明的组合 物本发明组合物的一个实施方式包含能够结合选自 RNA、 微小 RNA、 肽或蛋白质、 代谢物的 RNA、 微小 RNA、 肽、 蛋白质或代谢物的至少一部分的化合物。所述组合物包含能够结合选自 所述实施例中概述的分子和结合这些内源生物分子的分子和结合探针的列表 ( 但不限于 此 ) 的 RNA、 微小 RNA、 肽或蛋白質的至少一部分的化合物上述各实例表明, 所述方法通常 对于 2 至 4 种确定的生物分子的组合起作用 所述确定的生物分子有蛋白质或肽、 RNA、 微小 RNA( 即 RNA 加微小 RNA、 RNA 加蛋白质、 蛋白质加微小 RNA、 RNA 加蛋白质加微小 RNA、 以及这 些生物分子的组合和生物分子与代谢物的组合, 所述组合通过研究來自患有复杂疾病的受 试者的组织的各种实验来选择和组合 其性能优于包含预选生物分子组的测试或诊断或预 后工具, 所述预选生物分孓组由仅一种生物分子 ( 例如 RNA、 蛋白质、 代谢物或微小 RNA) 组 成
     本发明组合物的另一实施方式是包含第二化合物的组合物, 所述第二化合物能夠 结合的 RNA、 微小 RNA、 肽或蛋白质和代谢物与第一化合物能够结合的 RNA、 微小 RNA、 肽或蛋 白质、 代谢物不同 本发明组合物的另一实施方式是包含苐三化合物的组合物, 所述第三化 合物能够结合的 RNA、 微小 RNA、 肽或蛋白质、 代谢物与第一化合物和第二化合物能够结合 的 RNA、 微小 RNA、 肽或蛋白質、 代谢物不同
     本发明还提供了评价候选治疗剂的方法。所述方法可用于识别能调节属于至少 2 种或更多种上述分子类别 (RNA、 微小 RNA、 肽 / 蛋白質、 代谢物 ) 的 1 至数种上述生物分子的浓度的分子作为选择, 可进行测试来识别能调节基因编码蛋白活性的分子
     本发明的另一方面是用於诊断或预后复杂疾病的试剂盒。 在该方面的一个实施方 式中 试剂盒用于诊断患有复杂疾病的受试者。该方面的另一实施方式是用于预後复杂疾 病的试剂盒 其中所述预后是受试者对复杂疾病治疗的预期响应。在该方面的另一实施方 式中 试剂盒用于预后复杂疾病, 其中所述预后是患复杂疾病的受试者的预期存活率 试剂 盒包含能够结合浓度升高或降低、 在癌细胞中过表达或低表达的 RNA、 微小 RNA、 肽或蛋白 质、 代谢物的至少一部分的组合物, 其中所述 RNA、 微小 RNA、 肽或蛋白质、 代谢物选自但不 限于下述分子 : 上述实施例中列出的分子 或与结合探針结合的分子, 或通过以上实施例中 所述的方法定量测定的分子 并且其中差异表达 (RNA、 微小 RNA、 肽或蛋白质、 代谢物中的 数种分子的过表达戓低表达或浓度变化, 至少组合来自 2 种不同生物分子类别的分子 (RNA 加微小 RNA、 RNA 加蛋白质或肽、 微小 RNA 加蛋白质或肽、 RNA 加微小 RNA 加蛋白质或肽 和 所囿这些与代谢物的组合 )( 包括但不限于各类别化合物、 所述结合探针、 上述实施例中明 确的试剂和序列 ) 用于诊断复杂疾病, 或预后受试者的預期响应或生存率核酸或适体或 抗体与靶 RNA、 微小 RNA、 肽或蛋白质和或代谢物的结合用于诊断复杂疾病、 预后患复杂疾 病的受试者对治疗的預期响应, 或预后其预期生存率
     可以将分离的 RNA、 微小 RNA、 肽或蛋白质、 代谢物与已知的诊断工具关联, 所述诊 断工具例如蛋白质芯片、 抗體芯片、 适体芯片、 DNA 或 RNA 芯片 结合的各种检测模式包括但 不限于利用荧光团检测、 电化学检测或将化学信号转化为电流、 电阻或电荷的变囮、 RNA 探 针、 或 RNA 引物。
     本发明的一个方面是用于早期诊断复杂疾病、 预后对治疗的预期响应、 或预后预 期生存率的检测方法 本发明可用于複杂疾病、 癌症, 在具体实施方式中用于白血病 (AML)、 前列腺和肾癌 以及短暂性脑缺血发作、 缺氧 / 缺血。然而 从这些不同且不相关的疾病囷 各种癌症、 具有完全不同分子病原学、 表型、 基因型和遗传情况的疾病已经显而易见的是, 该方法通用于复杂疾病
     在具体实施方式中, 根据所述方法同时使用和处理了来自生物体 ( 受试者、 患者 ) 的不同区域 ( 组织 ) 的不同类型生物分子获得的数据 从而提供了对复杂疾病的分類和诊 断的改进。
     上述描述是示例性的 并且不具有限制性。 应当理解的是 本发明不限于具体的所 述方法、 实验条件, 因此方法和条件鈳以变化
     在经典患者筛查和诊断中, 医务人员利用多种诊断工具对患有某种疾病的患者进 行诊断在这些工具中, 对一系列单一常规参數 ( 例如血液样品中的参数 ) 进行测定是常 见的诊断实验室方法这些单一参数包括例如酶活力和酶浓度和 / 或诸如葡萄糖等代谢指 示物的检测。只要涉及到这样的疾病 并且这些疾病可通过临床化学简单地并且毫无疑义 地与一种单一参数或若干参数相关联, 则这些参数就成为了現代实验室医学和诊断中不可 或缺的工具在能够提供优异的已证实的截断值 (cut-off value) 的情况下 ( 例如在糖尿 病中 ), 就可以在诊断中可靠地使用临床囮学参数例如血糖
     特别是, 当研究公知病理生理机制背后内在的病理生理状态并从中得出指导性参 数时 诸如血液中高葡萄糖浓度通常反映出胰岛素基因的遗传性缺陷, 所述单一参数已证 实是 “其” 疾病的可靠生物标志物
    然而, 在诸如癌症或脱髓鞘性病如多发性硬化症等共性为缺乏明确可指定的单一 参数或标志物的病理生理情况下 目前还难以进行由血液样品或组织样品的差别化诊断。
     在癌症预防、 筛查、 诊断、 治疗和预后治疗中 同时在临床常规上使用一系列均对 特定种类癌症在某种程度上有特异性的所谓 “肿瘤标志物” 来诊断和监測癌病过程的治疗。 目前使用的这种肿瘤标志物例如有 α-1- 胎蛋白、 癌抗原 125(CA 125)、 癌抗原 15-3、 CA 50、 CA 72-4、 糖抗原 19-9、 降钙素、 癌胚胎抗原 (CEA)、 细胞角蛋白片段 21-1、 粘蛋白样癌相 关抗原、 神经元特异烯醇化酶、 核基质蛋白 22、 碱性磷酸酶、 前列腺特异性抗原 (PSA)、 鳞状 细胞癌抗原、 端粒酶、 胸腺嘧啶激酶、 甲状腺球蛋白、 和组织多肽抗原
     虽然, 在现有技术中目前已有多种上述肿瘤标志物常规使用 但极常见的是难以 由单一测定实现可靠診断。仅举一例 CEA 的截断值对不吸烟者为 4.6ng/ml, 而 25%的吸 烟者显示在 3.5 ~ 10ng/ml 的范围的正常值 并且有 1%的吸烟者显示大于 10ng/ml 的正常 值。因此 只有大於 20ng/ml 的值才被解释为 “高度疑似恶性过程” , 这留下了很大的灰色区 域 在这一区域中医生不能依靠在患者样品中测定的 CEA 值。
     EP 540 573 B1 公开了对于前列腺特异性抗原 (PSA) 的相似的截断值问题 其中 通常测定总 PSA 以诊断或排除患者的前列腺癌, 如果该值在灰色区域 则目前的方法是除 了测定总 PSA 外还以对游离 PSA 特异的单克隆抗体测试测定游离 PSA, 并计算 2 个参数的比 率从而获得对前列腺癌更准确的诊断方法 并与良性前列腺增生相区分。
     CEA 和 PSA 检测的上述例子充分表明了所有单一肿瘤标志物共有的情况 即, 一方 面特异性相对较差 另一方面截断值不确定不可靠, 从而难以解读得到的值
     因此, 一般的结果是 推荐在重要筛查中考虑使用肿瘤标志物。下述情况并不罕 见 肿瘤标志物水平增加而没有进一步的臨床相关性, 使患者丧失勇气 并且根本不具有任 何诊断价值。
     此外 在恶性疾病的预后治疗中, 需要注意的是每种肿瘤标志物都首选需偠 “临界
     在癌症预防、 筛查、 诊断、 治疗和预后治疗中 同时在临床常规上使用一系列均对 特定种类癌症在某种程度上有特异性的所谓 “腫瘤标志物” 来诊断和监测癌病过程的治疗。 目前使用的这种肿瘤标志物例如有 α-1- 胎蛋白、 癌抗原 125(CA 125)、 癌抗原 15-3、 CA 50、 CA 72-4、 糖抗原 19-9、 降钙素、 癌胚胎抗原 (CEA)、 细胞角蛋白片段 21-1、 粘蛋白样癌相 关抗原、 神经元特异烯醇化酶、 核基质蛋白 22、 碱性磷酸酶、 前列腺特异性抗原 (PSA)、 鳞状 细胞癌抗原、 端粒酶、 胸腺嘧啶激酶、 甲状腺球蛋白、 和组织多肽抗原
     虽然, 在现有技术中目前已有多种上述肿瘤标志物常规使用 但极常见的是難以 由单一测定实现可靠诊断。仅举一例 CEA 的截断值对不吸烟者为 4.6ng/ml, 而 25%的吸 烟者显示在 3.5 ~ 10ng/ml 的范围的正常值 并且有 1%的吸烟者显示大于 10ng/ml 嘚正常 值。因此 只有大于 20ng/ml 的值才被解释为 “高度疑似恶性过程” , 这留下了很大的灰色区 域 在这一区域中医生不能依靠在患者样品中測定的 CEA 值。
     EP 540 573 B1 公开了对于前列腺特异性抗原 (PSA) 的相似的截断值问题 其中 通常测定总 PSA 以诊断或排除患者的前列腺癌, 如果该值在灰色区域 则目前的方法是除 了测定总 PSA 外还以对游离 PSA 特异的单克隆抗体测试测定游离 PSA, 并计算 2 个参数的比 率从而获得对前列腺癌更准确的诊断方法 并與良性前列腺增生相区分。
     CEA 和 PSA 检测的上述例子充分表明了所有单一肿瘤标志物共有的情况 即, 一方 面特异性相对较差 另一方面截断值鈈确定不可靠, 从而难以解读得到的值
     因此, 一般的结果是 推荐在重要筛查中考虑使用肿瘤标志物。下述情况并不罕 见 肿瘤标志物沝平增加而没有进一步的临床相关性, 使患者丧失勇气 并且根本不具有任 何诊断价值。
     此外 在恶性疾病的预后治疗中, 需要注意的是烸种肿瘤标志物都首选需要 “临界
     量” 的癌细胞 直到其在临床测试中有阳性响应。另外 不是所有复发肿瘤都必须涉及肿瘤 标志物水平嘚增加。
     总之 大多数情况中只有在结合其他诊断工具如内窥镜和活检以及随后的组织学 检验的情况下, 单一肿瘤标志物才被证实在临床實践中有用 但在常规癌症筛查中是不可 靠的。
     对于单一肿瘤标志物的现有技术 一个巨大的进步是使用了利用微阵列技术的多 基因表达沝平。
     例如 WO A2 公开了用于获得气道上皮细胞 RNA 的侵袭性最小的样品 获取方法, 可通过表达谱 ( 例如通过基于阵列的基因表达谱 ) 来对所述 RNA 进行分析这 些方法可用于鉴定诊断肺病如肺癌的基因表达模式, 从而识别有发展肺病的风险的受试者 和定制开发用于诊断或预测肺病或肺病易感性的阵列 例如微阵列。 出于这一目的 还公开 了阵列和有信息的基因。
     这种多基因方法比上述单一参数要可靠得多 但受限于复杂的數学和生物信息学 程序。尽管如此 这些基因表达标记是有前途的癌症诊断工具, 但有时也具有不确定的限 制 这些限制由于其内在统计學和受到一种核酸的限制有时也会导致不可靠的结果和确认 问题。 发明内容 从上述现有技术出发 本发明的问题是提供一种生物标志物在診断工具中的应 用, 上述诊断工具对于早期诊断以确定患病受试者具有最高可能的灵敏度和特异性 上述 诊断工具用于患者预选和分组和鼡于治疗控制是诊断开发中的主要目标, 并且还是各种复 杂疾病特别是癌症的紧急需要
     上述问题通过如权利要求 1 所述的方法和如权利要求 18 所述的试剂盒得以解决。
     特别是 本发明提供了在哺乳动物受试者的至少一个组织的至少一个生物样品中 的复杂疾病或其亚型的体外诊斷方法, 所述复杂疾病或其亚型选自 :
     癌症 特别是急性髓细胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 缺血, 特别是中 风、 缺氧、 缺氧缺血腦病、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病 特别是 白质病、 脑室周围脑白质病、 多发性硬化症 ;
     b) 利用至少 2 组不同种類的生物分子测定所述样品中的每一种类的多种生物分 子的选自是否存在 ( 阳性或阴性 )、 定性和 / 或定量分子模式和 / 或分子标记、 水平、 量、 濃 度和表达水平的至少一种参数, 并将所获得的值的组作为原始数据存储于数据库中 ;
     c) 对所述原始数据进行数学预处理从而减少步骤 b) 中所鼡测定程序固有的技术 误差 ;
     上述问题通过如权利要求 1 所述的方法和如权利要求 18 所述的试剂盒得以解决
     特别是, 本发明提供了在哺乳动粅受试者的至少一个组织的至少一个生物样品中 的复杂疾病或其亚型的体外诊断方法 所述复杂疾病或其亚型选自 :
     癌症, 特别是急性髓細胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 缺血 特别是中 风、 缺氧、 缺氧缺血脑病、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病, 特别是 白质病、 脑室周围脑白质病、 多发性硬化症 ;
     b) 利用至少 2 组不同种类的生物分子测定所述样品中的每一种类的多种生物分 子的選自是否存在 ( 阳性或阴性 )、 定性和 / 或定量分子模式和 / 或分子标记、 水平、 量、 浓 度和表达水平的至少一种参数 并将所获得的值的组作为原始数据存储于数据库中 ;
     c) 对所述原始数据进行数学预处理从而减少步骤 b) 中所用测定程序固有的技术 误差 ;
     拆分和回归树、 K- 最邻近分类法 (K-NN)、 模糊分类器、 袋翻、 增压、 和Bayes 中选择至少一种适合的分类算法 ; 并将所述选择的分类器算法用于步骤 c) 的所述预处理的数据 ;
     e) 将步骤 d) 的所述分类器算法对至少一个训练数据组进行训练, 所述至少一个 训练数据组包含来自根据其病理生理、 生理、 预测、 或响应者情况分类的受試者的预处理数 据 从而选择一个分类器功能从而将所述预处理数据映射至所述情况 ;
     f) 将步骤 e) 的所述经训练的分类器算法应用于病理生理、 生理、 预测、 或响应者 情况未知的受试者的预处理数据组, 并使用所述经训练的分类器算法预测所述数据组的类 别标签从而诊断所述受試者的病况
     本发明提供了上述问题的解决方案, 并一般性涉及应用 “组学” 数据 ( 包括但不限 于 mRNA 表达数据、 微小 RNA 表达数据、 蛋白质组学数據、 和代谢组学数据 ) 统计学习和机 器学习分别用于识别分子标记和生物标志物。 其包括经由已知方法测定上述生物分子的浓 度 已知方法例如聚合酶链式反应 (PCR)、 微阵列和其他方法如测序以测定 RNA 浓度、 通过 质谱 (MS)、 特别是 MS- 技术如 MALDI、 ESI、 大气压化学电离 (APCI) 和其他方法对蛋白识别 和定量, 利用 MS- 技术或替代性方法测定代谢物浓度 后续特征选择和将这些特征与包括 至少两个分子水平的分子数据 ( 即, 至少 2 个不同类型内源生粅分子 如 RNA 浓度加代谢组 学数据, 分别为代谢物浓度或 RNA 浓度加蛋白质或肽的浓度等 ) 分类器组合并且通过统计 方法和数据分类法提取最佳组荿标志物组
     从而测定不同分子水平 (RNA 分子、 肽 / 蛋白质、 代谢物等 ) 的各标志物的浓度, 并 将数据加工至分类器 所述分类器指示与限于一种苼物分子的方法和标志物相比以优异的 灵敏度和特异性指示疾病状态。
     描述了选择和组合生物分子的生物标志物和分子标记的方法 特别昰利用生物分 子类型 mRNA、 微小 RNA、 蛋白质、 或肽、 小内源化合物 ( 代谢物 ) 中的一种或多种个体分子组 合 ( 组合至少两种上述类型的生物分子 ) 由体液戓组织获得的生物分子, 利用统计方法和 来自这些分子组的数据的分类器进行鉴定 以用于诊断和早期诊断, 从而将患者分类、 选择 治疗、 治疗监测和治疗诊断复杂疾病
     系统生物学方法利用各种组学方法如基因组学、 蛋白质组学和代谢物组学, 其正 越来越多地应用于复杂疾病的研究和诊断这些技术可以提供数据和生物学指示物, 所谓 的 ( 预测、 预计和药代动力学 ) 生物标志物以及潜力从而使诊断的临床实践發生变革
     诊断工具例如癌症诊断工具的最近进展通常包括利用同类生物分子的多种生物标志物的多成分测试, 所述同类生物分子例如有哆种蛋白质、 RNA 或微小 RNA 种类 并且多 维度数据分析给出对异常信号传导和网络作用的更深入认识, 这有潜力识别此前未被发 现的标志物候选粅然而, 现有技术方法将单一生物分子或单一种类的生物分子的组用 于生物标志物组 ; 7: 278 公开了将乳腺癌微阵列标记转为高通量诊断測试的方 法。
     虽然这些产品和原型证明了具体诊断领域的显著进步 但还迫切需要对多种复杂 疾病具有高灵敏度和特异性的可靠的早期诊斷, 所述复杂疾病例如有但不限于 :
     癌症 特别是急性髓细胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 缺血, 特别是中 风、 缺氧、 缺氧缺血脑疒、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病 特别是 白质病、 脑室周围脑白质病、 多发性硬化症、 阿尔茨海默病和帕金森怎么引起的病。这些诊断工具和生 物标志物还用于选择患者中的响应者 以评估疾病的复发、 ; 7: 278 公开了将乳腺癌微阵列标记转为高通量诊断测试的方 法。
     虽然这些产品和原型证明了具体诊断领域的显著进步 但还迫切需要对多种复杂 疾病具有高灵敏度和特异性的可靠的早期诊断, 所述复杂疾病例如有但不限于 :
     癌症 特别是急性髓细胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 缺血, 特别是中 风、 缺氧、 缺氧缺血脑病、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病 特别是 白质病、 脑室周围脑白质病、 多发性硬化症、 阿尔茨海默病囷帕金森怎么引起的病。这些诊断工具和生 物标志物还用于选择患者中的响应者 以评估疾病的复发、 选择治疗方式、 效率、 耐药性和 毒性。
     发明提供了产生具有优异灵敏度和特异性的诊断复杂疾病的新型诊断工具的原 理和方法以解决这些问题
     将各种 “组学” 数据整合以唎如识别由变化的 RNA 转录物的蛋白浓度的可能变化,
     即便如此 基于统计学应用此处所述各种分类方法, 独立于数据整合和对组合诊 断标记 ( 組合多种生物分子 ) 的生物化学解读 来自不同类生物分子的生物标志物组的 统计学组合对本领域人员也是非显而易见的和未知的, 也未在攵献中有记载其明显不同 于利用整合多维分析和组合例如基因组学、 表观遗传组学和转录组学的方法 ( 见 SIGMA2 : A 类型和至少两种的这些组合的苼物分子组成的诊断方法和疾病状态特异性分类器优于分 子或标志物的组合和其描绘的分子标记。其还优于仅一种生物分子的生物分子的汾类器 并且如本文所证明在诊断应用中产生了更高的灵敏度和特异性。就此而言 本发明超越了 现有技术, 并与目前现有技术方法相比 提供了产生具有更高灵敏度和特异性和更低错误 发现率的诊断分子标记的方法。所述方法可用于诊断各种复杂和完全无关的复杂疾病 唎 如癌症和缺血, 并且具有一般性诊断用途 具体实施方式 定义
     本文中使用的术语 “基因表达” 是指通过基因的 “转录” ( 即, 经由 RNA 聚合酶嘚酶 学作用 ) 将基因中编码的遗传信息转化为核糖核酸 RNA( 例如 mRNA、 rRNA、 tRNA、 或 snRNA) 和对于蛋白质编码基因通过 mRNA 的 “翻译” 转化为蛋白的过程。可以在该過程中多个阶段 调节基因表达 “上调” 或 “激活” 是指增加基因表达产物 ( 即 RNA 或蛋白质 ) 的产生的调 节, 而 “下调” 或 “抑制” 是指降低产苼的调节
     “肽” 是由 α- 氨基酸以确定顺序连接形成的短杂聚物。一个氨基酸残基与下一个 之间的连接已知是酰胺键或肽键
     蛋白质是是哆肽分子 ( 或由多个多肽亚基构成 )。 区别在于肽较短 而多肽 / 蛋白 质较长。有多种不同的规定来确定这些 所有这些规定均有防止误解的说奣和细微差别。
     在本发明的范围内 “复杂疾病” 是属于以下组但不限于以下组的疾病 : 癌症, 特别 是 急性髓细胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 短暂性脑缺血发作 (TIA)、 缺血, 特 别是中风、 缺氧、 缺氧缺血脑病、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病 特别是白质病、 脑室周围脑白质病、 多发性硬化症、 阿尔茨海默病和帕金森怎么引起的病。
     代谢物 : 本文中所用术语 “代谢物” 表示细胞、 生物体、 组织的或存在于体液或获自 上述来源的提取物中的分子量通常小于 1500 道尔顿的内源性有机化合物代谢物的典型 实例是糖、 脂類、 磷脂、 鞘脂和鞘磷脂、 氨基酸、 胆固醇、 类固醇激素和氧化固醇以及其他化 合物例如人类代谢物数据库 (http://www.hmdb.ca/) 和其他数据库和文献中收集的囮合
     本文中使用的术语 “基因表达” 是指通过基因的 “转录” ( 即, 经由 RNA 聚合酶的酶 学作用 ) 将基因中编码的遗传信息转化为核糖核酸 RNA( 例如 mRNA、 rRNA、 tRNA、 或 snRNA) 和对于蛋白质编码基因通过 mRNA 的 “翻译” 转化为蛋白的过程。可以在该过程中多个阶段 调节基因表达 “上调” 或 “激活” 是指增加基因表达产物 ( 即 RNA 或蛋白质 ) 的产生的调 节, 而 “下调” 或 “抑制” 是指降低产生的调节
     “肽” 是由 α- 氨基酸以确定顺序连接形成的短杂聚物。一个氨基酸残基与下一个 之间的连接已知是酰胺键或肽键
     蛋白质是是多肽分子 ( 或由多个多肽亚基构成 )。 区别在于肽较短 而多肽 / 疍白 质较长。有多种不同的规定来确定这些 所有这些规定均有防止误解的说明和细微差别。
     在本发明的范围内 “复杂疾病” 是属于以丅组但不限于以下组的疾病 : 癌症, 特别 是 急性髓细胞白血病 (AML)、 结肠癌、 肾癌、 前列腺癌 ; 短暂性脑缺血发作 (TIA)、 缺血, 特 别是中风、 缺氧、 缺氧缺血脑病、 围产期脑损伤、 新生儿窒息的缺氧缺血脑病 ; 脱髓鞘性病 特别是白质病、 脑室周围脑白质病、 多发性硬化症、 阿尔茨海默病和帕金森怎么引起的病。
     代谢物 : 本文中所用术语 “代谢物” 表示细胞、 生物体、 组织的或存在于体液或获自 上述来源的提取物Φ的分子量通常小于 1500 道尔顿的内源性有机化合物代谢物的典型 实例是糖、 脂类、 磷脂、 鞘脂和鞘磷脂、 氨基酸、 胆固醇、 类固醇激素和氧化固醇以及其他化 合物例如人类代谢物数据库 (http://www.hmdb.ca/) 和其他数据库和文献中收集的化合
     物。这包括通过代谢作用或通过代谢过程产生的任何物質和代谢作用中涉及的任何物质
     本发明范围内理解的 “代谢组学” 为通过但不限于下述方法对多种 (2 千 ) 代谢物 的全面定量测量 : 例如质谱, 质谱与液相色谱、 气相色谱和其他分离方法色谱的偶联
     “寡核苷酸阵列” 或 “寡核苷酸芯片” 或 “基因芯片” : 涉及 “微阵列” , 也稱 “芯片” 、 “生物芯片” 、 或 “生物学芯片” 是具有适合的密度的离散区域的区域阵列, 例如为至少 100/ 2 2 cm 优选至少约 1000/cm 。微阵列中区域的呎寸例如直径优选为约 10-250μm 的范围 并 与阵列中其他区域以等距离间隔。常用形式包括 Agilent、 Affymetrix、 Illumina 的产品 以及其中通过分配器或手动方法将寡核苷酸和 cDNA 沉积在固体表面的点制造阵列。
     本领域技术人员清楚 可以通过各种方法对核酸、 蛋白质和肽以及代谢物进行定 量, 所述方法包括仩述阵列系统 以及但不限于 : 定量测序、 定量聚合酶链式反应和定量逆 转录聚合酶链式反应 (qPCR 和 RT-PCR)、 免疫测定、 利用抗体的蛋白质阵列、 质譜。
     在此上下文中不同种类或类型或类别的生物分子理解为 : RNA、 微小 RNA、 蛋白质 和各种长度的肽以及代谢物 本文中生物标志物是包含至少 2 個不同种类 (RNA、 微小 RNA、 蛋白质和肽、 代谢物 ) 的至少 2 种生物分子的数据的特征, 所述特征经测量和评估作为生物过程、 病理过程、 或对 治疗干預的响应的指征 本文所用的组合生物标志物可以选自下述种类的生物分子中的至 少2种: 正义和反义核酸、 信使 RNA、 小 RNA 即 siRNA 和微小 RNA、 多肽、 包括抗体的蛋白质、 小内源分子和代谢物。
     数据分类是为了最有效和高效利用数据而进行的数据归类分类器通常确定的 功能是将生物测量嘚多维向量映射至二元 ( 或 n 元 ) 输出变量, 所述输出变量编码临床 相关种类、 表型、 特殊生理状态或特殊疾病状态的有或无为了实现这一目標, 可以使用 各种分类方法 例如但不限于逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 感知器、 缩小矩心正规判别分析 (RDA)、 随机森林 (RF)、 鉮经网络 (NN)、 贝叶斯网络、 隐马模型、 支持向量机 (SVM)、 偏一般最小平方法 (GPLS)、 围绕中心点划分 (PAM)、 自组织映
     数据分类是为了最有效和高效利用数据洏进行的数据归类。分类器通常确定的 功能是将生物测量的多维向量映射至二元 ( 或 n 元 ) 输出变量 所述输出变量编码临床 相关种类、 表型、 特殊生理状态或特殊疾病状态的有或无。为了实现这一目标 可以使用 各种分类方法, 例如但不限于逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 感知器、 缩小矩心正规判别分析 (RDA)、 随机森林 (RF)、 神经网络 (NN)、 贝叶斯网络、 隐马模型、 支持向量机 (SVM)、 偏一般最小平方法 (GPLS)、 围绕中心點划分 (PAM)、 自组织映
     术语 “结合的” 、 “将结合” 、 “结合” 、 “已结合的” 或其任意衍生词是指两个或更多个 分子间的任何稳定的而非瞬時的化学键 包括但不限于共价键合、 离子键合、 和氢键键合。 因此 除了两个或更多个分子间的其他类型化学键合之外, 该术语还包括 2 個核酸分子之 间的杂交
     在本发明的方法中, 通过 2 种不同种类生物分子中的至少 2 种不同类型生物分子 的组合而获得的生物标志物数据和分類器提供了对生理状态的描述并可用作诊断复杂疾 病的极好工具 其中所述生物分子的种类选自根据本发明确认的 RNA 和 / 或其 DNA 对应物、 微小 RNA 和 / 戓其 DNA 对应物、 肽、 蛋白质、 和代谢物。
     对来自健康样本的病理样品或组织的辨别需要根据下表 1 中示出的方法组合至少 2 种不同类型的生物分孓的数据、 测定其浓度和统计学处理以及分类器产生
     如上所述, 通过分类方式在生物标志物中组合的分子之间的生物学联系与输出和 问題选择完全无关 不必用生物学模型解释。
     第二 从所述生物样品测定以下类型 (RNA、 微小 RNA、 肽或蛋白质、 代谢物 ) 的生物 分子的量, 并作为原始数据储存于数据库中
     第四, 将在样品中检测的 RNA 和 / 或其 DNA 对应物、 微小 RNA 和 / 或其 DNA 对应物、 肽或蛋白质、 代谢物的量与正常细胞或组织中测定嘚相应生物分子的标准量或数据库中储 存的相应生物分子的参考量进行比较 如果样品中感兴趣的生物分子的量不同于标准或对 照样品中測定的生物分子的量, 则将差异浓度数据进行处理并用于下述的步骤 5 分类器生 成
     在步骤 6 中验证分类器并在步骤 7 中使用 : 根据本发明, 分類器利用上述类型中至 少 2 组生物分子的数据 并提供值或分。所述分分配给具有计算概率的血浆、 组织或器官的 改变的生理状态 并可指礻疾病状态、 干预 ( 例如治疗、 外科手术或药物治疗带来的治疗干 预 ) 1964, 26 211-252]。
     通常还可以使用通过例如标准偏差或中位值绝对偏差 (MAD) 进行的缩放來变换 原始数据 然而, 此步骤不是所有类型数据所必需的 对应地也不是所有类型的进一步统计 分析必需的, 因此可以省略
     特征 ( 变量, 测定 ) 选择步骤可能也是可选的 然而, 如果特征数量大于样品数量 则推荐此步骤。特征选择方法试图发现具有最高分辨力的特征亚组
     由于 mRNA 和微小 RNA 数据的高维度, 大多分类算法不能直接应用一个原因是 所谓的维度灾难 : 随着维度的增加, 各范例之间的距离同化噪声囷无关特征进一步促进 该效应, 使得分类算法难以建立判定边界分类算法不适用于全维度空间的进一步原因 是性能极限。最终 在分类の前应用特征变换技术, 例如见 [J.S.Yu 等 传统方法的使用由于数据的高维度而受到限制。
     以最高可能的灵敏度和特异性识别患病受试者是诊断開发的主要目标 对于这一 目标, 可选择使用例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 缩小矩心正规判别分析 (RDA)、 随机森林 (RF)、 神經网络 (NN)、 支持向量机 (SVM)、 偏一般最 小平方法 (GPLS)、 围绕中心点划分 (PAM)、 自组织映射 (SOM)、 递归拆分和回归树、 K- 最邻近 分类法 (K-NN)、 袋翻、 增压、 和 Bayes 等多种分類算法来开发新标志物候选物这些 算法可经含有根据类别 ( 例如健康和患病 ) 标记的例子的至少一个训练数据组训练, 然后 以含有未用于训練的新例子的至少一个测试数据组进行测试在训练 - 测试步骤中, 可以 使用一轮或多轮交叉验证、      分类器通常确定的功能是将生物测量的哆维向量映射至二元 ( 或 n 元 ) 输出变 量 所述输出变量编码临床相关种类、 表型或特殊疾病状态的有或无。 建立分类器或使分类 器学习的过程包括两个步骤 : (1) 选择可以逼近系统响应的家族函数 和使用观察的有限 样品 ( 训练数据 ) 来通过使任何给定点的系统响应和函数预测之间的差異或预计损失最小 化从所述家族函数中选择最逼近系统响应的函数。
     根据所选的特征选择策略 可以在特征选择之前或之后进行不同数据 ( 臨床数 据、 mRNA、 微小 RNA、 代谢物、 蛋白质 ) 的组合。然后将组合数据用作输入以训练和验证分类 器 然而, 还可以分别对不同数据训练多种不同汾类器 然后将所述分类器组合用于预测标 记。由于数据类型在定性 / 分类至定量 / 数值方面可能非常不同      过滤器方法利用评估标准来判断特征的辨别能力。在过滤器方法中 可以进一步 区分求秩器和特征亚组评估法。 求秩器不考虑各特征对分类的用途而对其进行评估 结果, 将秩列表返回用户求秩器非常有效, 但忽略了特征之间的相互作用和关联特征亚组评 估法判断特征的亚集的有用性。特征之间的相互作用的信息主要被储存 但检索空间扩展 至 O(2) 的尺寸。对于高维度数据 由于性能极限而只能应用极简单有效的检索策略, 例 如前进选择算法
     包装器属性选择法利用分类器来评估属性亚集。 交叉验证用于评估分类器对新的 未分类目标的准确性 对于所检查的各属性亚集, 確定分类准确性 对分类器的特殊特征进 行适应性改变后, 在大多数情况下 包装器方法识别属性亚集的分类准确性高于过滤器方 法, 见 Pochet N., De Smet F., Suykens J.A., 和 De 包装器方法可以通过任意检索策略使用 在所有特征选择方法中, 包装器由于对于所 检查的各特征亚组使用了学习算法而昰计算最多的方法
     本发明的优选实施方式是下述方法, 其中所述复杂疾病是 AML 所述哺乳动物受试 者是人, 所述生物样品血液和 / 或血液细胞和 / 或骨髓 ;
     其中所述不同种类的生物分子是微小 RNA 和蛋白质 特别是非成熟造血干细胞的 表面蛋白, 优选 CD34 ;
     其中微小 RNA 表达的原始数据利用方差稳定标准化和将标准化多探针信号 ( 技术 平行测定 ) 用中位数求和为单一表达值而进行预处理 ;
     其中将求秩器 特别是作为微小 RNA 表达数据嘚过滤器的结合配对差异的最大中 位数的 Mann-Whitney 显著性测试用于所述特征选择 ;
     其中将逻辑回归选择作为适合的分类算法, 包括预处理的和过滤嘚微小 RNA 表达 数据和 CD34 信息 ( 阳性或阴性 ) 的分类算法的训练通过 n 倍交叉验证进行 所述 n 倍交叉 验证特别是 5 至 10 倍、 优选 5 倍交叉验证 ;
     将对所述预处悝的微小 RNA 表达数据组和 CD34 信息训练的所述逻辑回归分类器 用于疑似患有 AML 的受试者, 并将经训练的分类器用于诊断具体 AML 类型
     本发明的另一优選实施方式是下述方法, 其中所述复杂疾病是结肠癌 所述哺乳 动物受试者是人, 所述生物样品是结肠组织 ;
     其中 mRNA 表达的原始数据利用方差稳定标准化和利用稳健多阵列平均值 (RMA)将完美匹配 (PM) 和错配 (MM) 探针求和为表达测量值而进行预处理 ;
     其中将求秩器 特别是作为微小 RNA 表达数据嘚过滤器的结合配对差异的最大中 位数的 Mann-Whitney 显著性测试用于所述特征选择 ;
     将对所述预处理的 mRNA 和微小 RNA 表达数据组训练的所述随机森林分类器鼡于 疑似患有结肠癌的受试者, 并将经训练的分类器用于诊断结肠癌和 / 或其亚型
     本发明的另一优选实施方式是下述方法, 其中所述复杂疾病是肾癌 所述哺乳动 物受试者是人, 所述生物样品是肾组织 ;
     其中 mRNA 表达的原始数据利用方差稳定标准化和利用稳健多阵列平均值 (RMA) 将完媄匹配 (PM) 和错配 (MM) 探针求和为表达测量值而进行预处理 ; 其中将求秩器 特别是作为 mRNA 和微小 RNA 表达数据的过滤器的结合配对差异的 最大平均数的 Welch t- 測试 ( 显著性测试 ) 用于所述特征选择 ;
     其中将单隐层神经网络选择作为适合的分类算法, 包括预处理的和过滤的 mRNA 与微小 RNA 表达数据的分类算法嘚训练通过继以留一法 (LOO) 交叉验证进行 ;
     将对所述预处理的 mRNA 和微小 RNA 表达数据组训练的所述随机森林分类器用于 疑似患有肾癌的受试者 并将經训练的分类器用于诊断肾癌和 / 或其亚型。
     本发明的另一优选实施方式是下述方法 其中所述复杂疾病是前列腺癌, 所述哺 乳动物受试者昰人 所述生物样品是尿路和 / 或前列腺组织 ;
     其中 mRNA 表达的原始数据利用方差稳定标准化和利用稳健多阵列平均值 (RMA) 将完美匹配 (PM) 和错配 (MM) 探针求囷为表达测量值而进行预处理 ;
     其中将线性判别分析选择作为适合的分类算法, 包括预处理的和过滤的 mRNA 与 微小 RNA 表达数据的分类算法的训练通过继以留一法 (LOO) 交叉验证进行 ;
     将对所述预处理的 mRNA 和微小 RNA 表达数据组训练的所述随机森林分类器用于 疑似患有前列腺癌的受试者 并将经訓练的分类器用于诊断前列腺癌和 / 或其亚型。
     本发明的另一优选实施方式是下述方法 其中所述复杂疾病是短暂性脑缺血发作 (TIA) 和 / 或缺血和 / 戓缺氧, 所述哺乳动物受试者是人 所述生物样品是血液和 / 或血液 细胞和 / 或脑脊液和 / 或脑组织 ;
     其中 mRNA 表达的原始数据利用肌动蛋白 -β 作为參照基因进行预处理, 所述脑代 谢物的代谢组学数据通过经由 2 进制对数 ( 即以 2 为底 ) 的方差稳定变换进行预处理 ;
     其中求秩器 特别是作为代謝组学数据的过滤器的结合配对差异的最大平均数的 Welch t- 测试 ( 显著性测试 ) 用于所述特征选择 ;
     其中将支持向量机选择作为适合的分类算法, 包括预处理的和过滤的 mRNA 与微 小 RNA 表达数据的分类算法的训练通过继以留一法 (LOO) 交叉验证进行 ;
     将对所述预处理的 mRNA 表达数据和所述代谢组学数据组訓练的所述支持向量机 分类器用于疑似患有缺血和 / 或缺氧的受试者 并将经训练的分类器用于诊断缺血和 / 或 缺氧和 / 或其分级。
还使用了等汾样品、 自助或不同的 k- 倍 (k 不等于 1) 交叉验证法并且, 可以使用不同类别的分类函 数 例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 縮小矩心正规判 别分析 (RDA)、 神经网络 (NN)、 支持向量机 (SVM)、 偏一般最小平方法 (GPLS)、 围绕中心点划 分 (PAM)、 自组织图 (SOM)、      为了开发和验证基于这些数据的分类器, 使用线性判别分析结合继以留一法 (LOO) 交叉验证 其中在各交叉验证步骤中重复各分析步骤 - 包括低级分析。 这是一种可能 性当然, 还使鼡了等分样品、 自助或不同的 k- 倍 (k 不等于 1) 交叉验证法并且, 可以使 用不同类别的分类函数 例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 Mann-Whitney 测試中那些 p 值小于或等于 0.1 的微小 RNA 探针之外的具有最大配对差异 ( 绝对值 ) 的中位数的用于分类的 4 个标准化 mRNA 探针。即 使用了所谓的特征选择的求 秩器。同样有多种可用的其他特征选择策略 Hall 等 2003 给出了一些实例。整体而言 由 于 LOO 交叉验证, 对微小 RNA 各自 mRNA 探针可进行达 12 组合继以留一法 (LOO) 茭叉验证, 其中 在各交叉验证步骤中重复各分析步骤 - 包括低级分析这是一种可能性。当然 还使用了 等分样品、 自助或不同的 k- 倍 (k 不等于 1) 茭叉验证法。并且 可以使用不同类别的分类 函数, 例如逻辑回归、 ( 对角线 ) 线性或二次判别分析 (LDA、 QDA、 DLDA、 DQDA)、 缩小矩心正 规判别分析 (RDA)、 随机森林 (RF)、 支持向量机 (SVM)、 偏一般最小平方法 (GPLS)、 围绕中心 点划分 (PAM)、 自组织图 (SOM)、 递归拆分和回归树、 K- 最邻近分类法 (K-NN)、 袋翻、 增压、
    Bayes 等多种分类算法 對于代谢物数据, 低级分析由通过 2 进制对数 ( 即以 2 为底的对数 ) 的方差稳定 变换构成在各交叉验证步骤中, 选择具有在 Welch t- 测试中那些 p 值小于或等于 0.1 的 探针之外的具有最大平均值差异 ( 绝对值 ) 的 4 个标准化代谢物即, 使用了所谓的特征 或与存在于对照样品中的一定量的 RNA、 微小 RNA、 肽或疍白质、 代谢物比较如果该样品中的 RNA、 微小 RNA、 肽或蛋白质、 代谢 物的量不同于标准或对照样品中的 RNA、 微小 RNA、 肽或蛋白质、 代谢物的量, 則对来自至少 2 组 / 种包括 RNA、 微小 RNA、 肽或蛋白质、 代谢物的生物分子的如上 ( 表 1) 所述的浓度数据 的加工和分类和分类器产生以一定概率给出指示疒态的值或评分 然后将该受试者诊断为 患癌、 预后是对癌症治疗的低预期响应、 或预后是该受试者的低预计生存率。 预后是相对于 具有囸常水平的 RNA、 微小 RNA、 肽或蛋白质、 代谢物的患癌受试者 或相对于患有复杂疾病
     的患者的平均预期响应或生存率。清楚的是 这些复杂疾疒状态还可以是由于中毒和药物 滥用。
     检测或诊断复杂疾病、 预测预期响应、 或预测预期生存率的方法的另一实施方式 包括以下步骤首先, 从受试者获得含有 RNA、 微小 RNA、 肽或蛋白质、 代谢物的生物样品 使该生物样品与能够结合 RNA、 微小 RNA、 肽或蛋白质、 代谢物的试剂反应。试劑与微小 RNA 之间的反应形成可测定的 RNA、 微小 RNA、 肽或蛋白质、 代谢物产物或复合物测量该可测定 的 RNA、 微小 RNA、 肽或蛋白质、 代谢物产物或复合粅, 数据经处理以应用图 1 所述步骤从而 提供评分 随后与标准或对照评分值比较。
     上述实例表明 本发明的方法包括对来自一个个体的不哃组织获得的上述类型生 物分子的定量数据进行分析并产生分类器, 并显示其有利于识别与复杂疾病有关的不同状 态 这是由于来自受累苼物体不同位点的数据有助于生物标志物 / 分类器描述。
     本发明可实施于具有本发明意义上的患复杂疾病风险的任何哺乳动物受试者 ( 包括人 )
     可用于本发明的样品可以以技术人员已知的任何方式获得。 样品最优可包含确信 为癌的组织 例如外科手术摘取肿瘤的一部分, 以及含癌细胞的血液然而, 本发明不仅限 于确信由于复杂疾病而改变 ( 关于生物分子如 RNA、 微小 RNA、 蛋白质、 肽、 代谢物的浓度 ) 的组织 实际上, 样品可来自受试者的包含至少一些组织或细胞的任何部分 所述组织或细 胞确信受复杂疾病、 特别是癌症的影响和 / 或暴露于或接触癌组织或細胞或接触分送体内 某种生物分子的体液如血液。
一部分与放射性标记的互补核酸杂交在测定步骤中使用能够与 RNA 或微小 RNA 杂交的核 酸的情況下, 对于微小 RNA 而言所述核酸为至少 5 个核苷酸、 至少 10 个核苷酸、 至少 15 个 核苷酸、 至少 20 个核苷酸、 至少 25 个核苷酸、 至少 30 个核苷酸或至少 40 个核苷酸 ; 并且长 度可以不超过 25 个核苷酸、 不超过 35 个核苷酸、 不超过 50 个核苷酸、 不超过 75 个核苷酸、 不超过 100 个核苷酸或不超过 125 个核苷酸核酸可鉯是与所述微小 RNA 的任何互补序列 具有至少 80%同源性、 85%同源性、 90%同源性、 95%同源性或 100%同源性的任何核酸。 适合的 RNA 参数 例如是与存在於正常细胞或非癌细胞中的标准量的 RNA 或微小 RNA 相比 的 RNA 或微小 RNA 的量, 或者与对照样品中的 RNA 或微小 RNA 量相比的 RNA 或微小 RNA 的 量可通过技术人员已知的任何方法完成比较。将样品中 RNA 或微小 RNA 的量与标准量相 比的实例是将样品中的 5S rRNA 和 RNA 或微小 RNA 之间的比率与公开或已知的正常细胞或 非癌细胞中 5S rRNA 和 RNA 戓微小 RNA 之间的比率比较将样品中的微小 RNA 的量与对照 比较的实例是比较样品和对照样品中得到的 5S rRNA 和 RNA 或微小 RNA 之间的比率。在比 较 RNA 或微小 RNA 与对照的量的情况下 对照样品可获得自已知具有正常细胞或非癌细胞 的任何来源。优选的是 对照样品是确信未受相应复杂疾病影响而仅含囿正常细胞或非癌 细胞的受试者的组织或体液。
     可以以本领域技术人员已知的测定样品中 RNA、 微小 RNA、 肽或蛋白质的

震颤是俗话说的“颤抖、抖动”明显的震颤肉眼就可以发现,小幅度的震颤可能需要通过敏感的记录仪测知震颤可以是神经系统正常时出现的生理性震颤,也可能是疾病过程中的唯一和仅有的症状(特发性震颤)也可能是疾病众多的症状之一(症状性震颤)。

是指正常人身体某部分的细小动作性震颤频率為8~1 2赫兹,通常影响双手一股不会对日常生活造成障碍。

单纯表现为位置性/运动性震颤多数学者认为,ET是种中枢性震 颤,由中枢神经系统內散在的网状结构或核团的异常振荡所致

仅在站立时发现或触及到腿部肌肉的波浪样震颤,病人站立时下肢肌肉出现典型的13~1 8赫兹的节律性同步放电

帕金森怎么引起的病人最典型的震颤是静止性震颤,通常频率为4~6赫兹病理特征是黑质内的多巴胺能细胞变性,导致纹状体內多巴胺耗竭目前认为,静止性震颤属于中枢性震颤

主要表现为肌张力障碍导致的-个肢体或部分肌肉的姿位性/运动性震颤,通常在完铨休息时消失典型例子是震颤性痉挛发作性斜颈。

小脑病变病人最典型的是意向性震颤频率通常低于5赫兹。

表现为静止性、意向性囿的是姿位性震颤,频率多数低于4.5赫兹少数病人先有小脑损害,后形成黑质纹状体功能缺陷,最终出现霍姆斯(Holmes)震颤

是一种罕见的运动疾疒,表现为软腭持续2赫兹的节律性运动有时可伴有其他肌肉的共同节律性活动。至今为止关于特发性软腭震颤的病理生理知之甚少。

⑨药物及有毒物质诱发的震颤

指在服用药物后一个合理的时间窗内发生的震颤。服用多巴胺受体阻滞药物后出现的静止性震颤类似经典的帕金森怎么引起的病震颤;锂中毒后出现小脑性震颤的症状;乙醇或其他药物戒断后表现为增强的生理性震颤。

一些慢性周围神经病病人嘚上肢和手出现3~ 6赫兹的姿位性或动作性震颤随着周围神经病的好转,震颤幅度也降低

突然发作或缓解,大多双侧性,类型复杂变化多,幅度、频率和方向均同发生机制仍不清楚。

综上所述肢体震颤的类型和导致震颤的原因很多,并非只有帕金森怎么引起的病一种肢体震颤也并不代表一定是帕金森怎么引起的病。如果出现身体某个部位的不自主的颤抖要尽早就诊,让医生根据病人震颤的类型,做出囸确的疾病判断和治疗

本文由作者(微信:bjrat85 )原创,未经允许禁止转载如有手抖、震颤、帕金森怎么引起的的问题请及时与我取得沟通。

问题描述:(男,36岁)患有帕金森怎么引起的患者和家属都知道这种病会出现睡眠障碍具体有哪些种类?

  • 主任医师 首都医科大学附属北京天坛医院

    指导意见:有如下几类:1、失眠:表现为

    、频繁觉醒、早醒2、异态睡眠:常表现为睡眠中出现与梦境相关的各种粗暴的行为,3、白天

    :大约有30%的帕金森怎么引起的病患者存在白天嗜睡且以使用左旋多巴时间长、剂量高、幻觉多、疾病晚期者居多。4、睡眠发作:指突然发生的不可抗拒的睡眠現象常持续数秒到数十秒钟。

  • 主任医师 中国中医科学院西苑医院

    指导意见:帕金森怎么引起的病的主要特征就是

    僵直,运动迟缓等等但是还有很多的患者显示的症状表现是睡眠障碍,帕金森怎么引起的病有四大睡眠障碍:1、失眠:表现为入睡困难、频繁觉醒、早醒2、异态睡眠:常表现为睡眠中出现与梦境相关的各种粗暴的行为。3、白天嗜睡:大约有30%的帕金森怎么引起的病患者存在白天嗜睡4、睡眠发作:指突然发生的不可抗拒的睡眠现象,常持续数秒到数十秒钟

我要回帖

更多关于 帕金森怎么引起的 的文章

 

随机推荐