专利名称: |
基于代谢组学和人工智能技术的肺癌早期诊断标志物及其应用 |
摘要: |
本发明公开了基于代谢组学的肺癌早期诊断标志物及其筛选方法,所述诊断标志物包含25种血浆代谢标志物的任意一种或多种的组合。本发明还提供了使用所述肺癌早期诊断标志物构建诊断模型的方法及其在诊断试剂盒中的应用。本发明通过高效液相色谱质谱联用技术对患者血浆进行非靶标代谢组学分析,通过人工智能数据分析技术发现肺癌患者与正常人群之间的差异代谢物,进一步通过靶标代谢组学分析及机器学习建模验证所述特异性差异代谢物即肺癌早期诊断标志物在肺癌早期诊断中的诊断能力。 |
专利类型: |
发明专利 |
国家地区组织代码: |
北京;11 |
申请人: |
北京博远精准医疗科技有限公司 |
发明人: |
尹玉新;王光熙;周骏拓 |
专利状态: |
有效 |
申请日期: |
2019-03-14T00:00:00+0800 |
发布日期: |
2019-06-14T00:00:00+0800 |
申请号: |
CN201910190961.6 |
公开号: |
CN109884302A |
分类号: |
G01N33/574(2006.01);G;G01;G01N;G01N33 |
申请人地址: |
102208 北京市昌平区回龙观镇生命园路8号院一区1号-1至5层101(二层214室) |
主权项: |
1.一种肺癌早期诊断的诊断标志物,其特征在于:该标志物为以下25种血浆代谢标志物的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 16:0-22:6、甘油三酯TAG 16:0-18:1-18:1、磷脂酰胆碱PC 14:0e/2:0、磷脂酰胆碱PC 16:0e/2:0、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1、磷脂酰胆碱PC 18:2-18:2、磷脂酰胆碱PC 16:2-22:4、甘油三酯TAG16:0-18:1-18:2、甘油三酯TAG 16:0-18:2-18:2、甘油三酯TAG 16:1-18:1-18:2、甘油三酯TAG 16:0-18:2-18:3、甘油三酯TAG 18:0-18:1-18:2、甘油三酯TAG 18:1-18:2-18:2、甘油三酯TAG 16:0-18:2-20:4、甘油三酯TAG 18:1-18:2-18:3、甘油三酯TAG 16:1-18:2-20:4、甘油三酯TAG 18:2-18:2-18:3。 2.根据权利要求1所述的诊断标志物,其特征在于:该标志物包括以下9种血浆代谢标志物的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 16:0-22:6、甘油三酯TAG 16:0-18:1-18:1。 3.根据权利要求1或权利要求2所述的诊断标志物,其特征在于该标志物包括以下8种血浆代谢标志物的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 16:0-22:6。 4.根据权利要求1或权利要求2所述的诊断标志物,其特征在于:该标志物包括以下4种血浆代谢标志物的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、磷脂酰胆碱PC 16:0-18:1、甘油三酯TAG 16:0-18:1-18:1。 5.一种肺癌早期诊断标志物的筛选方法,其特征在于:包含以下步骤: (1)收集早期肺癌患者和健康人群的血浆样本作为分析样品; (2)采用液相色谱质谱联用技术对每个分析样本进行非靶向代谢组学分析,得到各血浆样本的原始代谢指纹图谱; (3)使用MS-Dial软件对早期肺癌血浆样本和健康血浆样本的原始代谢指纹图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的二维矩阵;并且对二维矩阵进行包括同位素峰、加合物和碎片离子在内的代谢物峰标识及峰面积积分,用于进一步的机器学习; (4)使用机器学习支持向量机(support vector machine,SVM)算法学习步骤(3)的二维矩阵数据,随机将上述早期肺癌及健康对照血浆样本数据的3/4作为训练集,1/4作为测试集进行学习,并随机循环迭代2000次,通过统计最终模型准确度的平均值,该SVM模型可有效对早期肺癌患者与健康人群的代谢组数据进行分类; (5)根据上述得到的SVM模型,通过基于机器学习的特征筛序,借助SVM建模的特征重要性评分并不断累加重要特征形成待测模型,评估模型分类准确度以显示不同模型的分类效能,并最终展示相对最优特征数及组合方式,筛选最优特征数及组合方式的标准为:增加特征数时模型准确度不再上升; (6)将上述筛选得到的最优特征即目标差异代谢物进行基于质谱的优化筛选,使用MS-Dial软件根据色谱峰型及二级质谱图数据质量筛选并获得潜在代谢标志物; (7)根据上述潜在代谢标志物的一级和二级质谱信息,推测标志物的分子质量和分子式,并且与代谢物谱图数据库中的谱图信息进行比对,从而对代谢物进行鉴定,得到适合于肺癌早期诊断的血浆代谢标志物。 6.一种肺癌诊断模型的构建方法,其特征在于:包含以下步骤: (1)收集早期肺癌患者和健康人群的血浆样本作为分析样品; (2)采用液相色谱质谱联用技术对每个分析样本进行诊断标志物的靶向代谢组学分析,得到各血浆样本的靶向代谢组图谱; (3)使用MS-Dial软件对早期肺癌血浆样本和健康血浆样本的靶向代谢组图谱进行图谱处理,得到每行为代谢物信息,每列为分析样本的标志物二维矩阵,用于进一步的机器学习; (4)根据该诊断标志物的二维矩阵,使用机器学习SVM构建分类模型,得到肺癌诊断模型。 7.根据权利要求6所述的肺癌诊断模型的构建方法,其特征在于:步骤(2)中所述诊断标志物为以下25种血浆代谢标志物的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC16:0-18:2、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 16:0-22:6、甘油三酯TAG 16:0-18:1-18:1、磷脂酰胆碱PC 14:0e/2:0、磷脂酰胆碱PC 16:0e/2:0、磷脂酰胆碱PC 20:0-16:1、磷脂酰胆碱PC 18:1-18:1、磷脂酰胆碱PC 18:2-18:2、磷脂酰胆碱PC 16:2-22:4、甘油三酯TAG 16:0-18:1-18:2、甘油三酯TAG 16:0-18:2-18:2、甘油三酯TAG 16:1-18:1-18:2、甘油三酯TAG 16:0-18:2-18:3、甘油三酯TAG 18:0-18:1-18:2、甘油三酯TAG 18:1-18:2-18:2、甘油三酯TAG 16:0-18:2-20:4、甘油三酯TAG 18:1-18:2-18:3、甘油三酯TAG 16:1-18:2-20:4、甘油三酯TAG 18:2-18:2-18:3。 8.根据权利要求6所述的肺癌诊断模型的构建方法,其特征在于:步骤(2)中所述诊断标志物为以下9种血浆代谢标志物的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 16:0-22:6、甘油三酯TAG 16:0-18:1-18:1。 9.根据权利要求6所述的肺癌诊断模型的构建方法,其特征在于:步骤(2)中所述诊断标志物为以下8种血浆代谢标志物的任意一种或多种:溶血磷脂酰胆碱LPC 16:0、溶血磷脂酰胆碱LPC 18:0、溶血磷脂酰胆碱LPC 20:4、磷脂酰胆碱PC 16:0-18:1、磷脂酰胆碱PC 16:0-18:2、磷脂酰胆碱PC 18:0-18:1、磷脂酰胆碱PC 18:0-18:2、磷脂酰胆碱PC 16:0-22:6。 10.一种肺癌早期诊断试剂盒,其特征在于:包含权利要求1-4所述的诊断标志物。 |
所属类别: |
发明专利 |