当前位置: 首页> 交通专利数据库 >详情
原文传递 一种高灵敏、高通量的化学物质注释方法与系统
专利名称: 一种高灵敏、高通量的化学物质注释方法与系统
摘要: 本发明公开了一种高灵敏、高通量的化学物质注释方法与系统,涉及化学物质识别的技术领域,包括利用EISA技术采集待检测样品的母离子和碎片离子;构建化学暴露组数据库,依次作为目标化学物质提取待检测样品的母离子色谱图;校正后获得目标色谱图,对其中所有色谱峰进行筛选,获得候选色谱峰及其峰值类型;对每个候选色谱峰均遍历匹配目标化学物质,获得目标化学物质对应的每个候选色谱峰的相关特征分值;基于峰值类型和相关特征分值对目标化学物质对应的每个候选色谱峰进行排序,将排序结果中前若干位的候选色谱峰作为待检测样品中化学物质的最终筛查结果输出。本发明能够显著提高检测到的低浓度化学物质的数量,具有高灵敏度和高通量的优势。
专利类型: 发明专利
国家地区组织代码: 广东;44
申请人: 广东工业大学
发明人: 薛靖川;诸嘉民;刘玉贤;蔡宴朋
专利状态: 有效
申请日期: 2023-08-15T00:00:00+0800
发布日期: 2023-11-24T00:00:00+0800
申请号: CN202311031340.6
公开号: CN117110466A
代理机构: 广州粤高专利商标代理有限公司
代理人: 郑堪泳
分类号: G01N30/02;G01N30/72;G01N30/86;G;G01;G01N;G01N30;G01N30/02;G01N30/72;G01N30/86
申请人地址: 510080 广东省广州市越秀区东风东路729号
主权项: 1.一种高灵敏、高通量的化学物质注释方法,其特征在于,包括: S1:基于EISA技术,采集待检测样品中的母离子和碎片离子; S2:构建化学暴露组数据库,包括若干种化学物质及其质谱数据; S3:设置质量精度标准,将所述化学暴露组数据库中的化学物质依次作为目标化学物质,对应提取待检测样品的母离子色谱图; S4:对待检测样品的母离子色谱图进行校正,获得目标色谱图;所述目标色谱图包括若干个色谱峰; S5:对所有色谱峰进行筛选,获得候选色谱峰及其峰值类型; S6:对于每个候选色谱峰,均遍历匹配目标化学物质,并计算目标化学物质对应的每个候选色谱峰的相关特征分值; S7:基于候选色谱峰的峰值类型和相关特征分值,对目标化学物质对应的每个候选色谱峰进行排序,获得排序结果; S8:将排序结果中前若干位的候选色谱峰,作为待检测样品中化学物质的最终筛查结果输出。 2.根据权利要求1所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S2中,基于化学标准品本地数据库、开源质谱数据库和公开文献的质谱数据,构建化学暴露组数据库;所述化学暴露组数据库包括若干种化学物质及其质谱数据,每种化学物质的质谱数据包括化学物质名称、母离子质荷比、碎片离子质荷比和强度。 3.根据权利要求1所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S4中,对待检测样品的母离子色谱图进行校正,获得目标色谱图的具体方法为: 对于提取到的待检测样品的色谱图,将其在色谱洗脱开始前和色谱洗脱结束后对应的色谱图部分进行删除,将剩余部分的色谱图作为目标色谱图,用于后续分析。 4.根据权利要求2或3所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S5的具体方法为: S5.1:计算所有色谱峰的峰高和锯齿形指数; S5.2:将峰高低于预设峰高阈值的色谱峰过滤,将剩余色谱峰作为候选色谱峰; S5.3:利用现有的质谱数据分析算法对候选色谱峰进行检测; S5.4:对于能够被现有的质谱数据分析算法检测到的候选色谱峰,将对应的候选色谱峰的峰值类型分类为第一类型;对于无法被现有的质谱数据分析算法检测到的候选色谱峰,若其锯齿形指数小于预设锯齿形指数阈值,则将对应的候选色谱峰的峰值类型分类为第二类型;否则,将对应的候选色谱峰的峰值类型分类为第三类型。 5.根据权利要求4所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S6的具体方法为: S6.1:对于每个候选色谱峰,将候选色谱峰顶端对应的碎片离子与化学暴露组数据库中目标化学物质的碎片离子依次进行匹配,获得每个候选色谱峰顶端处匹配的碎片离子及其数量、质荷比和强度; S6.2:基于候选色谱峰顶端处匹配的碎片离子和化学暴露组数据库中目标化学物质的碎片离子,计算第一分值和第二分值; S6.3:基于第一分值和第二分值,计算目标化学物质对应的候选色谱峰的相关特征分值; S6.4:重复步骤S6.1-S6.3,获得目标化学物质对应的每个候选色谱峰的相关特征分值。 6.根据权利要求5所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S6.2中,计算第一分值的具体方法为: 基于候选色谱峰顶端处匹配的碎片离子的数量和化学暴露组数据库中目标化学物质的碎片离子的数量,计算第一分值,计算公式为: 式中,MFRi表示目标化学物质的第i个候选色谱峰顶端处匹配的碎片离子的第一分值,Ni表示第i个候选色谱峰顶端处匹配的碎片离子的数量,NT表示化学暴露组数据库中目标化学物质的碎片离子的数量。 7.根据权利要求5所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S6.2中,计算第二分值的具体方法为: 基于候选色谱峰顶端处匹配的碎片离子的强度与化学暴露组数据库中目标化学物质的碎片离子的强度,计算第二分值,计算公式为: 式中,SSMi表示目标化学物质的第i个候选色谱峰顶端处匹配的碎片离子的第二分值,WQi表示第i个候选色谱峰顶端处匹配的碎片离子的强度,WRi表示化学暴露组数据库中目标化学物质的第i个碎片离子的强度。 8.根据权利要求6或7所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S6.3中,基于第一分值和第二分值,计算目标化学物质对应的候选色谱峰的相关特征分值的具体方法为: 对第一分值和第二分值分别赋予权重系数,计算目标化学物质对应的候选特征的相关特征分值: Scorei=αMFRi+βSSMi 式中,Scorei表示目标化学物质对应的第i个候选色谱峰的候选特征的相关特征分值,α,β分别表示第一、二权重系数。 9.根据权利要求8所述的高灵敏、高通量的化学物质注释方法,其特征在于,所述步骤S7的具体方法为: S7.1:设置候选色谱峰的峰值类型的排序优先级,从高到低依次为第一类型、第二类型、第三类型; S7.2:对于属于同一峰值类型的所有候选色谱峰,将其相关特征分值按照从大到小的顺序进行排列,获得每种峰值类型内的目标化学物质候选特征; S7.3:将每种峰值类型内的目标化学物质候选特征按照峰值类型的排序优先级进行拼接,获得排序结果。 10.一种高灵敏、高通量的化学物质注释系统,用于实现权利要求1-9任一项所述的注释方法,其特征在于,包括: 数据采集模块,用于基于EISA技术,采集待检测样品中的母离子和碎片离子; 数据库构建模块,用于构建化学暴露组数据库,包括若干种化学物质及其质谱数据; 色谱图生成模块,用于设置质量精度标准,将所述化学暴露组数据库中的化学物质依次作为目标化学物质,对应提取待检测样品的母离子色谱图; 色谱图校正模块,用于对待检测样品的母离子色谱图进行校正,获得目标色谱图;所述目标色谱图包括若干个色谱峰; 色谱峰筛选模块,用于对所有色谱峰进行筛选,获得候选色谱峰及其峰值类型; 数据匹配模块,用于对于每个候选色谱峰,均遍历匹配目标化学物质,并计算目标化学物质对应的每个候选色谱峰的相关特征分值; 排序模块,用于基于候选色谱峰的峰值类型和相关特征分值对目标化学物质对应的每个候选色谱峰进行排序,获得排序结果; 化学物质检测模块,用于将排序结果中前若干位的候选色谱峰,作为待检测样品中化学物质的最终筛查结果输出。
所属类别: 发明专利
检索历史
应用推荐