当前位置: 首页> 交通专利数据库 >详情
原文传递 单细胞拉曼光谱采集数目估计方法、数据处理方法及装置
专利名称: 单细胞拉曼光谱采集数目估计方法、数据处理方法及装置
摘要: 本发明属于数据处理技术领域,公开了一种单细胞拉曼光谱采集数目估计方法、数据处理方法及装置。单细胞拉曼光谱采集数目方法通过根据目标分析物的拉曼光谱信噪比、百分含量和指定阈值计算获得目标分析物被检出的概率值;然后计算拉曼光谱采集数目,从而可以在目标分析物和其它物质的光谱有重叠,即存在背景噪声的情况下,更加合理地计算目标分析物被检出的概率值,进而更加准确地计算拉曼光谱采集数目。单细胞拉曼光谱数据处理方法及装置,则整合了适合分析单细胞拉曼光谱数据的分析流程,并且嵌入了新开发的估计拉曼数据采集数目的方法,可以为用户提供单细胞拉曼光谱分析的半自动化分析平台,可以简化单细胞拉曼光谱分析操作。
专利类型: 发明专利
国家地区组织代码: 广东;44
申请人: 广州医科大学
发明人: 刘亚娟;余细勇
专利状态: 有效
申请日期: 2021-12-30T00:00:00+0800
发布日期: 2022-03-15T00:00:00+0800
申请号: CN202111654282.3
公开号: CN114184599A
代理机构: 广州广典知识产权代理事务所(普通合伙)
代理人: 顾书玲
分类号: G01N21/65;G;G01;G01N;G01N21;G01N21/65
申请人地址: 511436 广东省广州市番禺区新造镇广州医科大学
主权项: 1.单细胞拉曼光谱采集数目估计方法,其特征在于: 在采集拉曼成像数据之前做预实验,以收集简单的拉曼数据,根据简单的拉曼数据获取目标分析物的拉曼光谱信噪比; 根据用户在操作界面上选择的分析目的,确定对应的指定阈值; 当拉曼光谱信噪比小于指定阈值时,根据目标分析物的拉曼光谱信噪比、百分含量以及指定阈值,计算获得目标分析物被检出的概率值; 将概率值输入二项分布统计模型,获得拉曼光谱采集数目。 2.如权利要求1的单细胞拉曼光谱采集数目估计方法,其特征在于,根据目标分析物的拉曼光谱信噪比、百分含量以及指定阈值,计算获得目标分析物被检出的概率值,包括: 通过以下公式计算获得目标分析物被检出的概率值: 其中,VSNR代表目标分析物的拉曼光谱信噪比,C%代表目标分析物的百分含量,K代表指定阈值,p代表目标分析物被检出的概率值。 3.如权利要求1的单细胞拉曼光谱采集数目估计方法,其特征在于: 当目标分析物的拉曼光谱信噪比大于或等于指定阈值时,目标分析物被检出的概率值p等于目标分析物的百分含量C%。 4.如权利要求1至3任一项的单细胞拉曼光谱采集数目估计方法,其特征在于,根据用户在操作界面上选择的分析目的,为定性分析或定量分析,确定对应的指定阈值,包括: 若分析目的为定性分析,对应的指定阈值K为3; 若分析目的为定量分析,对应的指定阈值K为10。 5.单细胞拉曼光谱数据处理方法,其特征在于,包括以下流程: 光谱预处理:对拉曼光谱数据进行预处理,预处理包括去噪音、拉曼尖峰去除、基线平滑和光谱缩放;其中,拉曼光谱数据包括各个拉曼光谱采集点在不同拉曼波长下的拉曼光谱值,拉曼光谱采集点的数量是根据权利要求1至4任一项的拉曼光谱采集数目估计方法而确定的; 模式识别:根据用户在操作界面上选择的模式识别目的,通过对应的机器学习方法,对预处理后的拉曼光谱数据进行模式识别,以建立模式识别模型; 模型验证:利用交叉验证、置换测试、混淆矩阵和/或接受者操作特性曲线方法,对模式识别模型进行验证。 6.如权利要求5的单细胞拉曼光谱数据处理方法,其特征在于,模式识别目的包括细胞可视化分析、细胞分类分析或细胞定量分析,对应于不同的机器学习方法,对预处理后的拉曼光谱数据进行模式识别,以建立模式识别模型: 当模式识别目的为细胞可视化分析时,根据用户在操作界面上选择的降维分析方法或者聚类分析方法,对拉曼光谱数据中单细胞内的不同物质进行分类,并根据不同物质的分类信息进行数据重组,获得单细胞的可视化信息,以建立模式识别模型; 当模式识别目的为细胞分类分析时,根据用户在操作界面上选择的有监督的机器学习方法,通过光谱信息和细胞分类信息对拉曼光谱数据中多个单细胞进行分类,以建立模式识别模型;或者根据用户在操作界面上选择的无监督的机器学习方法,通过光谱信息对拉曼光谱数据中多个单细胞进行分类,以建立模式识别模型; 当模式识别目的为细胞定量分析时,根据用户在操作界面上选择的有监督的机器学习方法,通过光谱信息和细胞内物质的浓度信息,对各个拉曼光谱采集点的拉曼光谱值进行预测,以建立模式识别模型;根据预测结果获得微观浓度信息和/或宏观浓度信息。 7.如权利要求5或6的单细胞拉曼光谱数据处理方法,其特征在于,对拉曼光谱数据的预处理包括拉曼尖峰去除,具体的步骤为: 在操作界面上选择一个窗口的宽度;窗口的宽度包括一定数量的拉曼波长; 在窗口每次滑动一个步长后,对窗口范围内的拉曼光谱数据进行稳健主成分分析; 若稳健主成分分析判定窗口范围内的某个拉曼光谱值为异常值,将该拉曼光谱值确定为拉曼尖峰; 利用线性多项式对窗口范围内除拉曼尖峰之外的其它拉曼光谱值进行曲线拟合,构造拉曼尖峰的新数据点; 将拉曼尖峰替换成新数据点。 8.单细胞拉曼光谱数据处理装置,其特征在于,装置包括光谱预处理单元、模式识别单元和模型验证单元: 光谱预处理单元,用于对拉曼光谱数据进行预处理,预处理包括去噪音、拉曼尖峰去除、基线平滑和光谱缩放;其中,拉曼光谱数据包括各个拉曼光谱采集点在不同拉曼波长下的拉曼光谱值,拉曼光谱采集点的数量是根据权利要求1至4任一项的拉曼光谱采集数目估计方法而确定的; 模式识别单元,用于根据用户在操作界面上选择的模式识别目的,通过对应的机器学习方法,对预处理后的拉曼光谱数据进行模式识别,以建立模式识别模型; 模型验证单元,用于利用交互检验、置换测试、混淆矩阵和/或接受者操作特性曲线方法,对模式识别模型进行验证。 9.如权利要求8的单细胞拉曼光谱数据处理装置,其特征在于,模式识别目的包括细胞可视化分析、细胞分类分析或细胞定量分析;模式识别单元包括: 细胞可视化分析模块,用于在模式识别目的为细胞可视化分析时,根据用户在操作界面上选择的降维分析方法或者聚类分析方法,对拉曼光谱数据中单细胞内的不同物质进行分类,并根据不同物质的分类信息进行数据重组,获得单细胞的可视化信息,以建立模式识别模型; 分类分析模块,用于在模式识别目的为细胞分类分析时,根据用户在操作界面上选择的有监督的机器学习方法,通过光谱信息和细胞分类信息对拉曼光谱数据中多个单细胞进行分类,以建立模式识别模型,或者,根据用户在操作界面上选择的无监督的机器学习方法,通过光谱信息对拉曼光谱数据中多个单细胞进行分类,以建立模式识别模型; 定量分析模块,用于在模式识别目的为细胞定量分析时,根据用户在操作界面上选择的有监督的机器学习方法,通过光谱信息和细胞内物质的浓度信息,对各个拉曼光谱采集点的拉曼光谱值进行预测,以建立模式识别模型;根据预测结果获得微观浓度信息和/或宏观浓度信息。 10.如权利要求8或9的单细胞拉曼光谱数据处理装置,其特征在于,光谱预处理单元用于对拉曼光谱数据进行拉曼尖峰去除的方式具体为: 用户在操作界面上选择一个窗口的宽度;窗口的宽度包括一定数量的拉曼波长;在窗口每次滑动一个步长后,在窗口范围内的拉曼光谱数据进行稳健主成分分析;若稳健主成分分析判定窗口范围内的某个拉曼光谱值为异常值,将该拉曼光谱值确定为拉曼尖峰;利用线性多项式对窗口范围内除拉曼尖峰之外的其它拉曼光谱值进行曲线拟合,构造拉曼尖峰的新数据点;将拉曼尖峰替换成新数据点。
所属类别: 发明专利
检索历史
应用推荐