专利名称: |
基于靶向代谢组学数据分析的模型建立方法 |
摘要: |
本发明的基于靶向代谢组学数据分析的模型建立方法包括:选择一个样本群和一个对照群,该样本群和对照群中均包括40‑200个血液样本,每个血液样本包括:2‑50个靶向目标物;采用随机原则,将上述样本群中的一定比例的血液样本和对照群样本中同样比例的血液样本进行分组,分为分析集和验证集,在分析集中包括:样本组和对照组,在验证集中包括:样本组和对照组;将分析集中样本组和对照组的靶向目标物的浓度转化成该分析集中样本组和对照组的靶向目标物的转换比值,用分析集中的所有血液样本的2‑50个靶向目标物的转换比值做雷达图,来建立模型图,通过验证集来检验模型的可信度。 |
专利类型: |
发明专利 |
国家地区组织代码: |
北京;11 |
申请人: |
北京和合医学诊断技术股份有限公司 |
发明人: |
倪君君;许丽 |
专利状态: |
有效 |
申请日期: |
2019-03-04T00:00:00+0800 |
发布日期: |
2019-05-14T00:00:00+0800 |
申请号: |
CN201910159224.X |
公开号: |
CN109752549A |
代理机构: |
北京双收知识产权代理有限公司 |
代理人: |
解政文 |
分类号: |
G01N33/574(2006.01);G;G01;G01N;G01N33 |
申请人地址: |
101111 北京市大兴区北京经济技术开发区经海六路5号东尚E园14号楼 |
主权项: |
1.一种基于靶向代谢组学数据分析的模型建立方法,它包括以下步骤: (1)筛选数据:选择一个样本群和一个对照群,该样本群和对照群中均包括40-200个血液样本,每个血液样本包括:2-50个靶向目标物; (2)确定分析集与验证集:采用随机原则,将上述样本群中的一定比例的血液样本和对照群样本中同样比例的血液样本进行分组,分为分析集和验证集,在分析集中包括:样本组和对照组,在验证集中包括:样本组和对照组; (3)统计计算分析集中对照组中的每个血液样本的一个靶向目标物的浓度,计算均值和中位数,以均值或中位数作为该靶向目标物的对照组参照值; (4)统计计算分析集中样本组中步骤(3)的靶向目标物的浓度,计算均值和中位数,以均值或中位数作为该靶向目标物的样本组参照值; (5)将分析集中样本组和对照组的上述靶向目标物的浓度转化成该分析集中样本组和对照组的靶向目标物的转换比值,其转换方法包括以下步骤之一: (a)比较该靶向目标物的对照组参照值与该靶向目标物的样本组参照值的大小,当对照组参照值≥样本组参照值时,以该分析集中样本组和对照组的该靶向目标物的浓度为分子,以对照组参照值为分母来计算该分析集中样本组和对照组的该靶向目标物的转换比值;当对照组参照值<样本组参照值时,以该分析集中样本组和对照组的靶向目标物的浓度为分母,以对照组参照值为分子来计算该分析集中样本组和对照组的该靶向目标物的转换比值; (b)比较该靶向目标物的对照组参照值与该靶向目标物的样本组参照值的大小,当对照组参照值≥样本组参照值时,以该分析集中样本组和对照组的该靶向目标物的浓度为分母,以对照组参照值为分子来计算该分析集中样本组和对照组的该靶向目标物的转换比值;当对照组参照值<样本组参照值时,以该分析集中样本组和对照组的该靶向目标物的浓度为分子,以对照组参照值为分母来计算该分析集中样本组和对照组的该靶向目标物的转换比值; (6)重复上述步骤(3)至步骤(5),将分析集内样本组和对照组的血液样本所包括的2-50个靶向目标物浓度转化成为该靶向目标物转换比值,在同一模型中,只选择步骤(5)中的转换方法之一; (7)用分析集中的所有血液样本的上述2-50个靶向目标物的转换比值做雷达图,来建立模型图: 在坐标图中,选择一点为圆点,以该圆点为圆心,均匀地作2-50条射线,相邻两条射线之间的夹角相同,在每条射线上均标有相同的长度单位,得到雷达图; 将分析集的样本组中的一个靶向目标物的转换比值标注在上述雷达图的同一条射线上,同理,将分析集的样本组中的2-50个靶向目标物的转换比值标注在上述雷达图的相应射线上,在样本组2-50个靶向目标物质转换比值的0-30分位数之间的雷达图上做出一条闭合线,在样本组2-50个靶向目标物质转换比值的70-100分位数之间的雷达图上做出一条闭合线,上述两条闭合线之间的区域为样本组模型区间; 将分析集的对照组中的一个靶向目标物的转换比值标注在上述雷达图的同一条射线上,同理,将分析集的对照组中的2-50个靶向目标物的转换比值标注在上述雷达图的相应射线上,在样本组2-50个靶向目标物质转换比值的0-30分位数之间的雷达图上做出一条闭合线,在样本组2-50个靶向目标物质转换比值的70-100分位数之间在雷达图上做出一条闭合线,上述两条闭合线之间的区域为对照组模型区间; (8)模型参数的建立:首先计算分析集中,每个血液样本的2-50个靶向目标物浓度转换值的均值,记做R;观察模型中,每个血液样本的样本落在样本组模型区间内的靶向目标物的个数,记做N; (9)模型判断方法:如果按照步骤(5)中(a)计算分析集中每个血液样本的2-50个靶向目标物的转换值,当R<0.85±0.15和/或N≥(0.5±0.4)*靶向目标物的个数时,判断该样本为样本组的血液样本,否则,判断该样本为对照组的血液样本;如果按照步骤(5)中(b)计算分析集中每个血液样本的2-50个靶向目标物的转换值,当R>1.15±0.15和/或N≥(0.5±0.4)*靶向目标物的个数时,判断该样本为样本组的血液样本,否则,判断该样本为对照组的血液样本; (10)模型验证:将验证集中的样本组和对照组中的每个血液样本的2-50靶向目标物的浓度依据步骤(3)至(4)得出相应的对照组参照值和样本组参照值为依据,将步骤(5)中的分析集用验证集替代,来计算该靶向目标物的转换值,将验证集中的样本组和对照组中每个血液样本的2-50靶向目标物转换值带入上述模型,用步骤(8)和步骤(9)的判断方法来对验证集血液样本进行判别,计算模型的敏感性和特异性,敏感性为用该模型中验证出来的验证集中的样本组的血液样本个数与验证集中的血液样本个数的比值;特异性为用该模型中验证出来的验证集中的对照组血液样本个数与验证集中的对照组血液样本个数的比值,当敏感性和特异性均大于0.75时,说明该模型建立成功,否则重新调整步骤(7)中的样本组模型区间和对照组模型区间,直到敏感性和特异性均大于0.75为止。 2.如权利要求1所述的基于靶向代谢组学数据分析的模型建立方法,其特征在于:在步骤(2)中的一定比例为4:1至5:1。 3.如权利要求2所述的基于靶向代谢组学数据分析的模型建立方法,其特征在于:0分位数的点为在一条射线上,从圆点到0分位数点之间没有任何数据,30分位数的点为在一条射线上,从0分位数和30分位数点之间有30%的数据,70分位数的点为在一条射线上,从0分位数和70分位数点之间有70%的数据,100分位数的点为在一条射线上,从0分位数和100分位数点之间有100%的数据。 4.如权利要求3所述的基于靶向代谢组学数据分析的模型建立方法,其特征在于:所述靶向目标物为丙氨酸、缬氨酸、精氨酸、瓜氨酸、甘氨酸、组氨酸、亮氨酸、蛋氨酸、鸟氨酸、苯丙氨酸、酪氨酸、谷氨酸、天冬氨酸、乙酰肉碱、丙酰肉碱、丁酰肉碱、戊酰肉碱、己酰肉碱、辛酰肉碱、十四碳酰基肉碱或十六碳酰基肉碱。 5.如权利要求4所述的基于靶向代谢组学数据分析的模型建立方法,其特征在于:在步骤(3)和步骤(4)中,所述均值或中位数只选其中一个;并且在后续步骤(5)至步骤(10)中,均值或中位数的选择与步骤(3)和步骤(4)中均值或中位数的选择相同,即均值或中位数。 |
所属类别: |
发明专利 |