当前位置: 首页> 交通专利数据库 >详情
原文传递 采用k近邻算法筛选人甲状腺素运载蛋白干扰物的方法
专利名称: 采用k近邻算法筛选人甲状腺素运载蛋白干扰物的方法
摘要: 本发明公开了一种采用k近邻算法筛选人甲状腺素运载蛋白干扰物的方法。所述方法首先针对可电离有机化学品,计算基于形态修正的量化描述符,然后采用基于形态修正的量化描述符、官能团、分子碎片描述符和k近邻算法,构建了二元分类模型和定量预测模型;筛选目标有机化学品时首先基于二元分类模型将其区分为有活性和无活性有机化学品;然后使用定量模型预测有活性的有机化学品的干扰效应数据;最后依据预测的效应值判断目标有机化学品是否为潜在的人甲状腺素运载蛋白干扰物。本发明描述符机理清晰、易于计算,预测方法易于程序化,预测模型具有较好的拟合优度、稳健性和预测能力,筛选方法可扩展性较好,适用于筛查应用域内潜在人甲状腺素运载蛋白干扰物。
专利类型: 发明专利
国家地区组织代码: 江苏;32
申请人: 南京理工大学
发明人: 杨先海;刘会会
专利状态: 有效
申请日期: 2019-05-08T00:00:00+0800
发布日期: 2019-08-20T00:00:00+0800
申请号: CN201910378233.8
公开号: CN110146695A
代理机构: 南京理工大学专利中心
代理人: 刘海霞
分类号: G01N33/544(2006.01);G;G01;G01N;G01N33
申请人地址: 210094 江苏省南京市孝陵卫200号
主权项: 1.采用k近邻算法筛选人甲状腺素运载蛋白干扰物的方法,其特征在于,具体步骤如下: (1)收集有机化学品干扰效应数据 收集有机化学品的干扰效应数据,所述的干扰效应数据为有机化学品与125I-T4或荧光探针分子竞争hTTR结合位点的能力即半数竞争效应浓度IC50; (2)计算描述符 采用基于形态修正的量化描述符来表征可电离基团解离的影响:采用Gaussian 16软件优化有机化学品分子态和离子态的结构,然后基于Gaussian 16的输出文件,直接提取或计算有机化学品分子态和离子态的量化描述符,再根据式(1)计算基于形态修正的量化描述符X修正 X修正=δM·XM+δI·XI (1) , 其中,XM和XI分别是有机化学品分子态和离子态的描述符值,δM和δI分别是分子态和离子态的比例分数;并采用Dragon6.0软件计算官能团和分子碎片描述符以表征有机化学品各种基团对干扰效应的影响; (3)二元分类模型的构建及表征 采用收集的有机化学品的有无活性的定性数据,根据基于欧几里德距离的kNN算法构建二元分类模型,模型采用经济合作与发展组织关于模型构建与验证的导则进行表征,确定最优模型,所述的最优模型含三个描述符即形态修正的平均分子静电势Vaver-adj、连接到sp3杂化的碳原子的氟原子F-083和连接到sp3杂化或sp2杂化的碳原子的氢原子H-047,邻近数k为3,所述的二元分类模型的应用域为欧几里德距离小于0.928; (4)定量预测模型的构建及表征 选取采用相同测试方法和测试条件得到的定量数据,根据基于欧几里德距离的kNN算法构建定量模型,建模时用取对数的相对效应势RP表征有机化学品与125I-T4竞争hTTR结合位点的能力,RP定义为: , 其中,IC50(T4)和IC50(有机化学品)分别代表甲状腺素和有机化学品的IC50;确定最优模型,所述的最优模型含四个描述符:Sp2杂化的取代苯碳原子数nCb-、酚羟基数nArOH、分子内氢键数nHBonds和形态修正的平均分散度(П)Vadj,邻近数k为3;所述的定量预测模型的应用域为欧几里德距离小于1.11; (5)人甲状腺素运载蛋白干扰物的筛选 ①计算分类模型所需描述符,即形态修正的平均分子静电势Vaver-adj、连接到sp3杂化的碳原子的氟原子F-083、连接到sp3杂化或sp2杂化的碳原子的氢原子H-047,评估目标有机化学品是否在二元分类模型应用域内; 若目标有机化学品在二元分类模型应用域范围内,则根据二元分类模型计算目标有机化学品是否具有hTTR干扰活性;若目标有机化学品无活性,则不需要进一步评估;若目标有机化学品有活性,则依据定量预测模型预测其干扰效应数值大小;若目标有机化学品不在模型的应用域范围内,则不能用定量预测模型进行预测; ②对于有活性的目标有机化学品,根据定量预测模型的要求计算所需描述符,即Sp2杂化的取代苯碳原子数nCb-、酚羟基数nArOH、分子内氢键数nHBonds和形态修正的平均分散度(П)Vadj,评估其是否在定量预测模型的应用域范围内; 若目标有机化学品在定量预测模型的应用域范围内,则依据选择的定量预测模型计算目标有机化学品对hTTR的logRP值;若目标有机化学品不在定量预测模型的应用域范围内,则不能用定量预测模型进行预测; ③根据定量预测模型预测的logRP值判断目标有机化学品是否具有干扰hTTR转运甲状腺素的能力: 若有机化学品logRP>0,则表明目标有机化学品与hTTR结合能力强于甲状腺素; 若有机化学品logRP=0,则表明目标有机化学品与hTTR结合能力与甲状腺素相近; 若有机化学品logRP<0,则表明目标有机化学品与hTTR结合能力弱于甲状腺素。 2.根据权利要求1所述的方法,其特征在于,步骤(1)中,收集355个有机化学品的干扰效应数据,所述的有机化学品类别包括紫外防晒剂、有机锡类、有机氯农药、取代酚、卤代苯、烷基羧酸、双酚A及其衍生物、全/多氟羧酸和全/多氟磺酸、羟基多溴联苯醚、羟基多氯联苯、氯代烯烃、磷酸酯、磺酸多氯联苯、磺胺类抗生素、二噁英类有机化学品、多溴联苯醚、多氯联苯、苯胺类有机化学品。 3.根据权利要求1所述的方法,其特征在于,步骤(1)中,干扰效应数据测定方法采用放射性配体竞争结合法或荧光竞争置换法。 4.根据权利要求1所述的方法,其特征在于,步骤(3)中,355个有机化学品中,有活性和无活性的有机化学品分别为175和180个。 5.根据权利要求1所述的方法,其特征在于,步骤(4)中,选取采用放射性配体竞争结合法及pH=8.0条件下得到的定量数据,根据基于欧几里德距离的kNN算法构建定量模型。
所属类别: 发明专利
检索历史
应用推荐