当前位置: 首页> 交通专利数据库 >详情
原文传递 一种可自主规划轨迹的挖掘机臂智能控制系统及方法
专利名称: 一种可自主规划轨迹的挖掘机臂智能控制系统及方法
摘要: 本发明属于工程机械领域,涉及一种可自主规划轨迹的挖掘机臂智能控制系统及方法,所述的控制系统由环境感知模块、轨迹规划模块以及执行模块组成;所述的环境感知模块,用于在施工过程中采集挖掘机臂的施工环境数据;所述的轨迹规划模块,利用环境感知模块采集的施工环境数据完成挖掘机臂的运动规划;所述的执行模块,依据轨迹规划模块的输出结果完成挖掘机臂的运动控制。相对于现有技术,本发明的有益效果为:在施工过程中,用户只要开启本发明所公开的智能控制系统,该系统可自行采集施工环境数据并据其完成挖掘机臂的运动规划,最终对挖掘机臂的运动实现最优化控制,增大了施工过程中的安全系数,同时可大大提高施工效率。
专利类型: 发明专利
国家地区组织代码: 江苏;32
申请人: 江苏徐工工程机械研究院有限公司
发明人: 李金铭;王一乐;艾云峰;马厚雪;王凯;王飞跃
专利状态: 有效
申请日期: 2019-03-04T00:00:00+0800
发布日期: 2019-05-21T00:00:00+0800
申请号: CN201910159140.6
公开号: CN109778939A
代理机构: 南京纵横知识产权代理有限公司
代理人: 薛海霞;董建林
分类号: E02F9/20(2006.01);E;E02;E02F;E02F9
申请人地址: 221004 江苏省徐州市金山桥经济技术开发区驮蓝山路26号
主权项: 1.一种可自主规划轨迹的挖掘机臂智能控制系统,其特征在于,所述的控制系统由环境感知模块、轨迹规划模块以及执行模块组成;所述的环境感知模块,用于在施工过程中采集挖掘机臂的施工环境数据;所述的轨迹规划模块,利用环境感知模块采集的施工环境数据完成挖掘机臂的运动规划;所述的执行模块,依据轨迹规划模块的输出结果完成挖掘机臂的运动控制; 轨迹规划模块包含状态决策子模块、模型预测子模块以及动作选择子模块; 所述状态决策子模块,其利用施工环境数据针对当前的施工环境状态做出决策,即得到环境状态s和反馈值r; 所述模型预测子模块,依据当前计算的反馈值r,它可以将当前的环境状态s转化为一个Q值,Q值用于量度挖掘机臂智能控制系统工作过程中机械臂在各个自由度上不同动作的发生概率; 所述的动作选择子模块,其依据来自状态决策子模块的反馈值r与来自模型预测子模块的Q值完成运动规划。 2.根据权利要求1所述的一种可自主规划轨迹的挖掘机臂智能控制系统,其特征在于,状态决策子模块包含数据融合单元与反馈值计算单元;所述数据融合单元,用于将来自环境感知模块的数据组成有效的数据形式,即环境状态s;所述反馈值计算单元,依据环境状态s给出一个反馈值r;环境状态s包含利用施工环境数据推算得到的障碍物中心点信息、在不同方向上的障碍物尺度信息以及挖掘机臂到障碍物的距离信息; 为障碍物中心点,为三维随机向量,cloud(obj)为障碍物obj的点云信息; 在方向上障碍物的尺度信息如下: 为以为端点的任意单位向量,sc为在方向上障碍物尺度信息,是cloud(obj)中的元素; 假设t0时刻挖掘机臂上的点构成一个集合S,那么应以如下方式求取挖掘机臂到障碍物的距离信息L: 首先,计算方向 其次,计算方向上的障碍物尺度信息,如下所示: 最后,计算 其中,为挖掘机臂运动构件表面的一个点,obj_set为挖掘机臂工作空间中的障碍物列表。 3.根据权利要求2所述的一种可自主规划轨迹的挖掘机臂智能控制系统,其特征在于,反馈值r的取值应满足以下三个原则:可自主规划轨迹的挖掘机臂智能控制系统工作过程中,挖掘机臂到障碍物objk的距离Lk应该不断增大,即挖掘机铲斗到目标点位置的距离L0应该不断减小,即dL0<0;挖掘机铲斗到目标点姿态的差值Δθ应该不断减小,即d(Δθ)<0;在以上三个原则的基础上,按照如下步骤求取反馈值r: 首先,求取挖掘机臂关节运动的期望速度挖掘机臂的正运动学可以表示为为挖掘机臂操作空间中的位姿向量,为挖掘机臂关节空间中的位姿向量,qi为挖掘机臂关节空间中自由度i的位姿;挖掘机臂的一个微分运动可以表示为为挖掘机臂操作空间中的速度向量,为挖掘机臂关节空间中的速度向量,为挖掘机臂关节空间中自由度为i的运动速度;构造目标函数fun=∑k(αkdLk)+βdL0+γd(Δθ),其中,αk>0,β,γ<0,αk、β、γ分别表示目标函数中各个分量dLk、dL0与Δθ的权重系数;期望速度的求取过程是一个对目标函数fun的最优化过程,具体可表示为: 其中,vf_maxi为挖掘机臂在自由度i上正向运动的最大速度,而vb_maxi为挖掘机臂在自由度i上反向运动的最大速度,为当前时刻挖掘机臂在自由度i上的运动速度,af_maxi为挖掘机臂在自由度i上做加速运动时的最大加速度,而ab_maxi为挖掘机臂在自由度i上做减速运动时的最大加速度,Δt为控制周期,而i=1,2,…,n; 其次,对求得的期望速度进行归一化: 其中,pre_ri为将求得的自由度为i时的期望速度按照最大速度进行归一化后得到的值,i=1,2,…,n; 最后,计算反馈值r: r=(r.i) 其中,ki为增益系数,r.i为挖掘机臂在自由度i上的各个反馈值所构成的列向量,而i=1,2,…,n。 4.根据权利要求1所述的一种可自主规划轨迹的挖掘机臂智能控制系统,其特征在于,所述的动作选择单元包含价值更新单元与运动规划单元;所述价值更新单元,根据反馈值r对来自深度模型的Q值进行更新;所述运动规划单元,依据价值更新单元得到的更新后的Q值完成运动规划; 价值更新单元的运算公式为: Q(s1|r)=λ1r+λ2Q(s0|r) Q=(Q″ji) 其中j=1,2,…,m,i=1,2,…,n; 其中,λ1为权重系数,λ2为衰减系数,s0为一个控制周期以前的环境状态,s1为当前的环境状态; 运动规划单元的运算公式为: 对Q=(Q.i)而言,运动规划的过程分为两个步骤: 其一,挑选Q.i中的最大元素pi,即 pi=max(Q.i)×flagωi(ω∈{η|Qηi=max(Q.i)}); 其二,依据如下公式计算自由度i的运动速度vi, vi=κipi+ksi 其中,κi为针对自由度i的增益系数,ksi为针对自由度i的前馈速度值,Q.i表示挖掘机臂在自由度i上各种动作发生概率,而i=1,2,…,n;{η|Qηi=max(Q.i)}表示在自由度i上有可能发生全体动作的序数所构成集合的一个子集,其代表元素为η,此时挖掘机臂在自由度i上发生该子集元素所对应动作的概率最大,而ω正是这个子集的某个元素;因此,flagωi表示在自由度i上发生概率最大的动作所对应的速度标志位。 5.根据权利要求4所述的一种可自主规划轨迹的挖掘机臂智能控制系统,其特征在于,所述的动作选择单元根据Q值矩阵中元素取值大小来确定各个运动部件当前的运动方向、运动速度;运动部件包括中心回转体、动臂、斗杆与铲斗;运动方向为正向运动、不运动、反向运动。 6.根据权利要求1所述的一种可自主规划轨迹的挖掘机臂智能控制系统,其特征在于,所述执行模块包括挖掘机臂本体结构中的液压系统以及电气控制系统。 7.一种可自主规划轨迹的挖掘机臂智能控制方法,其特征在于,包括如下步骤: 1)采用环境感知模块在施工过程中采集挖掘机臂的施工环境数据; 2)通过轨迹规划模块针对施工环境数据进行处理以完成挖掘机臂的运动规划; 3)执行模块依据轨迹规划模块的输出结果完成挖掘机臂的运动控制; 步骤2)具体为:轨迹规划模块中状态决策子模块,利用施工环境数据针对当前的施工环境状态做出决策,即得到环境状态s和反馈值r;再采用轨迹规划模块中的模型预测子模块,依据当前计算的反馈值r,将状态决策子模块得到的环境状态s转化为Q值,Q值用于量度挖掘机臂智能控制系统工作过程中机械臂在各个自由度上不同动作的发生概率;轨迹规划模块中的动作选择子模块依据来自状态决策子模块的反馈值r与来自模型预测子模块的Q值完成运动规划。 8.根据权利要求7所述的一种可自主规划轨迹的挖掘机臂智能控制方法,其特征在于,状态决策子模块包含数据融合单元与反馈值计算单元;所述数据融合单元,用于将来自环境感知模块的数据组成有效的数据形式,即环境状态s;所述反馈值计算单元,依据环境状态s给出一个反馈值r; 所述的动作选择子模块包含价值更新单元与运动规划单元;所述价值更新单元,根据反馈值r对来自深度模型的Q值进行更新;所述运动规划单元,依据价值更新单元得到的更新后的Q值完成运动规划。 9.根据权利要求7所述的一种可自主规划轨迹的挖掘机臂智能控制方法,其特征在于,反馈值r的取值应满足以下三个原则:可自主规划轨迹的挖掘机臂智能控制系统工作过程中,挖掘机臂到障碍物objk的距离Lk应该不断增大,即挖掘机铲斗到目标点位置的距离L0应该不断减小,即dL0<0;挖掘机铲斗到目标点姿态的差值Δθ应该不断减小,即d(Δθ)<0;当满足以上三个原则时,按照如下步骤求取反馈值r: 首先,求取挖掘机臂关节运动的期望速度挖掘机臂的正运动学可以表示为为挖掘机臂操作空间中的位姿向量,为挖掘机臂关节空间中的位姿向量,qi为挖掘机臂关节空间中自由度i的位姿;挖掘机臂的一个微分运动可以表示为为挖掘机臂操作空间中的速度向量,为挖掘机臂关节空间中的速度向量,为挖掘机臂关节空间中自由度为i的运动速度;构造目标函数fun=∑k(αkdLk)+βdL0+γd(Δθ),其中,αk>0,β,γ<0,αk、β、γ分别表示目标函数中各个分量dLk、dL0与Δθ的权重系数;期望速度的求取过程是一个对目标函数fun的最优化过程,具体可表示为: 其中,vf_maxi为挖掘机臂在自由度i上正向运动的最大速度,而vb_maxi为挖掘机臂在自由度i上反向运动的最大速度,为当前时刻挖掘机臂在自由度i上的运动速度,af_maxi为挖掘机臂在自由度i上做加速运动时的最大加速度,而ab_maxi为挖掘机臂在自由度i上做减速运动时的最大加速度,Δt为控制周期,而i=1,2,…,n; 其次,对求得的期望速度进行归一化: 其中,pre_ri为将求得的自由度为i时的期望速度按照最大速度进行归一化后得到的值,i=1,2,…,n; 最后,计算反馈值r: r=(r.i) 其中,ki为增益系数,r.i为挖掘机臂在自由度i上的各个反馈值所构成的列向量,而i=1,2,…,n。 10.根据权利要求7所述的一种可自主规划轨迹的挖掘机臂智能控制方法,其特征在于,包括如下步骤: 1.完成环境感知模块、轨迹规划模块以及执行模块的初始化; 2.环境感知模块采集施工环境数据; 3.数据融合单元读取来自环境感知模块的施工环境数据; 4.数据融合单元将施工环境数据转化为环境状态s,算法如下, 5.反馈值计算单元读取来自数据融合单元的环境状态s; 6.反馈值计算单元依据环境状态s计算反馈值r,算法如下, r=(r.i); 7.利用反馈值r完成对模型预测子模块的修正; 8.模型预测子模块读取来自数据融合单元的环境状态s; 9.在当前反馈值r的条件下,模型预测子模块依据环境状态s计算Q值,具体为Q=Q(s|r); 10.价值更新单元读取来自模型预测子模块的Q值; 11.价值更新单元读取来自反馈值计算单元的反馈值r; 12.价值更新单元利用最新的反馈值r更新Q值,算法如下, Q(s1|r)=λ1r+λ2Q(s0|r) Q=(Q″ji) 13.运动规划单元读取来自价值更新单元的Q值; 14.运动规划单元利用更新后的Q值完成运动规划,算法如下, pi=max(Q.i)×flagωi(ω∈{η|Qηi=max(Q.i)}) vi=κipi+ksi; 15.运动规划单元将运动规划结果发送给执行模块; 16.执行模块实现挖掘机臂的运动控制; 17.判断施工过程是否结束,若是,停止对挖掘机臂的运动控制,否则,返回第2步。
所属类别: 发明专利
检索历史
应用推荐