一种基于人工智能的牙列畸形自动化分类和设计方法

著录项
申请号:
CN201710494251.3
申请日:
2017-06-26
公开(公告)号:
CN107260335A
公开日:
2017-10-20
申请(专利权)人:
达**
发明人:
达**, 达式**
主分类号:
A61C7/00(20060101)
分类号:
A61C7/00(20060101), G06F19/00(20110101), G06T11/60(20060101)
地址:
江苏省南京市北东**
国省代码:
江苏省
代理机构:
32218 南京天华专利代理有限责任公司
代理人:
莫英妍, 徐冬涛
优先权:
简介

本发明提出一种基于人工智能的牙列畸形自动化分类和设计方法,通过自动识别并选取牙列特征点,确定实际牙弓,建立参照系统,比对参考牙弓确定单牙移动量和偏转量,动态拟合最佳牙列位置,采用马尔科夫决策结合深度学习、增强学习进行牙列设计,过程中不需要医生对牙弓进行设定,且对于错误或不精确进行自动修正,迭代保证错误提前被丢弃,实现不需要人工干预的牙列畸形自动化分类和设计。
通过对特征点的分组,实现了咬合关系的对应,通过对牙齿宽度的计算,精确了牙齿间隙的计算。
通过特征点信息的计算,使得牙齿的凸度,拥挤量得以精确计算。
通过使用神经网络的深度学习,可以求解更优的设计方案。

专利说明

技术领域
本发明涉及一种基于人工智能的牙列畸形自动化分类和设计方法。

背景技术
现有的正畸设计软件,大多采取人工点选特征点,人工创建牙弓,以及医生参与设计病例治疗方案的方法对病例进行设计。
本专利使用人工智能中深度学习和增强学习的方法对现行正畸设计技术实行更新。
使用自动选取特征点,自动创建牙弓,以及自动设计治疗方案,并使用学习到的经验优化设计,减少了大量医生人为参与设计的时间和未来参与同类病例设计的时间。
本专利通过帮助医生将病例的数据,参数化,设计的自动化,提升了生产力。

发明内容
本发明所解决的技术问题在于提供一种基于人工智能的牙列畸形自动化分类和设计方法,通过选取牙列特征点,确定实际牙弓,并比对参考牙弓确定单牙移动量和偏转量,采用马尔科夫决策结合深度学习进行牙列设计,实现不需要人工干预的牙列畸形自动化分类和设计。

实现本发明目的的技术解决方案为:
一种牙列特征点的选取方法,按照分类标准将28颗牙齿分别标记:1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,1-3,2-3,3-3,4-3,1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2;采取算法自动计算选取,
将上下颌后槽牙分为组GroupA,包括1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,对于GroupA,
使用环搜与局部最高点的算法选取GroupA尖点:
(1)遍历单牙空间网格的点,找到离质心最近的点,记为点N;
(2)对环绕点N边上的其他点进行递归运算,扩大环搜的边半径;
(3)扩大边半径后,对最外层边上的点通过局部最大的算法寻找局部最高点,最高点即尖点;
对于牙1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,各具有4个尖点,使用排序法选取外侧的2个尖点作为外侧组Ptb
,记为<下Ptb
,上Ptb
>,选取内侧的两个尖点作为内侧组Ptb
;对于1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,各具有2个尖点,使用排序法选取外侧的1个尖点作为外侧组Ptb
,记为Ptb

选取GroupA宽点:
选取牙宽点,遍历单牙网格,选取两点,此两点与Ptb
及与Ptb
相距距离差最小,在距离差最小的组中选两点间距离最长的点组为宽点,宽点的坐标可以用来标定水平角度;
将尖牙分为组GroupB,包括1-3,2-3,3-3,4-3,对于GroupB,
使用四边之和最长以及最高点匹配算法选取GroupB尖点:
(1)找到单牙空间网格的z轴最大点即为尖点,记为点Pt
h;遍历单牙空间网格上的点,迭代选取三个点形成一个集合,保留含有尖点Pt
h的集合;
选取GroupB宽点:
(2)迭代选取两个点,此两点与集合内尖点Pt
h的距离,并计算与质心的距离求距离和d1+d2+d3+d4;
(3)对距离总和排序,选取距离比差的绝对值d1/d2-d3/d4最小,且距离和最大的那一对点,这一对点记为宽点;
对于1-3,2-3,3-3,4-3,各具有1个尖点和2个宽点,牙尖点记为Pt
h;使用排序算法,确定2个宽点位置关系并分别记为上侧Ptb
与下侧Ptb

将前牙分为组GroupC,包括1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2,对于GroupC,
(1)遍历网格上的点,迭代选取2个点,计算这两个点与质心距离及彼此之间的距离,求距离和d5+d6+d7;
(2)排序选取距离比d5/d6最小且距离和d5+d6+d7最大的那一对点即为宽点;
无尖点,GroupC宽点的选取分为单牙的左侧点和右侧点,使用排序法确定左侧点Ptb
,右侧点Ptb


进一步的,本发明提出一种基于上述牙列特征点的牙弓确定方法,实际上牙弓为特征点:1-7(Ptb
,Ptb
),1-6(Ptb
,Ptb
),1-5(Ptb
),1-4(Ptb
),1-3(Ptb
,Pt
h,Ptb
),1-2(Ptb
,Ptb
),1-1(Ptb
,Ptb
),与2-1(Ptb
,Ptb
),2-2(Ptb
,Ptb
),2-3(Ptb
,Pt
h,Ptb
),2-4(Ptb
),2-5(Ptb
),2-6(Ptb
,Ptb
),2-7(Ptb
,Ptb
)的连线;实际下牙弓为特征点:4-7(Ptb
,Ptb
),4-6(Ptb
,Ptb
),4-5(Ptb
),4(Ptb
),4-3(Ptb
,Pt
h,Ptb
),4-2(Ptb
,Ptb
),4-1(Ptb
,Ptb
),与3-1(Ptb
,Ptb
),3-2(Ptb
,Ptb
),3-3(Ptb
,Pt
h,Ptb
),3-4(Ptb
),3-5(Ptb
),3-6(Ptb
,Ptb
),3-7(Ptb
,Ptb
)的连线。

进一步的,本发明提出一种基于上述牙弓的牙齿矫正方法,对于实际上牙弓的特征点和实际下牙弓的特征点,均通过下式计算参考牙弓
式中,y为Y轴坐标,x为X轴坐标,d为牙弓深度,w为牙弓宽度,d通过两前牙中间点平均坐标与左边牙7与右边牙7的质心点全局坐标中点的差进行求取,牙弓宽度w由左边牙7与右边牙7的质心点全局坐标差求得;
在每颗牙齿的质心处,建立局部坐标系;将单牙绑定局部坐标系,获取并检测每颗牙的移动量与偏转量:
(1)在水平方向,计算各特征点与参考牙弓的对应点的角度,计算顺时针方向或逆时针方向的旋转角度,旋转角度数值除以2,得到偏转周期一;
(2)在水平方向,计算特征点组与绝对水平位置的角度,计算根唇向旋转角度,旋转角度数值除以2,得到偏转周期二;
(3)在水平方向,计算特征点组与参考牙弓的对应点的舍颊向距离,得到舌颊向移动量,用移动量数值除以0.2,得到移动周期一;
(4)在水平方向,计算特征点组与参考牙弓的对应点的近远中向距离,得到近远中向移动量,用移动量数值除以0.2,得到移动周期二;
(5)在垂直方向,计算每颗牙的质心坐标,求取平均,计算每颗牙的拉伸/下压移动量,用移动量数值除以0.2,得到移动周期三;
(6)在垂直方向,计算特征点组的两个点中点与垂直于平面的角度,计算冠轴旋转角度,用旋转角度数值除以2,得到偏转周期三;
(7)获取理想咬合的偏移量:上颌质心点与下颌外侧点对齐,上颌内侧点与下颌质心点对齐;
最后按照理想移动量和偏转量对单牙进行矫正设计。

进一步的,本发明的牙齿矫正方法,通过对模型不断迭代,更新特征点的位置,求得理想位置,并将整个迭代过程记录下的操作进行比对处理,去除相反操作,获得最优策略。

进一步的,本发明的牙齿矫正方法,参考牙弓的计算是通过式(1)的反复迭代得出。

进一步的,本发明的牙齿矫正方法,完成所有矫正操作后,重新更新特征点并建立新的实际牙弓和参考牙弓,判断新的实际牙弓与通过式(1)求得新的参考牙弓是否重合:若重合则退出;若不重合,基于新的参考牙弓获取并检测每颗牙的偏转量与偏转量;以上步骤循环迭代直至退出。

进一步的,本发明的牙齿矫正方法,具有自动粘贴附件,对每颗牙的空间网格,在质心处垂直牙弓线的方向上与牙体的网格求取交点,此交点为附件或矫治器的位置。

进一步的,本发明提出一种基于上述牙齿矫正的牙列分类方法,根据凸度和拥挤量进行减数或非减数分类:
根据双尖牙区实际宽度总和与参考牙弓对应弧度值差计算拥挤量;将双尖牙区每颗牙的质心与两侧中点连线,根据上下对应前牙连线的夹角计算凸度;根据上下对应双尖牙区的质心间距线与水平方向的角度确定咬合角度;对凸度小于115度且拥挤量小于6mm的单牙采取减数设计,对凸度大于115度小于120度且拥挤量小于3mm的单牙采取非减数设计,或对凸度大于115度小于120度且拥挤量小于2mm的单牙采取减径设计;
在不发生碰撞的前提下,根据偏移量和旋转量进行分解操作:
(1)将实际牙弓线上的单牙初始位置PosStart设为初始状态,参考牙弓线上的对应位置PosFine设为最终位置;
(2)对移动的先后顺序,根据减数或非减数治疗的方式更新单牙各方向的移动量和旋转量;
(3)根据移动量和旋转量将单牙的特征点向参考牙弓进行移动或旋转操作:每个单牙的移动操作包括舌颊向内外移动、前后移动、压伸移动,每个单牙的旋转操作包括根唇向内外旋转、冠轴向左右旋转和水平方向顺逆旋转;
(4)更新局部坐标系,再向PosFine进行移动和旋转,直到所有的移动和旋转完成;
(5)计算新的实际牙弓,若新实际牙弓与按照式(1)计算的新参考牙弓重合,则设计结束;否则回到(3)。

进一步的,本发明提出一种基于上述牙列分类的牙列设计方法,采用马尔科夫决策,将每颗单牙视为一个Agent,向最佳位置移动的每一步为一个新的位置状态State,记为S,经过以下操作向参考牙弓进行移动或旋转:每个单牙的移动操作包括舌颊向内外移动、前后移动、压伸移动,每个单牙的旋转操作包括根唇向内外旋转、冠轴向左右旋转、水平方向顺逆旋转;每个操作为一个Action,记为A,每一个Action都会有一个奖励Reward,记为R,移动到最佳位置的操作序列为策略Policy,对于每一个Agent,经过Action达到不同的状态,学习过程如下:
U(S)+=a(R(S)+γmaxQ(A',S')-Q(A,S))
其中,U代表经验值总和,Q代表经验值,γ代表衰减率,a代表学习效率;
然后进行不使用神经网络的增强学习设计,或进行使用神经网络的深度增强学习设计,或通过其他的病例学习到的经验进行设计:
其中,不使用神经网络的机器学习的步骤一个循环包括:
(1)根据单牙的偏移信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;
(2)创建一个经验表用于记录状态信息、操作和操作奖励的经验值;创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;
(3)对需要移动的单牙在可选Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;
(4)执行牙齿移动的操作,使用碰撞检测,确定Reward值;
(5)学习这个操作,从经验表中取出当前状态S这个操作的经验值作为预测值,并更新目标值,若还有操作未完成,则目标值为Reward加上衰减值Rd乘以该操作对应状态的最大经验值;若操作已经完成,则目标值等于奖励Reward,更新经验表中状态对应的预测值为当前的预测值加上学习效率乘以误差,所述误差为目标值减去预测值;更新下一状态为当前状态加上上述操作;
(6)返回步骤(3)循环操作至所有单牙操作完成;
经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略;
使用神经网络的机器学习的步骤包括:
(1)根据单牙的偏移信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;
(2)创建结构相同的评估网络和目标网络,每个网络均包括L1层和L2层,评估网络用于训练且有反向传递,目标网络用于保存训练的结果但没有反向传递,评估网络能及时更新参数,其输入参数为当前状态S和状态的现实值,其中状态的现实值由目标网络训练得到,通过对当前状态的训练,得到一个状态的预测值,预测值与现实值的差异为误差,将误差反向传递到评估网络,提升评估网络的参数;目标网络不及时更新参数,其输入参数为下一个状态S’,其结构与评估网络一致,当评估网络运行到一定的次数,则将结果保存至目标网络;
(3)创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;
(4)对需要移动的单牙在可选Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;
(5)执行牙齿移动的操作,使用碰撞检测,确定Reward值;保存当前状态、下一个状态、动作及奖励至内存模块;
(6)从内存模块中抽取参数,使用评价网络进行学习训练:首先将目标网络的参数更新成最新的估计参数,从内存中随机抽取样本,从评价网络中获取新的经验值,从目标网络中获取老的经验值,将两经验值相减并反向传递给评估网络进行梯度下降的训练;
(7)返回步骤(4)循环操作至所有单牙操作完成;
经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略;
通过机器学习进行经验设计:
(1)根据单牙的分类信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;
(2)创建一个经验表用于记录状态信息、操作和操作奖励的经验值;创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;
(3)对所有需要移动的单牙,获取每个单牙所需的操作指令,形成操作指令表,从经验表或神经网络中选取经验值最大且属于当前病例操作指令表的操作;对于操作表中有但经验表或神经网络中没有的操作,在可选的Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;
(4)执行牙齿移动的操作,使用碰撞检测,确定Reward值;
(5)学习这个操作,从经验表或神经网络中取出当前状态S这个操作的经验值作为预测值,并更新目标值,若还有操作未完成,则目标值为Reward加上衰减值Rd乘以该操作对应状态的最大经验值;若操作已经完成,则目标值等于奖励Reward,更新经验表或神经网络中状态对应的预测值为当前的预测值加上学习效率乘以误差,所述误差为目标值减去预测值;更新下一状态为当前状态加上上述操作;
(6)返回步骤(3)循环操作至所有单牙的可能性序列完全被测试;
经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略。

进一步的,本发明提出一种基于人工智能的牙列畸形自动化分类和设计方法,包括以下步骤:
步骤一:采取算法自动计算选取牙列特征点:
按照分类标准将28颗牙齿分别标记:1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,1-3,2-3,3-3,4-3,1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2;
将上下颌后槽牙分为组GroupA,包括1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,对于GroupA,
使用环搜与局部最高点的算法选取GroupA尖点:
(1)遍历单牙空间网格的点,找到离质心最近的点,记为点N;
(2)对环绕点N边上的其他点进行递归运算,扩大环搜的边半径;
(3)扩大边半径后,对最外层边上的点通过局部最大的算法寻找局部最高点,最高点即尖点;
对于牙1-6,2-6,3-6,4-6,1-7,2-7,3-7,4-7,各具有4个尖点,使用排序法选取外侧的2个尖点作为外侧组Ptb
,记为<下Ptb
,上Ptb
>,选取内侧的两个尖点作为内侧组Ptb
;对于1-4,2-4,3-4,4-4,1-5,2-5,3-5,4-5,各具有2个尖点,使用排序法选取外侧的1个尖点作为外侧组Ptb
,记为Ptb

选取GroupA宽点:
选取牙宽点,遍历单牙网格,选取两点,此两点与Ptb
及与Ptb
相距距离差最小,在距离差最小的组中选两点间距离最长的点组为宽点,宽点的坐标可以用来标定水平角度;
将尖牙分为组GroupB,包括1-3,2-3,3-3,4-3,对于GroupB,
使用四边之和最长以及最高点匹配算法选取GroupB尖点:
(1)找到单牙空间网格的z轴最大点即为尖点,记为点Pt
h;遍历单牙空间网格上的点,迭代选取三个点形成一个集合,保留含有尖点Pt
h的集合;
选取GroupB宽点:
(2)迭代选取两个点,此两点与集合内尖点Pt
h的距离,并计算与质心的距离求距离和d1+d2+d3+d4;
(3)对距离总和排序,选取距离比差的绝对值d1/d2-d3/d4最小,且距离和最大的那一对点,这一对点记为宽点;
对于1-3,2-3,3-3,4-3,各具有1个尖点和2个宽点,牙尖点记为Pt
h;使用排序算法,确定2个宽点位置关系并分别记为上侧Ptb
与下侧Ptb

将前牙分为组GroupC,包括1-1,1-2,2-1,2-2,3-1,3-2,4-1,4-2,对于GroupC,
(1)遍历网格上的点,迭代选取2个点,计算这两个点与质心距离及彼此之间的距离,求距离和d5+d6+d7;
(2)排序选取距离比d5/d6最小且距离和d5+d6+d7最大的那一对点即为宽点;
无尖点,GroupC宽点的选取为单牙的左侧点和右侧点,使用排序法确定左侧点Ptb
,右侧点Ptb

步骤二:根据牙列特征点确定实际牙弓:
实际上牙弓为特征点:1-7(Ptb
,Ptb
),1-6(Ptb
,Ptb
),1-5(Ptb
),1-4(Ptb
),1-3(Ptb
,Pt
h,Ptb
),1-2(Ptb
,Ptb
),1-1(Ptb
,Ptb
),与2-1(Ptb
,Ptb
),2-2(Ptb
,Ptb
),2-3(Ptb
,Pt
h,Ptb
),2-4(Ptb
),2-5(Ptb
),2-6(Ptb
,Ptb
),2-7(Ptb
,Ptb
)的连线;实际下牙弓为特征点:4-7(Ptb
,Ptb
),4-6(Ptb
,Ptb
),4-5(Ptb
),4(Ptb
),4-3(Ptb
,Pt
h,Ptb
),4-2(Ptb
,Ptb
),4-1(Ptb
,Ptb
),与3-1(Ptb
,Ptb
),3-2(Ptb
,Ptb
),3-3(Ptb
,Pt
h,Ptb
),3-4(Ptb
),3-5(Ptb
),3-6(Ptb
,Ptb
),3-7(Ptb
,Ptb
)的连线;
步骤三:基于实际牙弓,计算每颗牙的移动量与偏转量:
对于实际上牙弓的特征点和实际下牙弓的特征点,均通过下式计算参考牙弓
式中,y为Y轴坐标,x为X轴坐标,d为牙弓深度,w为牙弓宽度,d通过两前牙中间点平均坐标与左边牙7与右边牙7的质心点全局坐标中点的差进行求取,牙弓宽度w由左边牙7与右边牙7的质心点全局坐标差求得;其中参考牙弓的计算是通过式(2)反复迭代得出的;
在每颗牙齿的质心处,建立局部坐标系;将单牙绑定局部坐标系,获取并检测每颗牙的移动量与偏转量:
(1)在水平方向,计算各特征点与参考牙弓的对应点的角度,计算顺时针方向或逆时针方向的旋转角度,旋转角度数值除以2,得到偏转周期一;
(2)在水平方向,计算特征点组与绝对水平位置的角度,计算根唇向旋转角度,旋转角度数值除以2,得到偏转周期二;
(3)在水平方向,计算特征点组与参考牙弓的对应点的舍颊向距离,得到舌颊向移动量,用移动量数值除以0.2,得到移动周期一;
(4)在水平方向,计算特征点组与参考牙弓的对应点的近远中向距离,得到近远中向移动量,用移动量数值除以0.2,得到移动周期二;
(5)在垂直方向,计算每颗牙的质心坐标,求取平均,计算每颗牙的拉伸/下压移动量,用移动量数值除以0.2,得到移动周期三;
(6)在垂直方向,计算特征点组的两个点中点与垂直于平面的角度,计算冠轴旋转角度,用旋转角度数值除以2,得到偏转周期三;
(7)获取理想咬合的偏移量:上颌质心点与下颌外侧点对齐,上颌内侧点与下颌质心点对齐;
最后按照理想移动量和偏转量对单牙进行矫正设计;
完成所有矫正操作后,重新更新特征点并建立新的实际牙弓和参考牙弓,判断新的实际牙弓与通过式(2)求得的新的参考牙弓是否重合:若重合则退出;若不重合,基于新的参考牙弓获取并检测每颗牙的偏转量与偏转量;以上步骤循环迭代直至退出;所述牙齿矫正方法具有自动粘贴附件,对每颗牙的空间网格,在质心处垂直牙弓线的方向上与牙体的网格求取交点,此交点为附件或矫治器的位置;
步骤四:根据凸度和拥挤量对牙列进行减数或非减数分类:
根据双尖牙区实际宽度总和与参考牙弓对应弧度值差计算拥挤量;将双尖牙区每颗牙的质心与两侧中点连线,根据上下对应前牙连线的夹角计算凸度;根据上下对应双尖牙区的质心间距线与水平方向的角度确定咬合角度;对凸度小于115度且拥挤量小于6mm的单牙采取减数设计,对凸度大于115度小于120度且拥挤量小于3mm的单牙采取非减数设计,或对凸度大于115度小于120度且拥挤量小于2mm的单牙采取减径设计;
在不发生碰撞的前提下,根据偏移量和旋转量进行分解操作:
(1)将实际牙弓线上的单牙初始位置PosStart设为初始状态,参考牙弓线上的对应位置PosFine设为最终位置;
(2)对移动的先后顺序,根据减数或非减数治疗的方式更新单牙各方向的移动量和旋转量;
(3)根据移动量和旋转量将单牙的特征点向参考牙弓进行移动或旋转操作:每个单牙的移动操作包括舌颊向内外移动、前后移动、压伸移动,每个单牙的旋转操作包括根唇向内外旋转、冠轴向左右旋转和水平方向顺逆旋转;
(4)更新局部坐标系,再向PosFine进行移动和旋转,直到所有的移动和旋转完成;
(5)计算新的实际牙弓,若新实际牙弓与按照式(2)计算的新参考牙弓重合,则设计结束;否则回到(3);
步骤五:根据每颗牙的移动量与偏转量进行牙列设计:
采用马尔科夫决策,将每颗单牙视为一个Agent,向最佳位置移动的每一步为一个新的位置状态State,记为S,经过以下操作向参考牙弓进行移动或旋转:每个单牙的移动操作包括舌颊向内外移动、前后移动、压伸移动,每个单牙的旋转操作包括根唇向内外旋转、冠轴向左右旋转、水平方向顺逆旋转;每个操作为一个Action,记为A,每一个Action都会有一个奖励Reward,记为R,移动到最佳位置的操作序列为策略Policy,对于每一个Agent,经过Action达到不同的状态,学习过程如下:
U(S)+=a(R(S)+γmaxQ(A',S')-Q(A,S))
其中,U代表经验值总和,Q代表经验值,γ代表衰减率,a代表学习效率;
然后进行不使用神经网络的增强学习设计,或进行使用神经网络的深度增强学习设计,或通过其他的病例学习到的经验进行设计:
其中,不使用神经网络的机器学习的步骤一个循环包括:
(1)根据单牙的偏移信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;
(2)创建一个经验表用于记录状态信息、操作和操作奖励的经验值;创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;
(3)对需要移动的单牙在可选Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;
(4)执行牙齿移动的操作,使用碰撞检测,确定Reward值;
(5)学习这个操作,从经验表中取出当前状态S这个操作的经验值作为预测值,并更新目标值,若还有操作未完成,则目标值为Reward加上衰减值Rd乘以该操作对应状态的最大经验值;若操作已经完成,则目标值等于奖励Reward,更新经验表中状态对应的预测值为当前的预测值加上学习效率乘以误差,所述误差为目标值减去预测值;更新下一状态为当前状态加上上述操作;
(6)返回步骤(3)循环操作至所有单牙操作完成;
经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略;
使用神经网络的机器学习的步骤包括:
(1)根据单牙的偏移信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;
(2)创建结构相同的评估网络和目标网络,每个网络均包括L1层和L2层,评估网络用于训练且有反向传递,目标网络用于保存训练的结果但没有反向传递,评估网络能及时更新参数,其输入参数为当前状态S和状态的现实值,其中状态的现实值由目标网络训练得到,通过对当前状态的训练,得到一个状态的预测值,预测值与现实值的差异为误差,将误差反向传递到评估网络,提升评估网络的参数;目标网络不及时更新参数,其输入参数为下一个状态S’,其结构与评估网络一致,当评估网络运行到一定的次数,则将结果保存至目标网络;
(3)创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;
(4)对需要移动的单牙在可选Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;
(5)执行牙齿移动的操作,使用碰撞检测,确定Reward值;保存当前状态、下一个状态、动作及奖励至内存模块;
(6)从内存模块中抽取参数,使用评价网络进行学习训练:首先将目标网络的参数更新成最新的估计参数,从内存中随机抽取样本,从评价网络中获取新的经验值,从目标网络中获取老的经验值,将两经验值相减并反向传递给评估网络进行梯度下降的训练;
(7)返回步骤(4)循环操作至所有单牙操作完成;
经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略;
通过机器学习进行经验设计的步骤包括:
(1)根据单牙的分类信息及具体操作信息,创建一个操作表,包含每个单牙的移动和偏转对应操作,并设置初始参数,Rd为奖励的衰减率,Rd∈[1,0.1],EG为贪心率,EG∈[0,1],LR为学习率,LR∈[0,1],Reward的值取-1或0或1,其中1为单牙操作完成,-1为碰撞,0为完成当前操作;
(2)创建一个经验表用于记录状态信息、操作和操作奖励的经验值;创建一个循环,读入每个牙齿的位置信息,全局坐标记为初始状态;
(3)对所有需要移动的单牙,获取每个单牙所需的操作指令,形成操作指令表,从经验表或神经网络中选取经验值最大且属于当前病例操作指令表的操作;对于操作表中有但经验表或神经网络中没有的操作,在可选的Action序列中选择一个Action,随机选取EG的值,若小于EG设定值,则在经验表中选取评估值最大的操作动作,若大于EG设定值,则在Action中随机选取一个操作动作,记录当前状态S和完成该操作动作的状态S’;
(4)执行牙齿移动的操作,使用碰撞检测,确定Reward值;
(5)学习这个操作,从经验表或神经网络中取出当前状态S这个操作的经验值作为预测值,并更新目标值,若还有操作未完成,则目标值为Reward加上衰减值Rd乘以该操作对应状态的最大经验值;若操作已经完成,则目标值等于奖励Reward,更新经验表或神经网络中状态对应的预测值为当前的预测值加上学习效率乘以误差,所述误差为目标值减去预测值;更新下一状态为当前状态加上上述操作;
(6)返回步骤(3)循环操作至所有单牙的可能性序列完全被测试;
经过多次循环后,将得分最高、碰撞最少的操作序列选取为最优的策略。

本发明采用以上技术方案与现有技术相比,具有以下技术效果:
本发明的方法能够自动识别并选取牙列特征点,并建立参照系统,动态拟合最佳牙列位置,使用深度学习,增强学习设计正畸方案,过程中不需要医生对牙弓进行设定,且对于错误或不精确进行自动修正,迭代保证错误提前被丢弃,实现不需要人工干预的牙列畸形自动化分类和设计。
通过对特征点的分组,实现了咬合关系的对应,通过对牙齿宽度的计算,精确了牙齿间隙的计算。
通过特征点信息的计算,使得牙齿的凸度,拥挤量得以精确计算。
通过使用神经网络的深度学习,可以求解更优的设计方案。

附图说明
图1是本发明的基于人工智能的牙列畸形自动化分类和设计方法流程图;
图2是本发明的实际牙列特征点示意图;
图3是本发明的实际牙弓示意图;
图4是本发明的参考牙弓示意图;
图5是本发明的拟合牙列过程示意图;
图6是本发明的根据凸度和拥挤量进行减数或非减数分类示意图;
图7是本发明的确定凸度的示意图。

具体实施方式
下面详细描述本发明的实施方式,所述实施方式的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。
下面通过参考附图描述的实施方式是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。

如图1所示,为本发明的基于人工智能的牙列畸形自动化分类和设计方法流程图,主要包括以下步骤:
步骤一:选取牙列特征点,如图2所示,图中以上颌左边为例,十字星为上颌左边选取出来的特征点。

步骤二:根据牙列特征点确定实际牙弓,如图3所示为由特征点连接而成的实际牙弓。

步骤三:基于实际牙弓,比照参考牙弓计算每颗牙的移动量和偏转量,如图4所示为参考牙弓。

通过对已有模型的迭代,对牙齿进行动态的计算,不断更新设计策略,求得一个完整的治疗周期内的最优路径和最佳位置。
如图5所示,假设空间中单牙的宽度线用L表示,L2为投影的最近点,L1为L的理想位置,经过两次迭代,线段L第一次迭代到L2处,第二次迭代到L1处,迭代拟合模型之后自动退出迭代拟合过程。
这种渐进式的修改策略,是在空间中选取和尝试最完美牙弓的最佳位置。
其意义在于,不需要医生对牙弓进行设定,且对于不精确或者错误的自动修正,策略迭代保证了错误的移动或者旋转在形成最终的排牙策略前被丢弃。

首先按照参考牙弓计算偏移和旋转,检测实际牙弓的特征点与参考牙弓对应点是否拟合,若拟合则退出,然后更新特征点坐标建立实际牙弓线,并建立新的参考牙弓,再去除相反的操作,由于排牙完全由计算机自动处理,产生移动或者旋转的指令,有可能出现先逆时针旋转,而根据新的牙弓拟合后再顺时针旋转,或者先舌颊向内移动,再舌颊向外移动的处理,而由于存储的数据已然是按照医生的成对指令,则可以优化结果为去除相反的结果,以此达到最短移动距离和最少移动角度;最后自动粘贴附件,对每颗牙的空间网格,在质心处垂直牙弓线的方向上与牙体的网格求取交点,此交点为附件或矫治器的位置。

步骤四:根据凸度和拥挤量对牙列进行减数或非减数分类:对凸度小于115度且拥挤量小于6mm的单牙采取减数设计,对凸度大于115度小于120度且拥挤量小于3mm的单牙采取非减数设计,或对凸度大于115度小于120度且拥挤量小于2mm的单牙采取减径设计。

步骤五:根据每颗牙的移动量与偏转量进行牙列正畸设计,如图6所示首先根据凸度和拥挤量进行减数或非减数设计,如图7所示,利用Line1与Line3、Line2与Line4的夹角确定凸度;然后进行分解操作并按照决策树自动设计;再采用马尔科夫决策,对每颗单牙的移动操作序列进行使用或不使用神经网络的机器学习,最后通过机器学习进行经验设计,得到单牙的优化移动步骤。

以上所述仅是本发明的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本发明原理的前提下,还可以做出若干改进,这些改进应视为本发明的保护范围。

附图