教与学优化算法综述

(整期优先)网络出版时间:2021-12-29
/ 1

教与学优化算法综述

张喆

沈阳化工大学 110142


摘要:本文介绍了一种新的高效优化方法“基于教与学的优化”。该方法研究了教师对学习者的影响。与其他受自然启发的算法一样,TLBO也是一种基于总体的方法,并使用大量的解决方案来进行全局解决方案。人口被认为是一组学习者或一组学习者。TLBO的过程分为两部分:第一部分是“教师阶段”,第二部分是“学习阶段”。“教师阶段”指向教师学习,“学习者阶段”指通过学习者之间的互动来学习。

1.引言

受到教学方式思想体系的影响,Rao等人首先提出了教与学优化算法(TLBO)。TLBO算法背后的主要思想是模拟由教师阶段和学习阶段组成的经典学习过程。在教师阶段,老师将他的知识分配给所有学生,即学生从老师那里学习。而在学习阶段,学习者在同学的帮助下学习,即学习者通过与其他学习者的互动来学习。通过这样的两个过程不断循环,学习者的成绩将会不断提高,每个学习者所代表的一个解也将会不断被更新和优化,直到达到停止条件时算法停止。这一过程就是教与学优化算法所根据的基本原理。在TLBO算法中,种群被认为是一个组或一类的学习者。对TLBO的详细描述可以在中找到。本文只简单介绍该算法的教师和学习两个主要阶段。

2教与学优化

2.1 教师阶段

在教师阶段,一个好的老师试图把他的学生提高到与他相同的知识水平。然而,在实践中,这是不可能的,这取决于学生的能力,老师只能在一定程度上提高班级的平均知识水平。这遵循了一个依赖于许多因素的随机过程。设M是平均值,T是任意迭代中的老师。T尝试将M移动到自己的水平,所以新的平均值将被指定为Mnew。根据现有和新平均值之间的差异,根据以下表达式更新解决方案:

61cbee3ab6031_html_4409a001f620749e.gif (2-1)

式中:TF是确定要改变的平均值的教学因子,r是一个向量,其元素是[0,1]范围内的随机数。TF的值根据以下公式试探性地设置为1或2。

61cbee3ab6031_html_654cbf340d28e36e.gif (2-2)

式中:round用于舍入到最接近的整数,rand(0,1)是在[0,1]范围内的随机数。

教师阶段结束后,学习者可以根据老师教的结果来更新自己的水平,如果相比之前的水平有所提高,则修改自己的数值,否则就不做变化。

2.2 学习阶段

学习者通过两种不同的方式增加他们的知识:通过教师的输入和他们之间的互动。学习者在小组讨论、演讲、正式交流等帮助下,与其他学习者随机交流互动。如果其他学习者的知识比他多,他就会向其学习并学到新的东西。在学习阶段,对于第i个学习者Xi修改表示为:

61cbee3ab6031_html_e6ea5dba9ae65c79.gif (2-3)

式中:Xk是另一个随机学习者,f是要优化的目标函数。r是[0,1]范围内的随机数的向量。




参考文献

[1] Goldberg D. Genetic algorithms in search, optimization, and machine learning. New York: Addison-Wesley; 1989.

[2] Back T. Evolutionary algorithms in theory and practice. Oxford University Press; 1996.

[3] Kennedy V, Eberhart R. Particle swarm optimization. In: Proceedings of the IEEE International Conference on Neural Networks. 1995. p. 1942–48.

[4] Clerc M. Particle swarm optimization. ISTE Publishing Company; 2006.

[5] Karaboga D. An idea based on honey bee swarm for numerical optimization. Technical report-TR06. Erciyes University, Engineering Faculty, Computer Engineering Department. 2005.