学科分类
/ 1
4 个结果
  • 简介:Amultiresolutionstate-spacediscretizationmethodwithpseudorandomgriddingisdevelopedfortheepisodicunsupervisedlearningmethodofQ-learning.Itisusedasthelearningagentforclosed-loopcontrolofmorphingorhighlyreconfigurablesystems.Thispaperdevelopsamethodwherebyastate-spaceisadaptivelydiscretizedbyprogressivelyfinerpseudorandomgridsaroundtheregionsofinterestwithinthestateorlearningspaceinanefforttobreaktheCurseofDimensionality.Utilityofthemethodi...

  • 标签: 加强学习 MORPHING 随机的格子
  • 简介:这篇论文基于多客观的最佳的控制系统建议非线性的控制器和一个大阶段角度津贴设计方法的一种新类型。与建议方法,系统的性能变得比原来的系统的好。然后,雷达伺服系统的一个例子与大阶段角度津贴被设计多客观的最佳的设计方法。最后,性能基于计算机模拟证明多客观的最佳的系统比线性最佳的系统优异。

  • 标签: 多目标优化控制 自适应控制器 优化控制系统 优化设计方法 非线性控制器 雷达伺服系统
  • 简介:Aprimarychallengeofagent-basedpolicylearningincomplexanduncertainenvironmentsisescalatingcomputationalcomplexitywiththesizeofthetaskspace(actionchoicesandworldstates)andthenumberofagents.Nonetheless,thereisampleevidenceinthenaturalworldthathigh-functioningsocialmammalslearntosolvecomplexproblemswithease,bothindividuallyandcooperatively.Thisabilitytosolvecomputationallyintractableproblemsstemsfrombothbraincircuitsforhierarchicalrepresentation...

  • 标签: 分散的 Markov 决定过程 加强学习 Multiagent 系统
  • 简介:通过建立push-over分析方法中的等效单自由度体系,分析得到一混凝土组合框架结构的等延性需求谱.利用有限元软件对组合框架进行非线性静力推覆分析,基于位移模式把多自由度体系转换为等效单自由度体系,建立其等效加速度与等效位移曲线.按现行抗震规范建立组合框架结构谱加速度与谱位移曲线,从而对该类结构进行抗震评估.用非线性动力时程分析方法对本文提出方法进行了比较,验证了该方法的可靠性.

  • 标签: 静力弹塑性分析 非线性动力时程分析 钢-混组合框架