每隔一年,国际自动化规划和调度会议(International Conference on Automated Planning and Scheduling)都会举办一场竞赛,由会议参与者设计的计算机系统试图找到规划问题的最佳解决方案,比如安排飞行或协调自主卫星团队的任务。
然而,除了最直接的问题外,即使是最好的规划算法,在解决问题方面也不如有特殊天赋的人有效——比如麻省理工学院的学生。
麻省理工学院(MIT)计算机科学与人工智能实验室(Computer Science and Artificial Intelligence Laboratory)的研究人员正试图通过让自动化规划者受益于人类直觉来改进他们。通过将高性能人类规划者的策略编码成机器可读的形式,他们能够在一组具有挑战性的问题上,将赢得竞赛的规划算法的表现提高10%到15%。
本周,研究人员将在人工智能发展协会(Association for The Advancement of Artificial Intelligence)的年度会议上展示他们的研究结果。
“在实验室中,在其他调查中,我们发现,在计划、调度和优化等方面,通常只有一小部分人真正出类拔萃,”麻省理工学院(MIT)航空航天助理教授朱莉·沙阿(Julie Shah)说。“我们能否从真正擅长此道的少数人那里获取见解和高层战略,并让机器利用这些见解,比绝大多数人更擅长解决问题?”
会议论文的第一作者是航空航天专业研究生约瑟夫·金。沙阿和诺福克州立大学(Norfolk State University)的本科生克里斯托弗·班克斯(Christopher Banks)加入了他的团队。2016年夏天,班克斯是沙阿实验室的一名研究实习生。
人的因素
参加自动规划比赛(称为国际规划比赛,IPC)的算法会遇到不同难度的相关问题。最简单的问题需要满足一些严格的约束:例如,给定一定数量的机场,一定数量的飞机,一定数量的人在每一个与特定的目的地机场,有可能计划飞机的飞行路线,所有乘客到达目的地,但从来没有飞机飞空的吗?
更复杂的一类问题——数值问题——增加了一些灵活的数值参数:你能找到一组既满足原始问题的约束条件,又能使飞机的飞行时间和燃料消耗最小化的飞行计划吗?
最后,最复杂的问题——时间问题——在数值问题上增加了时间约束:你能否在确保飞机在特定时间到达和起飞的同时,最小化飞行时间和燃料消耗?
对于每个问题,算法有半小时的时间来生成计划。计划的质量是根据一些“成本函数”来衡量的,比如综合总飞行时间和总油耗的方程。
沙阿、金和班克斯招募了36名麻省理工学院本科生和研究生,向他们每个人提出了来自两个不同竞赛的规划问题,一个侧重于飞机路线,另一个侧重于卫星定位。和自动规划一样,学生们有半小时的时间来解决每个问题。
“通过选择麻省理工学院的学生,我们基本上是在选择世界上解决问题的专家,”沙阿说。“很可能,他们会比大多数人做得更好。”
编码策略
当然,他们比自动规划者更好。学生们提交了答案后,Kim就他们解决问题的一般策略采访了他们。他们的回答包括“飞机访问每个城市最多一次”,以及“对于每个卫星,在三圈以内找到航线。”
研究人员发现,大多数学生的策略都可以用一种称为线性时间逻辑的形式语言来描述,而这种形式语言又可以用来为问题说明添加约束条件。由于不同的策略可能相互抵消,研究人员使用在各自比赛中胜出的规划算法,分别测试了每个学生的策略。结果各不相同,但只有细微差别。在数值问题上,飞行计划和卫星定位问题的平均改进分别为13%和16%;在时间问题上,改善率分别为12%和10%。
沙阿说:“规划者提出的计划,当它使用个人的高级策略时,看起来更像人类生成的计划。”“也许有这样一座桥梁,让用户的高级策略对机器有用,通过让它对机器有用,也许它会让人更容易理解。”
在正在进行的工作中,Kim和Shah使用自然语言处理技术使系统完全自动化,这样它就可以将用户对高级策略的自由形式描述转换为线性时间逻辑,而无需人工干预。
了下:快速原型



