bobo 发表于 2015-5-9 22:41:21

10 多智能体

上一章节:《人工智能机器人学导论》-9 慎思/反应混合范式

《人工智能机器人学导论》-10 多智能体

概述
在行星探测或地雷排查任务中,机器人的数量应该能覆盖更大的区域。另外也可以通过使用多个廉价的机器人代替单个昂贵机器人,因此多智能体在成本方面更为可取。
多智能体也在机器人比赛中变得流行,例如RoboCup机器人足球比赛。下面首先总结一些多智能体的问题:
1、队伍设计困难:如何认清当前任务适合使用多智能体?设计者如何分解任务?有预测和证实群体行为的工具吗?
2、存在参与的机器人太多,反而坏事的效应。例如相互挡道。传感器干扰等。
3、合适智能体之间需要通信,应该交流什么信息
4、智能体太自主或具有较高的独立性可能导致与群体目标产生较多冲突,但智能体具有较多的自主性可能更适合开放环境。这些方面需要折中。

异构性
异构性是指团队中单个机器人之间的相似程度。机器人群可以是异构的也可以是同构的。甚至部分任务是同构的,而另外一些任务是异构的。

同构团队和蜂群
大多数智能体团队是同构的。每个机器人都是一样的,这样可以降低成本也简化了编程。

异构团队
团队中有一个计算处理能力更强的成员。该成员作为团队的领导可以指挥其他智能更少的成员。例如无人机和地面车辆的异构机器人团队,完成搜索任务。
有一种异构协作叫做有袋机器人,母体机器人搭载一个或多个更小的子机器人。母体机器人具备更高的翻越能力。母体还可以携带电池为子机器人充电。或者母体机器人比较高,视角比较开阔,为子机器人提供规划帮助。



多智能体的控制
机器人足球使用全局的摄像头来识别各个机器人运动员的位置,机器人运动员本身实际是没有任何智能的,控制和规划都通过主机来实现,发送控制指令控制各个机器人运动员的运动。

多智能的突生群体行为
小兽群(Nerd Herd)机器人实验中准备了20个相同的机器人,把它们的目标设定为同一个地点。而到达目标地址是在另外一边。另外只能有一个机器人能通过狭窄的过道。


在第一组实验中,机器人处于无知共存状态。机器人在同一个团队但是没有任何其他机器人的知识。机器人将其他的机器人看成是障碍物。一旦聚集在入口处,他们就会相互壁障消耗很多时间。更糟糕的是机器人越多拥挤越严重,全体通过的时间越长。

第二组实验中,机器人处于有知共存状态,机器人相互认识,并有一个相互的简单群体规则。除了走向目标和壁障,还加入了一个另外的行为:如果发现另一个机器人,机器人停下来并等待时间p。如果p时间之后障碍机器人还挡路,机器人会向左转并恢复执行走向目标行为。新的行为减轻了堵塞,群体通过过道的速度大约相当于第一组的20倍。

第三组实验中,机器人处于智能共存状态。用一种启发式的行为代替避让机器人的群体行为:机器人相互排斥,但在移动中机器人努力向着机器人群的总体移动方向前进。结果机器人出现了群体行为,排成一列纵队通过了狭窄的过道。

动因
ALLIANCE结构的多智能体具备更大的鲁棒性和容错。它是包容结构的派生。其主要思想是团队成员既可以观察也可以听到其他队员的进展,当然也包括它自己的进展。如果不知道自己的进展,它们应该停下所做的事情并转移到其他事情上去。如果某个机器人空闲而另外一个机器人无法完成任务,它应该尝试帮助完成未完成的任务。对于存在行为的逻辑顺序的任务这一点特别有用,这样的任务在机器人开始另一个作业之前,必须在区域内完成特定的作业。这种行为的改变通过 动因来调控。机器人从事某项作业设定为两个内部动因 -- 机器人烦躁和机器人默认来调控。其他机器人在完成作业时表现越差,机器人对该作业的烦躁度就越高。机器人在完成作业时的自身表现越差,默认程度就越高。如果糟糕程度超过了限度,机器人要么接管未完成的任务,要么放弃当前任务并改变行为。
例如下面这个推箱子的空间蚂蚁寻觅行星的机器人实验,这个实验目的是寻找行星,将行星(纸箱)推回到基地。


下面是多智能体通过动因来协作的过程

时间0机器人1寻找静止行星 机器人2寻找静止行星
1发现行星A1 发现行星A1
2走向行星A1 走向行星A1
3到达A1恢复执行寻找静止行星行为
4推A1回基地
T1默认度++寻找静止行星
T1烦躁度++
5推A1回基地
T1默认度++发现行星A2
T1烦躁度++
6推A1回基地
T1默认度++ 走向A2
T1烦躁度++
7 推A1回基地
T1默认度++
T2烦躁度++ 推A2回基地
T1烦躁度 大于门限
将T1放入带做事务堆栈
T2默认度++
8推A1回基地
T1默认度++
T2烦躁度++ 推A2回基地
T1烦躁度++
T2默认度++
9 T1默认度 大于门限
放弃作业T1
寻找静止行星
T2烦躁度++ 推A2回基地
T2默认度++
10 T2烦躁度 大于门限
尝试作业T2
走向A2 T2默认度++
11 推A2回基地
T2默认度 = 0 推A2回基地
T2默认度 = 0
12 到达基地 到达基地

下一章节:《人工智能机器人学导论》-11 导航-拓扑路径规划


大连林海 发表于 2015-5-12 09:33:02

这是即将出版大书吗

bobo 发表于 2015-5-14 15:07:52

大连林海 发表于 2015-5-12 09:33
这是即将出版大书吗

这只是读书笔记 ,更详细的阅读可以在当当购买一本书.

大连林海 发表于 2015-5-14 16:05:01

bobo 发表于 2015-5-14 15:07
这只是读书笔记 ,更详细的阅读可以在当当购买一本书.

给个名字

bobo 发表于 2015-5-15 14:02:00

大连林海 发表于 2015-5-14 16:05
给个名字

人工智能机器人学导论
http://product.dangdang.com/8925932.html

貌似已经缺货
页: [1]
查看完整版本: 10 多智能体