现在的位置: 首页 > 自动控制 > 控制·综述 > 自动控制 > 正文

控制论思想

2007-09-30 22:13 控制·综述, 自动控制 ⁄ 共 12335字 ⁄ 字号 暂无评论

控制论击毁驱逐舰

1982年4月,英国和阿根廷在南大西洋的马尔维纳斯(福克兰)群岛附近,展开了第二次世界大战以来规模最大的海空战,也是世界上第一场动用核潜艇和空对舰导弹以及复杂电子系统的大战。这次海战,双方共出动了数十艘战舰和几百架飞机,尤其是使用了几十种现代化导弹,在水面、水下、空中和岛岸进行了封锁与反封锁、空袭与反空袭、登陆与反登陆的殊死较量。5 月2日,英“征服者”号核潜艇在水下发射两枚配有先进制导系统的“虎鱼”式鱼雷,击沉了阿根廷唯一的一艘3 千多吨的巡洋舰。5 月4日,阿根廷使用法国制造的“超级军旗式”战斗机,在距英舰央48 公里左右处,发射一枚“飞鱼AM39”型空对舰导弹,一举击沉了英国现代化程度很高、价值约2 亿美元的“谢菲尔德”号导弹驱逐舰。5 月25日,阿方再次使用“超级军旗式”飞机发射两枚“飞鱼式”导弹,又击沉了一艘排水量为1.8 万吨的英国“大西洋运送者”号运兵船。

阿方空军用一枚价值20万美元的“飞鱼”导弹,击沉了英国一艘价值2亿美元的导弹驱逐舰,使世界各国军事人员目瞪口呆,惊呼导弹在未来的海战中将起到“关键作用”。战斗结果表明,配有精密制导系统的武器彻底改变了传统海战方式,双方用不着面对面地舰炮对射,在几十公里乃至几百公里外就可用导弹发动攻击了。

我们介绍这一战例的目的在于说明这样一个事实:现代导弹装配的精密制导系统正是自动控制技术在军事上的一个重要应用。

控制论是什么?

控制论研究的对象是包括人在内的生物系统和各种非生物系统(如工程系统、化工系统、通讯系统、经济系统等)。所谓系统,是由相互制约的各个部件组成的具有一定功能的整体。

恒温箱就是一个简单的系统。如图所示,构成系统的基本部件是:电源、开关、加热电阻丝、箱体和执行动作的人。因为我们的目标是要保持恒温箱内的温度不变,所以这就是一个控制系统,受控对象是箱内温度,控制方式是接通或断开电源开关。

如果我们希望箱内的温度保持在20℃(假定环境温度低于20℃),那么当操作员观察到温度计的数值低于20℃时,就合上开关,接通电源加热,使箱内的温度升高。等升到20℃,操作员又将开关断开了一段时间后,箱内温度就会因为散热而下降,这时操作员又得合上开关为箱子加热。重复上述过程,操作员眼睛观察温度计,手控制电源开关,就能基本上保证箱内的温度维持在20℃。

如果我们采用自动控制技术来代替人的劳动,就成为自动恒温系统。它与人工恒温系统不同的是减少了操作员,但增加了一根弹簧、一个继电器和有关线路。温度计底部及20℃处,各有一根导线连到电源上,这些增加部件的功能就是代替人工操作。当继电器回路的电源接通时,就会产生吸力,将开关拉开(断开),因此加热电阻不工作(停止加热)。如果继电器回路中电源断开,继电器不产生吸力,那么开关受弹簧拉力的作用而闭合,接通加热器回路的电源,加热器开始加热。

这个系统是怎样实现自动控制的呢?原理很简单。因为温度计内的水银是可以导电的,所以当箱内温度低于规定值20℃时,继电器回路是断开的,不产生吸力,弹簧把开关拉紧(闭合),加热器回路有电,电阻丝发热,箱内温度持续升高。一旦温度升到20℃时,水银使继电器回路接通,因为继电器产生的吸力大于弹簧的拉力,所以将开关断开,加热器停止工作。由此可见,在自动恒温系统中,弹簧与继电器接替了操作员双手的工作——合上或断开开关;而温度计上的接线相当于人双眼的观察,它能依据箱内是否达到规定值而使继电器动作,从而实现了自动恒温的目的。

从上面这个简单例子可以归纳出自动控制系统的一个突出特点,即系统自动控制过程就是信息传递和变换的过程。但是一旦系统中信息传递受阻,又会发生什么情况呢?我们再以一个美国独立战争时期发生的一件事来说明。

当时,英国殖民主义者为了巩固它在美国的殖民统治地位和有效镇压美国人民的起义,曾组织了一次重要的战役。英军指挥者设想一支军队从加拿大出发,同另一支从纽约出发的军队,在一个名叫萨拉托加的地方汇合,对那里的起义队伍形成两面夹击的进攻阵势,企图一举消灭起义军队。但是战役的结果却并不像英军指挥者设想的那样。当其中一支部队到达指定地点时,却始终不见另一支英军前来汇合,结果形成了孤军奋战的被动局面,惨遭失败。事后才查明,原因是由于疏忽,行动命令只发给了一支部队,另一支部队根本就没有接到命令。

显而易见,英军失败的主要原因是信息受阻。其下属根本没有收到上级的任何指示,因为英军的信息传递只有自上而下(命令),而没有自下往上的信息反馈。所谓反馈(Feed-back),是指当指挥者控制系统发出的指令信息(也叫系统输入)输入后,通过系统内部变换后又将信息作用的结果(也叫系统输出)返回到系统输出端,并根据系统输出与系统输入(规定值)是否吻合,再对系统施加作用的过程。这也正是控制论创始人维纳所提出的“双向通讯”的慨念,既有从系统输入到系统输出的正向信息传递和变换,也有从系统输出端返回输入端的反馈信息。从控制论的观点来看,系统的自动控制过程正是通过“双向通讯”的信息反馈联系而实现的。信息在系统中的这种循环往返过程中,不断变换形式,最终实现控制目标。这就是控制论所揭示的自动控制系统的反馈机制,它是自动控制系统的第二个特点。

反馈机制

在山村野地,一群小鸡在嘁嘁喳喳地寻找食物,时而翻动草屑,时而啄食幼虫,怡然自得。一只饿鹰从远处飞来,发现了猎物,急速俯冲下来,吓得小鸡四处逃窜,于是演出了一幕“追踪—逃逸”的活戏剧。在这个“追踪—逃逸”系统中,对老鹰来说,目标是小鸡,控制机构是鹰脑(发出指令),执行动作的机构是鹰翅、鹰爪和嘴。在整个追踪过程中,鹰借助眼睛不断地获得反馈信息(即小鸡的位置、速度和方向变化),据此及时调整自己的动作,直到抓住目标。

从这场“鹰鸡殊死之战”的过程中,我们可以看出信息反馈和反馈控制的重要性。

其实反馈作为一种技术手段自动控制目标,早在古代就开始了,只不过那时人们尚未从理论上加以升华。相传早在2 千多年前,我国和古希腊都曾发明过水钟(“铜壶滴漏”)。这种简单的装置中就包含了深奥的反馈控制原理。水钟的基本要求是控制水流的速度恒定以达到准确记时的目的。控制方式如图所示。

反馈控制早期应用的另一个实例是离心式调速器如图所示。大家都知道,1768 年,英国工人瓦特(J.Watt,1736~1819 年)发明了蒸汽机,从而导致了西方国家的第1 次产业革命。据说瓦特小时候家里很穷,没有上过学,可是他十分爱学习,特别爱动脑子。一天,小瓦特在厨房里看奶奶做饭,正巧炉子上的一壶水开了,壶盖“啪啪”地直响,还不断的跳动。小瓦特看了半天,感到很奇怪,就问奶奶:“什么东西使壶盖跳动不停呀?”奶奶说:“水开了,壶盖就动呗!”瓦特进一步问道:“为什么水烧开了,壶盖就会动呢?是不是有什么东西在里面推动它呢?”奶奶看瓦特老是问个不停,就说:“我不知道,你自己去看吧!”为了弄清壶盖为什么会跳动,瓦特常常坐在炉旁边仔细观察和思索,后来,他终于搞清楚了,原来,水烧开后,会产生一股“气”(即水蒸汽),是“气”的力量在推动壶盖上下跳动。瓦特长大后,正是利用这个道理发明了蒸汽机。

为了进一步解决蒸汽机所推动的机械装置的速度控制问题,1788 年瓦特在系统中采用了离心式自动调速器。据估计,在19 世纪中,仅英国就有7.5万台装有瓦特调速器的蒸汽机装置。我们又一次看到了反馈控制的神奇魅力。

有趣的是,我们人体本身几乎处处都具有高速复杂控制能力的反馈控制系统。不知大家注意过没有,人体在正常状态下,无论春夏秋冬环境如何变化,都能保持体温、血压、血糖浓度、呼吸和心跳率基本恒定。大多数动物也具备这种功能。但是大家是否知道人类和动物如何实现这种自我调功能的机理呢?说白了,关键还是反馈控制的功劳。人体内显然没有像继电器、温度计和调速器这一类东西,而是依靠更为复杂的生物化学或生物物理过程来“检测”各种生理变化的。例如,血液中葡萄糖浓度若偏离标准值,人体检测到这条信息后就会由大脑中枢神经发出控制胰岛素分泌的命令(信息),由胰岛素分泌量的变化来调整血糖浓度使之恢复到正常值。同样的,人体内各种分泌和神经系统,每时每刻(即使当你睡着的时候)都在参与各种自我调节活动,以保持人体内部状态和心理状态基本稳定。这些自我调节过程和我们前面介绍的自动恒温、离心调速器的原理基本上是一致的。

反馈控制的概念还可以应用到更为广泛的领域,如教师讲课时,在认真讲授书中内容的同时,还密切观察同学们的反应,并随时提问,课后批改作业。这后面的三种方式就是为了获取反馈信息,以检查同学们掌握教学内容的程度,并根据这些信息调整讲授方法和进度,确保教学质量。

反馈机制对于人们的各种社会实践活动也具有十分重要的意义。就拿企业管理来说吧,管理也是一种深奥的控制活动,必须紧紧抓住信息反馈这个关键环节。管理没有信息反馈,只有上情下达,而无下情上达,就必然会脱离实际而出乱子,企业也会弄得一塌糊涂。同样,对经营决策者来说,市场信息的反馈也是至关重要的,不注意市场需求变化而关起门来盲目生产的决策者,必然会导致企业亏损,甚至倒闭。

从上面的讨论可以看出,信息概念和反馈思想是控制论的两个基本出发点。

陀螺与航行自动控制

大家小时候可能都玩过陀螺,当你掌握了正确方法用鞭子抽打它几下以后,它就会尖顶朝下竖起来,并绕其轴线旋转而不倾倒。

可别小看陀螺这小玩意儿,人们正是根据其自旋不倒的原理而设计制造出了五花八门的精密陀螺仪,为各种飞行器(如飞机)、导弹、人造卫星等)的飞行自动控制奠定了基础。尽管陀螺仪的外表看起来与常见的陀螺不大一样,其大小也不尽相同(如用在飞行仪器上的陀螺仪最轻者只有几十克重,而一个稳定核潜艇的陀螺仪却重达55 吨),但是基本原理却并无二致。

陀螺仪对于现代飞行控制系统来说可谓举足轻重。它不仅对整个系统的工作起着决定性作用,而且它的精度高低、可靠性程度和使用寿命长短等指标,对飞行器的稳定性和精确性都有着至关重要的影响。

陀螺仪的最早应用领域是航海事业。19 世纪人们广泛利用陀螺仪标定航向,在漫长的航海史上写下了新的一页。从20 世纪40 年代开始,陀螺仪便在导弹武器及航空航天事业上得到广泛应用,其稳定性和工作精度也随着科学技术的进步和工艺水平的提高而迅速提高。目前陀螺仪已有滚珠轴承、气浮、液浮、挠性、激光等类型。

陀螺仪在高速旋转时,能够抗拒任何外力和干扰的影响,保持其自转轴相对于惯性空间方向上稳定不变。当飞行器的飞行姿态偏离了预定正确方向,陀螺仪在转轴与飞行方向之间的夹角便发生了变化,飞行器上的检测元件立刻就可测量出来,并同时发出控制信号,通过执行机构的作用使飞行器的状态恢复正常。因此,这种自动控制系统也叫做“姿态稳定系统”。

陀螺自转轴方向不变的原理除应用于导弹的制导和飞机姿态控制以外,在宇航技术中也同样得到广泛运用。例如陀螺仪用在人造卫星上,可以保证人造卫星不受外界干扰而稳定运行在预定轨道上。不论人造卫星绕地球转到哪个位置或受其他什么外界干扰,卫星上的陀螺仪始终是指向空间某一预定方向。

小小的玩具陀螺和精度日益提高的陀螺仪竟具有完全相同的原理,初看起来似乎觉得有点不可思议,其实这正是大千世界中存在的客观规律。许多表面上看来非常简单的东西,却蕴藏着深奥的科学道理,关键在于我们要认清其本质规律,从而推动社会向前发展。

英国科学巨人牛顿从苹果落地而不是飞向空中这样一个司空见惯的现象中,发现了苹果从树上落到地上与其他行星绕太阳运行都遵循着同样的法则——万有引力定律,并且计算出了太阳系中各行星绕太阳旋转的轨道和周期,一下子把几百年来争论不休的是“日心学说”正确还是“地心学说”正确的问题解释得一清二楚。科技发展史表明,科学上许多原理和理论,常常是经过一段模糊时期后突然为人们所认识。细心的读者是否会从中得到什么启迪呢?

自动控制与电子战争

现代科学技术的发展,使电子技术在军事上的应用日益普及。现代化的武器装备,如大炮、坦克、飞机、军舰、导弹等,都配有相应的雷达、通讯设备及红外线或激光装置。然而历史的发展规律总是“有矛就有盾”。有了电子技术的应用,就会有电子技术上的斗争,这样现代战争中就出现了一个崭新的竞争领域——电子对抗和电子干扰,或叫做电子战。

所谓电子对抗,是指敌对双方利用电子设备和能够反射、吸收电磁波的器材的电子斗争。电子对抗的历史可以追溯到本世纪初。当无线电刚开始在军事通信中应用时,以截获和破译敌方情报为特征的简单的无线电通信对抗就萌芽了,并揭开了电子对抗的序幕。二次大战以来,炮瞄雷达、导弹制导雷达和飞机截击雷达相继问世,大大提高了武器命中率。与此同时,围绕着兵器控制与反控制展开了更激烈的电子对抗。

我们知道,雷达和无线电通信是现代社会当之无愧的“千里眼”和“顺风耳”。而电子干扰却能把敌人的“眼睛”和“耳朵”封住,使它们成为“瞎子”和“聋子”,或者巧施妙计,使敌人上当受骗。比如,利用雷达干扰发射机作为干扰源,可以发射或转发某种电磁波来压制敌方的电子设备,使它们无法正常工作。我们平时收看电视都有体会,如果附近有电子干扰(如汽车发动机或电焊机等工作时所产生的干扰),电视屏幕的画面就会发生畸变,干扰越强,画面畸变越厉害。同样,当飞机或舰艇上的雷达接收机受到干扰压制后,在雷达距离显示器屏幕上会出现参差不齐的“茅草”。干扰电波的能量越大,“茅草”长得越高,把本应能够发现的目标信号给掩盖住了,因为此时目标信号完全淹没在干扰信号中了。而且,无线电通信设备受到强烈的电磁干扰后,耳机中充满了杂乱刺耳的噪声,也无法进行正常的通信联络。

另外一种电子对抗手段是欺骗性干扰。其原理是用干扰发射机或无线电台巧妙地模仿敌方信号使敌人上当受骗。对雷达的欺骗性干扰,可使雷达在测定目标、方位、速度时产生错误,破坏雷达跟踪或制导,使敌方火炮、导弹击不中目标。无线电通信欺骗干扰还可以冒充敌台通报、通话,搅乱敌方通信,达到以假乱真的目的。

电子干扰技术在第二次世界大战中为盟军1944 年6 月在法国诺曼底登陆,并最终消灭德国法西斯军队立下了汗马功劳。当时盟军的具体作法是:

(1)将计就计,实施欺骗。纳粹德军统帅部曾武断地认为联军将在加莱地区登陆。英美联军将计就计,在多佛尔设置了一个假司令部电台群,不断发出内容适当的电报,故意泄密,造成联军将在加莱登陆的假象,使希特勒陷入圈套。

(2)严密侦察,挖睛扫障。英美联军对德军部署在法国沿海一带的雷达站、干扰站、警报台和电台进行严密侦察,并做到了如指掌。在登陆前夕,又派出轰炸机和战斗机进行大规模袭击,摧毁了德军所有的干扰台和80%以上的雷达站,挖掉了德军的“眼睛”,并保证了联军雷达和电台的正常工作。

(3)巧布疑阵,声东击西。登陆前夜,英美联军用一群群小船装着角反射器,拖着涂铝汽球等用于干扰的物体驶向加莱地区,使残存无几的德军雷达误将小船队视为大批飞机掩护下的大型进攻舰队,牵制住了加莱地区的大量德军,减少了联军在诺曼底登陆战中的阻力。

(4)施放干扰,出奇制胜。登陆开始时,英美联军出动320 架干扰飞机迷惑德军残存的雷达,掩护了飞向战区的大批战机。庞大的突击舰队始终隐蔽前进,只是在距登陆地点10 海里时,因发动机响声才被德军发现,然而联军5 个师20 万人的突击部队的登陆已是势不可挡了。

60 年代以来,还出现了一种反雷达导弹,是专门用来对付敌方雷达的导弹。其原理是利用敌方雷达发射的电磁波作引导,跟踪其信号直捣老巢,最后摧毁敌方雷达站。反雷达导弹第一次出现在战争舞台上是1965 年,当时美国利用“百舌鸟”反雷达导弹,攻击越南的高炮阵地。装备“百舌鸟”导弹的飞机,一般先在地面防空高炮火力有效射程外盘旋,引诱敌方雷达开机搜索,然后捕捉其信号,再发射导弹予以摧毁。这种武器曾严重破坏了越南北方地面雷达系统。其后,在中东战争、英阿马岛战争、两伊战争中,反雷达导弹都显示了巨大的威力。

“最优化”思想

在日常生活中,我们都有这样的经验,无论干什么事都希望以最小的代价获得最大的成功。例如上街购买东西时,我们总是挑那些质量好、外形最美观、价格也便宜的商品;在学习上,我们喜欢掌握最好的学习方法,以便在最短的时间内取得最好的学习成绩;在工作时,我们更愿意用最轻松愉快的方式来取得最满意的工作效果。这些看似平常的日常现象,其中包含了现代控制理论中的“最优化”思想。将上述这种“最优化”的观点应用于工程实践,便产生了在社会生活各个方面得到广泛应用的最优控制技术。

最优控制理论的发展是伴随着“最优化”概念的提出而开始的。在第二次大战期间及以后的一段时间内,应战争和军事防御上的需要,以提高大炮发射命中率为主要目标的自动控制系统(通常叫做伺服系统)的技术日臻完善。但是,随着社会的发展,简单的反馈控制已经难以满足工程实践的要求,传统的系统设计方法也无法实现日渐增高的性能指标。在这种情况下,科学家们通过大量的研究,于50 年代初提出了最优化的概念,并试图对控制对象施加最优控制。但由于理论上尚不完善故未能真正实现。直到1960 年前后,由于在控制理论中引入一系列新的研究方法和数学成果,推出了最优控制所必须满足的必要的充分条件后,才使最优控制的应用逐渐普及,并成为60年代自动控制领域的热门课题。特别是空间技术的迅猛发展,更进一步推动了最优控制理论向前迈进。举个例子来说,为了使宇宙飞船登月舱能以最小的燃料在月球表面准确、平稳地实现“软着陆”,即落到月球表面时的速度

恰好为零,以避免与月球表面发生碰撞而损坏舱内设备,必然选择合适的控制方式来改变火箭发动机的推力。这就是所谓的“月球软着陆”问题,也叫做“燃料最省控制问题。”

再举一个例子:坐电梯。开关一按,哧溜一下就到了几十层的大楼顶上。电梯省时省力,是现代科学和文明的产物。不过,应当怎样来控制电梯的运动,使它能以最短的时间到达顶楼(或从楼上下到地面)地面呢?也许有人会说,这还不简单,让电梯始终以最快的速度直上(或直下)不就行了么!其实仔细想一下就会发现这种控制方式是不行的。因为当电梯以最大的速度冲向楼顶(或地面)时,必然会发生剧烈的碰撞而造成设置损坏甚至人员伤亡。因此必须运用科学分析的方法,制定合理可行的控制方案,既要保证电梯上升(或下降)的时间最短,又要让它到达楼顶或地面时速度恰好为零。这也是一个最优控制问题,我们称之为“时间最优控制问题”。

为了解决各种各样的最优控制问题,人们找到了许多方法,其中有两种最有成效。一种是美国学者贝尔曼于1953~1957 年间研究提出的“动态规划”;另一种是前苏联学者庞特里亚金于1956~1958 年间创立的“极大值原理”。

变色蜥蜴的启示

“变色龙”,也叫“变色蜥蜴”,它能够自动适应周围环境的变化,随时把皮肤颜色变成与它所附着的物体相同的颜色(俗称保护色)。变色龙这种难能可贵的变色本领具有极好的伪装效果,通常不会为凶猛野兽识别,从而达到保护自己免受其天敌袭击或吞食的目的。

我们人体本身也同样具有适应外界环境变化的巨大能力。如人的体温,无论酷暑严寒,总能保持在一个相对恒定的水平上。

人们从生物体具有自动适应外界环境变化的能力这种自然现象中受到了很大的启发。如果人们设计的自动控制系统也能够在外界条件发生变化时,仍然保持最优运行,岂不是美事一桩吗?正是在这种思想支配下,人们提出了自适应控制(Adaptive Control)的概念。

前面我们已经介绍了,反馈控制的基本思想是利用系统输入(受控量)与希望值之间的偏差来控制系统的行为,使误差趋近于零。但实际上,由于多数受控制对象的特性很难准确掌握,内部参数也随环境而变化(如电阻会随温度变化),外界条件会随时波动(如电压波动),而且这些变化通常是无法预测的,所以,人们在对原系统进行控制的过程中,该系统的特性实际上已经发生了不同程度的变化。事先确定的最优控制在内部参数和外部环境变化后,可能已不再是最优方案了,因此只有设计一种随内部参数和外部环境变化而自动调整系统特性的控制方式,才能保证控制系统始终处于或接近最优运行状态,这种系统就是自适应控制系统,具有自适应能力的控制器叫做自适应控制器。

自适应控制的设想,最先是由考德威尔(W.1.Caldwell)于1950 年提出来的。1958 年美国麻省理工学院的怀特克(H.P.Whitaker)教授首先应用自适应控制方法设计了飞机自适应自动驾驶仪。

自适应控制系统的两个基本功能是:①能够自动检测和分析受控对象的特性以及系统所处环境的变化;②能够根据从环境和系统内部检测到的信息得出决策,适当改变系统的结构或参数以及控制策略,以保护系统在任何情况下都能稳定和最优运行。要实现这两种功能,显然必须进行大量的复杂计算和推断,所以自适应控制系统离不开现代社会的“天之骄子”——电子计算机的帮助。可以说,没有电子计算机的参与,要实现系统的自适应控制是不可能的,正如“巧妇难为无米之炊”。

如前所述,飞行器的控制是较早应用自适应控制技术的。大家知道,飞行器飞行的高度和速度会随着高空中云层、气流等环境的改变而发生剧烈变化,飞行器的动力学参数也会产生较大波动,依靠常规的反馈控制往往难以获得令人满意的控制精度。现在,采用带电脑的自适应控制系统可以实现良好的飞行。此外,大型船舶的自动驾驶仪是自适应控制技术成功应用的典型范例。

海上航行,环境复杂,气候多变,随时会出现一些意想不到的情况,如海浪、海潮、台风等。采用船舶自适应驾驶仪后,则可以克服风、流、浪、水域深度、船舶装载重量及其他不可预见的因素对船舶操纵性能的影响,确保船舶在各种环境条件下能量消耗最小,并安全准确地航行。目前,瑞典、日本和英美等国已生产出许多性能良好的产品投放市场。由于采用这种自适应驾驶仪后,航速可提高1%,估计每条远洋轮船可节省燃油3%,因此具有明显的经济效益和社会效益。

在医院,当有重病患者需急诊抢救时,往往要对患者进行长时间的输液治疗,这对医护人员是一个很重的负担。日夜值班守护,一时疏忽就可能酿成重大事故。但如果采用自适应监护系统,就可以日夜不间断地监测病人的脉搏和心电图,及时获得病情信息,并根据病人病情变化自动调整输液量。这样不但减轻医护人员的工作负担,还可明显提高治疗效果。

此外,自适应控制技术还广泛应用于工业、农业、石油勘探与开发、资源分配、宏观经济调控等各个部门。

自适应控制系统的进一步发展,将走向所谓“自学习”、“自组织”和“智能控制”系统。这些系统除具备一般自适应功能外,还能够自动记忆本系统过去的经验和教训,回忆过去曾经发生的情况,并基于这些信息改进系统的自适应功能。或许在不远的将来,通过读者朋友们的辛勤劳动和创造,在自动控制领域内将产生更加惊人的突破。

“黑箱”问题

今天,人们在许多科学研究领域,都可以碰到“黑箱”这一概念,但它并不是指一只真正的黑色箱子,而是控制论中的一个重要概念。作为一种近代科学方法,黑箱方法已越来越受到人们重视,并且与现代科学技术手段联系在一起,广泛应用于社会生活实践中。

1945 年,控制论的创始人维纳在一篇文章中写道:“所有的科学问题都是作为‘闭盒’问题开始的”,“若干可供选择的结构被密封在‘闭盒’中,研究它们的唯一途径是利用闭盒的输入和输出。”维纳所说的闭盒,也就是我们今天所说的黑箱。

到底什么是“黑箱”呢?粗略地说,所谓黑箱是指它的内部构造和机理还不清楚,但可以通过外部观测和试验来认识它的功能和特征。在现实生活中,许多客观事物,当人们还不可能,或客观条件不允许深入解剖其内部细节(因而无法详细了解其内部结构和特征),都可以把它看做是黑箱。为了让读者对黑箱概念有个形象化的认识,我们先从“大脑之谜”说起。

“大脑之谜”,也叫做“身心问题”,在科学研究史上是一个长期以来没有得到圆满解答的难题,无数科学家和哲学家倾注了毕生的心血进行过深入探讨和研究,提出了种种假设和理论。思维究竟是怎样从物质中产生出来的?大脑功能的具体活动机制又是什么?要解答这一系列问题可不是一件容易的事。人们可以用物理上的分割法,研究物质的结构和属性;也可以用化学分解和合成的方法来了解不同物质的成分。但这些方法,对研究大脑的思维功能却是鞭长莫及的,因为即使按这些方法的要求,将大脑打开,解剖分析,也只能是对失去思维功能的大脑物质的认识。这样,在科学研究面前,大脑的思维过程就是一个只见其外观和表现,而无法深入其内在了解其机制的难题。它就像一个不能打开的箱子一样,里面的一切对于我们来说都是黑乎乎的,一无所知。

在高能物理中,就有如下一个事实:当物质被高度分割后,就会出现不能再分割的微粒,这时人们只能借助科学仪器来观察其行为,而无法再通过分割来了解其内部结构。对于这类问题,必须开辟新的研究途径。幸好控制论中提出的黑箱研究方法,为我们研究这类问题提供了可能。

所谓黑箱方法,指的是当一个系统内部结构不清楚时,利用外部观察和试验方法,获得系统(即黑箱)的输入——输出特性;再根据这种信息,在不打开“黑箱”的情况下,研究其功能和属性,探索其构造和机理的一种科学方法。人们常说“知人知面不知心”。如果说人相当于一个黑箱的话,那么我们可以通过“听其言,观其行”而“知其心”,这是一种行为分析的方法。

黑箱方法的道理并不神秘,在我们的日常生活中,人们都在自觉或不自觉地运用这种方法。比如说看电视,如果说看电视必须要懂得电视内部结构和工作原理才行,那恐怕能看电视的人就不会很多了。然而,人们虽然不懂得电视机内部构造和机理,却知道按哪个开关打开它,调整哪些开关可以得到清晰稳定的画面效果,什么情况是出了故障,等等。这些都是我们运用黑箱方法的具体体现。不过黑箱方法最典型的应用是中医看病。中医看病,主要是通过“望、闻、问、切”等外部观察作出诊断,开方抓药。有时遇到疑难杂症没有把握时,可以先投以试探性的药物,观察病人的反应,并随时增减药物,观其疗效,一旦抓住病症就大胆对症下药。这种从人体的输入特征入手,实施“辩证论治”的方法正是黑箱方法的精髓所在。上面所举的例子,主要是让读者对黑箱方法有个基本的认识,但是控制论的黑箱方法,作为一种科学研究方法,具有自己的特点和独特表达方式。随着科学技术不断发展,

对系统进行动态观测的黑箱方法,已发展成为现代控制理论的一个重要分支——系统辨识。辨识,指的是通过外部观测系统得到系统的输入-输出数据,然后用数学方法确定系统的结构和参数,求得定量描述系统动态特性的数学模型,并在此基础上,实现对系统的最优控制。

“人狮搏斗”中的控制论思想

意大利古罗马斗兽场内,座无虚席、人声鼎沸,一场残酷的人狮角逐正在这里进行。只见“兽中之王”大吼一声,猛地一扑,向角斗士直扑过来,而那位健壮刚强的小伙子却敏捷的闪开了..奴隶主们注视着这一惊险纷呈的场面,不由得大声叫喊起来,或者得意忘形,或者懊丧至极。原来,他们正在进行一场奇导的赌博,而且下了一笔可观的赌注呢!

在这场雄狮与奴隶的生死搏斗中,狮子总想尽早扑住对手美餐一顿,而人则要设法躲避求得安宁。这是一场惊心动魄、扣人心弦的角斗。但是,谁又能料到,在这场事件背后竟然蕴含着深奥的对策论的朴素思想呢?

拿活生生的人去与残忍的雄狮角斗取乐,这在世界文明的今天是不可思议的,然面在古罗马的奴隶制社会却是司空见惯。假如您读过小说《斯巴达克思》的话,您就会不以为怪了。

对抗的双方都要运用自己的聪明才智,充分发挥自身的优势,尽量利用对方的弱点,选择最优策略,最终战胜对方。对策论就是一门利用数学的观点和方法研究竞争或斗争现象中,是否存在一方战胜另一方的最优策略以及如何制定最优策略的科学。由于我国古代把下棋玩牌这类活动叫做博奕,所以对策论又叫博奕论。

对策论的相互思想还可以追溯到公元前若干世纪。其中我国古代田忌赛马的故事已成为脍炙人口的对策问题的范例。这个故事给我们这样一个启发:只要策略得当,实力并不是取胜的唯一因素。这也深刻地反映了对策的极端重要性。

对策论虽然渊源久远,但它真正成为一门独立的学科,还是1944 年数学家冯·诺依曼和经济学家摩根斯坦合著的《对策论与经济行为》一书出版以后的事。而该书则被认为是对策论发展的一块里程碑。冯·诺依曼不仅创立了对策论,他还是电子计算机的奠基人。1946 年以后,由于电子计算机的发明和应用,大大简化了对策论中的复杂计算,才使对策论不再仅仅是纸上谈兵了。进人60 年代,对策论与最优控制相互渗透,使对策论得到了长足的发展。

在对策论发展的基础上,美国的依萨克斯博士通过对军事上追逃问题的深入研究,开创了微分对策的研究工作,提出在追逃问题中,追逃双方都能自由决策的新的对策,即微分对策理论。

形形色色的对策现象,一般都具有三个最基本的要素:(1)局中人。具有决策权的参与对策的各方叫做局中人。局中人既可以理解成个人(如狮子与奴隶、齐王与田忌等),也可以理解成集体(如参加比赛的球队)。从人类与大自然进行斗争的角度理解,也可以把大自然作为局中人,同时把那些得失一致的参加者看作是一个局中人。(2)策略集。对策过程中每个局中人可以采取的方案称为该局中人的策略。一个局中人可能采取的所有策略则称为他的策略集。(3)得失函数。一局对策结束之后,每个局中人都有自己的得与失,它与各局中人所采取的策略有关,故称为得失函数。

只有两个局中人的对策叫二人对策,三人以上叫多人对策。在二人对策中,如果胜者之所得就是负者之所失,双方得失之和为零,则称此种对策为二人零和对策。实际生活中许多问题都可以归结为二人零和对策问题,如人狮之斗、田忌赛马及各种追踪问题。如果对策各方得失之和大于零,即是互相协助、合作的,则称这种对策为合作对策。

对策论的应用很广,尤其是作为新一代更复杂的微分对策理论,由于与控制理论特别是最优控制理论紧密相联,已经能够解决许多实际问题,在军事部署、自动控制、海洋捕捞、农业抗灾、贸易竞争、外交谈判、疾病医治以及各种体育比赛中被广泛应用。进入70 年代后,对策论更加向纵深发展。如模糊数学是新近发展起来的一个数学分支,在对策论中也得到了应用。借助模糊数学,可开辟对策论研究的新领域,用以探讨如周围环境、对策策略、合作关系等在模糊情况下的对策问题。

毋庸讳言,对策论,尤其是微分对策理论,毕竟还只是一门年轻的科学,其理论和应用不论在广度或是深度方面都有许多问题,等待着广大有识之士去开垦、去发掘、去探讨。相信在不远的将来,在对策论这片土地上,会绽开更多、更美的花朵。

给我留言

留言无头像?