|
我们身边的人工智能应用
* N& N. r( K( N0 j/ s! t0 {, T- P7 I- H' ]2 E
/ v+ ~4 u) V p
人工智能是在计算机科学、控制论、信息论、心理学、语言学等多种学科相互渗透的基础发展起来的一门新兴边缘学科,主要研究用用机器(主要是计算机)来模仿和实现人类的智能行为,经过几十年的发展,人工智能应用在不少领域得到发展,在我们的日常生活和学习当中也有许多地方得到应用。本文就符号计算、模式识别、专家系统、机器翻译等方面的应用作简单介绍,籍此使读者对我们身边的人工智能应用有一个感性的认识。' G/ q, p1 F7 V1 V, N
1 符号计算
4 b, N% G, e: o5 U. v# ~计算机最主要的用途之一就是科学计算,科学计算可分为两类:一类是纯数值的计算,例如求函数的值,方程的数值解,比如天气预报、油藏模拟、航天等领域;。另一类是符号计算,又称代数运算,这是一种智能化的计算,处理的是符号。符号可以代表整数、有理数、实数和复数,也可以代表多项式,函数,集合等。。长期以来,人们一直盼望有一个可以进行符号计算的计算机软件系统。。早在50年代末,人们就开始对此研究。。进入80年代后,随着计算机的普及和人工智能的发展,相继出现了多种功能齐全的计算机代数系统软件,其中Mathematica和Maple是它们的代表,由于它们都是用C语言写成的,所以可以在绝大多数计算机上使用。。Mathematica是第一个将符号运算,数值计算和图形显示很好地结合在一起的数学软件,用户能够方便地用它进行多种形式的数学处理。
2 A6 _4 e1 ]4 m' g9 F, Y计算机代数系统的优越性主要在于它能够进行大规模的代数运算。。通常我们用笔和纸进行代数运算只能处理符号较少的算式,当算式的符号上升到百位数后,手工计算就很困难了,这时用计算机代数系统进行运算就可以做到准确,快捷,有效。。 现在符号计算软件有一些共同的特点就是在可以进行符号运算、数值计算和图形显示等同时,还具有高效的可编程功能。在操作界面上一般都支持交互式处理,人们通过键盘输入命令,计算机处理后即显示结果。并且人机界面友好,命令输入方便灵活,很容易寻求帮助。
& e, O; c% U9 I' S) r& e尽管计算机代数系统在代替人繁琐的符号运算上有着无比的优越性,但是,计算机毕竟是机器,它只能执行人们给它的指令,有一定的局限性。首先,多数计算机代数系统对计算机硬件有较高的要求,在进行符号运算时,通常需要很大的内存和较长的计算时间,而精确的代数运算以时间和空间为代价的。第二个问题是用计算机代数系统进行数值计算,虽然计算精度可以到任意位,但由于计算机代数系统是用软件本身浮点运算代替硬件算术运算,所以在速度要比用Fortran语言算同样的问题慢百倍甚至千倍。另外,虽然计算机代数系统包含大量的数学知识,但这仅仅是数学中的一小部分,目前仍有许多数学领域未能被计算机代数系统涉及。计算机代数系统仍在不断地发展、完善之中。! q4 l7 \& h* N
2 模式识别
1 q! N9 n7 g c* `5 }/ @/ Y! l模式识别就是通过计算机用数学技术方法来研究模式的自动处理和判读。这里,我们把环境与客体统称为“模式”,随着计算机技术的发展,人类有可能研究复杂的信息处理过程。用计算机实现模式(文字、声音、人物、物体等)的自动识别,是开发智能机器的一个最关键的突破口,也为人类认识自身智能提供线索。信息处理过程的一个重要形式是生命体对环境及客体的识别。对人类来说,特别重要的是对光学信息(通过视觉器官来获得)和声学信息(通过听觉器官来获得)的识别。这是模式识别的两个重要方面。市场上可见到的代表性产品有光学字符识别系统 (Optical Character Recognition,OCR)、语音识别系统等。" C, H% P1 V- ^" z- B, E
计算机识别的显著特点是速度快、准确性和效率高。识别过程与人类的学习过程相似。 v: @$ h* ?8 b7 P$ @# E
以“汉字识别”为例:首先将汉字图象进行处理,抽取主要表达特征并将其特征与汉字的代码存在计算机中。就象把老师教我们这个字叫什么、如何写的知识记忆在大脑中。这一过程叫做“训练”。识别过程就是将输入的汉字图像经处理后与计算机中所保存的全部汉字进行比较,找出最相近的字作为识别结果,这一过程叫做“匹配”。 ; i* K/ t i+ s
语音识别就是让计算机能听懂人说的话,一个重要的例子就是七国语言(英、日、意、韩、法、德、中)口语自动翻译系统。其中,中文部分的实验平台设立在中国科学院自动化所的模式识别国家重点实验室,这是口语翻译研究跨入世界领先水平的标志。该系统实现后,人们出国预定旅馆、购买机票、在餐馆对话和兑换外币时,只要利用电话网络和国际互联网,就可用手机、电话等与“老外”通话。
9 D7 H% g2 O, D/ Y指纹是人体的一个重要特征,具有唯一性。北京大学有关专家对数字图像的离散几何性质进行了深入研究,建立了从指纹灰度图像精确计算纹线局部方向、进而提取指纹特征信息的理论与算法,随后研究成功了适于民用身份鉴定的全自动指纹鉴定系统,以及适于公安刑事侦破的指纹鉴定系统。从而开创了我国指纹自动识别系统应用的先河。北大指纹自动识别系统的推出,使我国公安干警从指纹查对的繁重人工处理中解放出来。浙江省从1997年开始使用北大指纹自动识别系统,采取省地(市)二级建库、省地(市)县三级查询的方式,形成了独特的“浙江模式”。省公安厅现已建立了100多万人的指纹库,是目前国内的第二大库。在100多万人的指纹库中,检索一枚现场指纹仅需4分钟左右。2000年浙江省用指纹自动识别系统直接破案3063起,连带破案12000多起。破案率为全国第一,并遥遥领先于国内其它指纹识别系统,被公安部树为指纹系统建设应用样板。
) a7 \: T, }0 O) t, c$ Y这里介绍一个综合应用的例子,一汽集团公司与国防科技大学最近合作研制成功“红旗轿车自主驾驶系统”(即无人驾驶系统),它标志着我国研制高速智能汽车的能力已达到当今世界先进水平。汽车自主驾驶技术是集模式识别、智能控制、计算机学和汽车操纵动力学等多门学科于一体的综合性技术,代表着一个国家控制技术的水平。红旗车自主驾驶系统采用计算机视觉导航方式,并采用仿人控制,实现了对红旗车的操纵控制。首先,摄像机将车前方的道路和车辆行驶情况输入到图像处理和图像识别系统。该系统识别出道路状况、前方车辆的相对距离和相对车速。接着,路径规划系统根据这些信息规划出一条合适路径,即决定如何开车。然后,路径跟踪系统根据需跟踪的路径,结合车辆行驶状态参数和车辆驾驶动力学约束,形成控制命令,控制方向盘和油门开启机构产生相应动作,使汽车按照规划好的路径前进,即按自主驾驶系统的规划路径前进。
" w! r3 v& t+ o6 m- y' u% N' V3 专家系统
1 P: Q g1 W4 I8 `/ b( c% D+ L. N2 Z专家系统是一种模拟人类专家解决领域问题的计算机程序系统。专家系统内部含有大量的某个领域的专家水平的知识与经验,能够运用人类专家的知识和解决问题的方法进行推理和判断,模拟人类专家的决策过程,来解决该领域的复杂问题。专家系统是人工智能应用研究最活跃和最广泛的应用领域之一,涉及到社会各个方面,各种专家系统已遍布各个专业领域,取得很大的成功。根据专家系统处理的问题的类型,把专家系统分为解释型、诊断型、调试型、维修型、教育型、预测型、规划型、设计型和控制型等10种类型。具体应用就很多了,例如血液凝结疾病诊断系统、电话电缆维护专家系统、花布图案设计和花布印染专家系统等等。
" \# Z$ C$ q8 A# _1 a8 j) Y- [: O为了实现专家系统,必须要存储有该专门领域中经过事先总结、分析并按某种模式表示的专家知识(组成知识库),以及拥有类似于领域专家解决实际问题的推理机制(构成推理机)。系统能对输入信息进行处理,并运用知识进行推理,做出决策和判断,其解决问题的水平达到或接近专家的水平,因此能起到专家或专家助手的作用。
2 j% {! i Y* H- k7 y# x开发专家系统的关键是表示和运用专家知识,即来自领域专家的己被证明对解决有关领域内的典型问题有用的事实和过程。目前,专家系统主要采用基于规则的知识表示和推理技术。由于领域的知识更多是不精确或不确定的,因此,不确定的知识表示与知识推理是专家系统开发与研究的重要课题。此外,专家系统开发工具的研制发展也很迅速,这对扩大专家系统的应用范围,加快专家系统的开发过程,将起到积极地促进作用。随着计算机科学技术整体水平的提高,分布式专家系统、协同式专家系统等新一代专家系统的研究也发展很快。在新一代专家系统中,不但采用基于规则的推理方法,而且采用了诸如人工神经网络的方法与技术。$ E, ]2 J$ S' f' a% Z# y
4 机器翻译
3 G$ R0 @) C' [; u' w; }( w; V机器翻译是利用计算机把一种自然语言转变成另一种自然语言的过程,用以完成这一过程的软件系统叫做机器翻译系统。几十年来,国内外许多专家、学者为机器翻译的研究付出了大量的心血和汗水。虽然至今还没有一个实用、全面、高质量的自动翻译系统出现,不过也取得了很大的进展,特别是作为人们的辅助翻译工具,机器翻译已经得到大多数人的认可。目前,国内的机器翻译软件不下百种,根据这些软件的翻译特点,大致可以分为三大类:词典翻译类、汉化翻译类和专业翻译类。词典类翻译软件代表是“金山词霸”了,堪称是多快好省的电子词典,它可以迅速查询英文单词或词组的词义,并提供单词的发音,为用户了解单词或词组含义提供了极大的便利。汉化翻译软件的典型代表是“东方快车2000”,它首先提出了“智能汉化”的概念,使翻译软件的辅助翻译作用更加明显。以“译星”、“雅信译霸”为代表的专业翻译系统,是面对专业或行业用户的翻译软件,但其专业翻译的质量与人们的实用性还有不少差距,有人评价说“满篇英文难不住,满篇中文看不懂”,该说法虽然比较极端,但机译译文的质量确实却一直是个老大难问题。这里,我们不妨对现有的机译和人译过程作一比较,从中可以看出一些原因。
# q9 D T5 T0 o/ |5 L' J% r, q 机器翻译:
$ V3 s, y- E5 I 1.一句一句处理,上下文缺乏联系;
4 Z; X$ }' ^. `/ f1 {( u 2.对源语言的分析只是求解句法关系,完全不是意义上的理解;
- _! _0 a; S8 G' Y6 f. K 3.缺乏领域知识,从计算机到医学,从化工到法律都通用,就换专业词典;
, D: ~; f* H( X+ Q5 c 4.译文转换是基于源语言的句法结构的,受源语言的句法结构的束缚;
$ Z4 Y2 [5 t! b( H) L0 A8 I1 b 5.翻译只是句法结构的和词汇的机械对应。 * A! m. t5 c& K$ ^1 k; d; f
人工翻译: ( X. X- `, H+ b4 p4 ]% I6 A1 _
1.一般会先通读全文,会前后照应;
8 F4 e2 v- Z6 D0 A& e: } 2.对源语言是求得意义上的理解;
; k1 X& z+ S' X6 ]* O) W( G 3.只有专业翻译人员,而没有万能翻译人员; 9 O, L. O9 q& h# U
4.译文是基于他对源语言的理解,不受源语言的句法结构的束缚;
; ?) Z7 q' j" g( l$ s, l 5.翻译是一个再创造的过程。 7 C2 t& i# w5 H" l& a; y
在目前的情况下,计算机辅助翻译应该是一个比较好的实际选择。事实上,在很多领域中,计算机辅助人类工作的方式已经得到了广泛的应用,例如CAD软件。如果计算机辅助技术用于语言的翻译研究,应该同样可以起到很大的辅助作用,这就是所谓的“计算机辅助翻译”。它集机器记忆式翻译、语法分析式翻译和人际交互式翻译为一体,把翻译过程中机械、重复、琐碎的工作交给计算机来完成。这样,翻译者只需将精力集中在创造性的思考上,有利于工作效率的提高。: k/ X. k+ n) X% g! Q$ O
机器翻译研究归根结底是一个知识处理问题,它涉及到有关语言内的知识、语言间的知识、以及语言外的世界知识,其中包括常识和相关领域的专门知识。随着因特网的普及与发展,机器翻译的应用前景十分广阔。作为人类探索自己智能和操作知识的机制的窗口,机器翻译的研究与应用将更加诱人。国际上有关专家分析认为机器翻译要想达到类似人工翻译一样的流畅程度,至少还要经历15年时间的持续研究,但在人类对语言研究还没有清楚“人脑是如何进行语言的模糊识别和判断”的情况下,机器翻译要想达到100%的准确率是不可能的。) v& X p" \2 {) V) W
5 人工智能思想的应用:在家里寻找外星人$ h' r9 Q* y0 m0 `/ ~ V
人工智能的基本思想已经在许多领域中得到了应用,“在家里寻找外星人”(SETI@home)项目就是利用人工智能的神经网络和网格计算思想的一个成功案例。SETI@home是Search for Extra Terrestrial Intelligence at Home的缩写,意为:在家里寻找外星文明。该项目由美国行星学会和美国加州大学伯克利分校于1999年5月17日开始启动,它利用特定的PC机屏幕保护程序,来调用全球上网的个人计算机的闲置能力,分析世界上最大的射电望远镜获得的数据,帮助科学家探索外星生物。其计算模式的实质就是网格计算。 4 T P4 }- `% i! k5 ~7 J0 g/ G
SETI@home项目的大致流程是这样的: 4 ~$ O2 u( t1 ~% A& @; k4 @
1.政府或者研究部门将一项需要巨大运算量的任务以程序和数据的形式提交给服务器。 7 F1 i4 D3 x- B# L: W
2.服务器将数据和程序代码分成更小的部分,也称“子任务”。 6 [& \8 @/ f2 i$ I4 L
3.在志愿者的PC机上安装一种特殊的客户程序(事实上是一个屏幕保护程序),它能自动同服务器联络,自动下载和处理子任务。 1 B) z( G7 R1 U& w* o
4.子任务处理完后的结果被送回服务器。然后,客户程序下载新的子任务,继续处理。 8 N8 t6 v2 q$ e! q- P1 C
5.一旦所有的子任务处理完毕,服务器就将各种结果汇总,生成最后的报告,并把最终结果发回提交人。
6 n# S6 ^. v) Z& K5 c8 |SETI@home的资料来源于波多黎哥Arecibo的无线电望远镜所收集的信息,本次观测自1998年10月开始,每天收集约35G资料,因为该处没有足够的网路频宽,因此只能录制磁带,以传统邮寄的方式送达柏克莱加大,资料再分割成每单位约350K,透过Internet传送到参与者的电脑,借分散运算来处理庞大的资料。由于SETI@home项目没有得到国家的专项拨款费,所以只好请全世界的PC帮忙。参与这个活动的人没有任何奖赏,只有默默奉献,不过根据反馈回来的数据片断的多少统计,虽然到目前为止尚未找到外星人,但是,SETI@home项目却有力地证明网格计算是行之有效的。
& Z$ x' n' z$ C2 u从SETI@home项目正式启动以来,已经有470多万志愿者参加了这个项目,他们从指定的站点下载射电望远镜收集的信息的片断,用自己的计算机运行分析,从中寻找宇宙中生命的迹象,总处理数据量达到了15T,平均每位参与者让自己的电脑为SETI@home工作了17个半小时,这相当于使用一台PC机工作482023年,相当于使用超级计算机工作48年。该项目充分利用了分布在世界各地计算机的力量,虽然整个计划耗资只有50万美元,却拥有强大的威力。 |
|