《数字化生存》第31/51页


流利的法语,否则就跟听外星人讲话一样(而且即便你法文流利,也不一定能懂)。
你可能会想:“还要来点儿酒吗?”是小孩都听得懂的简单法文,而政治就需要更
精深的语言技巧了。不错,但这并不是两段对话的重要区别所在。
当有人间你要不要添一点酒的时候,他可能正伸长了手臂去拿酒瓶,眼睛也正注视
着你的空酒杯。也就是说,你正在解码的信息并不只是声音而已,而是并行而累赘的多
重信息。而且,所有的主体和客体都处于同一时空。这种种条件同时作用的结果才使你
能听懂他的意思。
我要重申,累赘是件好事。并行信道(手势、眼神和谈话)的使用是人类沟通的核
心。人类自然而然地倾向于使用并行的表达方式。假如你只会讲一点点意大利语,和意
大利人通电话将会非常辛苦。但当你住进一家意大利旅馆,发现房间里没有香皂时,你
不会拿起电话,而会直接下楼,走到前台值班员那里,拿出你在语言速成学校学会的所
有看家本领,让他拿香皂给你,你甚至一边说一边还会做几个洗澡的动作。
身在异地时,我们会用尽一切办法,来传达我们的意图,并且解读所有相关信号,
力求索解出哪怕一丁点意思。电脑正是身处这样的异地――人类的土地上。让电脑开口
要电脑说话,有两种方式:重放先前录下的声音,或合成字母、音节或(最可能的
是)音素的声音。两种方式各有利弊。让电脑说话和音乐的制作一样,你可以把声音存
储下来(就像CD一样),然后重播,也可以采用合成的方式,根据曲调,重制音乐(就
像音乐家一样)。
重述先前存储的说话内容,也就回到了听起来最“自然”的口、耳沟通方式,尤其
是当我们存储的是一个完整的讯息时,就更显得如此。由于这个原因,大多数的电话留
言都是以这种方式录制的。当你试图把录好的片段声音或个别单字拼凑起来的时候,结
果就比较不如人意了,因为整体的韵律不见了。
过去,人们不大愿意用预录的谈话来作人机界面,因为这样会消耗电脑大多的存储
容量。今天,它已经不太成问题了。
真正的问题也正是最明显的问题。你必须提前把话录下来,才能运用预录的谈话。
假如你期望电脑说话的时候,不要把名字弄错,那么你就得先把那些名字存储起来。存
储好的声音不能适用于随机的讲话。由于这个原因,人们使用了第二种方式――合成。
语音合成器会根据一些规则,把一串文字的内容逐字念出来(就跟你念这句话时没
什么两样)。每一种语言都有所不同,因而合成的难易度也不尽相同。
英语是最难合成的语言之一,因为我们以一种奇怪而且似乎不合逻辑的方式来书写
英文。其他一些语言,例如土耳其语,就容易多了。事实上,要合成土耳其语非常容易,
因为基马尔在1929年把土耳其语从使用阿拉伯字母改为使用拉丁字母,这样转换的结果,
使声音和字母之间形成了一一对应,每个字母都发音:没有不发音的字母或令人困惑的
复合元音;因此,在单字的层次上,土耳其语简直令电脑语音合成器的美梦成真。
即使机器能够发出每一个和任何一个单字的音,还有别的问题。把合成的字音集合
起来,在词组或句子的层次上,加上整体的节奏和语气,是非常困难的事情。然而这样
做非常重要,不仅能让电脑说的话好听,而且还能根据说话的内容和意图表现出不同的
色彩、表情和语调。否则,电脑发出来的声音就好像醉酒的瑞典人在喃喃自语一样单调
得让人倒胃口。
我们现在开始看到(听到)有些系统正把语音合成和声音存储两种方式结合在一起,
随着数字化越来越普遍,最终的解决方案将是两者合一。小型化的趋势
在下一个千年里,我们会发现我们和机器说的话,与我们和人类说的话一样多,或
甚至比跟人类说的话还要多。和没有生命的物体说话时,人们最感困扰的似乎是自我意
识问题。我们跟狗和金丝雀讲话的时候,觉得非常自在,但是和门把手或灯柱说话,就
会觉得怪怪的(除非你烂醉如泥)。难道我和烤箱说话的时候会不觉得傻乎乎吗?大概
跟对着电话应答机讲话半斤八两吧。
小型化(miniaturization)的趋势将使今天的语音输入比过去更遍及于每一个角落。
电脑正变得越来越小,昨天还占据了整个房间的电脑设备,今天已出现在你的桌面上,
明天你更可以把袖珍型电脑戴在手腕上。
许多桌上型电脑用户都不能充分认识过去10年来电脑体积的缩小幅度,原因是电脑
体积的变化包含不同的方面,例如键盘的尺寸仍然尽可能保持不变,而显示器反而变大
了。因此,今天桌上型电脑的整体大小仍和15年前的苹果型机不相上下。
如果你已有很长时间未曾使用调制解调器,调制解调器大小的变化更足以说明真正
的变化有多大。不到15年以前,一个速率1200波特的调制解调器(价格约1000美元)几
乎像一个侧躺的烤箱一样大。当时,速率9600波特的调制解调器就像一个放在架子上的
大铁笼子一样。然而到了今天,你可以在一块智能卡上找到速率为19200波特的调制解调
器。即使已经把调制解调器做成倍用卡般大小,我们仍然有许多空间没有好好利用,现
在的设计有相当部分纯粹是为了外型的缘故(为了填满插口,或是大得让我们能握住,
而不会随便弄丢)。我们所以没有把像调制解调器这样的东西装在“大头针头”上,主
要不是技术上的原因,而是因为我们很容易把大头针随手乱放,再找起来很困难。
一旦挣脱了手指张开幅度的束缚(手指张开的幅度决定了一个舒适合用的键盘的形
状和大小),电脑的大小就会更多地受到衣兜、钱夹、手表、圆珠笔和其他类似物品的
体积的影响。在这种种形式中,信用卡很接近我们想要的最小尺寸,显示器很小,因此
图形用户界面变得没有多少意义了。
笔形的系统很可能被视为笨拙的过渡期工具,既太大,又太小。按钮式的设计也不
理想。看看你的电视机和录像机遥控器,你就会明白按钮的局限所在:按钮式装置完全
是为手指纤细、眼力极佳的年轻人设计的。
由于以上种种原因,小型化的趋势必然会推动语音制造和语音识别技术的提高,并
促使语音识别成为附在小型物体上的电脑的占支配地位的人机界面。实际的语音识别系
统不需要一定装在袖扣和表链中。小型装备可以通过通信而提供帮助。关键在于,小型

当前:第31/51页

提示: 双击屏幕进入下一页