logo
首页 > 本期精彩 > 科技大世界 > 你愿意和机器交谈吗

你愿意和机器交谈吗

作者: 张 虎浏览: 时间: 2016-05-31


  如今,世界上已经充满了各种各样的合成语音。例如,当你拨打电话没法接通的时候,电话里会出现一种人工合成语音:“你拨打的电话暂时无法接通。”人们在对电子合成语音的新鲜感消失之后,越来越多的人不愿意被机器指挥着做这做那。然而,如果没有合成语音的出现,人们可能会有更多烦恼。我们之所以不喜欢合成语音,是因为我们已经习惯了回应自然的声音。因此,研究人员正在致力于合成一种更加真实的人声。


用机器直接合成人声


  长期以来,不少研究人员对合成人类语音的研究具有浓厚的兴趣。早在18世纪80年代,匈牙利发明家沃尔夫冈·卡姆帕兰成功地发明了能够说出词组和简短句子的“说话机器”。在19世纪末,当美国发明家贝尔还是一个十几岁孩子的时候,他就把一个人造的喉咙安装在狗的脖子上,试图将它连续不断的叫声转变为词语。在20世纪,将电波重新转化为原来的声音已经成为可能。1939年,贝尔实验室的荷马·达德利公布了语音合成仪,这种仪器能够通过控制电流来模拟出一种生硬的人类语音。


  1978年,美国德克萨斯仪器厂推出了它们的新产品———一种“拼读单词”的玩具。人们利用键盘将单词输入这种玩具后,玩具就能发音读出单词。1979年,美国麻省理工学院的拼音合成专家丹尼斯·兰发明了一种名为“完美的保罗”的合成语音技术。不久之后,丹尼斯又推出了一种更为沉稳的男性合成语音,并取名叫“巨人哈里”。


  1985年,英国著名的理论物理学家史蒂芬·霍金因为疾病不能发出声音,他使用了“完美的保罗”语音合成器后感觉良好。这让丹尼斯的合成语音技术名噪一时。


用机器组合人声


  在20世纪90年代初,语音合成的研究者们放弃了试图用机器直接合成人类声音的方法,取而代之的是利用真实人声进行组合的合成方法。这种被称为“连接合成”的方法是利用整段的真人发音,然后将它分割成小部分的单元声音或音素,之后再将它们重新组合成新的词语或句子。但是,美国斯坦福大学加州分校通信学院的克里福德·纳斯在他所著的《语音电信》一书中写道:“尽管我们在声音处理方面有了很大的进步,但即使是最好的人工合成语音也会缺乏令人信服的情感。而这正是我们觉得人工合成语音让人厌烦的原因。”


合成更加人性化的语音


  纳斯的研究小组发现,那些参加实验的志愿者更加喜欢与他们性别相一致的人工合成语音。研究人员还发现,如果一个人工合成语音要以“销售员”的身份让别人更加信任的话,他的“人性化特征”比它所说的内容更加重要。研究人员利用两种合成语音在网上拍卖古董,其中一种为“开朗的合成语音”,另外一种为“内向的合成语音”。两个拍卖组还采用了不同的说话方式,“开朗的合成语音”拍卖组的推销内容比较长,并且丰富多彩,在表现出热心的同时还不断地说:“我相信你会喜欢它的。”而“内向的合成语音”拍卖组的推销内容相对比较短,并且实实在在地将拍卖物品的基本特征描述出来。对于这个试验,研究者们发现不论对销售物品的描述情况如何,性格外向的购买者们总是偏好于“开朗的合成语音”拍卖组的拍卖物品,而性格相对内向的购买者们则喜欢“内向的合成语音”拍卖组的拍卖物品。


  接着,纳斯和他的同事们又有了一个新的发现,人们对自己车内的数码声音的反应会直接影响到驾驶者的安全问题,车内数码声设置的正确与否能够带来的安全效应比提高车内安全的基础设施带来的安全效应要高得多。德国的宝马汽车公司于2001年在一些新车中配备了卫星定位系统,但是购买这系列的车的人们对这款车的评价非常不好,使得宝马公司不得不召回这些产品。纳斯应邀参与了这套系统的修正工作,他说:“我发现不喜欢这个系统的顾客主要是男性,因为大部分男性车主对全球定位系统使用的女性声音采取怀疑的态度,他们觉得这个声音听起来非常不舒服,并且不值得信任。”宝马汽车公司进行了广泛的市场调查,最终一款名为“飞行员助手”的人工语音合成系统让车主感到满意。这款语音系统发出的声音显得非常权威,说话语气不仅友善而且充满了自信,语速比一般人说话稍快些,更加深沉。新语音系统从来不会对驾驶员说“我”这个令人反感的单词,从而让车主有了真正当主人的感觉。


  在测试人工合成语音的过程中,任何一种被人们认为理想的合成语音系统都要能够察觉出人们的心情,并且相应地选择一种适合用户的个性化的声音。为此,研究人员正在着重研究开发一种心情探测软件。在研究机器人的过程中,要让机器人像人类那样说话,极为重要的一步就是开发出更加人性化的语音合成技术。纳斯相信,总有一天我们会厌倦与那些工作效率低下,喜怒无常的人去交流,转而喜欢与那些能发出电子合成语音且更加善解人意的机器人进行交谈。


《科学画报》2015.12   
关键词: