在英语里,/p/在pair和span中的发音就是不一样的,前者带有轻微的吐气,后者则不送气。
汉语里也有类似的例子。同样是简简单单的“一”,在“一律”“一块”中“一”全部由本调阴平变为阳平调,而“一番”“一端”中的“一”则遵循着“阴平字前变去声”的规律。
还有些差别极其细微,比如同样是/i:/音,在lead和leave中的音长也会有厘秒级的差异。所以,目前还没有任何机器或是模型可以代替人类对自然语言进行精确判定。
不过,字词句的组合几乎是无穷无尽的,为了提高效率、减轻杨渊的工作量,孙女士他们想出了另一个办法。
她和她的同事招募了一些青年下颌关节紊乱综合征患者,在征得同意后,为他们提供随身携带的录音设备。这些小玩意儿可以对患者每天的说话进行长达一个月的追踪记录。记录回收之后,超级计算机将提取发音单位的出现频率,并与未患病的人进行对比。这样,孙女士的团队就可以提取出患者的语言中平时比常人更频繁出现的发音组合,从而有针对性地进行下颌关节磨损测试。
这项工作从立项到实施,已经进行了很多年。
“期间因为发生了一场事故,停了一段时间,”杨渊说,“不过现在一切都很顺利。”