返回

第十四章 突破!新输入法神器

首页
关灯
护眼
字:
上一页 回目录 下一页 进书架
    第十四章 突破!新输入法神器 (第2/3页)



    声音采样越广泛识别准确率越高,而语音样本库越庞大,用于搜索匹配的时间就会越久导致反应时间的延长,因此语音样本的抽样压缩和语音搜索匹配算法一直是克里优化的俩个重点。

    克里一直在不停地模拟改进提取语音语义特征值的算法,通过不断压缩冗余值,在保持不失真的情况下持续不断缩小语音样本语料库大小,另外一方面也不断改进对语音语料库智能搜索匹配算法。

    优化算法杜克帮不了什么忙,但是收集尽可能多的语音样本杜克却没有问题,所以杜克的每一天都过着一种非常充实的生活,日复一日地搜索下载不同类型的语音样本供克里分析提炼,同时不断去学习理解克里所创造的这些全新的处理算法,要敲开麻省理工的大门。

    杜克必须要有一篇体现自己能力的世界领先水准的语音识别基础理论创新性论文,可是在克里的知识库中并没有现成的语音识别知识,这些对于克里来说太老旧了,老旧到比莱姆都没有为克里增加这些知识。

    而克里现在做的就是在地球上现有语音识别理论和算法基础上,利用他强悍到无边的模拟能力,不断地模拟各种不同的语音处理算法。

    通过模拟来找到一种更加有效的--这种方法虽然有些笨拙,但是有了克里超强的运算能力,毕竟每秒钟成千上万种可能算法都可以模拟,使得这种笨拙的方法也有相当的效果,找出了好几种可能的优化算法,将识别率和反应时间提升到了一个新的高度。

    可是要将这些成果用地球人能够理解的语言和理论写出来,还要让人能够看懂,不管是对克里还是杜克来说都是一个新挑战,因为克里不是以01为核心的机械二进制思维模式,而是生物多态思维模式。

    尽管克里现在已经能够瞬间同时模拟出地球上常见十多种不同性能PC机虚拟机--为了让克里能够准确了解地球上电脑的运算能力,杜克买了四台不同接口的主机和接近二十块市面主流PC机CPU提供给克里分析和测试性能基准,然后克里根据这些配置的性能来进行虚拟对应的模拟器。

    可是这些特殊的虚拟机由于不需要让人理解,所以克里完全可以按照自己的运算方式来创造,因此性能虽然相当,但是实现模式却大相径庭,比起地球上RISC和CISC俩种不同架构的CPU来说,复杂程度都不是一个数量级的。

    因此在克里完成了按照他自己模式实现的算法后,还要按照地球上01规则来重新实现,这个对于克里来说确实是一种巨大的挑战了,更别说论文还要在此基础上再次抽象,不光要有软件实现算法,还要建立起以地球数学基础能够证明的数学模型。

    因此克里几乎二十四小时不间断地不断运转着,最终模拟算法能够在最低基准上面实现1秒内达到97%识别率,而在双核2G主频电脑上实现1秒内99%以上识别率之后,足足又用了俩个周的时间。

    在杜克看完十几本数学专著,下载研究了好几个开源语音识别软件的基础上,克里才完成了语音识别新算法的论文和协助杜克开发完成一个在地球电脑上运行的语音识别软件。而这个语音识别软件的第一个应用就是包装成为一种语音输入法。

    海角论坛。完成语音识别软件和论文写作俩个任务,杜克现在是一身的轻松。

    他注册换了

    (本章未完,请点击下一页继续阅读)
上一页 回目录 下一页 存书签