Linux语音识别软件(转)

目前,市面上出现了多种支持不同操作系统的语音识别控制软件。Linux上的语音识别软件与其它语音识别软件一样,第一次安装的并不能对用户的声音识别得十分准确。使用语音库来识别命令和常规文字。语音命令的识别转换过程从第4行语句开始。语音识别的发展虽然语音识别软件对于大多数命令和一般的文本都可以正确地识别,但是在某些情况下,即使是一个微小的错误也是不允许。...

Linux 语音识别软件()[@more@] 长期以来,与计算机对话一直是科幻小说中熟悉的故事情节,直到今天,真正的对话只有在小说中才有可能。但在过去十年中,语音识别软件 发展非常迅速。目前市面上有多种支持不同操作系统的语音识别控件软件。或许很多人没有意识到 Linux 桌面也是完全语音控制的,软件开发者已经取得了一些成果。下面我们将对Linux系统下的语音识别软件进行分析总结,帮助大家了解其优缺点。

Linux 上的语音识别软件

Linux软件 下的语音控制可以为因过度使用计算机而导致残障或计算机综合症的人提供机会。以前,他们必须修改其他操作系统以支持语音识别技术。即使没有特殊考虑,普通人也可以使用语音识别软件,让操作电脑变得更轻松、更有趣。虽然本文非常关注语音识别系统的未来(因为它们并没有完全解放双手),但它们确实分享了一些工作。

已经有两个包 软件 包含 Linux 的语音控制软件。一种是IBM开发的,支持Linux,可以提供一些基本的语音识别功能;另一个在 GPL 下,通过库为桌面系统和应用程序提供语音控制功能。

IBM 的 Linux 在美国可用,目前仅在美国和加拿大可用。它的成本约为 40 美元,包括运费和一副耳机。用户也可以从IBM 的网站下载,享受一定的价格优惠。8.0 和 . 目前,支持英国英语和美国英语、法语和德语。8.0 之后的版本将不再包括在内。本文将重点介绍 IBM 的安装和使用。

应用

Linux需要机器的配置:MMX 233以上CPU,128MB内存,16位声卡。事实上,它是专门为 Red Hat 6.2 设计开发的,但用户可以在 Red Hat 7.3 环境和其他 Linux 发行版中正常运行。当然,用户在安装过程中也可能会遇到一些问题。

在安装语音识别软件之前,必须先安装Java运行环境。版本 1.0 和 1.1 在 JRE-1.2.2 环境中进行了测试。使用正确的版本可以避免不同 JRE 环境之间的不兼容。

JRE安装完成后,将安装盘放入光驱,运行根目录下的文件,然后运行设置自己为用户,并设置合适的音量。最后,反复练习使 软件 适应你自己的声音。请记住,安装顺序绝不能颠倒。

“辅导”

和其他语音识别软件一样,第一次安装在识别用户声音时不是很准确。用户必须“收听”它才能识别用户的声音。

“收听”的一种方法是一遍又一遍地大声朗读用户手册中的文字。对于大多数用户来说,这并不难,但是手册中的单词可能不会被用户频繁使用,所以这种方法效率不高。

更好的方法是在工作中使用 app软件。它是用 Java 语言编写的。当用户口述时,某些单词可能无法正确识别,发生这种情况时,用户可以使用 . 这允许修改识别工具以更准确地识别用户的声音。这种方法可能更加劳动密集,但可以使用语音命令进行类似的修改。但是,请注意随时保存,因为它不是很稳定。

一位专家曾表示,目前的语音识别软件只需要10到60个小时的“训练”就可以达到98%的准确率。但到目前为止,在Linux环境下测试的结果是,它的正确率只有92%到95%,绝大多数语音指令都能被正确识别。即使用户只花几个小时练习,他们也能发现正确率显着提高。但是,用户要特别注意单词的发音,麦克风的质量和周围环境都会影响语音识别的准确性。

控制 Linux 桌面

当用户完成安装并经过一段时间的培训后,就可以安装了。它的作用是控制桌面系统和应用程序软件。没有这些功能。用户可以到下载软件,注意一定要提前安装好RPM,因为源程序需要Linux SDK中的中断运行。

安装完成后,在最后出现的窗口中输入m,注意不要运行。此时,用户可以通过口述命令“下一个窗口”来进行简单的测试,另一个窗口应该出现在桌面上。

允许用户预先配置某些操作的口头命令。一组口语命令称为语法组。语法组可以与应用程序中的特定应用程序、窗口或模块相关联,也可以由上下文生成。语音命令调用的动作可以包括击键、鼠标事件、运行外部命令或三者的任意组合。

使用语音库来识别命令和常规文本。.xml 配置文件可以定义命令。使用标准配置文件,其位置为 /usr/share//.xml。当然,用户也可以修改它的位置,比如可以改成~/./.xml。

该窗口显示哪个命令语法处于活动状态,并包括一个显示最近说出的命令的面板。如果用户说出的某些单词被认为与命令过于相似而无法识别,则面板中显示的命令将显示为灰色以提醒用户,并且该命令不会被执行。

对于任何应用程序窗口,都有 4 种不同的状态。在命令模式下,只识别命令;在听写模式下,不识别特定的应用命令,只显示能识别的单词;在空闲模式下,只能识别通用命令;最后,在命令之间和听写模式下,口语单词和命令都可以识别,用户需要在命令前后停顿语音识别转换文字软件mac,以与文本区分开来。

命令模式在用户第一次运行应用程序时自动启动。如果用户要同时开启听写模式,只需说出“听写模式”即可;如果他想关闭听写模式,他只需要说“停止听写模式”就可以了。

文字转换语音软件app_科大讯飞50 文字转换语音软件_语音识别转换文字软件mac

当然,最好的方法是将窗口放在系统的窗口管理器中,这样您就可以随时看到它是如何工作的。如果您希望它在启动时自动运行,只需将 m 放入窗口管理器的启动例程中。

语音控制应用

让我们看一下如何为应用程序定义语法。首先语音识别转换文字软件mac,将要定义语法的 软件 定义为人类可读的名称,然后将程序的窗口命名为语句,以便可以识别要激活哪个语法命令。在第一行中,您可以看到一个特殊的固定应用程序名称,它不是窗口标题。此特殊应用程序名称必须与上下文一致。

听写属性包含在应用程序的标签中。如果条件为真,则语句第一次运行时,自动进入听写模式。语句的第二行包含一些已经在区域中定义的值。用户可以在定义区定义自己的标签,并将其应用到整个配置文件中。

语句第3行举例说明了定义区域可以包含什么,这里的命令标签只能在该命令的范围内使用。这条线路的主要目的是通过语音命令各自的箭头键来相互连接。执行命令时,系统会将语音命令映射到相应的键盘命令。语音指令的识别和转换过程从句子的第 4 行开始。第 4 到 8 行是键盘操作相关的语句,第 9 到 15 行是鼠标相关的语句,第 16 到 22 行是与其他应用程序相关的命令语句,第 23 行是结束行。

语音识别转换文字软件mac_科大讯飞50 文字转换语音软件_文字转换语音软件app

通过编辑个人配置文件,用户可以自动化几乎所有过去需要键盘和鼠标的操作。许多常见应用程序的语法组 软件 已经包含在默认配置文件中,这使它们成为用户的好例子。

语音识别的发展

无法控制一些特殊应用软件和一些主流游戏软件。对于GIMP和软件等一些是可以控制的,但是由于这样的软件需要大量的鼠标操作,用户会很厌倦用语音来控制鼠标。

虽然语音识别软件 通常可以正确识别大多数命令和文本,但在某些情况下,即使是微小的错误也是不允许的。voice软件 的用户必须保持声音稳定。

另外,虽然可以完成很多工作,但用户无法通过语音控制整个Linux桌面环境。

IBM 已经发布了一个新的,但它只支持 mac 并且未来是否支持 Linux 尚不确定。的开发人员正试图找到一种支持开放系统而不添加新功能的替代方案。

来自“ITPUB博客”,链接:如需转载,请注明出处,否则追究法律责任。

相关文章

发表评论