简繁智能转换

汉字简繁文本智能转换系统 官方博客
汉字简繁文本智能转换系统提供了字、词、术语、标点等不同层次的转换功能,以及网页转换服务,转换准确率高于国内外同类产品。
厦门大学自然语言处理实验室出品

单机版使用说明

点击下载本说明文档的pdf版本

本系统向用户提供了单机版简繁汉字转换工具。该工具无需安装,可直接在Windows命令行界面下运行。

下载地址http://jf.cloudtranslation.cc/cmd.rar

注意:由于简繁汉字转换系统需要大规模语言模型,因此本工具要求在64位操作系统下运行(建议采用Microsoft Windows7 x64 或 Microsoft Windows Server 2008 R2 x64),而且机器必须装有8G以上内存。

1. 运行

打开windows命令提示符,切换到单机版简繁汉字转换工具所在目录,输入jf,根据相关提示,进一步设置相关参数,即可使用简繁汉字智能转换系统的全部功能(如图1所示)。

 图1

2. 命令行模式

工具中提供了命令行模式供用户使用,目前仅支持简转繁。具体操作方法:

(1)输入jf -lm lm_s2t.txt -c进入命令行模式(如图2所示,其中lm_s2t.txt为语言模型文件;由于语言模型规模较大,加载需要等待几分钟时间)。

 图2

(2)在命令行模式下,输入h可查看使用提示(如图2所示)。

(3)在命令行模式下,输入简体文本,命令行界面返回转换后的繁体文本(如图2所示)。

3. 文件转换

工具中提供了文件转换功能供用户使用,支持简转繁和繁转简。具体操作方法:

(1)文件简转繁:输入jf -jf file1.txt file2.txt -lm lm_s2t.txt(其中file1.txt为简体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2t.txt为语言模型文件)。

(2)文件繁转简:输入jf -fj file1.txt file2.txt -lm lm_s2t.txt(其中file1.txt为繁体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2t.txt为语言模型文件)。

4. 面向古籍的简繁转换

工具中提供了面向古籍的简繁转换功能供用户使用。与普通转换(面向台湾的简繁转换)使用方法相似,只需在命令中带上选项-ac。具体操作方法:

(1)命令行模式:输入jf -lm lm_s2a.txt -c -ac进入面向古汉语的命令行模式(如图3所示,其中lm_s2a.txt为古汉语语言模型文件;由于语言模型规模较大,加载需要等待几分钟时间)。

 图3

(2)文件简转繁:输入jf -jf file1.txt file2.txt -lm lm_s2a.txt(其中file1.txt为简体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2a.txt为古汉语语言模型文件)。

(3)文件繁转简:输入jf -fj file1.txt file2.txt -lm lm_s2a.txt(其中file1.txt为繁体原文文件,file2.txt为输出转换结果的目标文件名,lm_s2a.txt为古汉语语言模型文件)。

5. 评测功能

本工具提供了对简繁转换结果进行评测的功能,具体操作方法如下:

(1)按前文第2节介绍的方式进入命令行模式。

(2)在命令行模式下,输入diff gold.txt test.txt diff.html即可进行评测(如图4所示),其中gold.txt为标准答案,test.txt为待评价的转换结果,diff.html为指定的对比结果输出文件。

 图4

(3)用浏览器打开diff.html,即可查看系统输出的对比结果(如图5所示),点击页面上方的链接“跳到与原文不一致的字表”,自动定位到页面下方的统计结果(如图6所示)。

 图5

 图6


评论

热度(1)