本软件是一个免费、义务服务的绿色软件,设计的目的是减轻研究者的劳动量。
软件06年投入使用,07年获得国家版权,是一个完全免费使用的绿色软件。经过近五年的反复修改,目前已经发展到3.9.5版本,软件从3.9.4版本后,为方便研究者,取消了原来的注册模块。软件全面支unicode,3.7版本增强了规模处理真实文本的能力,可以对目录下文件夹及子文件夹内所有txt文本进行穷尽式的读取,可以对上亿的语料进行处理,并且进行了一系列的优化与修改。可以用目前使用本软件的主要人群为高校教师、在读博士和硕士生。
软件曾经获得广西民族大学研究生科研创新、广西民族大学文学院研究生一级创新项目经费资助。
软件的主要功能:
1、检索含有某个关键词语的句子,同时可按关键词语左右1-6位排序。
2、成批检索含有多个关键词语的句子。
3、智能检索含有关联词语的句子,如:不但…而且之类。
4、智能识别多种形式的重叠形式,并且把含有重叠形式的句子检索出来。
5、正则表达式检索,替换。
6、对汉语或者类似于汉语的语料进行字频统计,对英语或者类似于英语的语料进行词频统计,本软件已经用汉语、藏文等等进行测试,均获得成功。
7、对标注词性的语料(北大标准,二级标准)可以进行词频统计,可以检索多种形式的搭配,比如:动词+名词。
8、对英语或都类似于英语的语料进行检索。本软件已经用越南语和泰语进行测试,都能正常检索。
9、对多语平行语料检索,可以检索一对一、一对多的平行语料。
10、此外还有其它的一些功能,比如编辑文本,分割文本等等。