数据库管理系统存储的一般都是结构化数据,长足于数值的计算、查询、统计与挖掘。随着计算机存储与计算能力的迅猛发展,越来越多的非结构化文本数据存储在数据库中,数据库中的文本搜索日益广泛。
当前,数据库中的文本搜索,一般采用SQL语句中的Like操作符或者采用数据库系统自带的全文索引功能。Like操作往往特别耗时,数据规模超过10万条,查询往往会导致网络连接超时,无法满足在线搜索的需要;同时,Like查询仅仅是简单的字符串匹配,没有考虑语言语义,检索“和服”,同样会命中“产品和服务”。当前,数据库内置的全文索引功能,速度和效果同样存在类似缺陷。因此,在数据库系统基础上,需要对非结构化文本字段构建智能的搜索引擎。
DBTSearch全文搜索引擎是一套专门针对数据库的全文智能搜索引擎系统,可以无缝地与现有数据库系统融合,实现全文搜索与相关的数据库管理应用系统。
DBTSearch主要特色:
* DBTSearch兼容当前所有厂商的数据库系统,其中SQL Server, Oracle, MySQL,DB2等;
* DBTSearch可以按照任意指定字段的排序,支持指定字段的搜索,也可以搜索多个字段,以及复杂表达式的综合搜索;
* DBTSearch支持精确匹配以及模糊匹配,默认为精确匹配,忽略字母大小写进行模糊匹配;
* DBTSearch提供Windows,Linux的C和JNI接口;
* DBTSearch实现的是多线程搜索服务;
* DBTSearch每秒可索引3000条记录(主要瓶颈为数据库记录读取效率);搜索速度在毫秒级别。
* DBTSearch支持增量更新。