横瓜全文搜索引擎,是基于Windows平台的全文搜索引擎(不提供网络蜘蛛和网络爬虫),最大容量150万网页。对于150万网页规模的数据,可在30分钟内完成所有架构工作。横瓜全文搜索引擎分词速度约为2500万字/分钟,约占99.984%的关键词检索时间小于0.001秒。横瓜全文搜索引擎的PC硬件配置,仅需要700M内存、空闲硬盘10G、文件系统NTFS。横瓜全文搜索引擎,主要采用横瓜分布式Map数据库技术、分词索引技术、最大左匹配切词技术、倒排技术、MD5摘要信息抽取技术、新词智能识别技术、硬盘整理加速技术、疑似垂直搜索技术、中文海量词典技术、横瓜HTTP检索服务器web-search缓存技术、HTM转换TXT技术等。
安装说明:
1、第一次使用软件前,先执行Setup.exe。程序add.exe、body.exe、title.exe为系统内核,勿动!
2、架构搜索步骤:须依次单击websearch.exe程序中的按钮“”数据清零“”、“”导入记录“”、“”标题分词“”、
“”正文分词“”、“”WWW查询“”。
3、数据清零。建立新的搜索之前,须单击“”数据清零“”按钮来清除旧数据和旧索引。
4、websearch.exe可管理记录、索引、分词等,若要执行HTTP检索查询服务,websearch.exe须挂机。
5、数据导入。在web目录下,有Access格式的输入接口文件web.mdb(字段id取值越小排名越靠前)。
将待处理数据输入到web.mdb后,单击“”导入记录“”按钮,web.mdb中的记录被导入到web.dat。在检
索时直接从web.dat取记录,web.mdb仅起接口作用,导入完成后可自愿删留。对于增量记录,可允许
从web.mdb中多次导入新记录,但新增量的记录,检索排名靠...