软件说明
- 每天自动将新发布的网页内容增加到全文索引数据库中,每个访问网站的用户可以在第一时间内检索到您发布到网站的信息。
- 将您单位有价值的信息在Internet/Intranet网上发布。
- 您单位或个人的站点信息较多,可方便上网查找所需信息者进行站内检索。
- 如果您是Internet内容供应商(ICP),可为您的用户提供更方便的信息查询手段。
- 如果您是Internet服务提供商(ISP),可帮助您为用户提供更完美的服务,以增强您的竞争力。WebSearch全文检索系统组成模块
- 全文数据库服务器 核心技术为中英文全文检索,以卓越的性能和多种强大的功能为各种格式文档的存储、管理和检索提供原动力。
- 站点检索工具 为Web站点提供该站点网页的全文检索功能,由Web模块和全文数据库服务器组成。Web模块为最终用户的使用提供简单易用的操作界面。可自动定期搜索网站,自动根据网站内容更新索引。
- 网页抓取工具 可通过”智能机器人”从互联网上成批或有选择的收集用户感兴趣的信息,能够抓取文本、图像、多媒体文件和各种格式化文档。拥有灵活的抓取控制策略,如控制抓取层次等。高效率和高可靠性的抓取,能跳过无效链接。自动化程度高,能自动启动Spider搜索功能的时间,以及重复搜索的时间间隔。操作非常简单便捷。
- 与WebBuilder内容管理和发布系统的集成 可方便地按各种设置将数据库中的数据自动生成HTML文件,加载到Web服务器上,并可按设定的时间每天自动进行,不需人工干预。可自动根据数据库字段的取值生成导航页面和相关静态网页。为构造电子化媒体网站而专门设计,主要完成网上特定站点信息的采集和整理,分为数据采集和数据加工两部分。所有的操作可以通过浏览器完成。根据用户的分类标准把用户的资料按层次分门别类地组织在一起,生成静态索引页面,便于用户按目录浏览的方式定位所需信息。
- 搜索引擎构造工具 由GetSite网页抓取模块、可以与WebBuilder内容管理和发布系统进行集成,与全文数据库服务器等集成。该工具可以为门户网站定制他们特有的专业搜索引擎或通用搜索引擎。 WebSearch全文检索系统突出特点
- 查询速度快 基于全文检索技术检索网页的信息,比传统的数据库检索技术和直接检索网页的内容要快,降低了对检索服务器的硬件要求并提高了响应速度。
- 智能化高查准率、查全率 实现了以自然语言处理技术为核心内容的智能中文分词技术,能够满足查全率和查准率的要求。
- 查询手段丰富 支持各种逻辑运算(如AND、OR、NOT等),支持西文检索和中西文混合检索、词频运算和按时间或相关性(重要性)排序,等等。
- 新网页自动入库 由WebBuilder系统生成的网页将自动进入全文索引数据库,无需用户进行任何干预。
- 多平台支持 支持多种硬件平台(如小型机、工作站、服务器、PC机等)和多种操作系统(如Linux、Sun Solaris、Windows /NT/2000等)。
- 多语言支持 支持简体中文(GB2312、GBK)、繁体中文(BIG5)、英文和Unicode,并能够在不同的编码之间转换。
- 高开放性 可透明地连接Oracle、SQL Server、DB2、Informix、Sybase等主流的关系数据库管理系统。
- 其它优秀特点 如简便的安装、便捷的用户管理,等等。