软件说明
起点R3企业级搜索引擎经过多年的行业应用和演变,具备四大核心竞争优势:企业级安全(灵活可扩展的用户体系、基于角色的访问控制、文档级/记录级的权限级别),更高的准确 性和智能化(概念检索、基于统计的中文语言处理、主题抽取算法),稳定强大全文检索功能(优异的性能、T级数据支撑能力、亚秒级响应速度,7*24全年稳 定运行),低成本高灵活度的按需定制(强大的接口扩展能力、集群、分布式按需扩展) 起点ESP R3专注于为企业提供一套完整的企业搜索平台,包括企业内容采集、内容存储、文档管理、语言处理、安全管理、统一检索门户、应用开发平台等。 功能特性 结果加以整合,在经过消重和排序等操作后,以统一的格式将结果呈现给用户的检索。R3更能够为不同用户提供不同的界面展现方式,即满足通用检索需求,又能够实现个性化需要。 语言处理:中文分词是企业搜索必须具备的技术之一,应用中文分词技术才能使搜索结果更加符合用户习惯,更加接近用户的期望结果,起点R3企业级搜索引擎产品集成了中文分词技术,并有着100万词库的支持,用户也可以根据自己的需要和行业特色来添加和维护词库。中文分词技术的准确率达到96%以上。 安全系统:实现了各类文档、资料、数据等信息的访问安全,起点R3企业级搜索引擎产品采用独创的分级安全体系来保障不同安全级别的信息必须经过授权才能够访问;通过对检索结果进行文档级安全和集合级安全的分类来实现授权体系的灵活与强大功能。R3更能够与绝大部分业务系统的用户体系整合,并可以继承原有的权限系统,支持LDAP、数据库、Domino等。 内容存储:实现各类文档、资料、数据等信息的分布式存储,R3是能够更大限度地提高部署灵活性和可扩展性,所有的元数据和全文索引分别存储在不同的单元上。R3支持主流数据库平台、操作系统、浏览器、门户、应用程序服务器和开发标准,从而提供了一个不受供应商限制的体系结构。 这一灵活性可保护您在现有 IT 基础架构中的投资, 进而可降低总体拥有成本。 文档管理:超过50种文档类型的支持,通过将文档元数据和索引信息进行分开存储实现了强大的元数据管理功能,辅以基于文档安全级别的控制体系,对文档的整个生命周期进行全面管理。R3能够通过创新的回溯功能查看文档的历史版本,严格的法规遵从策略,全面提升企业文档到知识的转换能力。 内容采集:除了支持所有主流数据库和文件系统的采集以外,起点R3企业级搜索引擎产品还支持内容仓库的采集,支持Domino、Documentum等企业内容管理中的数据,R3能够针对指定文件所在目录进行高效检索,并内置文件解析器,可对PDF、OFFICE、HTML、TXT、音频、视频等多种文件格式自动解析。同时根据需要R3能够定制从其它各类数据源获取要检索的数据内容,例如:XML文件、其它数据池等等。即使在同一个应用中,也可以通过配置同时从多个数据源获取数据并提供检索服务。 应用开发平台:R3是一个完整的企业搜索平台,能够完成企业内容整合过程的绝大部分功能,将功能强大的R3作为整个解决方案的应用基础,充分利用其底层应用功能,并封装为更易于使用的服务来提高应用开发的效率,更好地满足不断变化的业务需求。 产品特点 支持所有主流数据库 支持Oracle、IBM DB2、SQL Server、Sybase、Informix、MySQL等所有主流数据库,并能够支持每种数据库系统的多个不同主流版本。 支持数据库字段内容的全文检索 能够自动对数据库中中大对象字段中存贮的格式化文档,如Word、PowerPoint、Excel、PDF等文件进行全文检索,并支持超过50种类文档格式。 产品化程度高,成熟稳定 几乎所有功能都可以通过WEB可视化管理,产品化程度全面超越同行业其他产品 产品架构灵活,开放程度 灵活强大的插件扩展体系,支持十几种功能扩展类型,产品继承开源软件Solr的全部特性,开放程度高 使用和维护简单 可视化的管理与配置工具使系统简单易用,轻松实现信息管理。 运行环境
硬件 | 512MB以上内存 |
操作系统 | Microsoft Windows NT 4.0(SP3以上) 或 Windows 2000/2003/2008 Linux/Unix AIX |
CPU | 2GHz或以上 |
硬盘 | 50G以上 |
功能列表
编号 |
名称 |
功能说明 |
R3-F01-0 | 内容采集 | 实现企业环境中的各种数据源的数据采集功能 |
R3-F01-1 | 本地文件采集 | 对本地文件系统中的文件进行采集和文本处理 |
R3- F01-2 | 网络文件采集 | 对网络环境中的文件系统进行采集和文本处理 |
R3-F01-3 | FTP采集 | 扩展网络采集类型,支持对FTP环境存储的文件进行采集和文本处理 |
R3-F01-4 | POP3采集 | 扩展网络采集类型,能够对支持POP3协议的邮件系统中的邮件进行采集,支持SSL方式的链接协议 |
R3-F01-5 | Domino采集 | 采集BM Domino系统中的内容 |
R3-F01-6 | Documentum采集 | 采集EMC Documentum系统中的内容 |
R3-F01-7 | Mysql采集 | 采集Mysql数据,支持按主键采集和按更新时间戳采集,自动采集,支持任务调度模式。 |
R3-F01-8 | Oracle采集 | 采集ORACLE数据,支持按主键采集和按更新时间戳采集,支持ORACLE的各个版本,自动采集,支持任务调度模式。 |
R3-F01-9 | SQL Server采集 | 采集SQL Server数据,支持按主键采集和按更新时间戳采集,自动采集,支持任务调度模式。 |
R3-F01-10 | DB2采集 | 采集DB2数据,支持按主键采集和按更新时间戳采集,自动采集,支持任务调度模式。 |
R3-F02 | 内容检索 | |
R3-F02-1 | 关键词检索 | 标准的关键词检索功能,支持任意字段的检索,支持日期和数字类型的关键词检索,支持范围检索 |
R3-F02-2 | 全文搜索 | 企业内容的全文检索,支持千万级的数据量,简单检索响应时间为亚秒级,海量数据,瞬间展现 |
R3-F02-3 | 检索统计 | 检索结果分组统计,支持多种数据类型的分组统计功能,无数据量限制。 |
R3-F02-4 | 分类检索 | 人工堆数据内容分类,检索能够在分类下进行,能够对分类授权。只有具有分类授权访问的用户才能够使用分类检索功能 |
R3-F02-5 | 检索安全分级 | 严格控制检索结果记录的安全性,默认分为5个级别,第五级为最低级别,所有用户都可以访问,最高位第一级,只有用户的安全级别为第一级采集可以访问。 |
R3-F02-6 | 检索过滤 | 安全访问功能,检索结果能够被授权用户访问,通过与第三方用户体系和角色系统集成,实现信息的访问安全 |
R3-F02-7 | 检索结果反显 | 检索结果按用户自定义方式进行反显 |
R3-F02-8 | 任意字段排序 | 检索结果排序功能,支持任意数据类型 |
R3-F02-9 | 日期分组统计 | 检索结果按照日期进行分组统计,例如:年度分组统计 |
R3-F02-10 | 数字分组统计 | 检索结果按照数字范围进行分组统计,例如:年龄段分组统计 |
R3-F02-11 | 主题分组统计 | 检索结果按照主题进行分组统计,例如:公司新闻消息中关于市场推广活动的统计 |
R3-F02-12 | 跨库检索 | 支持对异构数据系统的统一检索,例如:对万方、维普等第三方检索系统的异构数据集成 |
R3-F02-13 | 分布式检索 | 支撑海量数据,能够通过多级分布方式提升系统的数据处理能力,能够以低成本的方式按需扩展系统 |
R3-F02-14 | 个性化搜索 | R3独有的功能,不同用户或不同角色可以定义不同的检索结果展现方式。 |
R3-F02-15 | 快速预览 | 快速预览检索结果,即快照功能 |
R3-F02-16 | 授权原文下载 | 获得授权的用户,能够对原文进行下载 |
R3-F03 | 系统管理 | |
R3-F03-1 | 角色管理 | 系统登录用户角色管理,也可以和外部系统整合作为映射参数 |
R3-F03-2 | 用户管理 | 系统用户管理 |
R3-F03-3 | 用户级别管理 | 系统安全级别,用户安全级别,系统信息访问分级参数 |
R3-F03-4 | 用户界面定义 | 自定义用户检索前台,系统支持不同用户访问不同前台检索界面 |
R3-F03-5 | 角色界面定义 | 为角色定义安全级别、默认角色使用的检索界面 |
R3-F03-6 | 采集策略定义 | 定义采集线程数、采集内存使用量、内存使用总量等参数 |
R3-F03-7 | 系统邮件设置 | 系统发送邮件时使用的SMTP账号、密码、发件人邮件地址等信息 |
R3-F04 | 核心扩展 | |
R3-F04-1 | 检索模板定义 | |
R3-F04-2 | 文档格式定义 | |
R3-F04-3 | 元数据定义 | |
R3-F04-5 | 语言处理接口 | |
R3-F04-7 | 数据库驱动 | |
R3-F04-8 | 数据采集器 | |
R3-F04-9 | 语言分析 | |
R3-F04-10 | 文件解析 | |
R3-F04-11 | 数据处理 | |
R3-F04-12 | 文本处理 | |
R3-F04-13 | 身份验证 |