< 返回
bi与搜索技术的融合趋势与技术问题分析(下)

门户当道

尽管推进困难重重,但bi与搜索的融合已成一个明确的技术方向。在bi领域,搜索技术炙手可热。gartner的一位分析师说:“从没见过bi厂商如此急切地寻找搜索技术,今天不会向你谈论其bi软件与企业搜索产品集成的bi厂商是太少见了。”另一方面,搜索厂商也在积极拓宽企业级搜索引擎的覆盖范围,企业bi系统中高质量的结构化数据正好弥补了其搜索的数据源。因此,无论是bi厂商还是搜索厂商,都在寻找合适的落脚点,企业门户正是这样一个能够兼顾双方利益、兼容不同技术框架的战略选择。

“应该说,目前市场上我们所见到的‘bi+搜索’的产品基本上都是围绕门户展开的”张天峰说。文章前面提到的产品大都集中在门户和内容管理方面,在门户平台之上,结构化与非结构化数据搜索、乃至更高层次的信息检索技术形成了多种集成化的解决方案。

在结构化数据的语义关联方面,一些bi软件已经通过模板的使用和数据关联定义等方法,部分地解决了在结构化数据查询中提供上下文关联信息的问题。以此为基础,一些企业级搜索引擎,比如google、x1,可以将检索出的结构化数据交付bi系统,然后将其结果与自身的搜索索引项建立联邦性的关联。与此同时,bi厂商也在不断强化数据的挖掘和定向交付能力。比如information builders支持从流程交易环节获取数据,并且使之对google企业搜索引擎可用。而在目前,面向结构化和非结构化数据查询结果的联邦技术有望成为bi与搜索技术融合的一个关键部件。

安全与算法问题

在技术演进带来搜索容量提升、bi软件覆盖范围扩大等可喜成果的同时,信息安全问题更加无法逃避。当企业的it部门在企业范围内部署了搜索工具,并使之与bi决策分析系统连接起来,数据泄漏的风险随之陡然增大。bi分析与搜索功能集成后,企业员工将获得更多的数据查询途径,但跨系统数据的访问控制问题也随即出现。人们发现,为不同部门、级别的员工在这个集成化的系统中定义权限并不容易。

其实,在bi领域,访问控制机制是非常成熟的。目前最需要解决的问题是,如何保证bi与搜索集成之后的系统能够交付员工需要的所有数据。同时准确地屏蔽那些机密的、不在权限允许的范围之内的数据。有安全专家认为,在理想的技术框架下,单点登录(sso)技术可以解决向员工交付所需完整数据的问题,ldap访问目录服务器可以解决访问权限控制的问题。但在实际部署时,数据泄漏的问题仍然会在执行环节出现,系统中的很多数据所接受的访问控制并没有被企业范围的访问机制所严格限制。

一些“bi+搜索”解决方案简单地在bi包后面或其他的后端应用中添加用户信任机制,并且依赖这些应用内置的访问机制去限制反馈结果。这种做法显然不够全面,在实际部署时,企业安全策略的调整,在bi系统中搜索引擎添加位置的选择,都是访问控制环节需要关注的细节问题。

在参与技术融合的问题上,每个厂商都是自己的切入角度,而这往往是基于其专有技术的。这在一定程度上导致了目前这个领域所展开的技术研发并不是非常秩序化的,正如前面提到的技术标准化问题。今天,厂商之间已经围绕搜索运算法则展开了较量。

google一直努力在企业级搜索领域确立如web搜索世界中的“权威”地位,并表示不会公开自己的算法。而ibm则宣称新推出的基于企业搜索引擎内部相关权重因子的新算法。有关的因子包括客户点击特性、格式、文档进入位置、元数据等。很多产品还提供增强特定文档或url相关性的方法,以便他们在既定搜索中占据首位。针对企业搜索的特性,一些软件还允许企业针对某些特定术语进行个性化定制,以方便企业实现对关键业务词汇的定向搜索。“在这个领域,你会遇到各式各样的问题,它们与web搜索有很大不同。比较幸运的是,在这里你至少不会遭遇到有些企业利用卑鄙的手段欺骗你的算法的情况。”google企业级产品部门的一位负责人风趣地说。

特别提示:

“用google式的搜索引擎覆盖整个企业环境”听起来容易,但事实却并非如此。在实施“bi+搜索”项目时,你必须了解以下事实:

■ 厂商演示的魔术般的功能实际上需要付出艰苦的幕后工作,比如将数据查询映射到企业的数据集合。

■ 企业需要帮助员工在企业内部找到重要报告的搜索算法。

■ 不同的部门(例如,财务或销售)具有不同的搜索要求。

■ 务必进行访问控制,使员工不能非法访问企业的敏感信息。

■ 企业可能已经拥有了各种嵌入在不同应用和门户中的搜索引擎。

■ 购买者必须在不同的技术中做出选择:从google的搜索专用设备到分析非结构化数据的文本挖掘工具。

■ 目有市场上有很多厂商,这些厂商正在寻求利用科研领域的高级搜索技术解决企业问题的方法。

bi为什么爱搜索?

咫尺,亦是天涯。bi与搜索的融合之路并不像想象中那样接近,也不会这般遥远。也许在今天看来,这个话题太前瞻了。但是在近期内,这又是bi领域无法回避的焦点。有人认为,这是bi厂商希望搭上最近流行的搜索应用,进行新一轮的炒作。但当我们细细品评技术融合过程中的艰难与收获,我们发现,这种融合是完全符合it应用逻辑和顺应潮流的。在驾驭结构化和非结构化数据的问题上,数据库通过技术获得了成功,而bi为什么不可以?何况这正好与企业搜索技术的前进路线不谋而合。

现阶段bi与搜索的融合过程的确会遇到很多障碍,双方都要不断磨砺,才能达到和谐互融。我们不得不正视的是,虽然bi与搜索的交集越来越大,但这个领域要花费一定的时间才能确立规则。bi面向结构化数据的数据分析,以及企业搜索针对非结构化数据的广义文本挖掘,已经汇集到以企业门户为载体的内容管理平台。但在统一的界面背后,不同类型数据的挖掘、分析、展现、控制的过渡和衔接仍显得突兀。比如google onebox只提供一个公共接口,在实现数据展现终端合并的同时,数据抽取和分析的过程仍是分离的。因此,在肯定融合趋势的前提之下,如何实现数据交付全过程的完整结合,应是当前bi与搜索融合技术研发的第一要务。

bi与搜索集成产品及解决方案概览

business objects business objects google solutions 2006年5月 支持多种数据的搜索,包括桌面电脑中文本文档、电子邮件、微软办公文档,bi平台中水晶报表、仪表盘数据,以及企业网络内的pdf和合同文档等信息。

cognos cognos 8 go!search 2006年12月 与ibm omnifind进行链接,同时支持与fast search and transfer(fast)企业搜索平台的集成。搜索服务支持员工快速查找报表、分析、记分卡和其他bi资产。

google google onebox for enterprise 2006年4月 使google的专用搜索设备除文本之外还可以搜索保存在数据库和数据仓库中的结构化数据,它可以向bi等后端企业应用传递查询信息。目前已有多家主流bi厂商与之建立链接。

hyperion (海波龙) hyperion system 9 smart search for google 2007年2月 支持基于hyperion system 9知识库的报表、仪表盘、财务报表的定制,同时能够实现对企业中多种类非结构化数据的搜索。

ibm yahoo版ibm omnifind 2006年12月 免费的企业搜索应用。ibm omnifind内嵌对不同bi应用的访问机制,基于收购技术发展而来。其搜索结果可被点击,用户可以在新页面中查看更多数据,该性能部分借助ibm的数据仓库搜索能力实现。

information builders webfocus magnify 2007年1月 一种索引结构化数据,并在搜索结果中提供bi报告的搜索导航工具,以树型结构展现搜索结果。

oracle oracle secure enterprise search 2006年3月 提供对数据库、bi系统、电子邮件系统、企业门户内容的反向查询。内嵌安全机制,搜索索引保存在一个数据库中,通过oracle身份管理解决方案实现访问控制。

sas sas bi google onebox企业版解决方案 2006年第三季度 与google onebox的紧密集成,支持用户沿用原有搜索方式获得更深度的搜索结果。sas同时提供文本挖掘技术,帮助用户在企业文档中发现和提取知识,建立数据关联。

x1 technologies x1企业搜索平台 不详 能够在桌面和不同的企业搜索引擎之间建立联邦关系,支持对电子邮件、桌面文档的检索,是一个可扩展的解决方案,该平台可以在不同的地点间实现集群,或与指定的第三方厂商进行连接。