你的位置:首页 > 软件开发 > Java > 项目总结笔记系列 Autonomy IDOL Server KT Session1

项目总结笔记系列 Autonomy IDOL Server KT Session1

发布时间:2015-03-25 18:00:24
在说上面这个图之前,先说一下背景知识。Autonomy地址:http://www.autonomy.com.cnhttp://www.autonomy.com.cn/content/home/index.zh.html  先说说我的理解:我们利用Autonomy可以做什么。比如在 ...

项目总结笔记系列 Autonomy IDOL Server KT Session1

项目总结笔记系列 Autonomy IDOL Server KT Session1

在说上面这个图之前,先说一下背景知识。

Autonomy地址:

http://www.autonomy.com.cn

http://www.autonomy.com.cn/content/home/index.zh.html

  先说说我的理解:我们利用Autonomy可以做什么。比如在一个电商网站中,我们在某个电商网站中搜索了苹果6,Autonomy会迅速地在返回的页面中,给用户提**品的配件以及辅助产品的信息。比如,苹果6的手机壳、充电器、耳机线;相关其他的苹果产品,如ipad等。又或者当用户查找iphone 6,但是电商的库存为零了。这时候,Autonomy会自动选择替代的产品并返回给用户。并且,Autonomy会分析大量的用户购物数据及购物兴趣,各种隐性显性的关联因素,来引导用户来浏览其他的商品。这样,为电商引入了流量,增加了交叉促销,为促成交易贡献了自己的力量。Autonomy同时可以根据用户的喜好对销售需求做出迅速反应。最后,Autonomy 的情绪分析技术还能够使电商对其客户服务情况进行监控(包括各种facebook twitter weibo QQ),以提供最高标准的服务。你也许会想,这些操作其实在淘宝,天猫等中已经对它做了应用。其实,电商平台只是Autonomy使用的冰山一角,它对各种类型(结构化 非结构化)数据的整合,处理,过滤,模式匹配,情感分析,在金融、制造业、媒体、电商、医药等行业都有成功过的使用案例。这个可以在官网中,参考看到它的案例介绍及其其中的一些牛逼的技术的介绍。

1.Autonomy:autonomy,提供了一种能够理解任何文件格式的全面软件基础架构解决方案。无论数据是文字还是语音,是结构化还是非结构化,采用何种创建和存储手段,相关的应用程序为何,Autonomy 都能进行处理。这样无需人工建立复杂的连接器或使用元数据,也可实现应用程序之间的通讯。Autonomy的技术使企业应用系统独立于数据类型而运作,同时借助将手工操作自动化而提升了效率。

2.IDOL Server:智能数据操作层 (Intelligent Data Operating LayerTM,IDOL) 服务器位于 Autonomy软件的核心地位。IDOL Server 收集来自各连接器的数据,并以其能够实现快速处理和检索的独特结构储存它们。在处理信息时,IDOL 能够联系概念和语境来理解企业中所有的内容,对超过一千种不同格式的信息乃至使用者的兴趣进行自动的分析。IDOL 允许对数据资源进行超过 500种操作,包括超链接、代理、摘要、分类、聚类、结构化信息抽取、档案建立、个性化信息提醒以及检索。“安全性是 IDOL 体现出自己独到之处的一个重要方面。它提供了映射式的安全架构以及几乎实时的安全权限同步功能,因此,非常适用于对安全性要求较高的搜索应用场合”。

更多的文档参考:http://c0049920.itcs.hp.com:9000/action=help

3.ASOA:Autonomy 的基础架构产品在设计时尤其重视重复利用性、模块化、组件化、互用性以及性能等原则。而 Autonomy面向服务的架构 (ASOA) 则是这些设计原则的延伸。Autonomy 的所有模块都属于可选用的服务,并使用标准的 SOAP 作为其接口,这样大量基于语义的功能都能作为服务提供给用户。

4.Autonomy的实践:两家投资银行合并后不久,决定建立一个统一的研究系统平台,以便其客户可以即时访问合并后的银行的所有与研究资料。这包括全球范围内的 PDF 文件、Lotus Domino 服务器站点,以及存储在文档管理系统和网络上的大量 Microsoft Office 格式文档,形式参杂混合。要将所有这些数据合并到一个系统的前端,传统上需要开发多个接口,每个接口连接一个不同的数据源。相反,如果新合并的银行部署 IDOL 整合所有的数据源,IDOL 可简单为每个数据源配置相应的数据采集器。当各种类型的信息导入到 IDOL 后,一个单一的 JSP 前端就能够提供所有数据的检索、自动超链接(相似文档自动推送) - 无论数据格式是什么,也不管它存储在哪里。

 

  我们的Social Hub项目的底层是基于Autonomy的,Autonomy从各个平台上搜索到了各种各样的数据(通过连接器connector),Autonomy提供了各种基于.IDOL Server。(我们的conncector也许只是返回了一个file的address,CFS则要extracts文件,并且从文件中提取出metadata and file content把它们加到CFS的document中,你想,这样我们的IDOL server到时候可以直接搜索分析数据,而不需要再从原文件格式中取数据。可见,我们增加了CFS这一层,是将所需要的数据提供了一个统一的入口)相当于,你需要水,我从各种管道接来了水,放在一个水瓮中,供你来用。或者你需要钱,我从各个地方弄到了钱,放在了保险柜中,等你来用。

Autonomy的技术优势总结:

1.关键词和布尔表达式搜索

  当处理大量数据并且用户也完全明了其需要寻找的特定信息时,关键词和布尔值搜索的准确性是可以保证的。Autonomy 对这种方法也提供完全的支持。但是,尽管关键词搜索能够找出文档中匹配的字词,它却不能告诉我们整篇文档与所关注的主题之间有多大的相关程度。

  如“那晚我走在一条街上。这条街又长又黑。等我走到街的尽头时,有个抢劫犯跳出来袭击了我”,虽然句中多次出现“街”,但整段内容描述的却是一起犯罪事件。用关键词和布尔值方法搜索“街”时,该段内容很可能会被返回到搜索结果中,因此,这些方法有时并不准确。针对这一点,关键词搜索方法常采用权重来对搜索结果进行排列。当对比关键词出现在不同位置的两篇文档,其中一篇关键词出现在文档中的显著位置,例如标题,另一篇关键词出现在文档末尾,搜索方**认为前者的重要性比后者高,并给予其较高的权重值。此外关键词出现多次的文档得到的权重值也会比较高。

原标题:项目总结笔记系列 Autonomy IDOL Server KT Session1

关键词:session

*特别声明:以上内容来自于网络收集,著作权属原作者所有,如有侵权,请联系我们: admin#shaoqun.com (#换成@)。

可能感兴趣文章

我的浏览记录