近年来人们对“大数据”的兴趣日增,这 背后的原因正是非结构化数据的大幅飙升。凯捷与经济学人智库最近进行的一 项研究表明,58%的企业高管在做出商业决策时都依赖于非结构化数据分析。 对于公司而言,这些难以处理的新型海量信息意味着巨大的挑战,但同时也是 绝佳的机遇。分析的数据越多,发掘重要洞察信息的能力就越强。

技术供应 商高谈阔论非结构化数据中的隐藏价值。他们说,搞清非结构化数据的意义是 数据分析的最后一篇战场。找到一种方式来获取所有对话、PowerPoint演示文 稿和微博中的信息,公司就能从“大数据”中收获真正的财富。但是这些供应 商的出发点本身存在错误。商业型项目不应当从审视研究数据开始,首要任务 是确定您试图回答的问题。我的理想顾客是谁?产品为什么滞销?这些都是业 务问题。然而技术供应商试图回答的却是技术问题:我们如何挖掘数据?如何 在信息的汪洋大海中捞到那根“针”?

搞清非结构化数据的意义仅在一定程 度上与搜索有关。真正的价值来自将非结构化数据同其他地方的更具结构性的 信息联系起来。如何做到?考虑公司会如何提炼所有员工的信息。企业内部成 百上千万的信息交流中蕴含着大量的宝贵见解,但是如何聚焦于最相关的信息 并将其转化为真正的洞察呢?ECM也许就是关注的领域:

所谓ECM(Enterprise Content Management - 企业内容管理)是一种用来捕获,管理,存储,保存和交付同组织流程相关的内容和文档的策略,方法和工具集。

ECM系统使用一个内容库和很多不同的应用程序以及不同的应用开发平台,从而达到控制、访问和交付内容的目的。内容可以是任何非结构化信息,如文件,网页,图片,视频,记录,或简单的文件。(非结构化信息是指不具备数据模型的电子信息,他区别于那些保存在数据库中的字段信息或文档中的语义标签信息)。ECM系统管理着内容以及他们的生命周期就如同数据库系统管理者数据库中的数据。

一个ECM系统管理管理着实际内容的二进制信息,描述其上下文的元数据,和其他内容的关联关系,在内容库中的分类和位置,以及搜索和访问内容所需的索引。同样重要的是,ECM系统管理着内容的处理过程和生命周期,以确保该信息是正确的。ECM系统管理着用于采集,保存和分发内容的工作流,同时,管理着内容的生命周期,生命周期用来控制该内容能保持多久,以及在保留期限过后该对内容进行何种处理。

根据研究机构Forrester,ECM有5个主要的应用领域:文档管理,网页内容管理(Web content managament),记录管理,影像管理和数字资产管理。这些不同的内容管理应用领域在存储,组织,访问和处理内容上有着相似的需求。但是,每个应用领域又有着不同的组织关注的重点和不同的最终用户。

   * 文档管理主要用来处理获取,编辑和分发office文档和文件。
   * Web内容管理能组织企业的网站,网页和网页发布流程。
   * 记录管理用来处理长期存档或销毁重要文档和记录。也应用于法规遵从和管理方面。
   * 影像管理用来处理扫描的影像内容。影像管理用来管理从扫描,图像质量控制,元数据获取到存储的整个流程。
   * 数字资产管理主要用来帮助创意和市场人员处理照片,视频的获取,创建和编辑。

通过ECM系统管理内容,各类机构能普遍降低手工处理信息的成本,增加信息处理的精确性,并能帮助搜索发掘重要的文档。使用ECM的好处包括:

   * 减少纸质文档的处理,和人过处理带来的错误
   * 减少纸质文档的存储空间
   * 降低文档丢失的风险
   * 快速定位所需的文档
   * 提高客户的在线体验
   * 能够在线访问那些原来只能通过纸质,微缩胶片或单片缩影胶片(microfiche)访问的信息
   * 改善对文档的控制以及文档为核心的处理流程
   * 提高费时的业务流程的效率
   * 提升文档访问和修改的安全性
   * 提升了追踪和监控能力,通过分辨瓶颈并修改系统来提高效率    

Title: 
Unstructured data with ECM - Enterprise Content Management