早在大数据之前,商业智能(BI)概念就已经得到了广泛的普及,经过多年发展,商业智能产品早已从传统BI发展到自助式BI,到底两者之间有何不同?本文,我们主要基于国内自助式BI产品的代表DataHunter,来探究一下其与传统BI在系统架构、大数据支持以及数据关联三方面的区别。
从产品理念上讲,传统BI侧重于输出数据报表,由业务人员提出分析需求,IT人员进行报表制作,通过生成大量的静态报表以供企业相关人员查看;而以DataHunter为代表的自助式BI更加侧重于数据分析,由于是自助式产品,所以无需IT部门的介入,业务人员可以自行进行完成整个数据分析流程。
产品架构
传统BI基本采用瀑布式开发模式,企业在部署前期,需要进行整体的架构设计,各个功能模块也都需要进行技术开发,所以传统BI的部署周期较长,交付时间基本在半年到一年左右。如企业需求发生变化,相关模块的调整周期也基本按月计算。
由于传统BI产品功能模块较多,操作复杂,特别是需要对数据进行ETL处理和数据建模,所以,通常传统BI是以IT部门为主导,整个分析流程也都需要IT人员参与并执行。
相比而言,DataHunter自助式BI产品采用B/S架构开发,系统灵活易用,即用户打开浏览器就可以进行数据处理、数据分析查看以及系统管理等。基于数据驱动的理念,DataHunter自助式BI产品无需预生成Cube,所以Data Analytics是以业务部门为主导,彻底将数据分析能力交还给业务人员。
简单、灵活、易用的产品特点,也使得DataHunter自助式BI产品在部署周期方面大大缩短。通常,其交付周期基本按照周、月计算,即便企业需求发生变化,相关模块的调整时间也基本按照天、周计算。
目前,DataHunter支持Chrome、Firefox、IE edge等多种常用浏览器。同时支持市面上几乎所有的主流操作系统,包括PC端和移动端,如Windows、MAC OS、Linux、Android、iOS等。此外,针对Linux的众多发行版,Data Analytics也都有很好的支持,如CentOS、 Ubuntu等。
大数据支持
传统BI采用的技术架构决定了其针对海量数据的计算能力相对不足。在传统的数据分析系统中,如需要处理大量的业务数据,通常会增加硬件计算能力,如大规模并行处理系统来实现,而昂贵的硬件无疑会带来更高的成本。
在数据源方面,尽管传统BI支持目前绝大部分的数据库软件,但在云时代下,传统BI并不支持云数据库、第三方应用数据源以及其他公共数据源,而对于像Hadoop等大数据平台的支持和接入,传统BI也基本很难满足。
DataHunter自助式BI产品是大数据时代的产物,天生就对海量数据处理有着很好的支持。DataHunter自助式BI产品基于内存分析引擎,对PB级的数据处理可以达到秒级响应,同时,内存分析技术也代表着未来BI产品的发展方向。在数据支持方面,其不仅支持目前市面上所有主流的数据库、数据文件,同时还接入第三方互联网数据、公共数据服务平台等。
数据关联
由于传统BI是采用验证式分析模式,所以在处理数据方面,需要保证很高的数据质量。这意味着,传统BI需要进行严格的ETL过程,确保数据,的干净并符合业务需求,同时,在数据抽取后,传统BI产品也无法对数据进行进一步的修改和编辑。
此外,由于传统BI的数据分析是建立在关系数据模型之上,所以在进行分析之前,IT人员需根据业务需求来进行复杂的建模,如遇到分析需求变化时,IT人员需重新建模或修改已有的分析模型,整体流程耗时较长,响应速度较慢,这种机制同时也导致了传统BI无法做到实时的数据分析。
不同于传统BI,在DataHunter自助式BI产品中,整个ETL过程都是在系统中自动进行,同时支持对上传后的数据表进行一系列的操作和编辑,包括自由更改表格文件名称、表格分组、字段类型等。
而且,DataHunter自助式BI产品具有智能化的数据关联功能,对上传后的数据处理尤为简单。用户只需要拖动工作表,即可自由关联相关数据表,支持包括全部联接、左侧联接、右侧联接以及内部联接四种方式。基于实时内存分析引擎,DataHunter支持用户在内存中对庞杂的业务数据进行实时的处理和分析。
结语:可以说,以DataHunter为代表的自助式BI产品,真正顺应了大数据时代的企业数据分析需求,基于以业务部门为主导的理念,简化IT支持,将分析能力真正交还给业务人员,加速企业完成数据驱动变革。