传统的关系型数据库审计已经很成熟,我们说说大数据库审计面临的挑战,安华金和在一个个针对大数据审计的项目落地过程中总结发现:
以操作类型为视角的统计很多场景不再实用,如HDFS下的数据库语句实际上是对文件系统的操作命令ls、cp等;
由于大数据存储节点众多,故数据访问端口范围的不确定性也随之而来,传统数据库审计对IP+端口的数据模型已不再适用,大数据审计一般都采用动态的端口范围,而且范围较大,如某项目现场的Hive端口数量30+;
语句模板难以用SQL方式翻译,在关系型数据库审计中安华金和的语句模板机制极大的减少了语句记录量,业务审计中以模板方式也极大的提高了统计和分析的价值,但大数据应用下这种方式将难以继续这种业务呈现;
业务化语言无法匹配,关系型数据库的业务化语言翻译不再适用于大数据时代。
这里提到的“大数据审计”有两层含义:
一是对使用大数据作为业务数据库存储的这类“数据库”审计;
二是对大量业务产生的审计数据以大数据方式存储。
前者的本质在于数据库的审计,后者的核心在于审计数据结果的处理。
在大数据使用愈发普及的市场背景下,以上两个方面常常同时出现:为了更好的服务于业务,大数据形态不断扩展和业务逐渐成熟,大数据审计成为刚需;大量的审计数据结果需要更大的存储空间和更庞大的后续统计分析,而这正是大数据擅长的地方,所以演变成了“用一个大数据应用来审计业务系统的大数据”。
在完成对大数据审计的协议解析后,如何呈现更合理的审计结果和统计分析?安华金和的思路是:基于现有DBAudit的语句、会话、风险三大视角基础框架,基于大数据形态做针对性的审计数据结果呈现和风险策略告警能力,DBAudit新的版本将会带来耳目一新的价值体现。
被审计数据库节点的极大增长,以及审计结果数据量的猛增,审计系统本身也将步入大数据化。
对大数据的审计支持能力,安华金和在国内厂商中一马当先,目前支持的大数据形态有:Hive、HBase、Sentry、HDFS、Impala、ElasticSearch,以及MangoDB、Redis等非关系型数据库。你与他们交流下,会有不同的收获。
这家伙很懒,还没有设置简介