DataFocus产品白皮书
1. DataFocus于企业的意义何在
1.1 企业为什么需要DataFocus
作为一名企业管理者,您是否时常感到蒙在鼓里,或者总感觉财务、销售等部门提供的数据与自己的感觉不符?明明公司已经有了ERP、CRM等等各种业务系统,为什么它们的数据时常打架,或者通过它们,你仍然对公司的业务只能雾里看花。
作为公司的信息部门负责人,您是否已经被无穷无尽的报表开发需求淹没?或者已经很努力可仍然被指责不能及时解决业务部门的数据问题?明明已经购买了各种报表软件,为什么工作量反而越来越大,效率反而越来越低?
作为公司业务部门如销售、财务、生产等部门负责人,您是否觉得IT部门总是无法正确的理解您的需求?或者他们总是在再三催促后才会交出你想要的数据报表?CRM、财务软件、ERP系统提供的数据分析还是几年前系统上线时候的需求,已经远远不能满足需求;哦,看到信息部门同事的黑眼圈,其实您们都已经不愿意再反复要求他们帮忙了。
作为公司负责人,每一次IT系统的投入,都会形成巨大的连带成本,这本账你最清楚。花钱购买软件往往只是一道开胃菜而已,后续的维护成本,人才流失成本会不会成为无底洞?以前购买的报表软件已经是一个教训了,刚培训出来的数据库工程师、数据分析师不满意工资待遇离职了,
1.2 商业智能发展的大趋势
(1)自助式数据分析是大势所趋
传统的数据分析模式,都是通过IT信息部门集中管控。需求由业务人员发起,IT工程师根据业务人员的数据分析需求,写代码到各业务系统取出数据,制作报表。这种方式效率低下,费时费力。往往还因为业务部门和IT人员的认知不同,导致沟通偏差,未能准确满足需求。
未来,以业务人员为中心的,IT部门辅助的自助式分析模式,将从根本上解决以上问题。有了DataFocus这类数据分析工具,业务人员从自身需求出发自助进行数据分析成为现实。现在,IT部门只需要事先将数据进行好标准化规范,业务人员通过简单搜索即可完成。
“到2019年自助分析和BI用户创造的分析结果将超过数据科学家” --Gartner
(2)全栈式BI已成为潮流
传统的BI或报表工具,只局限在数据的分析和展现,往往还需要搭配第三方的数据仓库才能有效运行。DataFocus自带大数据仓库,企业数据分析不需要再采购第三方组件,系统部署完成后,从数据抽取、建模到搜索分析,分享、预警和移动端展现,All in one。DataFocus引领全栈式BI的潮流,将企业从BI部署、实施到上线运行的周期缩短70%以上。
“你需要的不仅仅是一种工具,而是一个工具箱。”
(3)自然语言搜索式分析渐成主流
Gartner多次预测,自然语言搜索式分析在2020年,将占50%以上市场份额。可以预计未来3-5年内,传统的报表软件将逐步退出历史舞台,拖拽式BI生产商,也将逐步通过技术转型,转向搜索式分析路线上来。DataFocus作为国际上第一款将NLP技术运用到商业智能产品中,同时支持中英文搜索的数据分析系统,紧随技术发展潮流,用AI驱动商业智能BI技术的发展。
“未来已来,将至已至;既往不恋,纵情向前。”
1.3 商业智能与数据中台的融合
大型企业往往IT系统繁多,只有通过建立大数据平台,将所有数据进行标准化规范,通过统一的规格、可封装的技术对外提供,数据才会从固定资产变为流动资产,最大化的释放价值。
DataFocus在设计之初就考虑到提供全栈式功能部署,运用基于自然语言的数据库搜索引擎技术,同时解决大数据的存储、规范和可复用的输出三大问题,轻松建立企业的智能化(AI-Driven)数据中台。企业还可以通过DataFocus的企业数据总线API模块,自主封装、开发各种灵活的前端运用,也可以通过DataFocus专家版的机器学习模块,根据各自的业务场景,训练可以解决特定问题的AI模型,解决更高级别的问题。
“数据中台是企业“业务+数据”的沉淀,是企业信息化资产构架核心。”
1.4 DataFocus核心优势
DataFocus是一款运用最新理念设计的数据分析系统,它包含了商业智能BI的各项功能,也可以作为商业级的智能数据中台部署和使用。企业可以围绕DataFocus打造全系列的数据分析和AI解决方案,而无须依赖更多第三方组件。
1.4.1 自带大数据仓库
大型企业集团多年的IT信息化建设,积累了海量的数据,这些数据分散在多达数十种的业务系统数据库中,形成了一个个数据孤岛。这一方面导致了数据标准不统一、无法准确的进行分析;另一方面,传统关系型数据库的查询性能也越来越低,导致分析效率的低下。
DataFocus标准版以上版本自带的大数据仓库,能够轻松对接各类传统关系型数据库抽取数据或直连数据。独有的雪花模型,支持复杂的数据库结构;通过多数据源整合,支持跨系统分析,彻底打破数据孤岛。
1.4.2 快速实时计算,无须CUBE
海量数据进行关联分析,往往有效率瓶颈。传统的OLAP分析方式会借助第三方工具进行CUBE预先计算的方式,以空间换时间。但是数据分析的工作是连贯的,这种定时跑任务的分析方法,只适用于传统的固化报表作业模式。
信息瞬息万变,决策毫秒之间。DataFocus采用列式数据存储的方式,通过自带的内存计算引擎,无须预先建立CUBE,数据分析实时交互,完全满足管理决策中经常遇到的临时性分析、多变的业务需求和频繁的结果刷新。IT部门将从此告别延时报表分析,亿级数据秒级响应。
1.4.3 强大的可视化能力
优秀的数据展现形式,既可以提高信息获取效率,又能很好的吸引注意力。DataFocus的图表分析可以自适应多达40种可视化图形,告别密密麻麻的表格数据。在此基础上,提供了大量图形通用配置功能,以供追求完美。
DataFocus的数据可视化大屏开发不仅可以做到高效,更可以做到媲美专业的数字大屏开发效果。增强后的数据看板功能模块,可以进行高度、灵活的自定义。比如设定复杂的大屏背景、组件风格、界面配置、全局摆放,动态效果等等,开发出震撼的可视化大屏甚至无须设计师参与。
1.4.4 搜索式分析
DataFocus既是国际上第一家正式投入商用的,同时支持中英双文搜索的大数据分析产品,也是国内第一家开创搜索分析交互方式的产品。搜索式数据分析不仅仅是一种技术变革。它有效的降低了数据分析的门槛,使得非技术出身,但是精通业务的人员也可以快速上手进行数据分析,这有效的打破部门墙,让自助式数据分析真正成为现实。
搜索式分析,还使得企业培训数据分析师变得容易。从而打破了商业智能工具买得起用不起的尴尬。让大数据分析像搜索一样简单,这是DataFocus一直以来的目标。
1.4.5 笛卡尔的透视
尽管有了搜索式分析的便利,企业在进行浩繁的数据分析探索时,仍然是低效的。举例来说,零售类企业有数以万计的SKU,数以千计的连锁门店和可分析时间段,数以百计的业务人员和促销渠道。分析师需要穷尽数亿级的组合才有可能找到一些典型的特征或趋势,比如某个单品,在特定时间段或特定门店会有快速增长的销量。这种工作理应交给机器。
DataFocus专业版的智能洞察模块,可以自动进行数据探索,从数亿的可能组合中,找出数据趋势和特征,并快速生成数据分析报告。
1.4.6 高斯之瞳
数据分析可以找到规律、发现问题,企业更加需要AI解决问题。DataFocus提供了各种武器帮助企业进行数据探索,企业在获得确定见解后,需要采取行动。有时候需要AI驱动的工具帮忙。比如,持续观察到某种商品库存占比过高,借助DataFocus专家版的算法模块,训练出库存预测AI,指导企业的采购进行调整。企业的数据分析,从描述性统计,到预测型分析,不需要额外购买更多软件,DataFocus帮你一站式搞定。
1.4.7 完善的多端应用
数据分析的结果往往需要与更多人分享或讨论,有时候还需要及时发送预警邮件。DataFocus同时支持企业微信和钉钉,通过简单的分享操作,即可快速实现手机查看。优化过的移动端展示效果,使得数据看板和图表的展现更加人性化,便于您旅途中也可以进行数据分析。
1.4.8 行列级权限控制
DataFocus精确到行、列的细粒度数据权限控制,分析报告自动根据用户权限现实对应的数据,这可以轻松满足大型企业集团精细化的数据控制需求。固化的分析报表或数据看板只需要制作一份,再根据权限配置,即可实现千人千面的数据展示效果。此外,DataFocus还支持LDAP服务器集成,实现多业务系统的单点登陆。
2. DataFocus的架构以及配置要求
2.1 DataFocus架构设计
DataFocus是一个可以实现特定业务场景下人机对话的AI系统,该系统尝试理解人类关于数据的问题,并以丰富的图表和数据回答相关问题,与传统的数据分析方式相比,交互更加智能,效率提高100倍以上。用户不必花费大量心力去学习和了解难懂的计算机语言,而是用自己最习惯的语言如中文或英文,来使用计算机,就跟谷歌搜索一样简单。
整个系统架构包括八大模块:数据仓库、数据搜索引擎、语义解析引擎、机器学习引擎、可视化引擎、内存计算引擎、分布式集群、安全控制。其中数据搜索引擎和语义解析引擎,是组成自然语言搜索的关键部分,大大地简化了数据分析系统的操作难度,其中语义解析引擎会主动猜想用户的下一次输入,将用户搜索输入效率提高40%以上,并根据用户使用习惯优化推荐排序,促使系统愈用愈智能 。
为了满足大数据计算的场景,系统内置的内存计算引擎采用MPP架构的列式数据存储技术,一次可缓存数亿行数据,内存实时运算,千万级数据常规查询秒级响应。DataFocus专家版还提供了机器学习集成平台,用户可以根据自身的业务需求场景,训练自己的AI模型,用于解决销售、库存预测,故障预警或产品推荐、用户画像等经典机器学习问题。
2.2 各版本软硬件配置
产品名称 | 操作系统支持 | 内存 | 硬盘 | CPU | 数据容量 | 备注 |
---|---|---|---|---|---|---|
DataFocus Standard | CentOS 7.2以上 | 20G可用 | /home 下50G可用 /root 下20G可用 | 双核 | 不限 | 数据容量受内存大小制约 |
3. DataFocus功能概述
3.1 数据处理
3.1.1 数据源支持
DataFocus可支持多种不同的数据库类型,也支持不同的数据连接方式。
企业对于数据时效性的要求,有需要实时更新数据的。例如“双十一”时期,企业需要实时掌握销售情况,这时候就要求销售大屏数据实时更新。也有对数据时效性要求没有这么高的,或者固定周期更新的,例如财务数据,人事数据都有固定的更新周期,以周报形式或者月报形式为主。另外还有部分数据可能是外来数据,比如同行业的对比数据等,是来自于外部的数据,此时就需要有可以上传本地数据的途径。
考虑实际业务需求,DataFocus开发了导入数据、直连数据、本地文件上传三种方式。
(一)导入数据
即把DataFocus作为一个数据仓库,将各个业务系统中的数据统一导入到DataFocus中,导入数据形式支持定时更新,支持自由选择更新方式。像是财务数据、人力资源数据、客户数据等都可选择此种连接方式。
导入数据支持的数据源类型主要有:PostgreSQL、Oracle、SqlServer、MySql、Sybase ASE、Sybase IQ、SAP。
更新频率: DataFocus支持用户以每天、每周、每月的频率在指定时间对数据源开始更新,用户可以根据自身需要,随心设置数据更新的频率。只需要在创建数据源或之后编辑数据源时配置定时导入选项,方便系统自动化的更新数据表,方便操作的同时,避免了遗漏情况的出现。
更新方式:DataFocus还支持对数据表进行全量和增量两种更新方式,即可以选择对数据源中选中的所有数据表进行全体更新,也可以选择仅仅对数据表中变化的数据进行部分更新。在企业数据量很大的情况下,选择增量模式无疑会得到更快的更新速度,以最快速度得到最新的分析报告。
(二)直连数据
即DataFocus直接连接企业数据库,不将数据库中的数据导入DataFocus,像是销售数据等对时效性有较高要求的,可以选择直连数据库的方式。直连的数据表其查询速度以及效率等,主要与企业的数据库性能有关,与DataFocus性能关系不大。
直连数据支持的数据源类型主要有:MySql。
更新频率:直连数据库支持实时更新,即数据库中数据有变化,DataFocus中相应的数据以及图表都会随之更新。
(三)本地文件上传
即导入本地的文件,一般导入的是业务系统中没有的数据,来自于外部的数据,比如天气数据、同行业数据等。
本地上传支持的文件类型有:csv 、txt、xls、xlsx、json。
3.1.2 多表关联
DataFocus提出了多表联合查询的概念。在企业实际应用中,需要分析的数据往往来自于多个不同的数据表,例如分析企业全面的销售情况,则需要对销售订单数据表、销售交货数据表、销售发货数据表等一系列销售相关的数据表进行联合查询分析,不能只单独查看分析某一个数据表,因为部分的销售情况并不能代表企业的全部面貌,在做数据分析的时候,最忌讳的就是以偏概全。如果只分析了销售订单数据,那么有可能会夸大了企业实际的销售情况,因为在后续销售过程中,不乏有很多退货的情况。故我们需要综合所有的销售数据,以更全面的角度来分析。
DataFocus中支持多表联合查询,但是在多表进行联合查询之前,需要先创建关联关系,并且构建模型。什么是创建关联关系?通俗地解释,就是例如excel中vlookup的功能,即通过多个表之间的某一列或者某几列进行匹配,然后将这几个表联立起来,例如上述各个销售数据表中采用的匹配字段是销售订单号。
创建完关联关系之后,并不能直接在DataFocus中起效,需要先构建模型,构建模型的具体过程无需用户操作,用户只需要打开构建模型的开关即可。
上述为了更全面的分析数据是多表查询的其中一个目的。还有另外一个目的,就是将事实表与维度表进行联合。什么意思?意思就是比如现在有一份销售订单数据,订单数据表中有物料ID、公司代码ID、客户ID等,但是这些字段都不是具体的值,而是一个个的字符串代码,这时候,就需要我们用关联关系来将销售订单数据表(事实表)与物料主数据(维度表)、公司代码主数据(维度表)、客户主数据(维度表)进行关联,从而得到例如销售订单数据中的物料AS001代表的是什么货物,公司代码A001代表的是哪家分公司,客户ID 3e5617代表哪个客户。
3.1.3 新增公式
在实际业务中,不管是什么分析,公式都是最常用的分析手段。比如时常需要计算的各项指标、各项比率等,都是通过公式计算所得。
DataFocus支持添加公式列,其所拥有的公式基本满足企业的需要,覆盖了大部分excel的公式函数等。例如在计算销售完成率、库存周转率、存销比等都需要利用原始数据进行简单的计算,从而生成一列新值。
对于DataFocus中支持的公式类型,大致可分为以下几种:
- 聚合公式:average、count、sum、max、min、sum_if、group_max等。
- 转换公式:to_date、to_string、to_double、to_integer、to_bool等。
- 日期时间公式:data、day、day_number_of_week、diff_days、month、year、time等。
- 混合公式:!=、>=、<=、<、>、=、least等。
- 数值公式:+、-、*、/、^、abs、cbrt、cos、ln、log2、sq、sqrt等。
- 判断公式:and、if…then…else、ifnull、isnull、not、or等。
- 字符公式:concat、contains、strlen、strpos、substr等。
DataFocus中公式的利用,不仅可以通过添加公式创建新列,还可以再次利用已创建的公式进行二次创建,即公式嵌套。例如在计算金融指标保利加通道指标项时,就需要先通过公式计算出收盘价标准差的两倍,再利用这个公式计算出它的Up线,也就是收盘价平均值加上刚刚计算出的收盘价标准差的两倍,以及它的Down线,即收盘价平均值减去刚刚计算出的收盘价标准差的两倍,这里相当于公式嵌套了一次。
DataFocus中公式可以解决大部分数据分析问题,可以计算各项关键性指标,可以嵌套使用。
3.1.4 行列转换
在实际的业务中,我们经常会遇到如下的场景,比如日期不是作为单独的日期列中的值,而是把日期的值作为一个个单独的列,如下图,每一日作为一个列。
但是有时候并不想要上述的数据格式,想要的是日期作为一列,销量作为一列,以便更好的看出其销量的趋势变化情况,这时候就需要用到行列转换的功能。
考虑到实际业务情况,DataFocus开发了行列转换功能,不仅能将上述的列转换成行,也可以将行转换成列。此功能解决了大多数实际业务场景中难以解决的问题。
如下图,即上述列转行的结果。DataFocus中,在上述搜索结果的基础上直接选择操作——行列转换,选择需要转换的行或者列,即可实时的看到转换后的效果。
列转行之后,即可将日期作为X轴,销量作为Y轴,数据显示成柱状图、折线图等常用图形,可以直观地观察销量的数据变化情况以及变化趋势。
3.1.5 筛选过滤
筛选过滤,是我们数据分析中最常用的手段之一。比如在对店铺进行销售分析时,经常需要单独查看某一家店铺的具体销售情况,这时候就需要对店铺进行筛选过滤,或者在进行时间序列的数据分析时,需要具体分析某一时期,这时候就需要对时间序列进行筛选过滤,又或者在分析销售数据时,需要知道哪些是没有达到销售目标的,故需要对销售金额或者销售量进行过滤,以上三种应用场景都是最常见的。
DataFocus中针对不同列类型的筛选过滤有不同的操作。其列类型有3种,分别为属性列、数值列、时间日期列,对这三种不同类型的列都可以直接进行筛选过滤。例如以下示例,是对不同列的筛选过滤,DataFocus中可以单独进行筛选,也可以进行多重筛选。
原始值:
属性列筛选过滤:
数值列筛选过滤:
时间日期列筛选过滤:
多重筛选:
3.1.6 中间表应用
在DataFocus中,提出了一个新的概念,就是中间表的概念。中间表是什么,有什么用?这是很多人在第一次听到中间表之后的瞬间反应。DataFocus的中间表,就是用来处理数据的一种手段,比如在分析一个列非常多的数据表,但是只需要分析利用其中的某几列,这时候,可以先创建一个中间表,中间表中可以只包含需要分析的列,再用此中间表进行分析,这样不仅会提高系统分析的速度效率,也会节省用户的操作时间。
DataFocus中创建中间表有两种方式,一种是通过question的方式创建,即通过搜索的方式,将搜索结果保存为中间表,此种方式保存的中间表为聚合后的数据。
另一种是通过prejoin的方式,即按照原始数据创建中间表,表中数据是没有经过聚合的。
上述两种不同的创建方式,其入口也不同,前者是在搜索之后直接进行保存,后者是在数据管理页面中,选择创建中间表,进入到如下的创建中间表页面。
有时候,在创建完关联关系后,会将多个表中需要分析的列选出,保存到同一个中间表中,即化繁为简,后续分析相关的数据,就不需要再重复选择多个数据表,只需要选择一个中间表即可,此方法同样也加快了系统的分析效率。
3.1.7 智能洞察
智能洞察是DataFocus非常具有竞争力的一个功能。其集合了人工智能技术,只要一键,就能从数千万的组合中,发现数据之间的各种规律,此功能大大减轻了用户的工作量。主要适用于分析商品种类众多的销售数据、库存数据,因为商品种类众多,在分析不同类别对销售的影响时,工作量会非常大,每个种类都需要进行分析,这时候,如果采用智能洞察一键分析,让系统来做这些工作,系统会从各个维度全面的分析所有数据,寻找数据之间的关系以及规律,形成一份报告,从这份分析报告中,我们可以清楚地知道哪些数据之间有线性关系,哪些数据中有异常值。如下图,即智能洞察分析出部分数据的类别离群值、时序离群值以及部分数据占多数情况、稳定份额情况等。
数据管理页面,一键智能洞察,从数千万自由组合中发现数据异常及规律,分析报告还可进一步导出成PDF文件,以供后续辅助进行详细分析。
3.2 数据支持
DataFocus连接数据的方式很全面,就大类来说,支持导入本地数据文件和连接到数据源两种。无论是零散的本地报表或数据文件,还是企业ERP、OA等系统中的数据库都可以覆盖支持,而如媒体、互联网、铁路管理等等对即时分析要求较高的一些行业,DataFocus还提供了直连数据库的功能,真正做到可以随取数据随时展现。
可支持的数据源类型包括:
- 文本数据源:excel文件,csv文件,json文件的数据。
- 关系型数据库:主流的关系型数据库,如:Oracle、PostgreSQL、SqlServer、MySQL、Sybase等均可支持。
- 多维数据库:支持SAP等数据集。
- 直连数据库:目前开放MySQL数据库的直连功能。
是否增加数据填报介绍?(后面会更新,2.12.2这个版本还没有数据填报功能,版本和用户手册一样,以2.12.2为基础版)
3.3 搜索分析
搜索模块是DataFocus系统中最核心的功能模块之一,也是将业务数据进行可视化的主要模块。从下图可以看出,DataFocus系统中特设了一个搜索模块辅助进行数据分析。点击页面左侧的导航栏,就可以切换对应的模块。
本章节介绍的内容主要包括两大部分,首先是介绍简单的多维度搜索分析,其次就几个较有代表性的关键词,进行分类讲解,介绍一下DataFocus首创的中文自然语言搜索的功能,也就是关键词搜索的内容。
先讲述常用的中文关键词,后介绍英文环境下的关键词。关键语句可以对其划分系列,主要包括时间日期相关、排序相关、字符相关以及较复杂的复合语句搜索。
3.3.1 多维搜索分析
这里讲到的多维搜索分析就是指多维度的搜索分析,是利用多属性列或多数值列的数据进行搜索。多维搜索分析是DataFocus系统中最基础的搜索功能,通过将数据表中的列名双击键入搜索框中,然后更换适当的图表类型、配置XY轴的列名数据,最后得出分析结果。
接下来举一个实际分析中可能出现的场景,以某电商销售数据为例。假如分析多属性维度下销售金额的变化情况,可以添加“销售金额”该数值列和多个属性列如“产品名称”、“快递公司”、“目的区域”,然后修改图表类型,就可以得出不同产品在不同区域由不同的快递公司配送的销售金额之间的差异。
3.3.2 时间关键词搜索
接下来讲述的就是DataFocus所首创的中文自然语言搜索的功能,也就是利用关键语句进行搜索,在指定的搜索框中输入关键语句,DataFocus会自动给出提示,使搜索更加智能化。
先来介绍与时间相关的关键词。当我们在利用时间序列类型数据时,最常用的分析就是时间序列的分析,利用时间关键词可以将你需要分析的时序数据更加精细化,只要你存在时分秒的数据,可以直接进行上一分钟、上一秒的数据搜索。
这里以过去X分钟用户下单的订单金额为例,实时更新数据,然后在搜索栏输入“过去的X分钟”、“订单金额”、“下单时间”,即可实时查看过去X分钟下单的订单金额之和,非常智能化。但需要注意的是,数据表中的时间列数据必须存在时分秒的数据,而且必须实时更新,不然无法及时查看到确切的过去的X分钟的数据。
3.3.3 日期关键词搜索
与时间关键词相连的就是日期类的关键词,之所以要于时间关键词进行区分,主要是因为日期类的关键词拥有更加广泛的用途,不仅仅是查看过去几天、几周、几月的数据,更是可以计算月增长率、同比增长、环比增长情况等等。这里也将就几个具有代表性的日期关键词和大家介绍一下。
首先是查看早前X天的数据情况,可以利用关键词“最近/过去/前X天”。同样实时更新数据,然后在搜索框键入“前X天”,然后双击选择“产品”、“实际完成量”,就可以得出这些产品设备以当天为起始的前3天的实际完成量。
日期类关键词除了能查看过去的数据,还有更加方便的功能就是计算同比环比情况。利用关键语句“按订单日期计算的销售金额的总和的月增长率”,可以对销售金额数据的总和就订单日期进行月环比增长率的计算,直接得出环比增长率变化情况,浅蓝色代表下跌,深蓝色代表上升。
计算同比情况则是在环比的基础上添加一句“与往年同期相比”即可。
3.3.4 排序关键词搜索
数据呈现的形态有多种多样,但基本是按照一定规律的,比如按时间先后进行排列、按数值高低排列。利用排序关键词可以就这些规律进行一定的变动,比如变动数值的升降序情况。
排序关键词的特点就在于变更排序的方式,按照你所设定的规则对列中值进行升降序排列。比如在搜索栏中输入“按销售金额升序”,可以看到图中的销售金额的列中值已经按照从小到大的排序方式进行排列。
还有一种关键词是“按xxx降序排列的”,其本质和上述的关键语句是一样的,主要是表达方式上的区别。
3.3.5 字符关键词搜索
字符关键词也是关键词搜索中的重要组成部分。利用字符关键词可以对文本数据进行有选择性的筛选。在对文本类的数据进行搜索筛选时,往往能起到比较优异的效果。
这里举一个简单的例子解释字符类的关键词,在搜索栏输入“顾客姓名开头是‘C’”、双击选择“顾客姓名”,即可将顾客姓名开头为C的顾客筛选出来。
还有一种关键语句是将剔除符合筛选条件的列中值,可以选择键入“顾客姓名开头不是‘A’”,可以看到下图中,顾客姓名以A开头的都被剔除了。
3.3.6 复合语句搜索
最后是复合语句的搜索,简单来说,复合语句的含义就是将多个关键词按照一定的格式进行组合叠加,利用一句话进行多项的搜索。
举例说明,想对该电商销售数据的各目的区域中销售额排名前3的数据进行统计,查看不同区域销售的产品之间的差异,可以在搜索栏键入“按目的区域统计排名前3 的销售金额的总和”、“产品名称”。
还可以多重叠加关键语句,比如可以叠加两个日期类的关键语句,在搜索栏键入“按订单日期计算的销售金额的总和的月增长率与往年同期相比”、“九月”,可以单独提取9月份的同比情况。
最后一个比较具有代表性的复合中文关键语句是可以对数值列进行划分,可以自定义划分的组数和组间隔,比如在搜索栏键入“按销售金额 分7组统计的”、“销售金额的数量”,可以得出销售金额平均分为7组后,各组所占的销售金额的数量。
3.4数据可视化
图表类
DataFocus中包含丰富的图表,具有超强的个性化设置,支持移动端操作系统。另外,用户可根据需求,自行导出图形或图形对应数据信息。
3.4.1 丰富的图表类型
DataFocus支持柱状图、折线图、面积图、饼图、环图、散点图、气泡图、条形图、漏斗图、帕累托图、KPI指标、仪表图、雷达图、位置图、数据透视表、组合图、树形图、词云图、瀑布图、旭日图、打包图、弦图、桑基图、箱型图、平行图、经纬图、热力图等几十种图表大类,每一类细分为多种形态,如柱状图包括堆积柱状图、时序柱状图等。系统会根据用户当前分析的字段个数和种类,自动推荐合适的图标类型。
3.4.2 个性化的图表配置
DataFocus支持图表样式个性化配置,用户可以修改坐标轴、图例等属性,图表布局和风格设置,使图表更加美观。
图表颜色:提供默认主题颜色,还支持自定义修改图形颜色。
配置图:支持多个x轴,当图形中包含多个x轴变量时配置框中会显示所有的x轴变量,用户可以对其进行更改。
- 配置颜色规则:可设置将某一个自定义范围内的值在图表中显示一个颜色。
配置标准线:可设置一个标准目标值在图中显示。
配置悬浮文本:可设置数据标签文本,添加额外的文本信息。
表格属性:提供字体大小、文本颜色、财务型负数极其颜色,以及热图模式的主题颜色配置,根据用户的审美和自身需要进行调整。
图形属性:提供主题颜色、字体大小、图例显示位置、线条粗细、半径起点等微小属性设置,根据用户的审美和自身需要进行调整。
3.4.3 多样的图表交互效果
DataFocus具有丰富多样的图表交互方式,帮助用户更好的查看数据,极大的提升用户体验。DataFocus支持一下交互效果:
数据高亮显示:当鼠标移动到图表的某一数据点时,会显示该数据点所在的坐标值和相关信息,并且该图表线条或区域将高亮凸出显示;当鼠标移动到某一图例时,该图例对应的线条或区域将高亮凸出显示。
选择性显示:点击图例可以隐藏该图例对应图形,以方便用户更好的阅读数据。
图表切块:支持拖动鼠标将图表进行切块放大。
图表翻页:当坐标轴信息列较多时,支持图表翻页查看。
数据预警:可自行设置数据峰值、区间等预警,当数值复合设定的条件时,将会以高亮闪烁动画的方式突出显示,并发送邮件通知。
3.4.4 数据钻取
图表的数据钻取是一种常见的数据追踪方法,它包括上卷(roll up)和下钻(drill down)。上卷是从细节数据到高层次汇总数据的变换。下钻是从高层次汇总数据深入到细节数据进行数据查看,在实际使用场景中比较常用。通过上卷下钻的功能,使用户能自由得变换数据维的层次,深入了解数据,发现问题,解决问题。在DataFocus中右击图表数据区域可以上卷或下钻查看上下层数据。例如,将利润最高的省份“广东”向下钻取地级市,查看利润分布情况。
可视化大屏类
可视化大屏的功能就是将一个分析主题的图表组合成一个看板,用户可以基于大屏的监测关键指标,查看数据动态,定期进行工作汇报。DataFocus支持可视化看板导出为PDF报告,高效简便。
``
3.4.5 数据联动
用户在数据看板中可以通过数据联动,实现关联分析,即通过筛选器对数据进行过滤。
在DataFocus中用户从父级图形中点击“浙江省”,所有字图标联动变化,显示浙江省访问渠道来源比率、浙江省注册用户数变化趋势,浙江省不同年龄段用户差异等。
``
3.4.6 个性化布局配置
布局方式
提供网格布局和自由布局两种布局方式。网格布局可以修改固定的图表大小,分为25%、50%和100%三种样式大小,可拖动图表调整图表顺序;自由布局可以自行拖拽图表大小和位置,支持组件的的对展示,自由挥洒您的视觉创意。
全局样式
提供多种预制样式主题,用户同时也可自定义设置界面背景、组件背景、标题栏背景、组件文字、标题文字、隐藏副标题等美化设计,让可视化大屏的可读性和阅读感更强。
3.4.7 自定义组件
可以添加浮动组件和标题组件两种不同的组件,组件内容可以为文字或者图片。浮动组件不占据画布位置,可以悬浮在其他组件的上方任意位置;标题组件占据画布位置,会影响数据看板的图表顺序和布局。注意:在网格布局模式下,可以添加浮动和标题两种组件;自由布局下仅能添加浮动标题组件。
自定义组件的配置与一般图表组件有所不同,图片类组件配置项除组件大小以外,仅可以进行图片的上传配置,图片需要从本地向系统中导入,可以导入最多七张图进行轮播展示;文字组件需要对用户自由输入的文字进行字体粗细、是否斜体、段落对齐方式、文字背景与隐藏、字号以及字体颜色的配置。
3.5 企业级管控
DataFocus的层级式企业系统管控方案,切合主流企业的管理运营模式,集用户管理、组织管理、权限管理、数据资源分发管理于一体,形成一个完整、安全、高效的信息化管理模式,在让系统用户更好地进行数据分析的同时,保障企业资源安全无虞。
3.5.1 用户管理
管理员通过用户管理页面可以对系统内的用户和角色进行统一管理。系统按照组织构架将用户划分进行管理,管理员可以采用手动添加与批量同步用户源数据集两种方式去添加用户。支持平台内置认证和LDAP单点登录,在对接OA、ERP等系统内的员工组织数据库,直接批量导入用户源会十分方便。
系统内置六种角色权限,三种预置角色和四个预置管理员用户账号,拥有用户管理权限的管理员可以对用户进行角色赋予操作,进行系统管理任务的分配。除了默认的几个管理员角色外,有用户管理权限的管理员还可以任意组合这六种权限添加为新的角色,通过将该角色赋予其他用户,让其他用户协同进行系统的集中管理。
3.5.2 数据权限
DataFocus数据资源管控策略的特殊之处在于数据的权限分配依赖于组织关系而不是用户个人。拥有数据管理权限的管理员可以基于组织关系(即用户组),对数据表的使用权限进行精细到行列的分配。在数据管理-数据权限页面的选择用户组,然后选择需要分配的数据表并进行行列过滤条件的设置。当用户因为组织调动离开当前部门时,所在用户组发生了变动,相同的数据报告也会因为数据权限随组的变动而变化,只能看到当前部门所在组的权限范围内的内容,真正做到了不同角色通过同一系统看到符合自身需求的数据和报表,千人千面。
3.6 多端展示
随着科技和移动便携设备的发展,办公设备也越发的多元化,为了切实的满足用户需求和变化,DataFocus数据分析系统也相应的突破了时空的限制,实现了电脑、手机、pad等等的多端信息互通共享,搭建起多屏覆盖的数据分析决策系统,让用户可以随时随地的查看数据报告,即时进行分析决策,更好地掌控业务的发展变化,不愧于智慧管理智能分析的设计初衷。
3.6.1 移动端展示
为了避免浪费用户的移动设备空间,DataFocus与企业微信相结合,直接在企业微信内设置入口,随时查看数据报告。只要您的设备上有企业微信这个软件,无需多余下载,即可纵享数据分析。与PC端数据分析报表相同,DataFocus的移动端报表也做到了完美自适应多种尺寸,并支持多样化的数据展现,无论是钻取联动,还是消息提示,都完美继承了PC端的功能。
3.6.2 大屏应用
现今很多企业都会在会议、活动中应用到数据可视化大屏来展示公司的运营、销售、KPI达成等信息,或者是用来显示一些实时的数据指标来做到对现场、业务的监控。DataFocus的自由/网格双布局模式+全局/组件全面细节设置+多样化图表+丰富配色,可以完美支持各种尺寸要求的数据可视化大屏的制作与展示。
3.7 性能表现
4.关于DataFocus
DataFocus不仅给企业和个人带来更高效便捷的使用体验,真正实现大数据后台的人机对话,更是大数据技术平台领域的革新。DataFocus立足于满足不同行业客户的各个需求,在各个行业领域内建立了良好的口碑,品牌影响力逐年上升,产品关注度持续增长。截止目前,DataFocus在各行业内总计已搜索51570次,已创建数据看板230面,已创建问答3450个,深入到13种不同的行业,且总计值仍在不断地上升。
DataFocus连续多年享誉人工智能产品市场,获得各个著名投资公司及大型品牌青睐,并累计为超过200家以上传统企业或工厂提供数字化、信息化转型支持。通过帮助企业实现实时数据的挖掘和应用,DataFocus将继续致力于为广大合作伙伴提供低使用成本、高使用效率的人工智能产品,在新商业智能领域中和行业同仁共同推动整个行业的发展。
不仅如此,DataFocus目前采用免费全功能开放试用模式,试用期长达1-3个月,为的就是让客户能够更好地熟悉并相信这款产品,真正做到服务和产品至上。无论是企业或个人都可免费试用DataFocus的强大搜索式分析,让人人都可成为专业的数据分析师。每个想要试用的用户都可获得邀请码进行试用,开始他们的搜索式数据分析之旅。在答疑方面,DataFocus也有专业顾问一对一指导。