第一章 DataFocus入门
1.1 商业智能BI的发展趋势
(1)自助式数据分析是大势所趋
传统的数据分析模式,都是通过IT信息部门集中管控。需求由业务人员发起,IT工程师根据业务人员的数据分析需求,写代码到各业务系统取出数据,制作报表。这种方式效率低下,费时费力。往往还因为业务部门和IT人员的认知不同,导致沟通偏差,未能准确满足需求。 未来,以业务人员为中心的,IT部门辅助的自助式分析模式,将从根本上解决以上问题。有了DataFocus这类数据分析工具,业务人员从自身需求出发自助进行数据分析成为现实。现在,IT部门只需要事先将数据进行好标准化规范,业务人员通过简单搜索即可完成。
“到2019年自助分析和BI用户创造的分析结果将超过数据科学家” --Gartner
(2)全栈式BI已成为潮流
传统的BI或报表工具,只局限在数据的分析和展现,往往还需要搭配第三方的数据仓库才能有效运行。DataFocus自带大数据仓库,企业数据分析不需要再采购第三方组件,系统部署完成后,从数据抽取、建模到搜索分析,分享、预警和移动端展现,All in one! DataFocus引领全栈式BI的潮流,将企业从BI部署、实施到上线运行的周期缩短70%以上。
“你需要的不仅仅是一种工具,而是一个工具箱。”
(3)自然语言搜索式分析将成主流
Gartner多次预测,自然语言搜索式分析在2020年,将占50%以上市场份额。可以预计未来3-5年内,传统的报表软件将逐步退出历史舞台,拖拽式BI生产商,也将逐步通过技术转型,转向搜索式分析路线上来。DataFocus作为国际上第一款将NLP技术运用到商业智能产品中,同时支持中英文搜索的数据分析系统,紧随技术发展潮流,用AI驱动商业智能BI技术的发展。
“未来已来,将至已至;既往不恋,纵情向前。”
搜索配图:搜索式分析的设计图
DataFocus是一款运用最新理念设计的数据分析系统,它包含了商业智能BI的各项功能,也可以作为商业级的智能数据中台部署和使用。企业可以围绕DataFocus打造全系列的数据分析和AI解决方案,而无须依赖更多第三方组件。
传统商业智能BI,一方面由于架构设计落后,无法高效处理大容量、复杂业务系统大数据分析问题;另一方面其使用门槛高,需要用户花费大量时间学习才能掌握相应的分析技巧,给企业带来了使用成本高、数据生产和消费分离、分析周期长等一系列问题,从而造成企业、组织数字化治理的严重障碍。
“DataFocus通过引入人工智能技术,完全革新了商业智能BI的交互方式。”
通过链接企业各种数据源,DataFocus为您整合所有的数据资产,在此基础上,您只需要通过搜索问答的方式向它提问。AI驱动的数据分析能力,比传统的报表软件效率提高100倍以上,比传统的拖拽式BI工具更智能;更有价值的是,掌握这种搜索式分析技能,不需要熟练的数据库工程师或数据分析师。精通业务的非工程技术人员,经过半小时的培训,即可熟练掌握,7分钟即可开发一个完整的数据可视化大屏。
1.2 数据分析新星DataFocus
DataFocus是一款国产的智能数据分析软件,诞生于2018年。它是由一群技术极客打造的大数据可视化分析工具,其设计原则是尽可能简化用户的操作复杂度。与市面上绝大多数数据分析软件不同,DataFocus采用搜索式的交互设计,用户只需要在搜索框中输入由关键词组成的语句即可,用户不需要关系图表的设计、数据的摆放既可以快速获得可视化结果。整个操作过程类似使用Google或Bing搜索引擎一样。DataFocus的搜索框具有智能语言处理功能,可以高效的将用户的关键词搜索转换成数据库查询语言。
DataFocus不仅仅是一个数据可视化工具,它还具备大数据仓库、智能数据洞察和机器学习功能。用户可以通过在其官方网站(www.datafocus.ai)注册下载免费版或Mini版试用,企业用户也可以购买具备更丰富功能的专业版和专家版软件。
1.3 DataFocus主要特点
1.3.1 搜索式分析
“DataFocus既是国际上第一家正式投入商用的,同时支持中英双文搜索的大数据分析产品,也是国内第一家开创搜索分析交互方式的产品。”
DataFocus既是国际上第一家正式投入商用的,同时支持中英双文搜索的大数据分析产品,也是国内第一家开创搜索分析交互方式的产品。搜索式数据分析不仅仅是一种技术变革。它有效的降低了数据分析的门槛,使得非技术出身,但是精通业务的人员也可以快速上手进行数据分析,这有效的打破部门墙,让自助式数据分析真正成为现实。
搜索式分析,还使得企业培训数据分析师变得容易。从而打破了商业智能工具买得起用不起的尴尬。让大数据分析像搜索一样简单,这是DataFocus一直以来的目标。
1.3.2 自带大数据仓库
大型企业集团多年的IT信息化建设,积累了海量的数据,这些数据分散在多达数十种的业务系统数据库中,形成了一个个数据孤岛。这一方面导致了数据标准不统一、无法准确的进行分析;另一方面,传统关系型数据库的查询性能也越来越低,导致分析效率的低下。 DataFocus标准版以上版本自带的大数据仓库,能够轻松对接各类传统关系型数据库抽取数据或直连数据。独有的雪花模型,支持复杂的数据库结构;通过多数据源整合,支持跨系统分析,彻底打破数据孤岛。
1.3.3 强大的可视化能力
优秀的数据展现形式,既可以提高信息获取效率,又能很好的吸引注意力。DataFocus的图表分析可以自适应多达40种可视化图形,告别密密麻麻的表格数据。在此基础上,提供了大量图形通用配置功能,以供追求完美。
DataFocus的数据可视化大屏开发不仅可以做到高效,更可以做到媲美专业的数字大屏开发效果。增强后的数据看板功能模块,可以进行高度、灵活的自定义。比如设定复杂的大屏背景、组件风格、界面配置、全局摆放,动态效果等等,开发出震撼的可视化大屏甚至无须设计师参与。
1.3.4 快速实时计算,无须CUBE
海量数据进行关联分析,往往有效率瓶颈。传统的OLAP分析方式会借助第三方工具进行CUBE预先计算的方式,以空间换时间。但是数据分析的工作是连贯的,这种定时跑任务的分析方法,只适用于传统的固化报表作业模式。
信息瞬息万变,决策毫秒之间。DataFocus采用列式数据存储的方式,通过自带的内存计算引擎,无须预先建立CUBE,数据分析实时交互,完全满足管理决策中经常遇到的临时性分析、多变的业务需求和频繁的结果刷新。IT部门将从此告别延时报表分析,亿级数据秒级响应。
1.3.5 完善的多端应用
数据分析的结果往往需要与更多人分享或讨论,有时候还需要及时发送预警邮件。DataFocus同时支持企业微信和钉钉,通过简单的分享操作,即可快速实现手机查看。优化过的移动端展示效果,使得数据看板和图表的展现更加人性化,便于您旅途中也可以进行数据分析。
1.3.6 行列级权限控制
DataFocus精确到行、列的细粒度数据权限控制,分析报告自动根据用户权限现实对应的数据,这可以轻松满足大型企业集团精细化的数据控制需求。固化的分析报表或数据看板只需要制作一份,再根据权限配置,即可实现千人千面的数据展示效果。此外,DataFocus还支持LDAP服务器集成,实现多业务系统的单点登陆。
1.3.7 智能洞察
尽管有了搜索式分析的便利,企业在进行浩繁的数据分析探索时,仍然是低效的。举例来说,零售类企业有数以万计的SKU,数以千计的连锁门店和可分析时间段,数以百计的业务人员和促销渠道。分析师需要穷尽数亿级的组合才有可能找到一些典型的特征或趋势,比如某个单品,在特定时间段或特定门店会有快速增长的销量。这种工作理应交给机器。
DataFocus专业版的智能洞察模块,可以自动进行数据探索,从数亿的可能组合中,找出数据趋势和特征,并快速生成数据分析报告。
“从数万个类别中发现隐藏规律,需要分析数百万中可能,人类分析师需要100年!”
1.3.8 机器学习
数据分析可以找到规律、发现问题,企业更加需要AI解决问题。DataFocus提供了各种武器帮助企业进行数据探索,企业在获得确定见解后,需要采取行动。有时候需要AI驱动的工具帮忙。比如,持续观察到某种商品库存占比过高,借助DataFocus专家版的算法模块,训练出库存预测AI,指导企业的采购进行调整。企业的数据分析,从描述性统计,到预测型分析,不需要额外购买更多软件,DataFocus帮你一站式搞定。
“用DataFocus建立算法模型,优化您的业务!”
1.4 DataFocus产品体系
针对不同的用户场景,DataFocus开发了丰富的产品线,其中Mini版和标准版(Standard)可以直接从官方网站(www.datafocus.ai)下载试用。所有版本都提供了搜索可视化功能,以及数据链接、大部分数据看板(可视化大屏)功能,全线产品均提供云端部署或私有化部署方式,其中Mini版提供Windows和CentOS两个安装版本,各版本的具体定位及差异如下:
版本型号 | 用户定位 | 功能模块 | 数据量 |
---|---|---|---|
Mini | 个人用户、小型企业 | 搜索分析、数据可视化、数据看板,数据源链接,权限管理 | 单表10万行以内 |
Standard | 中大型企业 | 搜索分析、数据可视化、数据看板,数据源链接,大数据仓库,内存计算引擎 | 不限 |
Professional | 大型企业 | 搜索分析、数据可视化、数据看板,数据源链接,权限管理,大数据仓库,内存计算引擎,智能数据洞察 | 不限 |
Expert | 大型企业 | 搜索分析、数据可视化、数据看板,数据源链接,权限管理,大数据仓库,内存计算引擎,智能数据洞察,机器学习引擎 | 不限 |
1.5 了解DataFocus工作区
DataFocus的操作界面很简单,登入系统后,默认进入搜索页面。可以看到左侧区域“壹”依次有5个图标,分别是“搜索”、“数据看板”、“历史问答”、“数据管理”、“系统管理”5个模块。搜索页面左侧区域“贰”是待分析数据源,用户可以点击“选择数据源”,进入对应的界面选择要分析的数据表。数据源下方的区域“叁”是“增加公式”模块,可以实时的设定公式对数据表中的数据字段进行计算,编辑完的公式可以和数据表中的字段一起进行搜索分析。区域“肆”的搜索框用于解析用户的搜索语句。区域“伍”是图表显示区(第一次使用记得点一下右上角的文件:1-2_信息提示.png )。右上角区域“陆”依次是用户信息、登录状态、语言切换和社区帮助链接,帮助链接有丰富的视频教程和使用手册。
最简单的分析方式就是在左侧数据表中双击待分析的字段,或者在搜索框中输入相应的字段,既可以进行维度分析。
数据看板模板是所有数据看板的列表显示页,可以在该页面发起创建新的数据看板,或者编辑已有的数据看板。
历史问答保存了所有已保存的分析图表。DataFocus的分析类似问答的形式,因此命名为历史问答。用户可以通过缩略图大致了解该图表的类型。也可以直接点击编辑进入搜索页面对该问题重新分析。
系统管理页面主要用于管理员用户和组进行创建、授权,超级管理员也可以查看日志、管理设备或对系统进行迁移。