大数据分析是大数据研究领域的核心内容之一。Google首席经济学家、UC Berkeley大学的Hal Varian 教授指出:“数据正在变得无处不在、触手可及;而数据创造的真正价值,在于我们能否提供进一步的稀缺的附加服务。这种增值服务就是数据分析。”数据的背后隐藏着信息,而信息之中蕴含着知识和智慧。大数据作为具有潜在价值的原始数据资产,只有通过深入分析才能挖掘出所需的信息、知识以及智慧。
未来人们的决策将日益依赖于大数据分析的结果,而非单纯的经验和直觉。美国《时代》杂志于 2012 年 11 月指出,奥巴马的成功连任背后所依托的关键即是两年来对大数据的分析与挖掘,例如,通过对海量选民微博的分析得出选民对总统候选人的喜好。中国移动“大云”也是根据对 7 亿 3 千万以上用户的数据进行分析,对用户偏好和关注热点等进行归类,用于改善用户体验和辅助市场决策。当前,大数据分析方法论以及支撑技术的研究成为大数据领域的核心焦点之一。

数据可视化是数据数据分析处理后表达一种结果,是表现数据价值的一种方式。可视化 (Visualization) 技术是利用计算机图形学和图像处理技术, 将数据转换成图形或图像在屏幕上显示出来, 并进行交互处理的理论、方法和技术。它涉及到计算机图形学、图像处理、计算机视觉、计算机辅助设计等多个领域, 成为研究数据表示、数据处理、决策分析等一系列问题的综合技术。科学计算可视化能够把科学数据, 包括测量获得的数值、图像或是计算中涉及、产生的数字信息变为直观的、以图形图像信息表示的、随时间和空间变化的物理现象或物理量呈现在研究者面前, 使他们能够观察、模拟和计算。科学计算可视化自1987年提出以来, 在各工程和计算领域得到了广泛的应用和发展。
图 2 视化分析及展示
可视化技术,又名“所见即所得”,是以数据展示为目的一种编程化思想。运用语言本身所拥有的特征,像搭建积木的方式构建操作界面。目前,可视化程序设计概念主要包括:窗口、对象、属性、方法、事件、响应等等。pyecharts是一款居于JavaScript的图表库,其与Python结合后可对数据进行实现可视化展成。
图 3 Echarts图表库
根据其官网介绍,其包含:
-
简洁的 API 设计,使用如丝滑般流畅,支持链式调用
-
囊括了 30+ 种常见图表,应有尽有
-
支持主流 Notebook 环境,Jupyter Notebook 和 JupyterLab
-
可轻松集成至 Flask,Django 等主流 Web 框架
-
高度灵活的配置项,可轻松搭配出精美的图表
-
详细的文档和示例,帮助开发者更快的上手项目
-
多达 400+ 地图文件以及原生的百度地图,为地理数据可视化提供强有力的支持
本次,以全国2021全国旅游前十强省份做一个case分享,因为样本少,可使用程序内建立建构的方式来构建。
图 4 全国旅游前十省份数据资料
图 6 2020旅游前十强省份
一幅图胜过千言万语,人类从外界获得的信息约有80%以上来自于视觉系统,当大数据以直观的可视化的图形形式展示在分析者面前时,分析者往往能够一眼洞悉数据背后隐藏的信息并转化知识以及智慧。“天沐云”也将基于此技术,在未来将会根据需求定制出不同的通表,供用户提供服务。