您现在的位置是:LG博客 > 大数据 >

香港科技大学屈华民教授十条干货:可视化是大数据最后一公里

2020-08-01 13:38:1898人已围观

“相隔一年,世界已经巨变,技术变革提前并且加速,与其担忧,不如担当。”马云在2020世界人工智能大会上讲到。

疫情之下,对于愿意思考未来的企业家来说,机会才刚刚开始。新科技将改变未来商业世界版图。

港科大EMBA中英双语课程以云课堂,参观实验室,专题报告,知识转移四部曲的方式开展了「走进科大实验室」系列活动,邀请到首屈一指的科研教授,与大家一起分享世界级的科研成果,一起感受科技的力量,以及其蕴含的巨大商机。

早于18世纪的英国,已采用地图显示流行病者的分布;时至今日,美国总统选举、世界疫情的走势,将可视化大数据的应用显露无遗。根据顶级期刊的论文发表量,香港科技大学VisLab是世界最大的可视化数据研究所之一,位列全球前五名之内,研发成果为顶尖企业Microsoft、IBM、华为、腾讯、博世采用,其领军人屈华民教授,深入浅出地阐述可视化技术的发展,以及应用实例,带大家走进香港科大实验室。

一、什么是数据可视化?

我们从网络、城市、财务、物流、农业、传感器等来源收集大量数据,然后进行提取和整合,筛选出合用的数据,再进行大数据计算与数据挖掘,而可视化就是数据分析的最后一公里路程,用图像形式把有用的数据送到终端用户手里,应用范围包括财务与风险管理、基因农业、智慧城市、网上购物、健康管理等各个领域。而数据有四大特性:数量大;动态高;变化多、形态丰富,如文字、视频、音档等形态;价值悬殊,部分极有具参考价值,部分是完全无用的数据。

二、为什么要将数据可视化?

正因为以上四大特性,而可视化是数据分析最后一公里路程,以图表、图像方式展示,让人们可从复杂海量的数据中,获得新见解、洞察趋势,可见其关键的作用。根据Harvard Business Review的研究,指出全球最大日用品生产商宝洁,已肯定可视化数据有助决策,从根本上升级数据的使用,并规范成为管理的工具之一,提升决策和执行的效益。

美国在2016年公布的「美国人工智能研发战略规划」中,当中战略二是:「开发人工智能与人类协作的有效方法 」,肯定了人工智能和人类的结合,然而人工智能是根据原始的数据进行演算,过程中要让人类读懂数据,可视化数据担当关键的桥梁作用;在技术上,可视化和用户界面需要进一步开发改良,以帮助人们理解大量现代数据集和各种来源的信息。

在2019年六月,全球领先的CRM厂商Salesforce斥资157亿美元收购全球最大的分析平台Tableau。Tableau正是一家交互式数据可视化软件公司,成立于2003年一月,一直专注于商用智能技术的开发和应用,其收购价反映数据可视化的价值 。

三、读图力之开发

既然有视像化之数据,人们也需要掌握一定的读图力,从中理解事情的趋势,甚至藉此作出判断。以新冠肺炎各国发病的走势图为例,整理者将美国、英国、中国及比利时的病例数量按时间线表达,各国的高峰期、平稳期、下降期的走势曲线,比较下发现走势相若,有阅读者领会的到中国控制疫情的能力,也有人从自然发展的曲线作出判断,相信各国的信息都是真实的,反映不同阅读者从中得到的领悟,层次也有高低分别,这跟他们的读图能力有直接的关系。而刚才提及的「美国人工智能研发战略规划」,其中一项战略就是要求大学生掌握可视化数据的读图力,藉以解决问题,同时训练左右脑思维。

最初级的读图能力,适用于普罗大众。现在许多媒体已采用图像来说故事、展示数据,例如 《纽约时报》中文网于2020年中发表的一篇文章:「美国人工智能领域的秘密武器:中国人才」,数字显示,有54%中国学生于美国取得研究院学位,而现在留在美国人工智能领域工作的中国研究院毕业生,刚巧是54%,光是看数字,会令人误会,所有于美国取得研究院学位的中国学生,全数留美工作;但是,因着图像的补充,显示54%于美国工作的中国研究院毕业生中,有若干百分比是来自中国及其他国家的研究院,简单的一张图像,清晰地显示了两者的不同。

至于中级的读图能力,需经过一定培训方可掌握。例如 《彭博新闻》以地图形式整合国内用于土地上的经费,金融新闻会按地区描画出家庭的消费习惯等,内含复杂多元化的数据,要求读者有一定读图力去理解。

高级的读图力,响应由形态众多,如文字、视频、音档等整合分析而成的可视化数据,主要是研究人员处理信息系统,以及向科技企业报告时采用,阅读者有如开车时要手脚并用,相互协调,才能洞悉出事情的脉络发展。

四、数据可视化应用实例──智慧校园

-