大数据时代的数据科学与数据驱动决策

(整期优先)网络出版时间:2019-07-17
/ 2

大数据时代的数据科学与数据驱动决策

李明远

福建省建瓯第一中学,福建省

摘要:大数据时代下数据广度与数量的爆炸性增长给数据科学的发展提出了更高的要求,这也给新时期的数据科学家,企业管理人员,普通职员提出了新的挑战。对数据科学,数据处理,数据驱动决策等领域的认识加深将有效地提升企业运营效率,给企业赢取竞争优势。

关键词:大数据;数据科学;数据驱动决策

随着可用数据的爆发性增长,各个产业界的企业如今都聚焦于从数据中获取竞争优势。如今,数据的多样性以及数量已经远远超过了人工处理的容量,甚至超过了传统数据库的容量。同时,计算机的性能变得越发强大,网络变得无处不在,算法研究变得越发深入,给数据科学在商业中的广泛应用打下了基础。

虽然众多企业已经明白数据科学家的重要性1,对于数据科学的定义不清晰将导致实际工作中的决策错误,使得许多工作事半功倍。因此,对于数据科学及其相关定义如数据科学实践,数据科学驱动决策的准确认知十分重要。

数据科学

数据科学,从一个更高维度的视角来看,是一系列的可以指导从数据中获取信息以及知识的基本原则2。或许与数据科学关系最密切的词是数据挖掘——通过使用数据科学原则指导的技术从数据中获取知识的实践。数据挖掘的算法有成千上万种,其中的细节更是不可计数。这些都反应了数据科学领域的蓬勃发展。

这些基本原则与技术在商业领域得到了广泛的应用,或许其中最为典型的应用就是市场运营中的针对性营销以及网上广告投放。数据科学同样可被应用于顾客关系管理中以提升顾客服务,提升单位顾客价值。金融业中则使用数据科学以评价用户的信用得分,从而指导面向用户的服务。

数据挖掘算法仅仅是数据科学领域的一部分,一个成功的数据科学家必须有能力从数据的角度去分析商业问题2。数据科学借鉴了许多传统的学科。统计学知识组成了数据科学的大部分技术。在一些特定的领域,数据科学同样要求个体的直觉,创造性,常识以及知识去解决问题。一个数据科学的视角为实践者提供了解决问题的结构与原则,同样给数据科学家提供了从数据中系统获取知识的框架。

数据科学以及数据驱动决策

数据科学涵盖了通过对数据的自动分析以理解现实状况的原则,处理以及技术。通常说来,数据科学的终极目标是提升决策,这也是业务界最关注的。数据驱动决策主要指的是将选择基于对数据的分析而不是纯粹的直觉的实践3。比如,一个市场人员可以通过自己丰富的从业经验判断最佳广告投放路径,也可以通过对数据的分析做出决策,也可以结合以上两种方法。数据驱动决策不具备排他性,可以作为传统决策手段的补充。

据美国一项研究报告显示,一个企业越深入的使用数据驱动决策,它的产出越高3。虽然提升的幅度仅在4~6%左右,数据驱动决策还带来了更高的资本回报率,资产利用率和市场价值。国内也在数据驱动决策领域做出了实践。之前国内一直对老年人公交卡在早高峰之前的使用有所讨论,舆论倾向于在早高峰期间禁止使用老年公交卡以提升上班族通行效率。然而通过对北京公共交通的数据分析显示,公共通行的高峰时间段在07:30到08:00之间,而老年人出行的时间通常在09:00之后。因此老年人不仅没有影响高峰期的公共交通,反倒对通勤低谷期的公共交通起到了很好的运力补充4。由此,数据驱动决策体现了其对决策合理性的提升。数据驱动实践同样在政府服务领域得到了深入应用5。数据驱动决策在对社交平台及政务平台的舆论,民情搜集及分析、对公共服务领域如医疗服务的数据平台建设、对应急管理领域如灾情,节假日的景区人群的历史数据分析等方面都得到了良好的实践,提升了决策的全面性与科学性。

数据处理及大数据

数据处理技术不仅在数据中信息获取和数据驱动决策中至关重要,它同样在大规模交易,现代网络处理以及网上广告管理系统等方面起到了很大的作用6。因此,不是所有数据处理都与数据科学有关。而对大数据,最直接的认识就是数据规模过大使得传统的数据处理系统无法处理,因此推动了新技术的出现于发展。与许多传统技术一样,大数据技术在数据工程等领域得到了应用。具体的应用领域囊括数据挖掘,数据处理以及支持数据挖掘技术的其他数据科学实践。

在大数据时代,数据科学所需要的最重要支撑之一就是数据分析思维。数据分析思维不仅对数据科学家很重要,对于企业及其他组织也十分重要7。比如,企业的管理人员及员工如果具备基本的数据分析思维,可以从企业的数据科学资源中获取重要的信息。没有数据科学资源的企业中的管理人员则可以依靠数据分析思维从客户中获取信息。更普遍的说,如今的商业越来越多的被数据分析驱动,对数据分析有深入了解的企业将获得极大的竞争优势。理解数据科学的基本概念,同时构造并组织数据分析的基本框架,不仅能够提升企业再数据驱动决策领域的视野与机会,还能帮助企业应对基于数据的竞争与威胁。

结论

在如今这个数据广度与深度爆炸式增长的大数据时代,数据科学发挥着不可替代的作用,组成了数据处理,数据驱动决策以及大数据技术的基础。为了使数据科学领域蓬勃发展而不是仅仅作为大众眼中的一个流行词汇,数据科学家必须把视野越过常用的数据算法,技术,以及工具,思考数据科学的核心原则与构架,思考数据科学与数据驱动决策,数据科学与数据处理,大数据之间的关系,由此才能更好的应用数据科学,推动数据科学发展。

参考文献

1.DavenportTH,PatilDJ.Datascientist[J].Harvardbusinessreview,2012,90(5):70-76.

2.VanDerAalstW.Datascienceinaction[M]//ProcessMining.Springer,Berlin,Heidelberg,2016:3-23.

3.BrynjolfssonE,HittL,KimH.Howdoesdata-drivendecision-makingaffectfirmperformance[C]//WorkshopforInformationSystemsandEconomicsatthe9thAnnualIndustrialOrganizationConference,April.2011:8-10.

4.张淳艺.数据驱动决策应成常态[N].健康报,2019-06-09(002).

5.何林生.大数据驱动政府科学决策:现状与前景[J].福建行政学院学报,2019(01):82-89.

6.Monino,Jean-Louis.DataValue,BigDataAnalytics,andDecision-Making[J].JournaloftheKnowledgeEconomy,2016:1-12.

7.MinelliM,Chambers,Michele,Dhiraj,Ambiga.BigData,BigAnalytics(EmergingBusinessIntelligenceandAnalyticTrendsforToday\"sBusinesses)||BusinessAnalytics[M].2013.