欢迎访问一起赢论文辅导网
机械论文
当前位置:首页 > 机械论文
大数据变革背景下的顾客网络满意度比较
来源:一起赢论文网     日期:2015-10-17     浏览数:2097     【 字体:

大数据变革背景下的顾客网络满意度比较———基于OLAP 可视化技术应用视角王宗水,赵红中国科学院大学管理学院,北京100190)摘要选取家知名火锅连锁企业作为研究对象,根据mapreduce 原理收集、处理样本数据采用在线分析处理( On-Line Analytical ProcessingOLAP) 技术从时间、区域、满意度三个指标维度来实现大数据环境下顾客网络满意度的可视化。对家企业顾客网络满意度评价进行比较分析,指出在不同时间、区域存在的差异。结果表明,OLAP 技术能够以最直观的方式反应大数据环境下顾客网络满意度的差异及变化趋势,能够为企业网络口碑建设及网络营销策略的制定提供直接的参考依据。关键词大数据大数据变革顾客网络满意度; OLAP 可视化DOI: 10. 13956 /j. ss. 10018409. 2015. 05. 23中图分类号: F272; F719 文献标识码: A 文章编号: 10018409( 2015) 05010605Comparison of Customer Online SatisfactionComments in Big Data evolution———A View of OLAP Visualization Technology UtilityWANG Zong-shuiZHAO Hong( School of ManagementUniversity of Chinese Academy of SciencesBeijing 100190)Abstract: This paper summarizes the connotation and characteristics of big data. And thenit compares the research methodsdata collectiondata filtering and samples selection of customer satisfaction between traditional and big data era. Nextit collects and selects data based on mapreduce principlesand On-Line Analytical Processing ( OLAP) visualization technologyhas been used to analyze the online customer satisfaction which consists of timeareas and satisfaction three dimensionsand three famous hot pot chain enterprises as instance. At lastit uses OLAP method to compare the three hot potchain enterprises' online customer satisfaction of different periods and areas. Result shows that the OLAP can reflect thedifference and changing tendency obviously and provides direct reference for the enterprises' internet marketing as well asword-of-mouth marketing strategiesKey words: big data; revolution of big data; internet customer satisfaction; OLAP visualizations1 引言大数据顾名思义即所涉及的数据量规模巨大且无法通过人工在合理时间内实现截取、管理、处理、并整理成为人类所能解读的信息[1]。大数据时代,数据的性质发生了质的改变,从简单的处理对象转变为一种基础性资源,这种变化必然导致数据管理方式的变革[2]。近十年,随着社交网络、博客、LBS( Location Based Service) 等信息的产生和传播方式的发展,数据以多种多样的形式表现出来,而且其增长速度、表现形式仍在快速增加。因此即使经过一定的过滤,由于数据源众多、较长的积累周期也会形成海量的数据[3]例如顾客网络评价。由于越来越多的消费者喜欢通过网络交流消费经历、感受,并且对消费结果做出评价,经过一定时期的积累,必定会形成大量反映顾客整体满意度的数据。同时,网络评价对消费者行为具有一定·106·《软科学》2015 月·第29 卷·第期(总第185 期) 营销与服务的影响[45],而且影响到顾客对经营者的信任程度[6],关系到被评价对象的长远发展。所以通过有效的方法实现大数据情境下顾客网络评价信息的可视化,对消费者满意度特性研究以及企业通过提升满意度来增加自身价值等方面具有重要的意义。本文在分析大数据的特点以及所带来的变革基础上,选取家火锅餐饮连锁企业进行顾客网络满意度比较。结合mapreduce 原理完成数据的筛选和样本的确定,通过OLAP 技术实现数据的可视化,将时间、区域维度下的比较结果直观地展示出来,为企业发展战略的制定提供参考,也是大数据研究及应用的重要探索。大数据变革的内涵由于市场压力和技术的演化,大数据计算正在以极快的速度发展[7],先进的数字传感技术、通讯技术、计算存储设备创造了巨大的数据,通过大数据计算收集了关于商业、科技、政府和社会的数据[8]。Bryant Katz 等同时指出,大数据计算不仅改变了公司的经营活动、科学研究、医疗活动,而且关系到国家的国防建设以及情报工作。例如Wal-malt 目前正在建立的能够存储千兆字节( 4000 万亿字节的数据库记录每一个消费者的消费信息,为实现消费者的数字化管理奠定了基础在医疗应用领域,大量医疗数据的收集能够实现更有效的病情诊断,提高医治效率等。在此基础上本文将大数据变革的内涵归纳为由于海量的关于经济、社会、文化、科技、自然环境以及政治等各个方面的信息、数据,通过收集、存储、分析处理后所产生的能够对以前认知、行为产生一定影响甚至完全颠覆的巨大变革。2. 1 大数据变革的特点大数据变革的特点主要由大数据3V 特点( VolumeVelocityVariety) 所决定,表现为数据量大、输入和处理速度快、数据多样性[8]三个方面,但更强调对现有认知或行为的影响和改变。当然也有一些机构认为大数据还具有价值性( value) 、真实性( veracity) 等特性[9],然而并没有达成一致的共识[2],因此本文从3V 角度分析大数据变革的特点。( 1) 海量的数据增加量。大数据与传统数据相比,从GB( Gigabyte) TB( Terabyte) 达到PB( Petabyte) ,网络大数据甚至达到了EB( Exabyte) ZB( Zettabyte) 级别[10],仍然呈爆炸式的快速增长并且远超过摩尔定律的增长速度[11]。( 2) 高速的数据传输、处理。由于计算机、通讯技术、网络设施的发展,数据实现了即时传播,时间的影响呈进一步弱化的趋势。( 3) 多样的数据形式。主要体现在两个方面一方面在数据类型上可分为科学数据、Web 数据、多媒体数据等多种数据类型[12另一方面在数据结构上体现为结构化数据、非结构化数据以及半结构化数据,而且后两种占的比重越来越大[2]。2. 2 大数据变革的挑战2. 2. 1 大数据研究的两个矛盾大数据基于数字化、网络化、物联化、智能化、个性化[13]等特征反映的信息具有真实性、连续性以及区位性。虽然大数据展现出在真实性、时间、空间等方面的优越性,但由于数据量巨大必然产生一些新的问题。其主要表现在如下两个方面[14]。( 1) 可获取数据爆炸式急剧增长与用户有限的信息选择能力之间的矛盾。随着网络信息的急剧增加,信息的内容、结构、呈现形式都发生了显著的变化,对数据的筛选、应用受个人知识水平、价值取向、生活经验、自身性格等多种因素的影响[15]。( 2) 海量信息的呈现与用户有限需求之间的矛盾。大数据的一个显著特点就是所呈现的数据量巨大,据统计twitter 上每分钟就有700 youtube视频分享[16],然而用户对数据的需求是有限的,更多关注于与自身相关的信息收集,从而经过选择过滤掉其他不相关的信息,但这并不是信息的浪费,而是用户需求的局限性,从而产生了数据量巨大与用户需求有限之间的第二类矛盾。2. 2. 2 数据管理要求的变化目前大数据得到了多层次、多领域的关注,但这并不表明人们对大数据的深入了解,而是从另一方面反映出过度炒作的危险[2]。另外大数据不仅规模庞大而且具有分布式、异构、不准确、不一致等特性,加大了数据的管理难度[12]。大数据是把双刃剑[17],一方面为人们提供了获得新知识的源泉,另一方面却因为大数据的多元性以及非结构性特征导致数据的管理成本增加。因此大数据管理要求更高性能的数据收集、存储以及处理设备来支持包括大量非结构化、动态的数据筛选、传递、存储等工作同时对数据管理人员具有更高的要求,不仅要具备数学、统计学知识,更要拥有创新精神、相应的交叉学科知识以及对有价值信息的把握能力。所以大数据管理与传统的数据管理相比,无论是基础设施、管理模式或对管理人员的要求都发生了显著的变化。大数据变革对顾客满意度评价的影响3. 1 数据收集方法对顾客满意度的研究过程中,国外学者通常采用美国消费者满意度指数( American Customer Satisfaction IndexACSI) 来代表顾客的满意度[18, 19国内学者通常采用问卷、访谈等主要方式来研究顾客的满意度[20, 21]。不管是国内还是国外对顾客满意度的研究其计算通常采用主动获取的方式得到,即参与相关满意度评价的主体不是自发的而是被动受访,因此在这种情况下可能产生敷衍、厌烦情绪导致数据的效果较差。大数据时代,网络已经成为人们日常表达情感的一种方式,同时大众点评网、天猫、苏宁易购等多种网络平台为非问卷、调研方法获得消费者对某种消费的满意度提供了可能性,而且通常是自发的、对消费感受的真实评价排除极少数商家通过一些非诚信手段提高顾客评价的情况,面对如此巨大有价值的信息,怎样获取、筛选、深入挖掘是一项首先要解决的问题。因此本文依托于网络爬虫技术原理在特定网页上以特定检索词或符号,如顾客对消费的·107·《软科学营销与服务》2015 月·第29 卷·第期(总第185 期)评语、打分等来收集相应的顾客满意度数据。3. 2 数据筛选方法顾客网络评价数据伴随着时间的积累形成多条数据流,不同的流由于被评价对象的不同划分成不同的区间。因为数据流的持续到达速度快且规模大,因此数据流的处理具有一定的难度,而且很难把握数据的全貌[2]。Goole 早在2004 年就提出使用Mapeduce 技术来简化大量数据的处理[22],其基本流程如图所示。Mapreduce 技图1 Mapreduce 并行运算的基本流程术由于模型简单、拓展性良好、支持大规模并行运算、具有容错性,而且数据分析能力正在不断增强,在大数据分析中具有显著优势。因此本文在对数据流分析过程中以mapreduce 原理为基础来实现数据输入到输出的处理。3. 3 研究样本确定首先根据某研究中心2012 年评选出的10 大火锅品牌选取其中的AB三家作为研究对象为了避免研究结果对所涉及企业日常经营的影响,本文不直接指出企业名称) ; 然后根据mapreduce 的基本思路,以大陆以内的省、直辖市为基本单元确定split,并以满意度或相关的符号、标识等在大众点评网、美团网、QQ 美食等相关网络消费评价平台上搜集相关数据,对不相关的信息予以删除最后通过相应的mapreduce 类似条件的设定形成最终的数据输出结果,样本数据处理过程如图所示。图2 mapreduce 数据处理结构示意图在数据收集过程中发现,A在全国31 个省、直辖市都有连锁店,在全国26 个省、直辖市有连锁店,对网络评价总数小于100 的区域予以删除,则ABreduce result分别为107; 同时选取北京、上海、重庆三个城市对三家公司进行深入比较,output 设定为3; 另外在数据的选取上以2011 日至2013 日这年作为数据获取的时间间距,括号内为对应收集的数据量,具体数据处理结果如表所示。表样本数据mapreduce 处理过程统计数据模块企业名称A B CSplit 31 31 26Map task 31 31 26educe result 10( 20667) 8( 7268) 7( 3215)Output 3( 10494) 3( 2420) 3( 552)4 Olap 在顾客网络满意度评价比较中的应用OLAP 是一种多维数据处理模型[23],由于其在企业多维数据处理方面表现出的灵活性、动态性、快速性而得到广泛的应用[24]。如企业的营销管理决策、专利的挖掘、网络教学管理、家电零售业数据仓库的管理等多个领域。OLAP 以多维方式进行数据分析处理,通过切块或片、旋转、积存、下钻等操作实现数据的大规模分析及统计计算,数据可以柱形图、饼图、折线图、三维图等多种形式输出,实现有价值信息的直接显示。4. 1 构建相关数据仓库顾客网络满意度通常包括时间、评价对象具体的连锁店、评语三个方面,因此可以从这三个维度构建数据库结构如图所示。其中指标维即为顾客网络评价的分值,其又可以根据具体情况细化到二级指标或者更多级指标。时间维即为数据统计分析的时间段,本文以半年为基础时间段,虽然顾客的网络满意度评价每天都在变化,但是这·108·《软科学》2015 月·第29 卷·第期(总第185 期) 营销与服务些变化是零散的、随机的,点式的数据往往不能反映一个拥有几十、甚至上百连锁店企业的整体满意度另外通过前期数据分析,发现顾客网络满意度评价在月、季度、半年、年等时间段中会呈现出整体性变化的一般规律,但是由于网络评价人数在较短时间内相对较少,通常在半年及以上才会累积到几百个评语。因此本文为了减少数据量不足引起的偏差,选取半年为数据收集、分析的基础时间段区域维度指连锁店所在的具体省、直辖市,区域划分是为了了解不同区域内顾客满意程度,指出不同地区存在的差异。图网络评价满意度数据仓库模型4. 2 顾客网络满意度评价的可视化顾客网络满意度评价的可视化分别采用切块和切片两种方式进行处理如图所示。所谓切块就是在整体顾客网络满意度评价中提取固定区域、固定时间段的信息;而切片处理则是固定时间、某一区域或者固定区域、某一时间段的顾客满意度。图顾客网络满意度评价切块、切片处理示意图作为OLAP 系统必须体现基本的功能,包括数据选取的节点、切片和切块位置的设定、时间次序的排列等基本信息,OLAP 在顾客网络满意度评价应用中的基本数据格式语句形式如下。<cube name =customer satisfaction comparison”><table name =comment_fact/>维度的确定<dimension name =customer satisfaction”><table name =customer satisfaction/><property name =“顾客满意度评价”column=customer satisfaction comment /><property name =“时间”column =time /><property name =“区域”column =area/>< /dimensionìíîïïïïïïïïïï······< /cube4. 3 顾客网络满意度比较通过表的数据进行OLAP 可视化计算,得到三家火锅连锁企业的整体累计顾客网络满意度评价指数CSI( customer satisfaction index) ,其计算公式为CSI = SUSN 表示对消费非常满意和十分满意的顾客评价,US表示对消费不满意和非常不满意的顾客评价,表示评价总数。图5 2011 月至2013 月顾客网络评价满意度比较计算得到CSIA= 0. 6125CSIB= 0. 5630CSIB= 0. 4920,因此的整体顾客网络满意度评价较高。那么,在2011 日至2013 年的时间里AB三家企业的满意度是怎样变化的呢从图可以看出A两家企业的顾客网络满意度都在0. 50 以上且都高于C的顾客网络满意度在0. 50 的水平波动与A存在一定的差距。以北京、上海、重庆三地进行切块可视化6) 可以看出在北京的满意度明显高于C,但是在重庆却低于C,而且在重庆的满意度略高于B。经过进一步对顾客的网络评语及查阅AB的相关信息,对可能的原因做了归纳: ( 1) A 成立较早具有较高的知名度,而且由北向南逐步扩大经营范围,所以在产品设计上往往更符合北方人的习惯; ( 2) B 都是从南方成长起来的品牌,在重庆很受欢迎,较而言也更符合重庆居民的偏好,因此在重庆的顾客网络评价满意度略高于A; 另外,因为重庆和北京在饮食习惯方面存在一定的差异,北京消费者·109·《软科学营销与服务》2015 月·第29 卷·第期(总第185 期)对B的消费相对较少,B在北京也没有形成规模优势,所以顾客网络评价满意度相对较低。这也反映出火锅行业受区域饮食习惯的影响较大,企业必须充分考虑目标市场消费者偏好的差异性。图北京、上海、重庆顾客网络满意度评价比较结论本文参考mapreduce 原理从大量数据中筛选得到顾客满意度信息,不仅可以用于企业自身管理,而且还可以应用于企业间的比较及行业分析。结合OLAP 可视化技术将顾客网络满意度评价进行同一企业及多个企业在时间、区域维度下的消费者满意度比较,为企业了解自身及竞争者情况提供了直观依据,具有重要的应用价值。当然本文也存在一定的局限性,其主要表现为: ( 1)在数据收集过程中有的连锁店虽然有大量的消费者,但是在网上对消费体验进行评论的比例却不高,导致本文的数据量与实际消费者的数量仍存在较大差距; ( 2) 本文选取的是结构化数据,非结构化数据的收集、处理相对不足; ( 3) 文中的顾客满意度是一个相对量,尽管选择的都是全样本数据,但是不同企业的样本量存在很大的差异,因此比较过程中存在样本容量产生的误差。总之,大数据环境下的顾客洞察和市场营销策略将会是一个重要的研究方向[24],本文只是一个初期的探索,接下来还有很长的路要走,而且会面临更多的难题。参考文献:1] Big dataEB/OL]. http: / /en. wikipedia. org /wiki /Big_data2011.[2] 孟小峰,慈祥. 大数据管理概念、技术与挑战[J]. 计算机研究与发展,201350( 1) : 146169.[3] Qin X Pet al. Big Data Analysis———Competition and Symbiosis ofDBMS and Mapeduce J]. Journal of Software201223( 1) :3245.[4] Chen Yet al. Marketing Implications of Online Consumer Producteviews J]. Business Week20037150: 136.[5] Duan Wet al. Informational Cascades and Software Adoption onthe Internet: An Empirical Investigation J]. MIS Quarterly200933( 1) : 2348.[6] 单初,鲁耀斌. 正面与负面网上评价对C2C 商家初始信任影响的实证研究[J]. 图书情报工作,201054( 12) : 136140.[7] Akerkar R. Big Data Computing M]. CC Press2013.[8] Bryant R,et al. Big-Data Computing: Creating evolutionary Breakthroughs in Commerce J]. Science and Society2008December.[9] Gordon K. What is Big Data? J]. ITNOW201355 ( 3) : 1213.[10] 王元卓,等. 网络大数据现状与发展[J]. 计算机学报,201336( 6) : 115.[11] 王珊,等. 架构大数据挑战、现状与展望[J]. 计算机学报,201134( 10) : 17411752.[12] 宫学庆,等. 数据密集型科学与工程需求和挑战[J]. 计算机学报,201235( 8) : 15631578.[13] 张兴旺,等. 变革中的大数据知识服务面向大数据的信息移动推荐服务新模式[J]. 图书与情报,2013( 4) : 7479.[14] 周涛,陈恩红. 推荐技术与互联网广告[J]. 中国计算机学会通讯,20139( 3) : 67.[15] 张立彬,王金翠. 关于提高大学生信息选择能力问题的思考[J]. 情报理论与实践,200629( 6) : 70670.[16] 徐恪,等. 在线社会网络的测量与分析[J]. 计算机学报,201336( 9) : 126.[17] 林志刚,彭波. 大数据管理的现实匹配多重挑战及趋势判断[J]. 改革,2013( 8) : 1523.[18] Torres AJ A Tribo. Customer Satisfaction and Brand EquityJ].Journal of Business esearch2011( 64) : 10891096.[19] Claes Fornell R R,Marnik G Dekimpe. The Effect of CustomerSatisfaction on Consumer Spending GrowthJ]. Journal of Marketingesearch 2010XLVII( February) : 2835.[20] 范秀成,等. 顾客满意带来什么忠诚J]. 管理世界,2009( 2) : 8391.[21] 王毅,赵平. 顾客满意度与企业股东价值关系研究[J]. 管理科学学报,201013( 6) : 5463.[22] Dean JS Ghemawat. Mapeduce: Simplified Data Processing onLarge Clusters J]. Communications of the ACM200851( 1) :107113.[23] 张延松,等. 海量数据分析的Onesizefitsall OLAP 技术[J].计算机学报,201134( 10) : 19361946.[24] 冯芷艳,等. 大数据背景下商务管理研究若干前沿课题[J]. 管理科学学报,201316 ( 1) : 19责任编辑王惠萍)·110·

[返回]
上一篇: 改进的大数据分层建树KNN聚类算法
下一篇: 我国电子政务建设的新动向2016