资讯网:大数据 你该知道的事

俗话词,熟读唐诗三百首,不会作诗也会吟,如今大数据正夯,人人都在谈大数据,人人都不想错过大数据,但你真的需要大数据吗?以下是关于大数据你所需要知道的事情。

A.大数据自问自答

1.你想从大数据得到什么?

在商言商,拥抱大数据正是为了它所能带来的商业价值,倘若无法从大数据中取得商业价值,也就没有必要赶搭大数据列车。如果企业领导人不知道自己想要从大数据获得什么资料,没有必要进行大

2.是否具备对的技能和人才?

想要拥抱大数据,需自问是否拥有这方面的人才、知识技能?目前拥有什么样的人才和知识技能?需要聘用什么人才和技能?一旦进行这方面的剖析和思考,当事人会发现大数据的世界是一个完全不同的世界。

3.是否真的有需要大数据,还是大多数时候都只是一个及时的数据需求?

例子1:大型多人在线游戏(Massively Multiplayer Online game)

全球各地的玩家透过网络玩同一款游戏,游戏业者掌握大数据有什么好处?更加了解玩家,例如玩家喜欢使用的武器?和朋友一起玩时会选用的地图类型?了解玩家的资料目的是为了……从玩家口袋挖出更多的钱。

如今的游戏多数开放让玩家免费玩,当玩家想要拥有火力更强大的武器、更强大的武力值……就必须付费购买。游戏业者也透过大数据来掌握不同区域玩家的特性,包括哪个区域的玩家数量最多,以便规划游戏容量。

例子2:台湾的甜品品牌黑丸

台湾甜品品牌黑丸从面子书专页收集客户的回馈并从POS系统提取销售资料,把相关资讯上传至微软的大数据云端解决方案,以便了解客户的情绪和销售数据。

一般来说在大热天之下,冷饮或甜品是消费人首选饮品,但大数据却显示,在黑丸的某些分店,情况却是相反的。

主讲人:大马微软科技解决方案专员Ian Choy

大马微软科技解决方案专员Ian Choy指出,以上所提仅是一部份热门技术,事实上市面上尚有众多技术可选用。“你以为这些就很有挑战性了?做为企业管理者,你也必须考须,你的大数据是要上云端还是留在地面?两者所使用的供应商以及技术不尽相同。”

他表示,大数据其实是相当复杂的科技,“如果有人跟你讲大数据很简单,只要买了我们的产品就万事搞定,你必须三思,大数据并不简单,它是一个完全不同的世界,即使是科技人要掌握大数据,也必须学习。”

B.如何落实大数据

主讲人:大马软体开发公司Fusionex区域总监林友实(Fusionex是我国少数在伦敦证券交易所上市的公司之一。)

关于如何以更好的方式落际大数据,有2种学派,一种学派主张收集数据并由数据说话,另一学派认为一切始于问一个正确的问题。

林友实更倾向于后者,“如果你没有问出一个正确的问题,你就难以找出正确的问题症结,你也就无法进行正确的分析。”

(1)自问,希望从大数据得到什么?要用大数据来做什么?期许从大数据获得什么商业价值?要从事哪一类的分析?拥有什么样的数据?需要什么样的人才和技术……这些都和问“正确”的问题息息相关。

(2)制定路线图。路线图也等同于行动计划书,可为未来描绘清晰楚的方向与目标。考量到科技进步神速,他建议制定约1至2年目标的路线图;路线图内应概括技术和商业目标在内,同时设定合理及可完成的标竿。

(3)使用各类型的数据,包括内部、外部和来自第三方的数据。找出自己拥有什么数据、谁拥有及掌握、目前的使用情况、缺少什么样的数据、发掘暗数据(Dark Data:收集了却没有使用的资料)的价值。当问对了问题以及累积了足够的资讯,数据之间某些相关性便会浮现,便形成会数据会说话。此外也应避免选择性偏差等。

(4)科技日新月异,必须了解和掌握大数据生态系统所涉及的各项技术数据从中作出选择,并时刻掌握新知。

(5)作好完善规划以保障保大数据内容的安全和隐私。

(6)制定数据管理策略,包括启动、主数据管理、委任资料管理员、确保收集到的资料是素质好的资料、遵守规定、关注数据主权(Data Sovereignty)课题等。

(7)打造专属的大数据团队,团队成员应概括商业和资讯科技在内,聘用或培训数据科学家(data scientist)

(8)持续改进。例如现有数据来源是否充足?是否有新的数据来源?现有模式是否运作顺利?出席研讨会、与供应商交流、掌握业内最新动态和案例。

例子1:医疗保健
大数据已广泛应用在智能医疗保健领域,包括患者管理、患者服务的临床设定、非临床设定等,其中一个例子是独居长者护理的监顾。某新加坡公司在居住环境设置动作感测器,除了可追踪独居老人的行动,还可学习掌握对方行为模型,以避免发送错误警示,例如监督和学习独居老人每天几点睡觉、每晚起床几次去上厕所、上厕所花多少时间、煮食用了多少时间,一旦有不正常情况便可发送警讯给亲属。(最好的地方是长者不必配带任何装置。)

例子2:交通
Street Bump是波市顿市政府开发的应用程式。用户开车前先打开Street Bump,利用手机的GPS定位功能和加速度传感器功能,在用户的汽车经过地面上的坑洞时自动记录和报告地点和时间信息,而不需要司机打电话或发送信息。

林友实指出,上述App出发点良好,不过由于该APP只限iPhone用户而且只限驾车人士,以致于在更富有的地区监测和修复坑洼,反而是贫瘠地区的地面坑洞被忽略了。

例子3:纽约德士司机资讯
由于有公众要求纽约德士司机资料,纽约市政府把有关资料进行某种程度匿名/遮蔽以保障德士司机隐私后,向外发布。但,由于德士执照有特定呈献结构——-以5开头,多数是6或7个号码,有心人士只花了不到2小时就成功破解,曝光已被遮蔽的资料,有心人士可借此追查到德士的隐私,包括执照号码、川行路线、祈祷时间……等。

贴示:
●在制定大数据策略时必须把所有涉及部门单位都考虑在内,大数据绝对不只是资讯科技部门的事情。
●●评估开展大数据的各种模式,包括云端、在地或者采取混合方式、聘用或者培训、外包或内部自行负责●●●传统资料来源依然有其价值
●●●●确保所取得的数据是干净、整洁以及其他现有数据保持一致性。
●●●●●由于拥有多样化的数据,因此需要多种数据处理方法。
●●●●●●简单化大数据的操作和使用、减少不必要的复杂性、让公司员工都能掌握并使用大数据

知多一点:

大数据3Vs
“大数据资料”是由数量巨大、结构复杂、型别众多资料构成的资料集合,是基于云端运算的资料处理与应用模式,透过资料的整合共享,交叉复用形成的智力资源和知识服务能力。

大数据有3个Vs,由信息技术研究和谘询公司Gartner的分析师Doug Laney最早在2001年时提出,分别代表资料量Volume、资料传输速度Velocity、资料类型Variety。

除了3Vs,陆续还有人提出更多“V”,其中又以Veracity(真实性)最被普遍认同。

南洋商报官网 | Nanyang Siang Pau Official Website
南洋商报有限公司版权所有 | Copyright © Nanyang Siang Pau Sdn Bhd
Solution Powered by