副刊

让数据做旅游决策
一个按键,3秒钟计算最佳!

一个按键下去,弹指之间就搜出数十笔至数百笔符合你要求的酒店、航班资料,背后是如何运作的?

一站式旅游服务平台Expedia手机应用程式全球行销主管兼亚太地区行销主管加贝尔嘉西亚(Gabriel Garcia)揭开迷底。



假设,你在某一天要从新加坡要飞往东京,Expedia如何为你挑选出最佳(意即最快又最简单)航班选择?

嘉西亚举例,如果从新直飞东京或许有30至50趟航班,假设行程中增加一个转机点,可选择的航班可达100亿,若停留两个站则可选择的航班可破兆。

在客户输入筛选过虑的条件之后,一个Enter按键,3秒钟内Expedia为客户计算出最佳航班选择,靠的是运用数据科学和机器学习,其中一种采用的演算法是广度优先搜索BFS(Breadth-First-Search)。

过滤逾千万亿单程组合



BFS先筛选过滤出10万个最可能的行程,再减少至1000最相关的行程,虽然看起来还剩下很多,但过程中其实已过滤排除了1900万亿个单程组合。

这只是计算一名客户的行程,Expedia每年有300亿笔搜寻,假设以300亿笔资料乘以1900万亿,要处理的旅程组合已到达天文数字程度,靠人力岂有可能在最短时间完成?“由此可见处理这些有多复杂困难以及科技如何帮助我们解决问题。”

他指出,该网站有1500TB(备注:1TB=1024GB)的数据,189亿行客户行为模型的数据,以及超过百人的数据科学家和分析员专注在机器学习运算以建立起客户行为模式用来识别客户的行为,“我们从大量的旅游数据中学习、识别模式,分析结果并将精华传递给客户,帮助他们做出正确的决定。”与此同时,Expedia也能利用这些数据针对特定用户投放具针对性的内容、广告。

他也披露,Expedia设立了创新实验室用来了解用户对旅游产品的喜好,针对性推介个人化产品,提升用户体验。

研究人员在脸部和额头安置感应器,再要求她浏览网页并回答问题,从中可掌握其情绪反应。

例如上图中在新加坡的创新实验室中,这名女子戴上各种感应器,随心浏览Expedia网页/或手机页面并接受问答调查。(新加坡创新实验室是Expedia在亚太地区首个实验室,另两个实验室设在伦敦及华盛顿。)

追踪技术掌握用户喜好

在另一端的研究人员应用肌电图(Electromyography)、眼球追踪等技术,可从女子眼神逗留在荧幕的方面及时间长短了解她在观察什么、从她所回答的问题中掌握她在应用Expedia网站时的各种情绪变化(例如找不到特定功能而感到挫折,或者找到某项优惠而喜悦),并了解到那些因素会影响她的消费决策。

“当你掌握到影响用户情绪的资讯时,就可以做出应对,比如提升功能或者调整,产品经理可以依此推出创新来解决问题,也可以用来通知相关的酒店客户有特定的需求。”

例如,日本用户在Expedia搜寻酒店时偏爱观看图片,也喜欢有浴缸设备的酒店,而大马用户热衷于闪促销。

嘉西亚:过去几年来,Expedia花费18亿美元(约75亿6000万令吉)在数字化和创新上,当中有一大部分是应用在研发上。

弹性开发 持续创新

“要使用科技或数据科学来帮助我们做出决策,我们自己必须先转型,”嘉西亚指出,Expedia是从2010年决定推动平台转型,应用科学方式、测试和学习(Test-and-learn methodology)在公司各层面如产品、市场行销、科技……并以数据做为创新的基础。

推动学习文化

简单来说,即为收集数据、提出假设、快速对假设进行测试、从中学习、获得最佳的重要资讯Insight,周而复始的进行。他指出,测试与学习方法也公司在思想上保持弹性开发的思维并持续创新,确保所有创新都是以客户为中心,并有数据Insgiht Verify,此举使到该公司的创新周期从一年发布4次增至每周发布1次。

嘉西亚表示,他所提的这些数据要能为公司所用才具备意义,而要推动测试与学习的文化,必须让公司上下都能够接触数据,也就是说数据民主化(Data Democratication)是极为重要的。

让员工接触数据 

“你或许有数据中心来收集数据,你可以有工具(大多数公司都有),但是除非你让所有员工都有机会接触这些数据,并鼓励他们大胆实验并学习,即使失败了也无所谓,否则就很难把这些数据的威力完全发挥出来,”反之,若员工接触数据的阻碍越少则效果越显着。

然而他也提醒,光是拥有大数据、盲目落实机器学习其实无法帮助企业解决问题,“我们必须了解问题所在,才能把问题丢给运算法来解决。你可以拥有想要的各种演算法,假如你丢的问题不正确,运算法无法帮你解决问题。”

打个比方,这就如同谷歌大神几乎可以回答所有的问题,但前提是网友必须问对的问题、正解的关键字才能得到正确的解答。

欢迎失败 从中学习

开放数据让员工能够接触并用来进行实验,有助于创新但并不是成功的保证。事实上,在1500个试验当中高达70%以以失败告终。

投入时间与心血到最后却一无所获,这种“白费心机”的“投资”并不是每个人或组织能够坦然接受。但在Expedia内部,他们习以为常。事实上,失败在Expedia并没有什么大不了,只要能从中有所学习并快速前进即可。

他指出,该公司总执行长马克奧克斯特鲁总是鼓励员工尽量的失败,“听起来这很奇怪,只要我们快速前进、有从失败中学习到东西,他鼓励我们尽量的失败。因为透过这种方法,你一点一滴在进步,想象一下如果Expedia所有员工每天都进步1%或者每做一件事都有1%的进步,这会打造出优秀的企业、优秀的人才为世界做出贡献。”

“如果有几百个试验是成功并带来超高的回酬,谁还会在乎几千个试验都失败了。拥抱数据科学确实为我们带来回报。”

181126C01_C5226-3_noresize

搜寻历史 无涉隐私

嘉西亚表示,有许多方式可以收集互联网用户的数据,而他们所收集的数据主要来自互联网用户在Expedia网站的搜索、Cookie、在浏览谷歌、Trivago或其他网站时所点击的链接和广告……等。

预测喜好推荐建议 

他指出,Expedia收集数据的目的是希望借此机会了解用户的搜寻行为模型,以便提供更好的建议或解决问题,“当用户到来我们的网页时,他们已经有明确的旅行意图,这些帮助我们了解客户的大致身分以及寻找什么样的行程。”

例如,某人想带子女一同度假,因此寻找的住宿地点必须符合“携带儿童入住”的要求,确认了这个搜寻行为后,Expedia便可依照这个要求推荐度假村,“我们只掌握到他的搜寻行为,并没有得到他的名字身分,这些不是机密资料。”

他指出,所收集的数据并不涉及也不需要得到个人机密数据或姓名,更何况Expedia并无权从谷歌或从面子书链结中取得,Expedia也不可能取得客户在谷歌、Chrome的浏览历史。

此外,用户是否登录Expedia网站亦有所区别,例如价格就只有登录Expedia的帐户才能查看,而一旦登录,Expedia网站便可从用户过往的搜寻历史、订购历史的数据自然会被Expedia应用并用来预测客户的喜好进而推荐旅游建议。

他强调,Expedia严格遵守资讯隐私法令。

聊天机器人回应询问

嘉西亚也披露,越来越多人(尤其是在亚太地区)习惯用手机上旅游网站,Expedia去年最后一季,有近50%的流量是来自手机,而三分之一的交易是在手机上完成,而手机重要性的提高也影响Expedia在产品开发的方式。

他表示,Expedia持续在移动平台上进行各种测试,他们使用面子书即时通讯、KakaoTalk、Line、微信、Skype,并在上述平台导入人工智能来打造更自然的聊天机器人(Chatbot)以回应用户的询问甚至进行交易。然而这类服务尚未在大马推出,这主要是因为大马人使用Whatsapp居多,但Whatsap尚未推出这类服务。

反应

 

要闻

从2位数骤增至646宗 数据盗窃增加堪忧

(吉隆坡13日讯)我国的数据盗窃案呈堪忧的增加迹象,从前年的2位数,到去年已经骤增至646宗。

去年Cyber999求助中心收到的涉及组织和个人的数据泄露(盗窃)事件总数,比2022年的50起和2021年的91起,翻了数倍。

根据马来西亚网络安全机构的统计,数据泄露是2023年总共5917起网络安全事件中第二高的网络安全事件,仅次于欺诈犯罪(3705 起)。

今年首3个月也出现了同样的趋势,共报142起数据泄露事件,根据这一趋势,该机构预计,如果不采取措施解决,数据盗窃案件将继续增加。

该机构表示:“如果组织和互联网用户不采取适当的安全措施来防止数据泄露,此事件将成为所投报的三大事件之一。”

该机构鉴定了3类数据泄露,分别是个人身分信息(PII),这涉及全名、身分证号码、地址、年龄、联系号码及薪金等。

“从骇入网站获取的大量个人身分信息,在网络犯罪论坛公开发售,并以比特币进行交易,而在公共网站则使用美金交易。

“同时,用户可以在公共网站,以名字、地址、联系号码、身分证号码、军人证号码或出生日期,搜寻个人身分信息,从而对个人数据隐私构成威胁。”

该机构解释,另两种数据泄露,是针对电邮识别,这包括电子邮件账户的用户名、密码及硬件识别等,同时涉及“wordpress”管理面板及文件传输协议(FTP)访问。

敏感数据须获保护

数据泄露影响,取决于泄露程度、类型及信息形式,可能涉及少数人,也有可能影响上百或逾千人。

该机构指出:“涉及大量数据泄露,将导致通知及恢复过程变得更加复杂。”

该机构提醒,敏感数据必须获得保护,这不仅涉及法律或道德,还涉及个人隐私及维护商业声誉。因此,该机构希望组织有责任及提升预防与管理个人数据泄露的能力。

该机构也建议网络用户,时刻了解最新网络犯罪趋势,及遵守最佳网络案件做法。这包括处理来源不详的电邮、网页浏览、线上网购及使用社交媒体应用程序等,而在线上交易前,务必检查应用程序、电商、产品与服务等。

“随着网络威胁案件持续增长,如果没有相当意识,组织及个人或将成为目标。”

反应
 
 

相关新闻

南洋地产