首页 >

对话途牛李晓炜:谈旅游业的大数据探索

本文作者:CSDN 2015-07-24
随着计算能力和存储能力的飞速提升,系统会越来越了解用户,甚至可以自动推荐用户最喜欢的酒店,航空公司,餐馆以及最喜爱的休闲活动,用户要做的就是下载一个APP就像是有了一个如影随形的私人导游和管家。

近期, 途牛旅游网与SequoiaDB巨杉数据库在大数据应用方面展开了深度的技术合作,并且取得了显著的成效。为此,我们也专门采访了途牛旅游网研发总监李晓炜先生, 让他谈一谈在线旅游行业的大数据应用及SequoiaDB的实践情况。

对话途牛李晓炜:谈旅游业的大数据探索和SequoiaDB实践

CSDN:介绍下您自己,也介绍一下途牛?能否也谈谈目前在线旅游行业的主要情况?

李晓炜:你好,我是途牛旅游网的李晓炜,负责途牛后台系统的开发工作。

途牛想必大家都听过,途牛旅游网是目前国内最大的在线旅游平台之一,提供全国75个城市的旅游度假预订服务,包括跟团、自助、自驾、酒店、景区门票、邮轮以及公司旅游预订等。

目前,在线旅游平台发展也渐渐成熟,之前有看过一份旅游行业的统计报告,2014年中国的在线旅游市场交易规模达到了3077.9亿元,同比增长了38.9%,预计2015全年,这一规模将达到3500~4000亿元,增长规模保持在30%以上。而截至2014年12月,国内在线旅游的用户已经达到了近1.5亿人,用户的年增长接近195%。

对话途牛李晓炜:谈旅游业的大数据探索和SequoiaDB实践

CSDN:在线旅游的发展方向是什么呢?

李晓炜:我认为目前在线旅游正在从向定制化、多样化、个性化和智能化的方向在发展。

从前可能大家都满足于通过线上订票、订酒店,现在用户更希望平台能代替他们做更多的事情,也就是我只要有旅游的想法,最好就能直接的帮我全程安排好,只需要付钱就行了。

而同时,用户也希望有更多的旅游项目的选择,满足个性化的需求。比如从前到一个地方,只安排几个固定的餐厅给游客们去,现在用户可能会想要找更地道或者是一些有特色的小店来品尝,这就要求我们能有更多的餐厅供他们选择,餐饮是目的地服务的一种,途牛也从今年开始在目的地服务方向发力,希望能彻底改变过去那种上车睡觉,下车拍照的旅游方式,希望大家都能全方位的深度感受当地的各种特色。

CSDN:作为一个资深的架构师、工程师,能否谈谈在线旅游这一块目前对于大数据的需求主要有什么呢?

李晓炜:刚刚也提到了未来在线旅游的一个大概发展情况,针对这些个性化、智慧化的需求,需要从用户的浏览,订购等行为中进行分析,行程主动的推荐,如何从互联网的海量数据中提炼出这些需求就需要大数据技术来支撑了。对于多样化的选择,更多的项目选择需要更大的存储,同时也需要能快速的存取、查询所需要的数据。对于智慧化方面,一个完整的旅游方案提供平台,需要快速的分析和数据处理。用户提出了需求,系统就会快速的分析,在庞大的数据量中分析出最适合用户需求的方案。

简单说,就是大数据的存储和大数据的分析。

CSDN:在线旅游的大数据现状是什么呢?主要的应用有哪些?

李晓炜:在旅游有几大特点,交易量大,会员量大,产品量大,订单量大等,不管是哪种数据类型都称的上是海量。互联网拥有长尾的特点,覆盖的客户群广,靠传统的数据库几乎无法分析动辄以TB计的数据。举个例子,我们需要从用户行为中分析用户的兴趣和消费趋向来反向决定我们推出什么样的产品,这个看似简单实则非常的复杂,我们需要对于不同的用户,根据他的年龄,性别,浏览历史,下单历史,所在地区等很多个维度去进行分析,进而指导我们在不同地区针对不同类型的人群主推不同的产品;另一个例子,一个用户有了出游意向,比如预算,意向目的地等信息之后,系统需要能智能的去给他推荐相应的产品套餐,简化客人的选择过程,帮他打包好所有的服务,这些也需要我们能在很短的时间内通过多维度的数据整合来给出建议,既要精确又要快,这就离不开对于大数据技术的运用了。当然除此之外还有很多的场景,在此就不一一给出了

CSDN:此次SequoiaDB巨杉数据库与途牛的合作,主要是在哪些方面?

李晓炜:“价格中心”,是途牛旅游业务的核心模块之一,负责记录所有的服务、商品等等的价格,并在用户需要时对其进行计算和组合。我们的系统每天计算的团期数量达百亿次之多,每次计算都会对数据库发生多次查询,且会跨多个库进行查询,而这些压力往往是在很短的时间内集中爆发,如我们的供应商进行大批量调价时,价格是对用户最敏感的信息,需要我们的系统能够在极大规模数据量和并发的情况下能够以极快的速度给出响应,了解大规模网站的都知道,基于RESTFUL的设计计算能力可以很容易的实现水平扩展,而数据存取的高可用却是皇冠上的明珠,想使用传统的关系性数据库实现上面的场景,维护和开发的成本非常高昂,有些时候甚至根本无法实现。考虑到我们的应用场景基本是以读为主,所以非常适合去使用巨杉的NoSQL数据库去提升性能。

对话途牛李晓炜:谈旅游业的大数据探索和SequoiaDB实践

另外,“资源系统”则是途牛的另一个核心业务模块。其负责存储和记录所有的旅游方案相关的资源信息,包括酒店,机票,门票,火车票,汽车票,地接,当地服务等,和价格中心相同,我们的资源也呈海量存储的特点,同样在对于静态资源的读取上,通过和巨杉的合作也大幅提升了系统的响应能力。

CSDN:能否大概介绍一下“价格中心”“资源中心”中巨杉数据库的应用情况?

李晓炜:途牛价格中心从架构上来分大致分为计算和存取两层,前面用应用服务器大量架设实例进行集群运算,中间使用MQ的方式接受来自资源,产品等系统的价格变动,库存变动,上下架等实时消息来触发计算,底层采用SequoiaDB巨杉数据库存储诸如成本价,采购方式,报价方式,库存等信息,在一次计算当中需要进行多次的高速查询。

对话途牛李晓炜:谈旅游业的大数据探索和SequoiaDB实践

CSDN:通过使用巨杉数据库,业务上有了多大的提升呢?

李晓炜:我们去年同期的一天的计算量大概是一个亿,今年在没有增加太多硬件资源的情况下达到了一百亿团期/天的计算量,在这个过程中SequoiaDB巨杉数据库在读取效率方面的巨大优势给了我们很强的支撑,使得总体的效率提高了近一倍。

CSDN:为什么选择SequoiaDB巨杉数据库

李晓炜:我们的团队在对比选型的过程中,看到了CSDN上发表的《bankmark NoSQL性能对比测试》一文,其中看到SequoiaDB巨杉数据库的性能与国际领先的NoSQL产品不分伯仲,部分性能甚至超越硅谷同类产品。惊讶于国内也出现了这样一款优秀的基础软件之余,巨杉数据库也进入了我们的考察视野。

对于途牛的实际应用场景,选择SequoiaDB巨杉数据库主要有4个方面。

水平扩展性:新型分布式数据库的扩展性帮助在线旅游平台的数据容量能够轻松的扩展,不仅扩展非常轻松,成本也比传统的存储方案便宜许多。这样就能更好更省的应对未来继续扩大的用户量。

灵活数据模型:灵活的数据模型,帮助存储复杂多样化的数据。文档型的模型,可以存储任何类型的数据无需重新设计数据模式,调用时也无需做更多的处理。对于处理多种复杂的数据类型十分有效。

更高的数据处理性能:相比于传统的关系型数据库,NoSQL的性能更为优秀,对大数据量的应用场景更适合。

国产化:国内完全自主研发的数据库产品,不仅使用更适合国内开发者,很多的设计上也更考虑了国人的使用习惯。

后来,在与巨杉数据库的技术团队有了深入的沟通后,我们的研发团队确实对巨杉数据库有了更深的认识,也给了我们更多选择巨杉的信心。

CSDN:对于在线旅游和大数据的结合的一些看法和建议

李晓炜:在不远的将来,线上旅游会彻底颠覆传统的线下旅游,随着计算能力和存储能力的飞速提升,我们将有能力实时的从全世界的景点信息中帮助用户筛选出最最合理的出行方案。当你输入目的地和预算时就会自动的根据目的地的热度,不同等级资源的价格等因素综合计算出最适合你的方案,甚至可以自动的帮游客规划好路线,实现自动的错峰出行。系统会越来越了解你,甚至可以自动推荐你最喜欢的酒店,航空公司,你最喜爱的餐馆以及你最喜爱的休闲活动,你要做的就是下载一个APP就像是有了一个如影随形的私人导游和管家。

版权声明
执惠本着「干货、深度、角度、客观」的原则发布行业深度文章。如果您想第一时间获取旅游大消费行业重量级文章或与执惠互动,请在微信公众号中搜索「执惠」并添加关注。欢迎投稿,共同推动中国旅游大消费产业链升级。投稿或寻求报道请发邮件至执惠编辑部邮箱zjz@tripvivid.com,审阅通过后文章将以最快速度发布并会附上您的姓名及单位。执惠发布的文章仅代表作者个人看法,不代表执惠观点。关于投融资信息,执惠旅游会尽量核实,不为投融资行为做任何背书。执惠尊重行业规范,转载都注明作者和来源,特别提醒,如果文章转载涉及版权问题,请您及时和我们联系删除。执惠的原创文章亦欢迎转载,但请务必注明作者和「来源:执惠」,任何不尊重原创的行为都将受到严厉追责。
本文来源CSDN,版权归原作者所有。
发表评论
后发表评论
最新文章
查看更多
# 热搜词 #

新用户登录后自动创建账号

登录表示你已阅读并同意《执惠用户协议》 注册

找回密码

注册账号