能不能实现携程酒店有候补订单无法再次下单对接到我们酒店自有系统,有没有自动化的工具可以

编者注:别想歪了!我们说的是“机器学习”~

在携程技术中心推出的线上公开课程[携程技术微分享]上来自携程酒店研发的BI经理潘鹏举,介绍了如何借助大数据和算法通过机器学习去克服酒店服务行业挑战,给用户带来更好的预订体验希望能对你有所启发。以下为全文实录

PS:关注携程技术中心微信號(ctriptech),回复“微分享”可获得[携程技术微分享]最新课程信息。

大家好我叫潘鹏举,人称PPJ来自携程酒店研发BI。上图是我的自我介绍简单做了一下标签,做了词云可视化

不知道各位有谁不知道携程,我简单介绍一下携程是一个在线OTA服务公司,提供酒店预订、民宿、短租、机票预订、度假预订、汽车预订、租车、邮轮、轮船预订火车票预订、商旅管理、签证、会场预订、全球购等业务,简单的说僦是个旅游中介主要是想玩转整个旅游生态圈,从我罗列的结果上看各种旅游相关产品都有。

公司介绍完了言归正传,以下是我今忝要分享的主题:机器学习如何创造价值目录结构如下:

首先简单介绍一下OTA酒店行业有哪些我们关心的KPI及其面对的挑战,让大家有个简單概念;

接着重点介绍一下算法在酒店行业是怎么用的看一下我们的经验对各位有没有启发,也想借此机会和大家交流一下怎么才能让算法创造出更大的价值;

最后分别简单介绍一下使用算法的经验和算法的上线架构等;

1、OTA酒店行业和其他行业的区别和挑战

首先我们先说苐一块OTA酒店行业;

我截取了某一个酒店的详情页,即我们的产品在上面我也罗列出了OTA酒店行业和其他行业的最主要的区别。

首先最大嘚区分就是:我们的房型是限时限购的从图上可以看到,我们只能5.11号入住过时不候。另外每个酒店的房间数量是相对固定的所以如果酒店超卖的话,那么就不好意思酒店没有办法一天内加盖房型,只能协调客人到其他酒店去入住了

然后是第二部分,代理(供应商)房型这部分就是二房东,它从酒店拿到库存然后放到携程售卖。这样有个什么问题呢?我没办法从酒店打听到任何库存信息、有候补订单无法再次下单信息所以我们在管理代理方面就很谨慎,因为不好的代理会拉低携程的服务水平如果有候补订单无法再次下单絀了问题,只能找二房东去协调速度慢不说,还有可能解决不了问题

第三部分,自营:指的是携程和酒店直接谈合作的房型这些房型中有保留房、直连、直签,自营的房型是靠谱的房型我们直接跟酒店要库存,知道房价、房态信息出了问题也可以跟酒店直接协商,自营房源是我们服务标杆各项服务指标都很好。

说完了行业区别我们看看我们面对哪些挑战;

因为我们的商业模式,所以第一点挑戰对我们影响很大我们很依赖酒店行为;有些酒店虽然在我们这里售卖,但是比较无赖会出现不付佣金、前台切客等行为,造成业务損失当然我们对各种行为有相应的识别方法和会有相应的惩罚措施,另外酒店服务水平参差不齐管理起来比较困难。

第二点提一下囿些低星酒店很落后,我们跟它联系只能用小灵通导致我们管理一些酒店比较困难。其他的挑战都比较好理解简单的说就是低频、长尾、季节性。

说完了挑战我们看看我们有哪些关心的服务KPI。

服务KPI就是好、快、准

稍微解释一些KPI,到店无房指的是酒店发给了客人入住憑证但是因为超卖导致客人无法入住,这种情况主要是酒店的违约行为正常情况下携程会帮忙协调入住其他酒店并赔偿相应的损失,茬旺季的时候会有所升高然后是到店无预定率,跟到店无房的区别是:客人到了酒店酒店说没有相应的有候补订单无法再次下单信息,出现这个问题主要是携程和酒店传真客人入住信息的过程中有问题出现这种情况携程会立即帮忙解决客人的入住问题。

目前来说基於我们强大的客服力量和优质的6sigma管理体系,这两个指标都控制在极低的水准上剩下的指标就不一一解释了。

我们现在面对的一个挑战是业务量持续的增长,我们没办法持续性的增加客服人员来维持一个高标准的服务水准因此需要借助于算法来实现智能化、自动化。

说唍了KPI我再接着介绍一下我们是如何评估项目收益的。

这里重点说一下客户价值这个是我觉得值得说的地方,其他的收益和成本类大镓都拎得清。

客户价值实际上传达的是一个间接收益的概念我们会量化出每个客人的等待成本,每个环节的时间成本每个事件的客人損失成本,把所有的这些成本量化成对应的金额所以我们在每个事件产生了之后,不仅可以计算出直接损失还能计算出间接损失

我举叻一个例子:比如一个客人出现了到店无房,除了要直接赔款损失外我们还要额外计算间接损失,那么我们在做到店无房项目的时候洳果间接收益+直接收益超过了成本,那么我们就值得投入人力去做优化

对于有些公司来说,单纯提升客人感受认为价值不大但是我们紦客人感受货币化了,那么这个价值就提高了

行业背景就告一段落,我接着说重点算法应用实践。

在正式说应用实践之前我们先简偠看看携程的数据量。2亿PV10TB/日,数量还是蛮大的我们用到的数据大体分成四块:业务数据、网站性能数据、用户行为数据和爬虫数据,其中我们的应用实践主要会用到业务数据和用户行为数据

1、关于数据的一些概念和观点

接着说说数据在哪块会产生比较大的价值。

我按照数据的冷热区分了一下数据价值一般性数据时效性越高,数据价值越大我划分了一下,如果只用冷数据那么可以挖到银矿,用好叻热数据你就挖到了金矿,如果你都直接预测了未来那么你就挖到了钻石。最下面我列了一个公式未来的人工智能就是基于过去和當前的状态来预测未来,这样的一个组合是未来应用的一个趋势按照冷热的分类,我们看看数据是怎么应用的

从这个ppt可以看到,越冷嘚数据越不能影响到线上的实时业务,起的作用也越小如何利用好当前的数据,对于应用效果会更好。看最下面的备注特意说一丅,这样区分确实不严谨但是从实践的角度看,越是过去的东西对未来的指导意义是越差的接着我说说我们在实际应用中的一些观点囷想法;

这里面主要是说一下分析和模型之间的差别,对公司来说不同阶段,重点会不同对模型的态度也不同,我们也花了很长的时間慢慢积累才会有一个又一个的应用。

右边的图主要是从数据应用的层面上说的里面没有提到DW层,但是DW层是地基没有一个好的地基昰没有办法说数据应用的。但是从价值上看越往上,数据价值越大

最后提一下,我们可能会有一个误区我要追求100%准确的数据,实际仩我们的数据很难100%准确,特别是像用户行为数据任何一种采集方式都会有PV漏记、错记的情况。我们要能容忍一定的数据采集偏差在現有的数据中看一下怎么利用数据创造价值。反过来说如果数据一直都存在这个偏差,那么对你未来的应用影响就小数据已经适应了伱的偏差。说了模型这么多好话我们看看一个算法应用的完整闭环是怎么样的。

这里提一下标红色部分人工和风控。在算法应用到线仩的过程中人工经验、人工过滤以及风控会起到很关键的作用。如果没有做到这点那么在实际应用中会大打折扣。

就像我左下角写的那样人是商业的CPU,决策过程中要依赖人来调整方向而风控是决定应用快慢的GPU,如果没有做好风控措施不仅可能会导致业务损失也有鈳能让算法没有发挥出作用,后面的实例中我会提到一些

说了一些概念后,我先说说我们怎么评估模型然后就讲讲我们的实践实例。

這里列出了三种常用的模型评估方法第一种A/BTest,用的最多几乎所有的项目如果没有ABTest是不能拿出来讲的。第二种是为了替代A/BTest想到的简单办法针对有些情况下面很难做AB实验。最后一种情况是我们评估+风控的方式先上线模型,但是业务不采纳模型结果然后我们用log来解析模型是否运转正确,效果好不好

说完了评估,我们说说酒店服务用到了哪些模型;

按照预定流程区分了预订前、中、后流程,主要目的昰为了提升客户体验和提高服务效率预订前的主要目的是为了让信息更加准确、预订中主要是为了提升预订效率和速度,预订后就是为叻有候补订单无法再次下单风控、酒店风控和客人风控左下还罗列了一些常见的算法应用,排序、推荐和画像这里就不细说了。这边說了一个整体的应用的架构接下来我举一些具体的例子。首先看第一个;

有候补订单无法再次下单量预测的作用我们一个应用是用来莋业务监控,做到了准实时延迟一分钟预测。右边写了应用的大致流程跟我之前写的算法应用闭环是同步的,从预测到应用接下来峩们看看用了什么算法。

其实就是简单的ARIMA+季节系数+一些人工调整把模型做了出来,没有用很复杂的算法最后的效果是平均误差~5%。评估指标我也列了一下主要是看漏报率,不同阶段重点不同在稳定期间,我们比较关心误报率因为系统稳定了,我们就要尽量减少人力損失关于预测误差,我这里也提到预测总是有误差的,不可能100%我们可以根据我们的预测的精准度来进行一些规则的设定,看最下面嘚规则这个规则让你有些弹性空间来防止预测错误导致的误报。

在时效性上我们以前是吃过亏的,最老的版本我们上线过T+1预测就是預测昨天的结果,看昨天是否异常我们发现这个对业务一点帮助也没有,你的业务损失已经产生了再去看异常没有特别大的作用,后媔我们就慢慢的提高了时效性并做了可视化目前这块的监控效果和可视化都很好,也监控了各关键KPI的异常情况

第一个例子说完了,接著看第二个例子

可能有人觉得,怎么会有怎么长的确认时长我在右边的解释了一下,并且罗列了相应的挑战针对这些挑战,我们是怎么做的呢继续接着看。

我们看一下旧流程和新流程的差别最大的差别就是我们在新流程中植入了一个预测模型,根据模型的预测结果来调整业务流程这样做的好处就是,以前回复慢的有候补订单无法再次下单要白白等待X分钟通过模型预测之后,我们就调整了顺序把原来确认慢的有候补订单无法再次下单提早确认了,可以提高确认速度

这个应用点是个很好的一个案例,它让我们来思考那些流程囿同样的问题促进我们进行相应的优化。这个模型准确率为93%召回率53%,取得了一个不错的效果这是第二个案例,接着看第三个案例

詢房模型,罗列了一下碰到的问题和需要解决的问题针对这么庞大的房态数据,如果用人肉的办法肯定是没办法做的很好的针对这些問题和困难,我们也花了很长的时间来去解决这个问题最后的解决方案请接着看PPT。

我们的解决方案见右边的流程图核心是两个模型和IVR洎动化工具。

我稍微简单的描述一下简单的说,针对关掉的房型我们会用自动开房模型预测出当前状态下每个房型的可定的概率score,我們统计出score的准确率在可接受的准确率下,把高于这个分数的房型全部自动打开然后让客人在网站上可以进行预订。针对那些不能自动咑开的房型我们会把这些房型放在询房看板上去。

另外一边针对现在可订的房型,我们去预测房型无房的概率然后把这些数据放在詢房看板上。

这样我们的询房看板上就有两部分的得分结果开房分数和关满房分数,针对这些房型我们有个IVR自动外呼工具把概率高的房型优先外呼到酒店,如果酒店告知房态有变化我们会做对应的房态变更。

通过这一整套流程我们完全实现的开房和关房的自动化,針对高准确率的房型系统自动操作。对准确率不高的房型我们采用酒店介入(即人工介入)的方式来平摊风险,把损失降到最低

所鉯决策过程中,会有很多人工的接入然后针对风险的高低,我们会有不同的风控和措施这样的结合才能让算法的作用最大化。这个案唎针对那些数据量大花费人力多,重复性工作多的事情具有很大的启发意义

案例三说完了,接着说第四个案例吧

用户价格偏好,是鼡户画像的一个很小的子集为什么会单独拎出来说,我等会讲

我们先看看我们碰到了什么问题,一个用户根据不同场景价格是一直茬波动的,我提供了一个例子某个客人在历史上的消费价格。我们后面用了一个算法来进行预测没有用简单的规则来刻画用户价格偏恏,花这么多力气做这个预测是因为猜中了客人的价格偏好对产品和推荐都很有帮助。

看一下我们是怎么做的图里面罗列了相应的思栲维度,用了xgboost来进行预测我们考虑了很多的实时场景,包括了客人的入住天距离节假日的天数区域、星级紧张度等,这都是为了刻画愙人在当前状态中会变成什么样

最后这个模型的效果还可以,77%的用户预测价格和实际价格偏差在50元以内模型说完了,看看这个应用给峩们的启示

这上面说了一件事情,画像不是一成不变的一直在变,要场景化所以如果只是为了画像而画像的话,意义不大我们会根据应用场景的不同进行调整。

以上就是第二部分算法的应用实践分享,接着我分享一下在算法方面的经验

这个是我们实验下来比较恏的模型项目流程,给大家参考一下其中标黄色字体是我们比较关心的,数据校验是为了让模型产生效果因为俗话说的好:垃圾进,垃圾出接着说一下Feature Engineering的事情;

这个没有特别好说的,跟其他人的做法雷同

提一下缺失值预测。如果我们觉得某些变量对业务帮助很大泹是有一定量的缺失值,那么我们就会用另一个模型来预测缺失值做法就是取出关键变量不存在缺失值的样本来进行训练,然后再对有缺失值的变量进行预测

然后说一下归一化,我们这里没有罗列因为我们现在用的常用的机器学习方法gbm,xgboost对量纲不敏感所以我们为了減少数据分布的损失较少做归一化。你们在实际应用中有些模型是一定要求你归一化的,所以还是需要进行归一化处理

类别变量处理方法罗列了一些,大家可以找资料看一下

这里说一下模型融合方法,我们常用这两种有对应的链接,大家看看资料这里不细说。

对整个模型的总结见图特意提一下倒数第二点,线下模型上线根据线上数据进行调优。主要是担心线上上线过程中有人为失误导致数据計算有偏差所以可以直接根据线上模型来进行模型优化来适应线上的开发错误,并且能够快速的定位出开发中的数据错误

列了一下一般情况下,分类算法的优劣对比大家可以试验一下。算法经验分享结束我们最后说一下上线架构。

大家看一下模型API架构简图我们的開发语言是Java,我们会用Java封装模型的所有输入参数然后把模型训练的结果存储成文件xx.Rdata或者xx.Py文件,最后Java把模型结果常驻内存最后去调用Rserver和Pyserver來进行预测。整个过程涉及的角色比较多

最后说一下数据校验,我们非常关注的罗列了一下我们的常用校验逻辑,供大家参考我的汾享就是这些,谢谢大家

发布时间: 18:26:45 来源:凤凰网 责任编輯:新语

凤凰科技讯(作者/管艺雯)12月14日消息携程旅游今日宣布,经过国家知识产权局的审查、网上公示携程旅游事业部有3个签证相關的技术与服务创新,已获得国家专利发明依托携程手机客户端,用户可以通过机器与人工智能代替传统办签 携程旅游部门

  凤凰科技訊(作者/管艺雯)12月14日消息,携程旅游今日宣布经过国家知识产权局的审查、网上公示,携程旅游事业部有3个签证相关的技术与服务创噺已获得国家专利发明,依托携程手机客户端用户可以通过机器与人工智能代替传统办签。

  携程旅游部门开发的“签证全自动填写方法和系统”、“互联网办理签证的材料处理方法和系统”、签证申请表的自动填写方法及装置已经公告获得国家专利最早的是2015年10月份申請,其他在今年3、4月申请从网上公开信息查询看,这也是我国签证领域首批国家专利

  公开数据显示,携程旅游已获得全球各国84个在华使领馆的签证办理资质通过签证业务团队直接与使领馆对接合作,目前携程手机端和网站提供全球125个国家和地区的签证预订办理服务

  攜程旅游研发部相关负责人表示,携程签证专利是一套从签证填写到出签的自动化、智能化系统 主要包括在线自动填写提交资料、已保存材料可复用、自主拍照打印、在线预审、自动录入领馆签证网站、签证进度跟踪与出签提醒等几大创新技术与服务。

  以“签证全自动填寫方法和系统”(专利号:CNA)为例该系统创新点包括领馆直连、自动化翻译填表内容、机器人自动化提交申请、自动化付款、自动化下載签证页、机器人自动化处理有候补订单无法再次下单,并触发客人通知流程、7*24小时服务

  可以自动从有候补订单无法再次下单数据库获取有候补订单无法再次下单数据,客户可以在手机客户端下有候补订单无法再次下单并上传签证所需材料携程在线预审相关材料;可以將审核过的材料,通过在线自动填写系统自动录入领馆签证申请网站。客户可通过进度查询看到自己签证进度,携程客户端可自主查看

  这一系统适用携程所有需要填写个人签证申请表的国家,电子签证国家在线提交信息后无需人工干预直连领馆网站,自动出签

  为解决客户多次办签、重复提交材料等问题,携程研发的“互联网办理签证的材料的处理方法和系统(专利号:CNA)”可以自动区分可复用材料和一次性材料,客人可选择性保存相关可复用材料;再次办签即可从携程签证数据库中选择可用的办签材料进行复用,避免不必要嘚材料的上传与审核

  对于用户来说,主要包括客户在线填写申请表而无需提交纸质材料。可选择是否保存下次使用;客人下单后可通過自拍上传照片携程根据不同国家的尺寸要求进行统一修改提交或打印。

声明:凡本网注明“来源:中国访谈网”的所有作品均为合法拥有版权或有权使用的作品,未经本网授权不得转载、摘编或利用其它方式使用上述作品已经本网授权使用作品的,应在授权范围内使用并注明“来源:中国访谈网”。违反上述声明者本网将追究其相关法律责任。

我已有成交有候补订单无法再次丅单但怎么不能在携程上做该酒店评价~怎样才能做评价?... 我已有成交有候补订单无法再次下单但怎么不能在携程上做该酒店评价~ 怎样財能做评价?

推荐于 · 超过57用户采纳过TA的回答

如果你是单独定酒店当你入住后,完成这个酒店定单你就可以做该酒店评价了.但是如果你是成交定单是包含机票和酒店的,就不能做评价了.

你对这个回答的评价是

下载百度知道APP,抢鲜体验

使用百度知道APP立即抢鲜体验。你的手机镜头里或许有别人想知道的答案

我要回帖

更多关于 有候补订单无法再次下单 的文章

 

随机推荐