7月17日,国内首个旅游垂直行业大模型“携程问道”正式在上海发布。这代表着AIGC(人工智能生成内容)在旅游行业的实质性应用向前迈进一大步。在发布会上,携程创始人梁建章详细阐述了大模型在旅游行业的机会以及AI未来有可能给行业创造的潜在价值。
不过,相较于对旅游垂直行业大模型美好未来的期待,劲旅君更关心的是:
OTA当下如何利用AIGC破解发展瓶颈?
如果将一个旅行者的旅途划分为三个阶段,分别是“行前”、“行中”和“行后”。
如何在“行前”更高效给旅行者种草,拉长其在平台停留时间,进而深度影响旅游消费决策,促使更多实质性消费,是OTA面临的最大难题之一。
旅游垂直行业大模型的出现,似乎让携程找到了在“行前”深度影响旅行者旅游消费决策的有效方法。
事实上,梁建章在发布会上关于“OTA如何利用AIGC”的演讲中,一大半内容都是在深度阐释这一话题,他的核心观点在于:
自然语言可以通过AI更高效解决旅行者在行前提出的问题。
在这个基础上,大模型要做的核心工作有两个:
其一,收集、优化并消化海量非结构化数据(旅行者提问为代表);
其二,让结构化数据(产品、价格、线路等)成为“靠谱的答案”;
梁建章认为,携程只要让旅行者的提问一直都能收到靠谱答案,就能深度影响他们的旅游消费决策,让旅行者获得满意服务同时,平台也能确保业绩稳定增长。
01
在一次旅行之前,我们可以将旅行者划分为两大类:
对自己旅行需求很模糊的旅行者;
对自己旅行需求很明确的旅行者;
前者的特征是,他们对于“旅行”相关的一切需求都是模糊的,例如“要不要去旅行”“去哪里旅行”“怎样去旅行”“吃什么”“住哪里”“如何规划行程”“如何办理证件手续”……
这类旅行者需要耗费大量时间搞清楚上述问题后,才能开启一段旅程。统计数据显示,他们每一次旅游决策,需要翻看数十篇旅行攻略和数百款旅游产品,平均消耗11天9小时37分钟,这还不包括超过60%的旅行者大费周章后无功而返。
后者的特征是,他们对于“旅行”有相对明确的需求,清楚自己要去的目的地,但是对于如何选定旅行相关的产品有很多问题,例如“挑选哪个酒店”“挑选哪个航班”“挑选哪个景点”“挑选哪个行程”……
统计数据显示,在确定单个目的地前提下,其平均旅游决策时间为9.9个小时,如果旅行目的地超过2个以上,这个时间将延长到13.6个小时。
这两类旅行者在“行前”有一个共同的特征,就是不断提出自己的“问题”。而且他们有个共同的心愿,希望有人能快速且准确的回答这些问题。
对于大模型而言,这些“问题”都被看作是非结构化数据,当大模型收集到的非结构化数据越多,分析计算的结果,距离他们最真实的诉求就越接近。
通俗来说就是,大模型越能够听懂旅行者到底想要什么。
例如,绝大多数人都会在“行前”会提出的一个问题:
某个月应该去哪儿玩?
这是一个非常模糊的提问,就连最专业的旅行家都不一定马上能给出最符合提问者诉求的答案。然而,当大模型收集到海量类似的问题后,它会将该问题的相关指标不断量化,包括提取“最多提及”“最佳月份”“最多人去”等关键标签,结合历史气温,降水,湿度,日照,风力等数,再参考相关订单数据和攻略数据,最终在大模型系统中催生出一个“目的地适宜度模型”,并按照一定逻辑给旅行者推荐某个月合适的目的地。
于是,我们会听到大模型的回复是这样的:
7月,30%的旅行者选择去阿维尼翁,这里有薰衣草、向日葵花海和戏剧节;8月,更多旅行者选择去伦敦,趁国王休假参观白金汉宫;9月,不少旅行者倾向于多伦多,感受红色枫叶和电影节;10月,德国慕尼黑的啤酒节和秋色最搭配,这里是欧洲订单量第二的目的地;12月,28%前往罗瓦涅米的旅行者会在这个圣诞老人的故乡过一次圣诞节……
这或许不是最正确的答案,但一定是最能给旅行者种草的答案。
梁建章透露,携程筛选出来的高质量旅游非结构化数据超过200亿。
这些海量的数据,可以在“行前”帮助旅行者让模糊的需求变明确,让漫长的筛选变简短,让旅游消费决策更加高效。
02
大模型通过持续收集非结构性数据,最大限度听懂旅行者需求只是第一步,为旅行者提供尽可能靠谱的答案才能完成旅行消费决策闭环。
旅行者“行前”在携程平台上提问,往往会得到一份尽可能详细的答案集锦。
这份答案集锦的优点是详细且全面,缺点则是冗长且复杂。
例如,当旅行者提问“大理最具设计感的酒店是哪家”时,平台可以给到旅行者一份数百家贴有“设计感”标签的酒店名单。
对于旅行者而言,从上百家酒店中选出一两家符合自己心意的酒店,依然是个耗时颇多的大工程。统计数据显示,在旅行者明确自己住宿需求的前提下,选择一家合适酒店,需要平均浏览14.3家酒店、23.1条点评,最终耗时168.9分钟。
为了更好解决效率的问题,携程此番在内容端进一步强化,尝试推出“系列榜单”,包括口碑榜(目的地、酒店、机票、景点)、携程热点榜和特价榜(机票、酒店)。
简单来说,榜单的作用就是对答案集锦的二次精编。
还是以“大理最具设计感的酒店是哪家”这个提问为例,榜单的筛选逻辑如下:
首先,榜单从上亿条点评中抓取60万条大理酒店点评,涉及数千酒店;
其次,通过一系列大数据计算,提取出50多个与设计感相关的关键词;
再次,经过线下审查和确认,总共筛选出505家大理具有设计感的酒店;
最后,大数据发现洱海边具有设计感的酒店更火爆,5家酒店最终入选;
这份层层筛选后的榜单,就成为“大理最具设计感的酒店是哪家”这一提问最靠谱的答案。
为了让大模型收集并应对更多元化的提问,携程开始扩大榜单类型,热点榜是其中之一。
热点榜最大的特色是利用“旅行异动归因模型”搜集、记录并分析“异动数据”,即携程基于多年数据预测值与实际值之间的差异达到响应标准的数据。截止目前,大模型在60亿行程数据中,找到了发生在68万个目的地的1亿2千万条旅行“异动数据”。
这些“异动”往往就是吸引旅行者的核心因素。例如,周杰伦在海口开演唱会、长沙发放文旅惠民消费券等,都是所谓的“异动因素”。
当旅行者向大模型发出“最近有哪些特别的目的地”“周边有哪些不一样的玩法”等提问时,这些产生“异动数据”的目的地就成为符合他们需求的答案,帮助旅行者高效完成旅游消费决策。
由于每张榜单数据运算量达到500万,算法入选率1/100,而且榜单是实时生成的,也就是所谓的“最新答案”,每当旅行者向大模型提问时,榜单内容就成为大模型优先向旅行者回复的答案。
03
每一个大模型背后,都有两股核心支撑力:算法和数据。
众所周知,想要不断进化算法,不断积累数据,需要不计成本的疯狂投入。在“携程问道”推出之后,业内其实颇有疑问:
携程是否在这方面做好疯狂烧钱的准备?
来自携程财报数据显示,2018年-2022年,携程在产品研发费用上的投入累计达452亿元。仅在2022年其产品研发费用达到83.41亿元,占净收入的42%。即便在疫情爆发的2020年,携程技术研发团队的人数占比就达到48%左右。
这些数据的潜台词很清晰:
搞大模型,携程钱管够。
在大模型数据积累方面,优质的旅游内容是源动力,而这恰是携程作为一个交易撮合平台的短板。
不过,近两年,携程在扩大自己内容生态方面持续提速。
除了继续通过交易积累更多交易数据、点评内容外,携程开始主动生产更多原创内容,2020年的携程BOSS直播、2021年的携程社区和星球号、2022年的口碑榜,再到今年升级版的“系列榜单”等,都是携程强化内容建设,支撑数据积累的重要动作。
根据携程一季报显示,携程平台上KOL数量同比增长45%,用户创作内容同比增长34%。
有意思的是,在对大模型寄予厚望的同时,梁建章却给所有人敲了个警钟:
AIGC不可能完全代替旅行者做决策,尤其对于休闲旅游的需求。
“旅行是一个寻找新奇需求的过程,很大程度上具有不可预测性。”
梁建章认为,AIGC只是用算法、榜单给旅行者提供了一个选择的清单,具体怎么选、选什么,旅游消费最终决策,必须是由人类来做的。
“不可能指望AIGC完全替代客人去决策,就像我的助理一样,我有很聪明的助理,但不可能完全安排我的行程。”
他同时透露,以携程新推出的“系列榜单”为例,即便是算法给出的结果再精确,最终还是要人工校验,再推向旅行者。
“归根到底,AIGC在垂直领域的应用刚刚开始,还有很多的东西要做,值得更多期待。”梁建章最后表示。