笔者在 2023 年 2 月曾就生成式人工智能对旅游业的影响作出九点预测,并发表于《中国旅游报》等媒体,今日再回顾其中部分预测已然得到印证与实现,尤其是旅游垂直领域的 OTA 等平台对 AI 人工智能通用入口应用的支持,以及在实时性数据查询方面已成为现实。
然而,生成式人工智能对文旅行业的整体性、结构性影响尚未完全显现。另一方面,在这一年多的时间里,整个生成式人工智能行业与产业发生了更为剧烈的变革,一些当初看似不太清晰的方面如今也有了更为具象化的进展。基于此,笔者结合今年以来开展的相关课题研究、行业调研、项目评审等所见所闻,对 AI 大模型在文旅领域的应用落地有了更深入的思考与理解,并从如下几个问题切入进行探讨。
一、通用大模型趋势、阵营和特点
目前,国外大模型发展呈现出两个重要分支,即以 ChatGPT 为代表的闭源大模型和以 Meta Llama 为代表的开源大模型。其中,GPT 已发展至 GPT4o 版本,并且在今年 9 月份推出了更具深度推理能力的 GPT1o 新分支,以解决慢思考问题。GPT 依旧是目前最为领先的通用大模型产品,其在多模态 AIGC(Sora)、智能体(GPTs)等方面推出了具有行业引领价值的产品形态。
国内通用大模型仍以抖音、百度、阿里、腾讯等互联网大厂开发的产品为主,加之大模型新五虎(智谱 AI、月之暗面、百川智能、MiniMax、零一万物)各具特色的产品,基本形成了对标 GPT 的国内通用大模型阵营。通用大模型的重要发展方向是寻找应用场景,与各行业及个人消费类应用以及产业类应用进行深度结合,探索大模型商业化落地的新模式。
二、文旅领域大模型应用的主要场景
一是 AIGC 文化内容创作。具体场景包括生成歌曲、戏曲、特定演唱者风格、音乐旋律等内容的 AI 音乐内容创作;进行绘画或风格重绘的 AI 绘画创作;进行小说、诗词 AI 编撰;对动漫、游戏、影视片段等多媒体内容进行 AI 生成。
二是文化和旅游 AI 信息检索与服务。具体包括基于大模型的文博场所介绍和讲解服务,例如图书馆书刊信息查询、检索、智能问答、图书推荐,以及博物馆智能化解说与导引;旅游信息服务,为游客提供交互方式更生动、更加人性化的 AI 旅游目的地信息查询等;智能产品预订,包括个性化的酒店、景点门票等旅游产品推荐及预订服务;旅游 AI 智能客服,实时回答游客的咨询并处理预订及投诉;目的地 AI 无人车,在旅游目的地提供导航、解说及接送服务的旅游服务;AI 旅游导览讲解,可以提供个性化、实时且支持多语言的旅游解说等场景。
三是 AI 旅游数字营销。具体包括帮助游客自动化生成旅游 Vlog 和攻略内容;智能化地为游客做出科学合理的行程计划;生成模拟旅拍场景的图片;利用 AIGC 生成内容打造 AI 数字人导游;生成用于推广和宣传旅游目的地的各种营销素材等场景。
四是 AI 文化和旅游治理。具体包括文化和旅游领域数据并辅助主管部门进行决策;对文化和旅游相关场所进行实时语音、视频监测以及采用 AI 摄像头对各类突发和异常情况进行实时监测等场景。
三、目前文旅领域大模型的使用并不普遍的原因
可能需要先讨论通用大模型与文旅领域小模型的辩证关系问题。文旅领域大模型,亦或者叫行业小模型能真正形成现象级应用的前提是通用大模型方面先产生现象级的应用,先出现用户数可以匹配小红书、抖音等几亿用户级别的超级应用。在这种应用上,用户对大模型的使用习惯和频次得以极大提升,用户习惯于每天与大模型相关应用进行深度交互。否则,文旅领域不大可能出现超级应用或功能。这一前提也使得目前文旅行业大模型应用还只是蜻蜓点水,更多只是初级的尝试,并未实质性地对旅游行为产生颠覆式的改变。
文化内容创作对 AIGC 工具的使用可能优先于旅游领域广泛应用,AIGC 相对场景较为具象化,而旅游领域需求最大的行程规划、出行预定暂时并未有太多用户量,其根本原因还是 AI 出行助理跟游客旅游决策所习惯的场景、体验、感官冲击方面呈现较大差距有关系。
四、文旅领域大模型具有潜力的具象化产品形态
抛开文化领域内容创作所使用的 AIGC 工具先不谈,在文旅领域最重要的生成式 AI 应用是信息服务,包括信息主动查询、推荐、路线规划、资源预定等。
从产品形态具象化的角度看,首先是智能体。随着各类基于大模型的智能体的出现,其更类似于一个个独立的个体,极大地模拟了现实中团队、组织、专家等角色。可以预计的是,文旅场景下各景区、博物馆、目的地、企业等都将纷纷开发自己的智能体,也许会出现一波类似微信公众号的产业机会,为行业运营智能体并形成自己机构基于智能体的新信息服务体系成为可能。
其次,是语音交互的泛在化。目前大模型交互体验较好的包括了语音交互,以豆包、文小言、Minimax 等平台为例,其慢慢有了类似于真人的交互体验。未来文旅场景下,其植入AR 眼镜、标识牌、大屏等各类硬件设施设备也将是一大趋势。
五、目前文旅领域市场主体参与大模型的主要形式
首先,是市场侧的在线旅游企业,以携程、同程为代表,其既在开发自己的独立大模型应用,又在为通用大模型厂商的智能体提供插件。这些插件可以帮助智能体开发者实时查询 OTA 平台文旅 POI 信息、票务信息查询等,未来也可能兼容资源预定等功能。
其次,是文旅市场主体,包括图书馆、博物馆、景区等也尝试开发自己的机构智能体。以北京城市图书馆为例,其将鲁迅的数据灌入智能体所形成的个性化智能体加强了读者交互趣味性。未来各机构结合自身知识库和个性化 IP 打造 AI 智能体将成为一大趋势。
再次,以杭州、北京海淀区、朝阳区等为代表的文旅局也纷纷采用“政府+市场”的模式开发了基于目的地信息服务平台的文旅智能体产品,将其作为新的触达游客的载体与已有平台进行结合。此外,包括去哪儿网、马蜂窝、飞猪、同程等企业也都开发了自己的行程规划类大模型应用。
六、文旅领域大模型发展存在的关键问题
首先,文旅领域大模型训练数据的问题。归根到底还是文旅行业数据要素化的问题。线上平台拥有大量数据,各自也将其作为训练自家大模型的首选数据;行业主体数据更多在线下实体,多不愿意轻易共享给大模型公司进行训练,更愿意进行大模型本地化部署或者采用智能体的形式。形成合规的数据确权、定价、交易、流转体系对解决文旅领域大模型训练和商业模式问题至关重要。
其次,内容合规监管问题。在文化领域或旅游信息服务领域,需要对 AIGC 内容的合规性进行常态化、实时化监管。未来数字人直播、文生图(视频)更为普及的情况下如何进行高效智能化监管也面临挑战。
再次,行业认知与模式选择的问题。文旅行业具有较强的政府和市场双重属性,也类似于此前普遍存在的文旅信息服务“一机游”模式的问题。政府与市场化企业在文旅大模型建设模式方面如何理清的问题,政府下场做大模型可能将成为趋势,建设运营模式的探索以及行业整体对大模型的认知还较为欠缺也是一大挑战。
七、对未来一段时间文旅大模型的展望
一是今明年文旅领域智能体代运营将形成一波产业机会。可以预见的是,各地方文旅局会投入到大模型的赛道,各个地方目前的文旅信息公共服务平台将迎来一波向大模型特别是智能体的转型机会,有点类似于当年微信公众号的兴起。可能后续各地文旅局所创建的当地文旅信息的智能体将成为标配,而帮助这些地方文旅机构进行智能体的打造和运营也将催生出一波产业红利。利用目前政府端平台已经具备的文旅信息服务资源,结合智能体和数字人的展现形式,将可能出现新的文旅信息服务范式。
二是将初步形成通专结合的文旅大模型新场景。以 ChatGPT、文心一言、豆包为代表的通用大模型将利用其用户和资金优势主导流量和 AI 智能体的入口端,在通用大模型方面将解决文旅基础信息查询的需求。一般化的能在互联网中找到答案的查询将主要依赖于通用大模型以及智能体进行;而文旅特定场景下较为深入、专业、本地化的查询与服务则更适合以垂类大模型或各文旅机构智能体的形式进行服务。这种格局将类似于大家可能在抖音和小红书上查找旅游攻略,但涉及预定门票、游览讲解、甚至查询项目排队时间等更为具象化的场景则会求助于文旅场所的小程序、公众号等。可以预见的是,通专结合的大模型格局将在相当一段时间内成为文旅场景的主流,这也为在通用大模型和互联网大厂之外的行业市场主体留下了发展局部小模型或智能体的空间。也许有一天人们也会习惯于将各文旅场所的智能体添加到微信好友中,并且向与人交流一般跟他们进行互动。
三是文旅大模型将逐渐从讲故事向务实化方向发展。目前文旅领域大模型应用还处于初级阶段,随着 AIGC 工具内容生产的进一步成熟,例如抖音也于今年 9 月发布了两款足以媲美 OpenAI Sora 的文生视频工具 PixelDance 和 Seaweed。随着大量短视频生产与此类工具的结合,加之大量视频数据的训练,其视频生产质量已经超过 Sora。此外,旅游领域信息查询、行程规划与预定是频次最高的刚需,犹如当年 OTA 从 Web 端转向移动端的趋势。可以想象未来各 OTA 也将在以上高频功能方面采用大模型计算优化人机交互方式,语音互动,拟人化的互动方式,甚至模拟内容社区的体验产生更多有利于激发游客旅游需求的内容形式都是可以想象的方向。总之,大模型将非常接近于文旅高频应用的全面 AI 化。
四是文旅数据要素化助力大模型生态早日成熟。文化领域数据要素化已经基本走通了文化 IP 资源确权、定价、交易、流转、分账、版权的完整流程,初步形成了数据资源端到端的要素化链条。今后用博物馆的文物 IP 授权二次创作、训练大模型或生成可供文生图大模型训练的 LoRA 都不再具有逻辑上的壁垒;而旅游数据方面,则还需要解决数据在不同机构间如何打通壁垒,让数据流动起来的问题。旅游公共服务数据的共享、旅游市场主体所掌握的自有数据用于模型训练的模式和路径有待进一步明晰。应该说大模型的发展也为文旅数据要素化机制建立提供了实际应用场景和驱动力。