论文题名: | 基于大数据的铁路客运用户画像系统研究及应用 |
关键词: | 铁路客运;用户画像系统;标签计算;运用场景 |
摘要: | 随着铁路的高速发展以及“互联网+”商业模式的快速推广,互联网已渗透到铁路客运的各个服务场景,铁路互联网用户呈现爆发式的增长,已经积累了大量的用户行为数据。通过用户的行为数据构建铁路客运用户画像系统,能够更加准确的把握旅客群体,圈定高质量旅客,针对不同的旅客群体制定个性化、差异化的营销和服务策略,在细分价值等级的旅客基础上合理配置铁路客运资源,实现铁路从传统的营销策略拓展为以旅客价值为依据的铁路利益最大化和旅客服务质量最优化的共赢策略。 本文首先介绍了相关的社会背景和技术背景,深入的研究了大数据生态环境中的相关技术,包括分布式文件系统HDFS、分布式数据仓库工具Hive、分布式计算框架Spark等。同时研究并实现了铁路客运用户画像系统的总体架构和用户标签计算的相关算法。最后介绍了铁路客运用户画像系统的运用场景,取得了良好的应用效果。 本论文主要研究成果包括: (1)针对铁路12306互联网售票系统,站车WIFI运营服务、广告平台、互联网订餐等信息系统的实际需求,并结合当前大数据领域的相关技术,研究并设计了铁路客运用户画像系统的总体架构。 (2)针对铁路不同信息系统产生的数据特点,深入研究并实现了结构化数据以及非结构化数据的批量处理和实时增量处理的方法。 (3)对铁路旅客行为数据进行了深入的研究,设计了铁路旅客标签体系,对基础标签、统计类标签、潜在标签的计算方法进行了详细的研究。 (4)针对海量的旅客行为数据,研究并实现了基于MapReduce的K-means算法、BP神经网络算法、PassengerRank算法,提高了潜在标签(例如:用户价值)的计算效率。 (5)针对铁路客运用户画像系统,设计了系统安全预警系统,实时监控铁路客运用户画像系统的运行情况,以实现运维人员对系统运行异常的快速反应。 (6)基于铁路客运用户画像系统,介绍了多个应用场景,研究并设计了一套完整的为第三方提供数据核验服务的平台,并取得了良好的应用效果。 |
作者: | 郝晓培 |
专业: | 计算机应用技术 |
导师: | 单杏花 |
授予学位: | 硕士 |
授予学位单位: | 中国铁道科学研究院 |
学位年度: | 2018 |
正文语种: | 中文 |