当前位置: 首页> 学位论文 >详情
原文传递 公交车载WiFi用户网络行为分析
论文题名: 公交车载WiFi用户网络行为分析
关键词: 手机终端;公共车载;数据挖掘;网络行为分析;数据流引擎
摘要: 随着手机终端的大屏化和手机应用体验的不断提升,手机作为网民主要上网终端的趋势进一步明显,互联网应用移动化宽带化的需求日益明显。与此同时,WiFi作为无线宽带接入的主要技术之一,具有技术成熟,成本低廉,应用广泛等优点。许多公司结合公共交通系统和WiFi技术,希望为乘客带来更多有价值的增值服务的同时,构建基于公共交通WiFi网络的、以大数据为依托的“入口+平台+服务”生态链。公交车载WiFi用户产生了大量的网络数据,这些数据具有很大的研究价值。通过对这些数据进行挖掘,有利于我们找到规律,理解群体的行为特点,进而为用户群体标签、广告推荐、运营管理等诸多应用提供理论和技术支持。针对这一背景,本文通过对公交车载WiFi用户网络行为的分析,构建行为模式挖掘模型,目标是分析用户行为特点和挖掘用户的潜在行为模式。
  本文首先从用户网络行为分析的研究背景、国内外研究现状出发,根据公交车载WiFi用户网络行为的数据,借助分布式平台Hadoop和数据流处理引擎Pig,分析了公交车载WiFi下用户网络行为的点击次数、消耗流量、手机品牌、网站类型偏好和上网时段等属性。
  本文在上面的统计分析工作基础上,提取最重要的1000个网站并且用App分类方式对这1000个网站贴上类型标签,从而得到反映用户行为类别的特征,然后对用户行为类别进行了分析。在此基础上,我们结合分布式机器学习工具Spark MLlib对用户进行聚类,并通过TF-IDF算法提取新的特征,从而改进聚类结果。接着对改进后的聚类结果分析,找到主流的4种类型模式,取得了令人满意的结果。最后,本文对上述工作背后的系统进行了介绍,就数据预处理模块、数据分析模块、数据挖掘模块进行了详细描述。
作者: 赵思
专业: 信息与通信工程
导师: 涂来
授予学位: 硕士
授予学位单位: 华中科技大学
学位年度: 2016
正文语种: 中文
检索历史
应用推荐