题名: | 基于社交网络数据的交通突发事件识别方法 |
作者: | 刘昭;何赏璐;刘英舜 |
作者单位: | 南京理工大学自动化学院 |
关键词: | 智能交通;社交网络数据;交通突发事件识别;文本分类;机器学习 |
摘要: | 为了从社交网络数据中挖掘出交通突发事件,研究了基于机器学习的文本识别方法。通过关键词和地点定位,利用网页爬虫“BeautifulSoup"爬取到原始文本。采用正则匹配、重复度计算以及“0-1”标记预处理原始文本。基于预处理后文本特征,研究了基于特征权重的特征词选取方法;其中,特征权重的计算综合了词语的出现频率和含有该词语的文本所占比例,通过将二者归一化并加权合并,获得训练集突发事件文本中各个无重复词语的特征权重;依据此值选择确定特征词,并用于后续分类器的输入。测试对比了不同的分类器以及特征词选择方法,结果表明,所提特征词选取方法与XGBoost分类器结合。在交通突发事件识别上具有最好的综合表现,精确率为0。6796,召回率为0。6481,F1值为0。6635。AUC值为0。7594。 |
期刊名称: | 交通信息与安全 |
出版年: | 2021 |
期: | 02 |
页码: | 53-60 |