题名: | 利用词向量探讨运输语料之逻辑关系 |
正文语种: | 中文 |
作者: | 陶治中 张悦朗 郭铭伦 |
作者单位: | 淡江大学运输管理学系,25137 新北市淡水区英专路151号 淡江大学运输管理学系运输科学研究所 |
关键词: | 运输语料 逻辑关系 词向量 自然语言处理 |
摘要: | 词向量计算是近年新兴的自然语言处理技术,也是社交媒体挖掘、命名实体识别(NER)等应用的基础.一份语料里的字词会透过一个向量,来表示它在高维空间的位置,该向量(vector)即为词向量(word embedding).不同语料(corpus)会有其特有的词向量,可能导致特有的逻辑关系.过去研究多针对医学领域的语料进行词向量分析,以辨别医学用语的效果,不过运输领域的语料则较缺乏相关词向量分析的研究.因此,本研究提出以Google地图的轨道运输场站评论作为语料,利用词向量对运输语料进行探讨.本研究首先针对Google地图的轨道运输场站评论内容进行数据剖析,再从中提取词向量以展示运输语料中的逻辑关系.结果发现,运输语料的单词之间确实具有邻近、类推与投影等关系. |
会议日期: | 201907 |
会议举办地点: | 台北 |
会议名称: | 第27届海峡两岸都市交通学术研讨会 |
出版日期: | 2019-06-30 |
母体文献: | 第27届海峡两岸都市交通学术研讨会论文集 |
分类号: | TP391 |