题名: | 民航领域术语定义的自动提取 |
正文语种: | 中文 |
作者: | 孙蝉娟 顾宏斌 潘湑 |
作者单位: | 南京航空航天大学民航学院 江苏南京,210016 |
关键词: | Term Definition Extract definition Pattern matching Term first appears |
摘要: | 为了提取民航教材中的术语定义,对进行实验的纯文本语料进行预处理,在分析民航领域术语定义的语言学特征的基础上,对术语定义的模式进行总结.根据所总结的模式编写正则表达式,对经过预处理的语料进行模式匹配.同时,假设如果一个术语第一次出现在一个句子中,则认为该句就是该术语的候选术语定义.通过将以上两种方法的实验结果结合起来,与人工提取的术语定义进行比较,得出两种方法相结合使用时的召回率与准确率,从而达到获取民航教材中的术语定义的目的. |
会议日期: | 20091030 |
会议举办地点: | 上海 |
会议名称: | 第八届全国交通运输领域青年学术会议 |
出版日期: | 2009-10-30 |
母体文献: | 第八届全国交通运输领域青年学术会议论文集 |
分类号: | TP3 H08 |