刚刚在百度文库看了下词库构建论文,感觉实现后对网站后期维护很有用,花了两块钱买了下来,分享给大家。
以下是论文的总结,附件中有具体操作细节,大家感觉有用的话就下载下来细研究一下。
4总结
本文是国内在采用集成词库模式解决受控
词表互操作方面的首次尝试,将会对我国词表
互操作和智能信息检索的发展有一定的推动作
用。具体可以应用于下列方面:
(1)可以为用户提供对应的分类号、主题词
或关键词,进行检索服务,进而可以开展网络检
索的提问扩展,实现概念检索,为构建本体、语
义网、主题图等知识组织系统提供语义来源等
术语服务。
(2)实现分类法、主题法之间的互操作,可
以减少图书馆员、情报工作者等的工作强度,节
省标引、分类、编目时间;一次概念判断,可以同
时赋予多个分类号或主题词。
(3)可以使采用不同分类号类分的图书集
中收藏,便于读者查询和借阅;还可以与国外分
类法兼容,从而更好地实现中、英文文献的
共享。
(4)把现在“闲置”的各种词表全部收集、利
用起来,发挥这些术语资源或语义工具的作用。
(5)可以用于修订、更新各种词表,还可用
于编制各种专业叙词表、电子政务叙词表或多
语种叙词表。在此基础上还可以建设专业术语
数据库、同义词词典等。
当然,本系统是一个实验性系统,还存在一
些不足,很多方面有待改善和扩充:①分类表映
射过程中没有考虑复分、仿分,这在推广使用中
会有很多障碍,以后可以考虑解决;②映射方法
上还需要创新,提出新的方法实现情报检索语
言之间的互操作,提高转换的准确度,另外计算
机参与的自动化程度还有待于提高;③基于词
库、XML的Web应用及本体可视化,上传下载、
扩展检索等一些术语服务有待开发。
基于受控词表互操作的集成词库构建研究.pdf
(396.02 KB, 下载次数: 4023)
|