您是第位访问嘉宾!
当前位置: 首页 > 新闻中心 > 综合新闻

中医药知识自动抽取算法研究

  • 发布者:user 发布时间:2017-06-21 10:58:33.0

自动抽取技术其主要目标是在自动抽取文本中的各种实体关系信息的基础上,挖掘实体之间的关系,本系统中主要抽取文献中的实体及关系,包括:方剂、中药(中药名称、中药剂量、单位)、穴位、针灸、文献基本信息等等。实体关系识别就是确定文本中的两个实体之间在某一个时间段范围内所存在的一类关系。其中有的关系属于事先预知的比较明确关系,可以通过基于规则的方法进行抽取。有的关系比较复杂和难以预知,需要通过统计方法进行处理。

针对中医药文献数据库自动化加工的问题,中医药学科学数据中心拟采用规则学习的算法,构建相应的规则知识库。针对中医药文献的受控标引特点,利用丰富的受控词资源,尝试建立一种计算机辅助进行文献信息抽取的方法,实现自动或半自动的文献数据加工及标引等任务;以期减少在文献数据加工中所消耗的人力物力,提高文献自动分类和信息抽取的效率和质量,对中医药信息抽取及其深度利用进行方法学探索。