论文

从历史记录到结构化人物传记数据:中文材料的半自动处理方式

关键词

作者

徐力恒 ,香港城市大学中文及历史学系助理教授
王宏甦 ,哈佛大学中国历代人物数据库(CBDB)高级项目经理
徐阳 北京大学历史学系博士生
徐力恒

参考文献 查看全部 ↓

从历史记录到结构化人物传记数据:中文材料的半自动处理方式

可试读20%内容 PDF阅读 阅读器阅览

试读已结束,剩余80%未读

¥8.54 查看全文 >

VIP免费

论文目录

  • 一 导言与文献回顾
    1. (一)中国历代人物传记资料库(CBDB)项目
    2. (二)建立用于唐代中国群体传记学数据的挑战
  • 二 电子化和提取人物传记数据
    1. (一)选择合适的材料进行电子化
    2. (二)优化OCR,以便提取和处理历史数据
  • 三 人物传记数据的处理和消歧
  • 四 讨论
    1. (一)半自动化方式的效率
    2. (二)史料数据化的价值
    3. (三)未来可供研究的新问题
  • 结语

论文图片/图表

查看更多>>>