章节

多语种语料库的建设及关键技术

关键词

作者

参考文献 查看全部 ↓

多语种语料库的建设及关键技术

可试读20%内容 PDF阅读 阅读器阅览

试读已结束,剩余80%未读

¥47.1 查看全文 >

VIP免费

章节目录

  • 第一节 多语种语料库介绍
    1. 一 语料库的分类
      1. 1.单语种语料库
      2. 2.平行语料库
      3. 3.多语种语料库
      4. 4.可比语料库
      5. 5.学习者语料库
      6. 6.历时语料库
      7. 7.专业语料库
      8. 8.多媒体语料库
      9. 9.原始语料库
    2. 二 多语种语料库的组成成分
    3. 三 多语种语料库的应用
  • 第二节 多语种语料库的特征
    1. 一 语料库的一般特征
    2. 二 基于词汇的特征
    3. 三 词法的特征
    4. 四 基于标注的真实语料
    5. 五 语言类型丰富,适用范围更广
  • 第三节 多语种语料库的构建框架
    1. 一 多语种语料库的构建
      1. 1.语料资源的数字化问题
      2. 2.语料资源的版权问题
    2. 二 语料文本资源的选择标准
      1. 1.口语、书面语和网络用语
      2. 2.正式语言和文学语言
      3. 3.语料资源的典型性
      4. 4.语义特征的时间性
      5. 5.语料库的总规模
      6. 6.抽样语料库的规模
      7. 7.统一文字编码标准
    3. 三 语料库的构建框架
      1. 1.单语种语料库的构建
      2. 2.平行语料库的构建
      3. 3.可比语料库的构建
      4. 4.多语种语料库的构建
    4. 四 多语种语料库构建原则
      1. 1.代表性
      2. 2.结构性
      3. 3.平衡性
      4. 4.规模性
      5. 5.元数据
  • 第四节 多语种语料信息智能分析技术
    1. 一 自然语言分析方法
      1. 1.词法分析
      2. 2.句法分析
      3. 3.语义分析
      4. 4.语境和篇章分析
      5. 5.知识图谱
      6. 6.文本情感分析
    2. 二 语料库智能分析的基本技术
      1. 1.字词切分和词性标注
      2. 2.短语句法及语义分析
      3. 3.句群分析
    3. 三 多语种语料库的实现案例
      1. 1.通用型语料库的处理
      2. 2.自建语料库的建立
      3. 3.智能分词技术的实现
  • 第五节 语料资源的大数据采集和存储技术
    1. 一 语料资源的大数据采集
      1. 1.传统语料资源采集
      2. 2.大数据语料资源采集
    2. 二 大数据支持的语料库存储技术
      1. 1.数据的自动清洗
      2. 2.非结构化存储技术
      3. 3.大数据存储系统
  • 第六节 多语种语料库信息检索及可视化呈现
    1. 一 语料信息检索
    2. 二 可视化技术
    3. 三 语料库的可视化案例
      1. 1.词频统计与词云
      2. 2.构建语义网络

章节图片/图表

查看更多>>>