章节
多语种语料库的建设及关键技术
检索正文关键字
章节目录
-
第一节 多语种语料库介绍
- 一 语料库的分类
- 1.单语种语料库
- 2.平行语料库
- 3.多语种语料库
- 4.可比语料库
- 5.学习者语料库
- 6.历时语料库
- 7.专业语料库
- 8.多媒体语料库
- 9.原始语料库
- 二 多语种语料库的组成成分
- 三 多语种语料库的应用
- 一 语料库的分类
-
第二节 多语种语料库的特征
- 一 语料库的一般特征
- 二 基于词汇的特征
- 三 词法的特征
- 四 基于标注的真实语料
- 五 语言类型丰富,适用范围更广
-
第三节 多语种语料库的构建框架
- 一 多语种语料库的构建
- 1.语料资源的数字化问题
- 2.语料资源的版权问题
- 二 语料文本资源的选择标准
- 1.口语、书面语和网络用语
- 2.正式语言和文学语言
- 3.语料资源的典型性
- 4.语义特征的时间性
- 5.语料库的总规模
- 6.抽样语料库的规模
- 7.统一文字编码标准
- 三 语料库的构建框架
- 1.单语种语料库的构建
- 2.平行语料库的构建
- 3.可比语料库的构建
- 4.多语种语料库的构建
- 四 多语种语料库构建原则
- 1.代表性
- 2.结构性
- 3.平衡性
- 4.规模性
- 5.元数据
- 一 多语种语料库的构建
-
第四节 多语种语料信息智能分析技术
- 一 自然语言分析方法
- 1.词法分析
- 2.句法分析
- 3.语义分析
- 4.语境和篇章分析
- 5.知识图谱
- 6.文本情感分析
- 二 语料库智能分析的基本技术
- 1.字词切分和词性标注
- 2.短语句法及语义分析
- 3.句群分析
- 三 多语种语料库的实现案例
- 1.通用型语料库的处理
- 2.自建语料库的建立
- 3.智能分词技术的实现
- 一 自然语言分析方法
-
第五节 语料资源的大数据采集和存储技术
- 一 语料资源的大数据采集
- 1.传统语料资源采集
- 2.大数据语料资源采集
- 二 大数据支持的语料库存储技术
- 1.数据的自动清洗
- 2.非结构化存储技术
- 3.大数据存储系统
- 一 语料资源的大数据采集
-
第六节 多语种语料库信息检索及可视化呈现
- 一 语料信息检索
- 二 可视化技术
- 三 语料库的可视化案例
- 1.词频统计与词云
- 2.构建语义网络
查看更多>>>