论文

一种不依赖用户行为数据的科研文献推送系统

摘要

[目的]实现一种智能推送科研文献的服务架构,解决在缺少用户行为数据时主动发起的文献精准推送问题。[方法]研究分析典型的推送系统和现存的文献情报服务,结合数据挖掘、数据存储、推送算法与可视化分析技术设计科研文献精准推送系统,并提出实现手段。[结果]系统整合了期刊文献录入、网络数据爬取、计算匹配学者、推广效果可视化和策略调整功能,期刊管理者可借助系统实现智能文献推送并发掘潜在读者。[结论]本文系统充分利用学术数据库公开的论文属性数据及作者属性数据,规避了科研文献个性化推荐系统常见的冷启动问题,为诸如期刊网站主动推送论文以吸引读者等应用场景提供支持。

作者

虞哲英 ,男,中国科学院大学人工智能学院,学生,本科,研究方向为人工智能、软件工程。
关贝 ,男,中国科学院软件研究所,助理研究员,博士,研究方向为人工智能方法和大数据分析方法、网络安全分析技术、操作系统虚拟化技术和安全操作系统,(通讯作者)
昝道广 ,男,山东科技大学,本科生,研究方向:自然语言处理。
吕荫润 ,男,中国科学院软件研究所协同创新中心,博士生,研究方向:析取规划、运筹优化、自然语言处理。
毕丽阳 ,女,北京理工大学,硕士生,研究方向:推荐系统。
王永吉 ,男,中国科学院软件研究所,博士生导师,二级研究员,博士,研究方向为人工智能、大数据、云计算、软件工程、虚拟化技术、隐蔽信道、实时系统等,(通讯作者)
YU Zheying
GUAN Bei
ZAN Daoguang
LYU Yinrun
BI Liyang
WANG Yongji

参考文献 查看全部 ↓
  • [1]黎超.基于大数据的电商个性化推荐系统分析[J].商业经济研究,2019(2):69-72.
  • [2]BEEL J,GIPP B,LANGER S,et al. Research-paper recommender systems:a literature survey[J].International Journal on Digital Libraries,2016,17(4):305-338.
  • [3]NASCIMENTO C,LAENDER A H F,DA SILVA A S,et al. A source independent framework for research paper recommendation[C]//NEWTON G. Proceedings of the 11th annual international ACM/IEEE joint conference on digital libraries. New York:ACM,2011:297-306.
  • [4]王炎.数据挖掘技术下的个性化智能推荐系统设计[J].微型电脑应用,2019,35(2):119-121.
  • [5]刘瑾.Web系统Selenium Web Driver自动化测试框架搭建[J].电子技术与软件工程,2017(21):171-172.
  • [6]王维朗,吕赛英,游滨等.提升科技期刊国际显示度的途径与策略. 中国科技期刊研究,2011,22(5):743-745.
  • [7]王萍,甄志勇,徐状.中国科技期刊学术影响力的提高与建设[C]//.中国科学技术协会学会学术部.第六届中国科技期刊发展论坛论文集,2010:225-230.
  • [8]彭桃英,周红梅,雷燕,等.网络环境下提高中国科技期刊影响力的途径.农业图书情报学刊,2013,25(8):164-167.
  • [9]于韬,王洪岩.基于TF-IDF算法的文本信息提取[J].科技视界,2018(16):117-118.
  • [10]赵瑞.邮址精确提取及邮件针对性发送系统开发[D].浙江理工大学,2015.
  • [11]张成博. RDBMS到Hadoop数据与SQL迁移的研究与实现[D].华东理工大学.2018.
  • [12]张志,胡志勇. RESTful架构在Web Service中的应用[J]. 计算机应用,2018,37(10):33-37.
  • [13]Gema Bello-Orgaz,Jason J. Jung,David Camacho. Social big data:Recent achievements and new challenges[J]. Information Fusion,2016,28.
  • [14]熊回香,杨雪萍,高连花.基于用户兴趣主题模型的个性化推荐研究[J].情报学报,2017,36(9):916-929.
  • [15]黄继婷,陈建兵,陈平华.融合偏好度与网络结构的推荐算法[J].计算机工程与应用,2019(10):1-10.
  • [16]牛永洁,田成龙.融合多因素的TFIDF关键词提取算法研究[J].计算机技术与发展,2019(7):1-5.
  • [17]XU Ke,ZHENG Xushen,CAI Yi,et al.Improving user recommendation by extracting social topics and interest topics of users in uni-directional social networks[J].Knowledge-Based Systems,2018,140:120-133.
  • [18]裴超,肖诗斌,江敏.基于改进的LDA主题模型的微博用户聚类研究[J].情报理论与实践,2016,39(3):135-139.

一种不依赖用户行为数据的科研文献推送系统

可试读20%内容 PDF阅读 阅读器阅览

试读已结束,剩余80%未读

¥4.66 查看全文 >

VIP免费

论文目录

  • 0 引言
  • 1 推送技术的应用现状
    1. 1.1 典型的推送系统应用
      1. 1.1.1 电子商务平台推送系统
      2. 1.1.2 个性化资讯服务
      3. 1.1.3 音视频推送引擎
    2. 1.2 科研文献推送服务现状
      1. 1.2.1 数字图书馆服务
      2. 1.2.2 学术数据库服务
      3. 1.2.3 期刊网站
    3. 1.3 现状分析
  • 2 架构设计
  • 3 数据采集
    1. 3.1 数据采集架构
    2. 3.2 文献数据采集
    3. 3.3 科研学者属性数据采集
    4. 3.4 关系数据采集
  • 4 数据存储
    1. 4.1 数据清洗
    2. 4.2 数据存储
    3. 4.3 数据访问
  • 5 推送算法
    1. 5.1 用户画像
      1. 5.1.1 用户特征模型
      2. 5.1.2 社交网络关系
      3. 5.1.3 兴趣保持模型
    2. 5.2 主题提取
      1. 5.2.1 潜在语义分析
      2. 5.2.2 LDA主题模型
    3. 5.3 精准推送
  • 6 应用服务
    1. 6.1 主动推送服务
      1. 6.1.1 文献精准推送
      2. 6.1.2 作者精准推送
    2. 6.2 统计分析服务
      1. 6.2.1 推送效果分析
      2. 6.2.2 读者特征分析
      3. 6.2.3 社交网络分析
  • 7 结语

论文图片/图表

查看更多>>>