学科分类
/ 1
4 个结果
  • 简介:摘要随着科学技术的快速进步,网络信息技术普及率全面提升,纸质版的文件逐渐被电子文件所取代,为了保证相关电子文件的安全,相关人员在文件归档管理中,如何做好文件的收集、整理、规范管理,就尤为重要。本文主要从何为电子文件、电子文件归档和管理进行相关论述。

  • 标签: 网络办公 电子文件 文件归档管理
  • 简介:利用Git代码库中文件提交信息统计开源软件中的单次提交的文件数量分布,并且利用网络模体分析方法将单次提交的少量文件之间的相互依赖关系进行了分析。发现每个项目中程序员单次提交的文件数量基本服从幂律分布,并且程序员单次提交的少量文件之间通常会存在显著的相互依赖关系。通过对程序员单次提交文件之间的关系分析,可以帮助现有的推荐系统预测程序员下一步可能修改的文件,从而提高程序员的工作效率。

  • 标签: 开源软件 编程网络 模体 幂律 文件依赖网络
  • 简介:网络科学研究发展迅猛,已经对物理,计算机和管理等学科产生了深远的影响。然而,中国国内目前最新的网络科学主题发展态势一直缺乏直观的分析。以2017年第十三届全国复杂网络大会的会议摘要为研究对象,从基于文本挖掘的主题提取与聚类的角度分析了网络科学最具代表性的复杂网络会议的研究趋势,该会议的研究趋势一定程度上可以反映出国内网络科学领域最新的研究态势。首先对会议摘要的文本信息进行预处理,通过自建词典和停用词库对文本进行jieba分词。然后使用LDA主题模型对摘要的主题分布进行识别,基于摘要间的JS距离进行凝聚层次聚类,得到10类会议主题。研究拓展了主题模型在学术会议研究态势与研究热点挖掘上的应用范围,丰富了学术会议主题挖掘与研究热点分析的思路,能为其他学术会议快速挖掘研究态势提供借鉴;同时提出一种基于主题模型和社交网络分析相结合来挖掘机构关联关系的研究方法,以机构研究主题相似度为参考指标,为机构寻找合适的科研合作单位提供参考建议。

  • 标签: 主题建模 文本挖掘 凝聚层次聚类 网络分析