当前位置:范文帮毕业论文内容页

学术期刊PDF文件处理方法

2022-02-25 13:10:01毕业论文访问手机版

网络出版具有传播速度快、传播范围广、检索方便、阅读便利等优点[1-2],已成为传播研究成果的重要方式。网络出版主要有期刊网站和第三方数据库平台等模式。目前,已有越来越多的期刊自建网站,并通过期刊网站及时发布稿件全文,以便于读者阅读和作者下载,提高期刊的影响力。在第三方数据库平台提供商中,中国知网在2017年推出了网络首发出版平台[3],通过该平台可进一步缩短出版时滞,且该平台支持增强出版的新型数字出版模式[4],允许期刊在上传稿件根文献的同时提交相关的附加材料,这极大有助于读者对稿件的理解。PDF格式文献可保持电子文献与纸质印刷的一致性,同时具有跨平台、体积小、安全性高等优点,目前仍然是我国学术期刊实现数字出版的主要模式[5]。在整期定稿后进行中国知网网络首发及在期刊网站发布时需要对整期PDF文件进行繁琐的单篇拆分操作,对含有附录的稿件,还需定位出是哪些稿件含有附录以提醒稿件责编准备附录材料,在期刊网站发布时,为便于读者阅读可将含附录的稿件与相应附录进行合并再上传至后台系统。这涉及一系列重复性操作,非常耗费编辑的时间,也影响了稿件的及时网络发布。VBA作为一种强大的编程语言,有助于实现重复工作的自动化,已在编辑工作中有所应用,并取得了较好的效果[6]。目前,暂未见到关于VBA处理整期PDF文件的文献报道,为此,笔者根据在《电力自动化设备》杂志社的工作实践,建立稿件处理窗口,采用VBA编程分别实现一键整期PDF文件单篇稿件的拆分、在组稿单中含附录稿件的标注及单篇稿件与附录的合并功能,以节省编辑工作时间,加快稿件的网络发布,提高期刊的影响力。

1准备工作

采用OfficeWord和AdobeAcrobat这2种常用办公软件,并在WordVBA编辑器中,将AdobeAcrobat9.0TypeLibrary和MicrosoftScriptingRuntime加入工具菜单的引用中。原始文件为组稿单Word文件和整期稿件PDF文件,以《电力自动化设备》2021年第2期为例,组稿单如表1所示。

2功能实现

2.1窗口建立

在WordVBA编辑器的Normal工程下建立如图1所示用户窗体。其中,输入单篇稿件的名称前缀,再点击“整期拆分及标注含附录稿”按钮,可将整期PDF文件拆分为单篇稿件,并在组稿单中对含附录的稿件进行突出显示,以提醒相应责编准备附录。一方面,可将准备好的附录文件与拆分的单篇稿件进行中国知网网络首发,另一方面,无需输入,直接点击“单篇合并附录”按钮可实现含附录的稿件与相应附录文件夹中附录文件的合并,并将合并后的文件在期刊网站进行发布。

2.2整期拆分及标注含附录稿

整期期刊通常由数十篇稿件构成,若对照每篇稿件在组稿单中的页码采用PDF软件的提取页面功能一一提取并命名保存将极其繁琐耗时,尤其在含有转页时还需单独提取转页,再将单篇稿件与相应转页进行合并。此外,由于整期文件中并非每篇稿件都有附录,若对每篇稿件进行一一查看是否含附录将会浪费时间。为此,笔者开发了整期PDF文件的拆分及标注含附录稿程序。表1组稿单中“页码”列采用符号“-”连接不含转页稿件的起止页或含转页稿件主体部分的起止页,以符号“→”后页码表示转页。整期PDF文件拆分的实现思路为:遍历表1组稿单中“页码”列,以“*[→]*”Like运算判断该行是否为含转页稿件信息,如果是,则分别创建整期PDF文件中该单篇稿件的主体部分PDF文件和转页部分PDF文件,并将这两部分合并存储,如果不是,则以“*[-]*”Like运算判断该行是否为不含转页稿件信息,如果是,则创建一个PDF文件存储整期PDF文件中该单篇稿件部分即可,依此循环完成对所有单篇稿件的拆分。需说明的是,在对各篇稿件创建新的PDF文件时,PDF文件以0为起始页,则其在整期文件中起始页为组稿单中起始页+正文前的页数-1,《电力自动化设备》期刊正文前包括4页目次和1页宣传内容,因此,程序中各篇稿件在整期文件中的起始页为组稿单中起始页+4。此外,本程序的输入为单篇稿件名称的前缀,《电力自动化设备》期刊采用“年+期+0+序号”的命名方式,序号不足10的在前面补0,如2021年第2期稿件的名称前缀为202102。《电力自动化设备》期刊在包含附录的稿件中以“附录见本刊网络版(http:∥)。”对附录进行链接和标注,基于此,标注含附录稿程序实现思路为:将整期拆分后的单篇PDF稿件另存为txt格式临时文件,遍历图1组稿单中“序号”列,以“**”Like运算判断是否为稿件序号,即该行是否为稿件信息,如果是,则读取该稿件对应的txt文件,判断是否包含附录标志,如果包含,则对组稿单中该序号所在单元格以黄色填充突出显示,依此循环完成整期文件中所有包含附录稿件的突出显示,同时删除临时txt文件。

2.3单篇合并附录

在责编准备好稿件附录后,即可将整期拆分文件与附录一并上传至中国知网网络首发平台进行发布。在期刊网站,为方便读者阅读,可将含附录稿件与附录合并后再上传。附录按照中国知网的格式要求以“根文献名称_附加材料”的方式命名并放置于相同名称的文件夹中,若将附录从文件夹中取出并与相应稿件一一合并较为繁琐费时。笔者开发出一键合并程序,实现思路为:遍历附录文件夹,将文件夹中附录与相应稿件合并替换原稿件,依此循环直到遍历完所有附录文件夹即完成所有附录与相应稿件的合并。该功能的具体操作方法为:在文件夹中放入准备好的附录文件夹,点击“单篇合并附录”按钮即可。

3实例展示

以《电力自动化设备》2021年第2期为例,将表1组稿单与整期PDF文件放置于同一文件夹中,在窗口中输入名称前缀“202102”并点击“整期拆分及标注含附录稿”按钮,得到结果如图2、表2所示。在文件夹中放入准备好的附录文件夹,点击“单篇合并附录”按钮,图2中含附录的单篇稿件即被单篇稿件与相应附录的合并文件所替代。

4结论

在整期稿件定稿后进行中国知网网络首发及期刊网站发布时需要对整期PDF文件进行繁琐的重复操作,为此笔者开发了稿件处理程序,实现整期稿件的拆分、含附录稿件的标注及单篇稿件与附录的合并功能。实际应用表明该程序功能有效,可帮助编辑解脱繁琐的PDF文件操作。