Greg Pittman

作者评论

这可能是一个可行的解决方法。这是一个在 GUTINDEX.ALL 文件上运行的 Python 脚本,您可以在从文件中删除前导信息后执行此操作

#!/usr/bin/env python
# -*- coding: utf-8 -*-

linelist = []
gutfile = 'GUTINDEX.ALL' # 确保您获得正确的完整路径
for line in open(gutfile).xreadlines()
if len(line) > 5
if ((line[-4].isdigit()) and (line[-3].isdigit()))
line = '' + line
linelist.append(line)
myfile = open('gutindexmod.all', 'w')
for eachline in linelist
myfile.write(eachline)
myfile.close()

这样做是查找以数字结尾的行,并在这些行前面加上 HTML 换行标记。扫描结果文件,它似乎工作得很好。如果您打算处理该文件,则必须允许小于 5 位数的电子书编号。

在线
line = '' + line
单引号之间应该有一个 xhtml 换行标记 - 不会显示在注释中。

© . All rights reserved.