Difference between revisions of "怎样用Emacs调电子书格式"

Jump to navigation Jump to search
no edit summary
==背景==
[[File:源pdf格式精美但转txt后换行凌乱.png|490px]]
 
找了本电子书,是 pdf 格式的,无法导出为好格式的 txt。想起好久没玩 Emacs 的 regexp 怕生疏了,于是就用 Emacs 调一下 txt 电子书的格式。
 
==步骤==
[[File:在段尾插入锚点.png|490px]]
 
; 1. 找段尾
: 把以句号、省略号、后引号、问号、后括号、破折号、感叹号结尾的地方,全打上 rjsyffj 这个标记,rjsyffj 是一句诗:人间四月芳菲尽。打上标记后,在把全书所有断行合并成一行,段尾也有了 rjsyffj 这个明显的标记。
; 2. 找章节
[[File:把章名摘出来.png|490px]]
 
: 这句就是把第某章前面加两个空行,后面也加一个空行,再打上 rjsyffj 这个标记,把全书所有断行合并成一行之后,章节名也有了 rjsyffj 这个明显的标记。^J 是在 Emacs 中按 C-q C-j 出现的,意思是换行。
: <code>\(第.章\) → ^J^J\&^Jrjsyffj </code>
; 3. 合并行
[[File:合并全书为一行安插了诗句锚点.png|490px]]
 
: 把所有断行合并成一行。相当于这几十万字的电子书变成了一行,但由于段尾在第 1 步中做了 rjsyffj 这个标记,所以这一大行,下一步把段尾替换出来就形成了美观的分段。
: <code>delete-indentation</code>
; 4. 找段尾
[[File:把锚点替换为段尾符就实现了分段.png|490px]]
 
: 把rjsyffj换成空行
 
; 5. 收尾
[[File:去除凌乱换行后成功分段.png|900px]]
 
: 删除多余的空格,取消 whitespace-mode,与原 pdf 对比看是否有误
 

Navigation menu