深夜读书会

 找回密码
 注册
搜索
楼主: ferq

[闲聊] epub和pdf差在哪里?

 关闭 [复制链接]

2

主题

108

帖子

433

积分

初翻书页

Rank: 2Rank: 2

积分
433
贡献
433
金币
558
发表于 2024-2-29 14:36:51 | 显示全部楼层
牛小涛 发表于 2024-2-29 07:42
确实,遇到扫描版的pdf还不如自己动手做个好了

超星库出来的文件多刺激啊,想想就令人绝望
回复 支持 反对

使用道具 举报

13

主题

2228

帖子

4108

积分

吃书妖怪

Rank: 5Rank: 5Rank: 5

积分
4108
贡献
4108
金币
4208
发表于 2024-3-1 08:29:30 | 显示全部楼层
bule 发表于 2024-2-29 14:36
超星库出来的文件多刺激啊,想想就令人绝望

额,越硬的骨头啃起来越得劲?
回复 支持 反对

使用道具 举报

1

主题

119

帖子

475

积分

初翻书页

Rank: 2Rank: 2

积分
475
贡献
475
金币
574
发表于 2024-3-1 15:26:31 | 显示全部楼层
本帖最后由 frdh 于 2024-3-1 15:52 编辑
bule 发表于 2024-2-29 14:35
这种屎山代码是不是可以自己编一个小程序自动识别处理一下


我觉得怎么弄都跟重制差不多了。
要编程序,规则得写的很细吧,毕竟其中还是有极小部分排版有用的。如果要找出来那部分有用的,还得细细看一遍。
当然粗暴点,全部干掉从头来过最简单就是了。但这时候又有粗暴程度的问题,这小程序只对这一种规则生效呢,还是对其他也一样很烂的生效呢,会不会有误杀呢?
最后最关键的是,我并不会写这种东西(我猜测应该是用某种解析器解析出元素标签类之类或者直接写正则匹配去除吧?)
我只会批量替换这种原始的方法(略微会一丢丢正则)
回复 支持 反对

使用道具 举报

29

主题

137

帖子

522

积分

小书痴

Rank: 3

积分
522
贡献
522
金币
126
发表于 2024-3-1 18:59:53 | 显示全部楼层
文字比图片看着舒服啊
回复 支持 反对

使用道具 举报

36

主题

57

帖子

361

积分

E·怠工组

Rank: 9

积分
361
贡献
361
金币
3565

E·怠工组天野远子·Epub组纪念章

发表于 2024-3-2 00:12:07 | 显示全部楼层
frdh 发表于 2024-2-29 13:50
是啊,不编辑只拿看来说没什么问题。但要编辑……就很繁杂了。
大部分样式都是垃圾代码,直接去掉都可以 ...

处理屎山最简单的就是不要动他,继续往上堆
这种不好搞,本来位置就是散乱的,优先级还高不好覆盖

你要在意code层面好看不好看,还不如重制来的省事
看你怎么界定什么是需要的了,要的部分整理成单独的样式,多余的全部删掉
回复 支持 反对

使用道具 举报

5

主题

186

帖子

323

积分

初翻书页

Rank: 2Rank: 2

积分
323
贡献
323
金币
159
发表于 2024-3-2 11:38:44 | 显示全部楼层
pdf是图片,epub是渲染,一个是源码,应该是渲染,pdf如果放大会糊(如果是矢量图就不会),但epub就不会,epub可以把男主的名字换成你自己的.....
回复 支持 反对

使用道具 举报

1

主题

119

帖子

475

积分

初翻书页

Rank: 2Rank: 2

积分
475
贡献
475
金币
574
发表于 2024-3-2 13:29:16 | 显示全部楼层
轻亦之间 发表于 2024-3-2 00:12
处理屎山最简单的就是不要动他,继续往上堆
这种不好搞,本来位置就是散乱的,优先级还高不好覆盖

是这样没错,但我觉得主要是没有一个强制性规范的问题。
毕竟每个人(工具)都能有各种奇奇怪怪的代码写法,显示出来效果够看就懒得管了。

至于界定需要与否,得看它是怎么排版的了。这个不好定义,只能看代码分析了。
比如,有人硬是加空格来制造间距,实现类似表格的对其效果。还有的是加样式来定义。真正拿td、tr等来定义的反而是少数(我目前看到的)。
再比如,有些人标题和内容一样用p、div,有的人加class,有的人直接把样式写进去等……

想要编辑一下,真是一言难尽。越看越头大
回复 支持 反对

使用道具 举报

36

主题

57

帖子

361

积分

E·怠工组

Rank: 9

积分
361
贡献
361
金币
3565

E·怠工组天野远子·Epub组纪念章

发表于 2024-3-3 13:39:33 | 显示全部楼层
frdh 发表于 2024-3-2 13:29
是这样没错,但我觉得主要是没有一个强制性规范的问题。
毕竟每个人(工具)都能有各种奇奇怪怪的代码写法 ...

这个还是别强求了,除非是在自己出版组织内部

实现方式本来就是多样化的,CSS之类的好处就在这里
不单单是方法的问题,想要的效果和兼容性也会不同,这本来就是ePub的自由性
回复 支持 反对

使用道具 举报

0

主题

26

帖子

548

积分

小书痴

Rank: 3

积分
548
贡献
548
金币
1159
发表于 2024-3-3 19:31:53 | 显示全部楼层
PDF相当于图片,修改性差但稳定;epub类似网页打一堆网页“打包”在一起,修改性强
回复 支持 反对

使用道具 举报

2

主题

19

帖子

89

积分

初翻书页

Rank: 2Rank: 2

积分
89
贡献
89
金币
64
发表于 2024-3-3 23:10:59 | 显示全部楼层
pdf都是图片看小说的话不方便
回复 支持 反对

使用道具 举报

0

主题

1

帖子

62

积分

初翻书页

Rank: 2Rank: 2

积分
62
贡献
62
金币
2
发表于 2024-3-4 10:20:35 | 显示全部楼层
扫描版pdf真的令人绝望,除了3:2的平板屏幕怎么看怎么难受,epub多好多少寸都能重排,换字体
回复 支持 反对

使用道具 举报

1

主题

119

帖子

475

积分

初翻书页

Rank: 2Rank: 2

积分
475
贡献
475
金币
574
发表于 2024-3-4 17:54:18 | 显示全部楼层
轻亦之间 发表于 2024-3-3 13:39
这个还是别强求了,除非是在自己出版组织内部

实现方式本来就是多样化的,CSS之类的好处就在这里

所以是没有强制性规范的问题嘛。

如果要实现某种效果,必须要用某种方法实现的话,就不存在兼容性和效果的问题了。
毕竟不支持规范就等于不识别,结果就是没有。相当于强迫各种阅读器、浏览器以及创作者去支持它。
这样即简单又暴力,不知道等谷歌完完全全统一浏览器世界的时候,能不能有近似效果(现在不就在淘汰一部分特别老旧的代码嘛,例如对ie的兼容性)
回复 支持 反对

使用道具 举报

2

主题

108

帖子

433

积分

初翻书页

Rank: 2Rank: 2

积分
433
贡献
433
金币
558
发表于 2024-3-5 18:41:10 | 显示全部楼层
frdh 发表于 2024-3-2 13:29
是这样没错,但我觉得主要是没有一个强制性规范的问题。
毕竟每个人(工具)都能有各种奇奇怪怪的代码写法 ...

想起来我问别人全文公式对齐制表位给了多少?对方,啥?我用空格手打对齐的。。。。。就,反正最后对没对齐吧。。。。。
回复 支持 反对

使用道具 举报

1

主题

6

帖子

49

积分

初翻书页

Rank: 2Rank: 2

积分
49
贡献
49
金币
8
发表于 2024-3-5 18:55:50 | 显示全部楼层
感觉epub还是偏网页一些
回复 支持 反对

使用道具 举报

1

主题

119

帖子

475

积分

初翻书页

Rank: 2Rank: 2

积分
475
贡献
475
金币
574
发表于 2024-3-5 21:05:58 | 显示全部楼层
bule 发表于 2024-3-5 18:41
想起来我问别人全文公式对齐制表位给了多少?对方,啥?我用空格手打对齐的。。。。。就,反正最后对没对 ...

只能说对于每个人的习惯,只有笑一笑了
回复 支持 反对

使用道具 举报

2

主题

9

帖子

67

积分

初翻书页

Rank: 2Rank: 2

积分
67
贡献
67
金币
64
发表于 2024-3-7 09:39:11 | 显示全部楼层
喜欢epub最重要的原因是它占地比pdf小太多了,对硬盘友好,对钱包友好
回复 支持 反对

使用道具 举报

1

主题

119

帖子

475

积分

初翻书页

Rank: 2Rank: 2

积分
475
贡献
475
金币
574
发表于 2024-3-7 20:01:17 | 显示全部楼层
本帖最后由 frdh 于 2024-3-7 20:09 编辑
kkkk757 发表于 2024-3-7 09:39
喜欢epub最重要的原因是它占地比pdf小太多了,对硬盘友好,对钱包友好


大小看内容物吧。都是图片形式的话,似乎半斤八两。一个图片一个文字,那大小自然天差地别。

不过要说对应的编辑器话,那是这样的 ,pdf的编辑器太大了
回复 支持 反对

使用道具 举报

2

主题

10

帖子

64

积分

初翻书页

Rank: 2Rank: 2

积分
64
贡献
64
金币
36
发表于 2024-3-7 23:24:22 | 显示全部楼层
PDF就是个图片合集吧 感觉一点都不方便
回复 支持 反对

使用道具 举报

1

主题

39

帖子

296

积分

初翻书页

Rank: 2Rank: 2

积分
296
贡献
296
金币
20
发表于 2024-3-27 21:40:42 | 显示全部楼层
经常看epub的小说也看过一些PDF的,还是epub方便
回复 支持 反对

使用道具 举报

1

主题

5

帖子

51

积分

初翻书页

Rank: 2Rank: 2

积分
51
贡献
51
金币
2
发表于 2024-3-29 18:41:04 | 显示全部楼层
一般阅读器对epub的支持会好一些
回复 支持 反对

使用道具 举报

您需要登录后才可以回帖 登录 | 注册

本版积分规则

QQ|Archiver|手机版|小黑屋|ritdon

GMT+8, 2024-5-24 05:47 , Processed in 0.234126 second(s), 18 queries .

Powered by Discuz! X3.4

Copyright © 2001-2021, Tencent Cloud.

快速回复 返回顶部 返回列表