pdf翻译
你是不是也遇到过这样的烦恼?想把PDF里的内容提取出来,却发现提取的内容格式一团糟?或者手里拿着一份英文PDF白皮书,却因为语言障碍,看得一头雾水?想用翻译工具,却需要一段段复制粘贴,效率低下。而,各种翻译插件却无法直接识别PDF文档。。别担心!这期视频,我会手把手教你如何将PDF文档轻松转换为不同格式(如Word、TXT、PPT),以及如何一键翻译英文PDF。
大家好,这里是灵智宝盒,我是qq。这个频道主要研究科技、AI等新技术,同时也会分享一些有趣又实用的工具。希望能够为大家打造一个真正的“宝藏库”,帮助提升工作效率,改善生活质量!如果你也喜欢这此方面的内容,请点击关注并打开小铃铛,这样你就第一时间收到我们的最新分享。
为了回应之前视频中遗留下来的问题,我们今天优先讲解如何快速翻译PDF中的英文内容。不过,在此之前,需要先将PDF转化为Markdown文档。具体操作步骤稍后详解。我们先看一键翻译PDF的惊艳效果!
接下来,我们开始第一步。将pdf转化成markdown。
pdf转markdown
现在,就让我们来揭秘PDF转Markdown的秘密武器!我为你精心挑选了两个超好用的开源项目:
mineru
这是由国内团队开发的一个开源项目,表现出了强大的功能!它的最大亮点是,转换后的文档格式保持得非常好,几乎可以完美还原PDF的排版。唯一的小遗憾是,目前仅支持PDF格式的转换。
使用起来非常简单,你有两种选择:可以自行部署,或者直接使用官方网站提供的在线服务。本着站在巨人肩膀上不重复造轮子的精神,直接使用官网工具。具体操作也十分容易:打开官网,使用Google账号登录,然后上传你的PDF文档,一键操作即可将其转化为Markdown格式。转换效果惊艳,几乎完全忠实于原文档的排版!
markitdown
接下来介绍的另一个开源项目,是微软推出的,果然品质不凡!它的亮点在于支持多种格式转换,灵活性非常高。不过,它有一个小缺憾:在转换过程中,可能无法完全保留PDF的原始排版和格式。此外,它没有提供官方使用平台,需要用户自行部署。
我们可以通过源码或Docker部署来使用它。坚持“站在巨人肩膀上,不重复造轮子”的原则,选择Docker部署是既省时又高效的做法。操作步骤如下:
- 在Docker中搜索“markitdown”,选择星标最多的版本进行下载;
- 下载完成后,直接点击运行;
- 打开本地的IP和端口,进入该服务页面;
- 上传你的PDF文件,点击提交,稍作等待,即可获取转换后的Markdown格式内容。
获取到的Markdown内容还可以粘贴到任意在线Markdown编辑器中,呈现为HTML格式,甚至实现实时在线翻译。
pdf 翻译 chatgpt
面对一些专业性较强的文档,传统的翻译工具可能无法达到理想的翻译效果。这个时候,很多人会想到利用ChatGPT进行翻译。不过,如果手动逐段复制文档内容进行翻译,工作量实在太大,令人疲惫不堪。
- mardwon转html
首先,将 PDF 文件转化为 Markdown 格式,再将 Markdown 粘贴到任意在线Markdown编辑器中,呈现为HTML格式。
-
kiss-translator & chatgpt 接着,通过浏览器扩展即可实现在线翻译。使用 Kiss Translator 插件,简单配置 ChatGPT 的 API,就能快速、高效地进行专业翻译。不过,这需要支付一定费用。那么有没有免费的解决方案呢?当然有!
-
kiss-translator & ollama & qbox_translator_server
只需将 Kiss Translator 插件的 API 替换为本地开源模型的 API 即可实现。具体操作方法可以参考上一个视频。
转其他格式
- pdf转txt
只需在已转换为 Markdown 文本的基础上,去除 Markdown 标记符号即可得到纯文字内容。
- pdf转word
将生成的 Markdown 的 HTML 文件内容复制粘贴到 Word 文档中,轻松完成转换。
- pdf转ppt
基于生成的 Markdown 文件,利用 VSCode 的 Marp 插件直接生成 PPT。转化操作也很简单,在插件安装好后,只需要在内容最前面加这些字符就可以了。
不难看出,所有格式转换的关键,都离不开「Markdown」这一步。
总结
今天,我们用最简单、免费的开源工具,教会大家如何把英文 PDF:
-
转换成 Markdown —— 清晰、易编辑
-
转成 HTML 在线阅读 —— 沉浸式体验
-
借助 ChatGPT& 翻译插件一键翻译 —— 专业又省钱
同时还延伸了文字、Word、PPT 等常见格式转换方案。掌握这套流程,再也不用被语言障碍和格式转换折磨!
好今天的内容就这些了,老样子,如果你喜欢我的内容,请点个点赞、关注、转发。