PDF 文字擷取
PDF 文字擷取工具是一款取出 PDF 中本文文字,並轉換為可複製或可下載為 .txt 形式的工具。畫面左側按頁預覽原 PDF,右側顯示擷取的文字。
請將 PDF 拖放到這裡
或
支援 PDF(最大 100 MB)。加密的 PDF 無法擷取文字。
PDF 全部在瀏覽器內處理,不會傳送至伺服器。
加密的 PDF 或僅由圖像構成的 PDF 無法擷取文字。
相關工具
PDF 文字擷取是什麼?
PDF 文字擷取工具是一款取出 PDF 中本文文字,並轉換為可複製或可下載為 .txt 形式的工具。畫面左側按頁預覽原 PDF,右側顯示擷取的文字。
頁碼範圍可用「1-3, 5, 7-10」之類的逗號分隔方式指定,留空時擷取全部頁面。啟用「插入分頁符」後,會在擷取文字的各頁邊界插入「--- 第 N 頁 ---」之類的分隔符,便於後續加工。
輸入的 PDF 全部在使用者的瀏覽器內完成解析,不會上傳至外部伺服器。即使是公司機密文件或包含個人資料的文件也可放心使用。全程在瀏覽器中完成。
使用方法
- 將 PDF 拖放到拖放區,或點擊選擇檔案。
- 輸入頁碼範圍(例: 1-3, 5, 7-10)。留空時以全部頁面為對象。
- 依需要切換「插入分頁符」核取方塊。
- 按下「開始擷取」後,右側區域將顯示擷取的文字。
- 透過「複製」複製到剪貼簿,或透過「下載 .txt」儲存為文字檔。
使用情境
- 希望將 PDF 化的會議紀錄或報告本文貼上至 Word / Notion / Slack 等的商務人士。
- 希望從電子書或操作手冊製作可搜尋文字格式(.txt)的個人使用者。
- 希望僅從長 PDF 中擷取必要頁碼範圍的文字,用作 AI / 搜尋引擎輸入的情境。
- 希望快速複製學術論文本文以製作引用的研究人員。
- 希望將舊型錄或宣傳冊的文字作為改寫素材再利用的編輯、撰稿人。
注意事項
- 單檔上限 100 MB。
- 加密的 PDF(受密碼保護的)無法擷取文字。
- 由影像構成的掃描 PDF 無法擷取文字(需要 OCR)。
- 受 PDF 內部結構影響,擷取結果的換行、空格、順序可能與原版面不同。
- 本工具不支援 OCR(從影像辨識文字)。僅對內嵌文字資訊的 PDF 有效。
常見問題
PDF 會被上傳至伺服器嗎?
不會。文字擷取全部在您的瀏覽器內完成。即使是公司機密文件或包含個人資料的文件也可放心使用。
可以從掃描的 PDF 中取出文字嗎?
無法取出。本工具僅取出 PDF 內嵌的文字資訊,不具備辨識影像化文字的 OCR 功能。如需從掃描 PDF 取出文字,請另行使用 OCR 工具。
分頁符以何種形式插入?
開啟「插入分頁符」後,會在各頁邊界插入「--- 第 1 頁 ---」「--- 第 2 頁 ---」之類的行。在傳遞給 AI 提示或撰寫依頁處理腳本時很方便。
擷取後換行或段落混亂了。
PDF 本來就是為了保留「畫面版面」的格式,文件結構(段落、標題等)的資訊未必完整保留。因此擷取結果基本正確,但換行位置、空格、分欄順序可能與原版面不同。後續做輕量整理後會更易處理。
請告知頁碼範圍指定的寫法。
用逗號分隔頁碼或範圍。例如「1-3, 5, 7-10」會僅擷取 1~3 頁、5 頁、7~10 頁的本文。留空時以全部頁面為對象。