[Python] PDFファイルからテキスト抽出
今日は、PyMuPDFというライブラリを利用し、PDFファイルからテキストを抽出します。 PyMuPDFはUnicodeに対応しているので、中国語や日本語の含まれるファイルも問題なく扱うことができます。なお、PyMuPD...
今日は、PyMuPDFというライブラリを利用し、PDFファイルからテキストを抽出します。 PyMuPDFはUnicodeに対応しているので、中国語や日本語の含まれるファイルも問題なく扱うことができます。なお、PyMuPD...
以前、パワーポイントで作成したファイルからテキストを抽出する方法として、PDFに変換してから「すべて選択」→「コピー」する方法を紹介したが、久しぶりにこの方法を試してみたら、Adobe Readerでうまくコピーを行うこ...
MS-Wordファイルからテキストを抽出し、編集後に書き戻す機能を追加したPinconvのバージョン4.06を公開します。 ダウンロード: pinconv4.exe (インストーラ形式 – 3.75MB) pinconv...
Wu はフルスクリーンエディタです。WriteroomやDark Roomのように集中して文章を書くための環境を提供します。起動すると黒い画面にカーソルだけが浮かび、文章を書く以外のことができなくなります。 Wu is ...