PyMuPDF Pro#
PyMuPDF Pro は、PyMuPDF 用の 商用拡張機能 セットです。
Office ドキュメントサポートと RAG/LLM 統合で PyMuPDF の機能を強化します。
doc、docx、hwp、hwpx、ppt、pptx、xls、xlsxなどの Office ドキュメント処理を可能にします。テキストと表の抽出、ドキュメント変換などをサポートします。
PyMuPDF4LLM の商用バージョンが含まれています。
商用ライセンスの取得についてお問い合わせの場合は、こちらのお問い合わせページをご利用ください。
注釈
PyMuPDF Pro のライセンス版には、PyMuPDF4LLM のライセンス版も含まれています。PyMuPDF4LLM パッケージの使用に興味がある場合は、個別にインストールする必要があります。
プラットフォームサポート#
以下のプラットフォームでのみ利用可能
Windows x86_64.
Linux x86_64 (glibc).
MacOS x86_64.
MacOS arm64.
Office ファイルサポート#
PyMuPDF がサポートする標準ファイルタイプ に加えて、PyMuPDF Pro は以下をサポートします
使用方法#
インストール#
pip でインストールするには
pip install pymupdfpro
Office ドキュメントを読み込む#
PyMuPDF Pro をインポートすると、Office ドキュメントを直接参照できます。例えば:
import pymupdf.pro
pymupdf.pro.unlock()
# PyMuPDF has now been extended with PyMuPDF Pro features, with some restrictions.
doc = pymupdf.open("my-office-doc.xls")
注釈
すべての標準 PyMuPDF 機能が期待どおりに公開されます - PyMuPDF Pro は拡張された Office ファイルタイプを処理します
その後は、制限事項 を考慮しながら、通常どおりドキュメントページを操作できます。
Office ドキュメントを PDF に変換する#
次のコードスニペットは、Office ドキュメントを PDF 形式に変換できます:
import pymupdf.pro
pymupdf.pro.unlock()
doc = pymupdf.open("my-office-doc.xlsx")
pdfdata = doc.convert_to_pdf()
with open('output.pdf', 'wb') as f:
f.write(pdfdata)
制限事項#
PyMuPDF Pro 機能は、ライセンスキーがない場合、次のように制限されます:
どのドキュメントでも最初の3ページのみが利用可能です。
すべての機能のロックを解除するには、トライアルキーを取得 してください。
トライアルキー#
ライセンスキーを取得するには、このページのフォームに記入 してください。提出したアドレスにトライアルキーがメールで送信されます。
キーの使用#
次のようにキーで PyMuPDF Pro を初期化します
import pymupdf.pro
pymupdf.pro.unlock(my_key)
# PyMuPDF has now been extended with PyMuPDF Pro features.
これにより、限られた期間製品を評価できます。この期間後も PyMuPDF Pro を使用したい場合は、商用ライセンスの取得についてお問い合わせ ください。
フォント#
デフォルトでは、pymupdf.pro.unlock() はインストールされているすべてのフォントディレクトリを検索します。
これは、キーワード専用引数で制御できます:
fontpath: 特定のフォントディレクトリ。リスト/タプルまたはos.sepで区切られた文字列として指定します。None(デフォルト)の場合、設定されていればos.environ['PYMUPDFPRO_FONT_PATH']を使用します。fontpath_auto: システムフォントディレクトリを追加するかどうか。None(デフォルト)の場合、os.environ['PYMUPDFPRO_FONT_PATH_AUTO']が '1' であれば true を使用します。true の場合、すべてのシステムフォントディレクトリを追加します。
関数 pymupdf.pro.get_fontpath() は、unlock() で使用されるすべてのフォントディレクトリのタプルを返します。
