PyMuPDF Pro#

PyMuPDF Pro は、PyMuPDF 用の 商用拡張機能 セットです。

Office ドキュメントサポートと RAG/LLM 統合で PyMuPDF の機能を強化します。

  • docdocxhwphwpxpptpptxxlsxlsx などの Office ドキュメント処理を可能にします。

  • テキストと表の抽出、ドキュメント変換などをサポートします。

  • PyMuPDF4LLM の商用バージョンが含まれています。

商用ライセンスの取得についてお問い合わせの場合は、こちらのお問い合わせページをご利用ください

注釈

PyMuPDF Pro のライセンス版には、PyMuPDF4LLM のライセンス版も含まれています。PyMuPDF4LLM パッケージの使用に興味がある場合は、個別にインストールする必要があります。

プラットフォームサポート#

以下のプラットフォームでのみ利用可能

  • Windows x86_64.

  • Linux x86_64 (glibc).

  • MacOS x86_64.

  • MacOS arm64.

Office ファイルサポート#

PyMuPDF がサポートする標準ファイルタイプ に加えて、PyMuPDF Pro は以下をサポートします

DOC/DOCX

XLS/XLSX

PPT/PPTX

HWP/HWPX

../_images/icon-docx.svg ../_images/icon-xlsx.svg ../_images/icon-pptx.svg ../_images/icon-hangul.svg

使用方法#

インストール#

pip でインストールするには

pip install pymupdfpro

Office ドキュメントを読み込む#

PyMuPDF Pro をインポートすると、Office ドキュメントを直接参照できます。例えば:

import pymupdf.pro
pymupdf.pro.unlock()
# PyMuPDF has now been extended with PyMuPDF Pro features, with some restrictions.
doc = pymupdf.open("my-office-doc.xls")

注釈

すべての標準 PyMuPDF 機能が期待どおりに公開されます - PyMuPDF Pro は拡張された Office ファイルタイプを処理します

その後は、制限事項 を考慮しながら、通常どおりドキュメントページを操作できます。

Office ドキュメントを PDF に変換する#

次のコードスニペットは、Office ドキュメントを PDF 形式に変換できます:

import pymupdf.pro
pymupdf.pro.unlock()

doc = pymupdf.open("my-office-doc.xlsx")

pdfdata = doc.convert_to_pdf()
with open('output.pdf', 'wb') as f:
    f.write(pdfdata)

制限事項#

PyMuPDF Pro 機能は、ライセンスキーがない場合、次のように制限されます:

どのドキュメントでも最初の3ページのみが利用可能です。

すべての機能のロックを解除するには、トライアルキーを取得 してください。

トライアルキー#

ライセンスキーを取得するには、このページのフォームに記入 してください。提出したアドレスにトライアルキーがメールで送信されます。

キーの使用#

次のようにキーで PyMuPDF Pro を初期化します

import pymupdf.pro
pymupdf.pro.unlock(my_key)
# PyMuPDF has now been extended with PyMuPDF Pro features.

これにより、限られた期間製品を評価できます。この期間後も PyMuPDF Pro を使用したい場合は、商用ライセンスの取得についてお問い合わせ ください。

フォント#

デフォルトでは、pymupdf.pro.unlock() はインストールされているすべてのフォントディレクトリを検索します。

これは、キーワード専用引数で制御できます:

  • fontpath: 特定のフォントディレクトリ。リスト/タプルまたは os.sep で区切られた文字列として指定します。None(デフォルト)の場合、設定されていれば os.environ['PYMUPDFPRO_FONT_PATH'] を使用します。

  • fontpath_auto: システムフォントディレクトリを追加するかどうか。None(デフォルト)の場合、os.environ['PYMUPDFPRO_FONT_PATH_AUTO'] が '1' であれば true を使用します。true の場合、すべてのシステムフォントディレクトリを追加します。

関数 pymupdf.pro.get_fontpath() は、unlock() で使用されるすべてのフォントディレクトリのタプルを返します。

This software is provided AS-IS with no warranty, either express or implied. This software is distributed under license and may not be copied, modified or distributed except as expressly authorized under the terms of that license. Refer to licensing information at artifex.com or contact Artifex Software Inc., 39 Mesa Street, Suite 108A, San Francisco CA 94129, United States for further information.