PyMuPDF Pro

PyMuPDF ProPyMuPDF 를 위한 상용 확장 세트입니다.

Office 문서 지원 및 RAG/LLM 통합으로 PyMuPDF 기능을 향상시킵니다.

  • doc, docx, hwp, hwpx, ppt, pptx, xls, xlsx 등을 포함한 Office 문서 처리를 활성화합니다.

  • 텍스트 및 테이블 추출, 문서 변환 등을 지원합니다.

  • PyMuPDF4LLM 의 상용 버전을 포함합니다.

상용 라이선스 취득에 대한 문의는 이 연락처 페이지 를 사용하세요.

참고

PyMuPDF Pro 의 라이선스 버전은 PyMuPDF4LLM 의 라이선스 버전도 제공합니다. PyMuPDF4LLM 패키지를 사용하려면 별도로 설치해야 합니다.

플랫폼 지원

다음 플랫폼에서만 사용 가능:

  • Windows x86_64.

  • Linux x86_64 (glibc).

  • MacOS x86_64.

  • MacOS arm64.

Office 파일 지원

PyMuPDF 가 지원하는 표준 파일 타입 외에도 PyMuPDF Pro 는 다음을 지원합니다:

DOC/DOCX

XLS/XLSX

PPT/PPTX

HWP/HWPX

../_images/icon-docx.svg ../_images/icon-xlsx.svg ../_images/icon-pptx.svg ../_images/icon-hangul.svg

사용법

설치

pip 를 통해 설치합니다:

pip install pymupdfpro

Office 문서 로드

PyMuPDF Pro 를 가져오면 Office 문서를 직접 참조할 수 있습니다. 예:

import pymupdf.pro
pymupdf.pro.unlock()
# PyMuPDF has now been extended with PyMuPDF Pro features, with some restrictions.
doc = pymupdf.open("my-office-doc.xls")

참고

모든 표준 PyMuPDF 기능이 예상대로 노출됩니다 - PyMuPDF Pro 는 확장된 Office 파일 타입을 처리합니다

그때부터 제한 사항 을 고려하여 일반적으로 수행하는 것처럼 문서 페이지로 작업할 수 있습니다.

Office 문서를 PDF 로 변환

다음 코드 조각은 Office 문서를 PDF 형식으로 변환할 수 있습니다:

import pymupdf.pro
pymupdf.pro.unlock()

doc = pymupdf.open("my-office-doc.xlsx")

pdfdata = doc.convert_to_pdf()
with open('output.pdf', 'wb') as f:
    f.write(pdfdata)

제한 사항

라이선스 키 없이 PyMuPDF Pro 기능은 다음과 같이 제한됩니다:

모든 문서의 처음 3페이지만 사용할 수 있습니다.

전체 기능을 잠금 해제하려면 시험 키를 받으세요.

시험 키

라이선스 키를 받으려면 이 페이지의 양식을 작성하세요. 그러면 제출한 주소로 시험 키가 이메일로 전송됩니다.

키 사용

다음과 같이 키로 PyMuPDF Pro 를 초기화합니다:

import pymupdf.pro
pymupdf.pro.unlock(my_key)
# PyMuPDF has now been extended with PyMuPDF Pro features.

이것은 제한된 시간 동안 제품을 평가할 수 있게 해줍니다. 이 시간 이후에 PyMuPDF Pro 를 사용하려면 상용 라이선스 취득에 대해 문의하세요.

글꼴

기본적으로 pymupdf.pro.unlock() 은 설치된 모든 글꼴 디렉토리를 검색합니다.

키워드 전용 인수로 제어할 수 있습니다:

  • fontpath: 특정 글꼴 디렉토리, list/tuple 또는 os.sep 로 구분된 문자열. None(기본값)인 경우 설정되어 있으면 os.environ['PYMUPDFPRO_FONT_PATH'] 를 사용합니다.

  • fontpath_auto: 시스템 글꼴 디렉토리를 추가할지 여부. None(기본값)인 경우 os.environ['PYMUPDFPRO_FONT_PATH_AUTO'] 가 ‘1’이면 true를 사용합니다. true이면 모든 시스템 글꼴 디렉토리를 추가합니다.

함수 pymupdf.pro.get_fontpath()unlock() 에서 사용하는 모든 글꼴 디렉토리의 튜플을 반환합니다.

This software is provided AS-IS with no warranty, either express or implied. This software is distributed under license and may not be copied, modified or distributed except as expressly authorized under the terms of that license. Refer to licensing information at artifex.com or contact Artifex Software Inc., 39 Mesa Street, Suite 108A, San Francisco CA 94129, United States for further information.