PyMuPDF Pro¶
PyMuPDF Pro 는 PyMuPDF 를 위한 상용 확장 세트입니다.
Office 문서 지원 및 RAG/LLM 통합으로 PyMuPDF 기능을 향상시킵니다.
doc,docx,hwp,hwpx,ppt,pptx,xls,xlsx등을 포함한 Office 문서 처리를 활성화합니다.텍스트 및 테이블 추출, 문서 변환 등을 지원합니다.
PyMuPDF4LLM 의 상용 버전을 포함합니다.
상용 라이선스 취득에 대한 문의는 이 연락처 페이지 를 사용하세요.
참고
PyMuPDF Pro 의 라이선스 버전은 PyMuPDF4LLM 의 라이선스 버전도 제공합니다. PyMuPDF4LLM 패키지를 사용하려면 별도로 설치해야 합니다.
플랫폼 지원¶
다음 플랫폼에서만 사용 가능:
Windows x86_64.
Linux x86_64 (glibc).
MacOS x86_64.
MacOS arm64.
Office 파일 지원¶
PyMuPDF 가 지원하는 표준 파일 타입 외에도 PyMuPDF Pro 는 다음을 지원합니다:
사용법¶
설치¶
pip 를 통해 설치합니다:
pip install pymupdfpro
Office 문서 로드¶
PyMuPDF Pro 를 가져오면 Office 문서를 직접 참조할 수 있습니다. 예:
import pymupdf.pro
pymupdf.pro.unlock()
# PyMuPDF has now been extended with PyMuPDF Pro features, with some restrictions.
doc = pymupdf.open("my-office-doc.xls")
참고
모든 표준 PyMuPDF 기능이 예상대로 노출됩니다 - PyMuPDF Pro 는 확장된 Office 파일 타입을 처리합니다
그때부터 제한 사항 을 고려하여 일반적으로 수행하는 것처럼 문서 페이지로 작업할 수 있습니다.
Office 문서를 PDF 로 변환¶
다음 코드 조각은 Office 문서를 PDF 형식으로 변환할 수 있습니다:
import pymupdf.pro
pymupdf.pro.unlock()
doc = pymupdf.open("my-office-doc.xlsx")
pdfdata = doc.convert_to_pdf()
with open('output.pdf', 'wb') as f:
f.write(pdfdata)
제한 사항¶
라이선스 키 없이 PyMuPDF Pro 기능은 다음과 같이 제한됩니다:
모든 문서의 처음 3페이지만 사용할 수 있습니다.
전체 기능을 잠금 해제하려면 시험 키를 받으세요.
시험 키¶
라이선스 키를 받으려면 이 페이지의 양식을 작성하세요. 그러면 제출한 주소로 시험 키가 이메일로 전송됩니다.
키 사용¶
다음과 같이 키로 PyMuPDF Pro 를 초기화합니다:
import pymupdf.pro
pymupdf.pro.unlock(my_key)
# PyMuPDF has now been extended with PyMuPDF Pro features.
이것은 제한된 시간 동안 제품을 평가할 수 있게 해줍니다. 이 시간 이후에 PyMuPDF Pro 를 사용하려면 상용 라이선스 취득에 대해 문의하세요.
글꼴¶
기본적으로 pymupdf.pro.unlock() 은 설치된 모든 글꼴 디렉토리를 검색합니다.
키워드 전용 인수로 제어할 수 있습니다:
fontpath: 특정 글꼴 디렉토리, list/tuple 또는os.sep로 구분된 문자열. None(기본값)인 경우 설정되어 있으면os.environ['PYMUPDFPRO_FONT_PATH']를 사용합니다.fontpath_auto: 시스템 글꼴 디렉토리를 추가할지 여부. None(기본값)인 경우os.environ['PYMUPDFPRO_FONT_PATH_AUTO']가 ‘1’이면 true를 사용합니다. true이면 모든 시스템 글꼴 디렉토리를 추가합니다.
함수 pymupdf.pro.get_fontpath() 는 unlock() 에서 사용하는 모든 글꼴 디렉토리의 튜플을 반환합니다.
