하나셀-초간단 피봇

1백만 건 데이터도 3초면 OK!복잡한 부분합이나 그룹 함수 몰라도 클릭 한 번이면 자동으로 중복 제거, 건수와 합계까지 완성.

하나셀-카카오톡 PC 발송

복사 붙여넣기는 이제 그만! 카카오톡 PC버전에서 메시지를 직접 자동 입력해 1:1로 깔끔하게 보낼 수 있어요. 단체방에서 개인정보 유출 걱정 없이, 100명이 넘는 고객에게도 일일이 손 안 대고 안부를 전하세요.
하나 엑셀 애드인 엑셀에서 데이터 작업을 효율적으로 하는 전문 애드인입니다. 총29개의 기능을 무료로 직접 사용해 보세요!!

2025-04-22 10 54 17 (5).png

 

이 VBA 모듈은 대한민국 대법원 등기소에서 발급한 부동산등기부등본 PDF 파일에서 텍스트 데이터를 추출하도록 설계되었습니다. PDF 문서를 Microsoft Excel 내에서 구조화된 텍스트 형식으로 변환하여 등기 정보의 분석 및 관리를 용이하게 합니다. 이 모듈은 집합건물, 개별 건물, 토지 등 다양한 유형의 부동산등기부등본을 처리하며, 말소사항 포함 여부에 따라 적절히 대응합니다.

 

목적 및 필요성

부동산등기부등본은 소유권, 담보권, 기타 법적 세부사항을 확인하는 데 필수적인 문서입니다. 이러한 문서는 일반적으로 PDF 형식으로 제공되며, 편집하거나 검색하기 어렵습니다. 수작업으로 데이터를 입력하는 것은 시간이 많이 걸리고 오류 가능성이 높으며, 특히 대량의 문서를 처리할 때 더욱 그렇습니다. 이 모듈은 다음과 같은 이유로 필요합니다:

  1. 데이터 추출 자동화: PDF 내용을 Excel 데이터로 변환하여 시간과 노력을 크게 절약합니다.

  2. 정확성 보장: 표와 다열 텍스트 등 복잡한 레이아웃을 처리하여 데이터 무결성을 유지합니다.

  3. 다양한 문서 유형 지원: 집합건물, 토지, 건물 등 다양한 등기부 형식을 처리합니다.

  4. 분석 용이성: 데이터를 워크시트에 정리하여 필터링, 정렬, 보고서 작성 등을 쉽게 합니다.

  5. 생산성 향상: 부동산, 법률, 금융 분야 전문가가 데이터 입력 대신 분석에 집중할 수 있도록 합니다.

이 도구는 부동산 중개인, 변호사, 자산 관리자, 금융 기관 등 부동산 거래, 실사, 자산 관리에 관련된 전문가에게 필수적입니다.

 

주요 기능

  • PDF 텍스트 추출: 외부 실행 파일(extract_pdf.exe)을 사용하여 PDF를 텍스트로 변환합니다.

  • 데이터 구조화: 좌표, 내용, 속성을 기반으로 데이터를 정밀하게 배치하는 정점(vertex) 모델로 파싱합니다.

  • 정렬 및 정리: 좌표별로 데이터를 정렬하고 불필요한 내용(예: "열람용" 텍스트)을 제거하며, 행/열 번호를 지정합니다.

  • 사용자 정의 포맷팅: 헤더, 테두리, 셀 병합 등을 포함한 깔끔한 Excel 표를 생성합니다.

  • 문서 유형 감지: 문서 유형(예: 집합건물, 토지)을 자동으로 식별하고 적절한 처리 규칙을 적용합니다.

  • 사용자 데이터베이스 통합: userDB 시트를 참조하여 문서별 헤더와 위치를 매핑합니다.

구성 요소

이 모듈은 여러 VBA 서브루틴과 함수로 구성되며, 각기 특정 역할을 수행합니다:

  1. reg_batch: 텍스트 추출, 정점 처리, 최종 포맷팅을 조율하는 메인 프로시저입니다.

  2. reg_clear: 새로운 처리를 위해 활성 시트의 기존 데이터를 지웁니다.

  3. file_select: PDF 파일을 선택하거나 테스트용 고정 경로를 사용합니다.

  4. extract_text: PDF의 텍스트 출력을 읽고, 정점 구조로 파싱하며, 문서 유형을 식별합니다.

  5. vertex: 정점 데이터를 처리하고, 열/행 번호를 지정하며, 불필요한 내용을 정리합니다.

  6. vform: 처리된 데이터를 헤더와 테두리가 포함된 구조화된 표로 포맷팅합니다.

  7. vertex_sorting_batch: 정점 데이터를 좌표별로 정렬하여 일관된 처리를 보장합니다.

  8. f_jointext: 셀 값을 구분자로 연결합니다.

  9. f_clng_arr: 문자열 배열을 long 정수로 변환합니다.

  10. real_border1, real_border2, real_border3: 문서 유형 및 열 옵션에 따라 표 테두리를 적용합니다.

  11. ClearClipboard: 포맷팅 문제를 방지하기 위해 시스템 클립보드를 지웁니다.

사용 방법

  1. 사전 준비:

    • VBA가 활성화된 Microsoft Excel.

    • C:\pycell\extract_pdf.exe 경로에 위치한 외부 도구 extract_pdf.exe.

    • vertex, userDB, verform이라는 이름의 시트가 포함된 통합 문서.

    • userDB 시트에는 문서 유형(예: "등기사항전부증명서(말소사항포함)-집합건물-")과 헤더 위치(예: "표제부"의 열 위치)가 포함되어야 합니다.

  2. 설정:

    • PDF 파일이 접근 가능해야 합니다(예: 테스트용 C:\000_kimsungho\AppspoonV2\regimg\test1.pdf).

    • userDB 시트에 올바른 문서 유형과 헤더 행 번호 및 열 위치가 입력되어 있는지 확인합니다.

  3. 모듈 실행:

    • Excel 통합 문서를 열고 매크로를 활성화합니다.

    • reg_batch 매크로를 실행하여 PDF를 처리합니다:

      • 대화 상자를 통해 PDF 파일을 선택하거나(file_select에서 테스트 경로 사용).

      • 모듈은 텍스트를 추출하고, vertex 및 vform 단계를 거쳐 verform 시트에 포맷팅된 표를 출력합니다.

    • 필요 시 reg_clear를 사용하여 활성 시트를 초기화합니다.

    • 테스트용으로 test 매크로를 실행하여 고정된 PDF 경로로 빠르게 실행할 수 있습니다.

  4. 출력:

    • vertex 시트: 좌표, 내용, 페이지 번호 등 원시 파싱 데이터를 포함합니다.

    • verform 시트: 헤더, 테두리, 셀 병합이 포함된 최종 포맷팅 표를 표시합니다.

    • 활성 시트: 문서 유형과 오류 메시지(예: PDF가 유효하지 않은 경우)를 표시합니다.

유용성

  • 시간 효율성: 수작업으로 몇 시간이 걸릴 작업을 몇 초 만에 완료합니다.

  • 확장성: 약간의 수정으로 여러 PDF를 일괄 처리할 수 있습니다.

  • 정확성: 복잡한 등기 데이터를 전사하는 데 따른 오류를 줄입니다.

  • 유연성: userDB 설정을 통해 다양한 문서 유형에 적응합니다.

  • 전문적 출력: 프레젠테이션이나 법적 문서에 적합한 깔끔한 보고서 형식의 표를 생성합니다.

이 모듈은 부동산 거래, 법적 분쟁, 금융 감사 등 정확하고 신속한 등기 데이터 접근이 중요한 환경에서 특히 가치가 높습니다.

 

주의사항 및 제한점

  1. 외부 의존성:

    • extract_pdf.exe가 필요하며, 지정된 경로에 설치되어 있어야 합니다.

    • 실행 파일이 시스템 및 PDF 형식과 호환되는지 확인하세요.

  2. 파일 경로 가정:

    • 고정 경로(예: C:\pycell\extract_pdf.exe)는 다른 환경에 맞게 조정해야 할 수 있습니다.

    • file_select의 테스트 경로는 실제 사용 시 업데이트해야 합니다.

  3. PDF 품질:

    • PDF는 텍스트 기반이어야 하며, 스캔된 이미지일 경우 OCR 전처리가 필요합니다.

    • 비정상적이거나 비표준 PDF는 오류 또는 불완전한 추출을 초래할 수 있습니다.

  4. 문서 유형 지원:

    • userDB에 정의된 유형으로 제한됩니다. 새로운 유형은 설정 업데이트가 필요합니다.

    • 문서 유형이 인식되지 않으면 오류(예: "부동산등기부 PDF Error")가 발생할 수 있습니다.

  5. 성능:

    • 페이지가 많은 대형 PDF는 정점 계산으로 인해 처리 속도가 느려질 수 있습니다.

    • 복잡한 문서는 메모리 사용량을 증가시킬 수 있습니다.

  6. 오류 처리:

    • 기본 오류 처리(예: 텍스트 파일 누락, 잘못된 문서 유형)가 포함되어 있지만, 예기치 않은 문제(예: 손상된 PDF)는 수동 개입이 필요할 수 있습니다.

    • 처리 중 데이터 손실을 방지하기 위해 통합 문서를 백업하세요.

  7. 포맷팅 가정:

    • 테두리 스타일과 열 옵션(예: real_border1, real_border2)은 특정 문서 레이아웃에 맞춰져 있습니다. 비표준 레이아웃은 코드 조정이 필요할 수 있습니다.

    • 셀 병합 및 글꼴 크기는 가독성을 위해 고정되어 있지만, 사용자 정의가 필요할 수 있습니다.

  8. 보안:

    • 외부 실행 파일(extract_pdf.exe) 및 셸 명령 실행은 신뢰할 수 없는 소스일 경우 보안 위험을 초래합니다.

    • 모든 PDF와 실행 파일을 검증하여 악성 코드를 방지하세요.

  9. 유지보수:

    • 코드는 특정 통합 문서 구조(vertex, userDB, verform)를 가정합니다. 시트 이름이나 레이아웃 변경은 기능을 손상시킵니다.

    • 새로운 문서 형식을 지원하려면 userDB를 정기적으로 업데이트해야 합니다.

모범 사례

  • 테스트 환경: 중요한 데이터를 처리하기 전에 테스트 PDF와 통합 문서로 기능을 검증하세요.

  • 데이터 백업: PDF와 통합 문서를 복사하여 우발적인 데이터 손실을 방지하세요.

  • userDB 업데이트: 새로운 문서 유형이나 헤더 매핑을 포함하도록 userDB 시트를 정기적으로 검토하고 업데이트하세요.

  • 성능 모니터링: 대형 PDF의 경우 Excel 충돌을 피하기 위해 처리를 작은 배치로 나누세요.

  • 출력 검증: 법적 용도로 특히 추출된 데이터를 원본 PDF와 비교하여 정확성을 확인하세요.

  • 보안 실행 파일: extract_pdf.exe를 신뢰할 수 있는 공급자로부터 소싱하고 악성 코드 검사를 수행하세요.

  • 문서 사용자 정의: 특정 포맷팅(예: 다른 테두리나 글꼴)이 필요한 경우 real_border 서브를 적절히 수정하세요.

문제 해결

  • 오류: "부동산등기부 PDF를 다시 선택해주세요":

    • PDF가 존재하는지, _output.txt 파일이 생성되었는지 확인하세요.

    • extract_pdf.exe의 경로를 검증하세요.

  • verform에 출력 없음:

    • PDF가 텍스트 기반인지 확인하세요(스캔된 PDF 아님).

    • userDB에 올바른 문서 유형과 매핑이 포함되어 있는지 확인하세요.

  • 잘못된 포맷팅:

    • 문서 레이아웃과 real_border 서브의 호환성을 검토하세요.

    • 헤더가 잘못 정렬된 경우 userDB의 열 옵션을 조정하세요.

  • 처리 속도 느림:

    • PDF 크기를 줄이거나 vertex 및 vform의 루프를 최적화하세요.

  • 문서 유형 오류:

    • 누락된 유형을 적절한 헤더 위치와 함께 userDB에 추가하세요.

이 VBA 모듈은 부동산등기부등본 PDF에서 데이터를 자동으로 추출하고 구조화하는 강력한 도구입니다. 복잡한 레이아웃을 처리하고 전문적인 출력을 생성하는 능력은 부동산 문서 작업을 하는 전문가에게 매우 가치가 있습니다. 그러나 사용자는 올바른 설정, 입력 검증, 진화하는 문서 형식을 처리하기 위한 코드 유지보수를 보장해야 합니다. 이 매뉴얼에 명시된 주의사항과 모범 사례를 따르면 모듈의 효과를 극대화하고 위험을 최소화할 수 있습니다.

사진 및 파일 첨부

여기에 파일을 끌어 놓거나 왼쪽의 버튼을 클릭하세요.

파일 용량 제한 : 0MB (허용 확장자 : *.*)

0개 첨부 됨 ( / )

  1. 하나셀 애드인 가격 정책 및 후원 안내 (2025년 4월 기준)

    Date2025.04.11 Category공지 By지천명영어 Reply1 Views303
    read more
  2. 하나 엑셀 애드인의 소개 - 하나 엑셀 애드인 - 당신의 엑셀을 더 강력하게!

    Date2025.03.06 Category공지 By지천명영어 Reply10 Views931 file
    read more
  3. 하나셀 애드인 - 전체 리스트

    Date2025.04.24 Category공지 By지천명영어 Reply0 Views48 file
    Read More
  4. (다운로드) 하나셀 애드인 추가기능(xlam) 버전 0.7

    Date2025.04.23 Category다운로드 By지천명영어 Reply0 Views75 file
    Read More
  5. (다운로드) 하나셀 애드인 exe 버전 0.7

    Date2025.04.23 Category다운로드 By지천명영어 Reply0 Views62 file
    Read More
  6. 하나셀 애드인 - 📘 메뉴얼: 중복 데이터 및 빈셀 처리

    Date2025.04.22 Category메뉴얼 By지천명영어 Reply0 Views124 file
    Read More
  7. 하나셀 애드인 - 선택범위내 데이터 정리 매뉴얼

    Date2025.04.22 Category메뉴얼 By지천명영어 Reply0 Views117 file
    Read More
  8. 하나셀 애드인 - 표본오차 및 연속패턴 찾기 매뉴얼

    Date2025.04.15 Category메뉴얼 By지천명영어 Reply0 Views231 file
    Read More
  9. 하나셀 애드인 - 부동산등기부등본 텍스트 추출 매뉴얼

    Date2025.04.11 Category메뉴얼 By지천명영어 Reply0 Views141 file
    Read More
  10. 하나셀 애드인 - OCR 이미지에서 텍스트 및 좌표 추출

    Date2025.04.11 Category메뉴얼 By지천명영어 Reply0 Views216 file
    Read More
  11. 하나셀 애드인 - 웹테이블 스크래핑

    Date2025.04.11 Category메뉴얼 By지천명영어 Reply0 Views191 file
    Read More
  12. 하나셀 애드인 - 외국어 번역 한방에 매뉴얼

    Date2025.04.10 Category메뉴얼 By지천명영어 Reply0 Views275 file
    Read More
  13. 하나셀 애드인 - PPT 데이터 컨트롤

    Date2025.04.10 Category메뉴얼 By지천명영어 Reply0 Views180 file
    Read More
  14. 엑셀 테두리 색상 변경 리본 기능 매뉴얼 개요

    Date2025.04.09 By지천명영어 Reply0 Views43 file
    Read More
  15. 엑셀 주소 형식 전환 및 엑셀 단축키 모음 매뉴얼

    Date2025.04.09 By지천명영어 Reply0 Views113 file
    Read More
  16. 메모 위치 조정 및 메모 숨기기 기능 매뉴얼

    Date2025.04.09 Category메뉴얼 Bysungu7777@yahoo.com Reply0 Views215 file
    Read More
  17. 하나 엑셀 애드인 - 오토카톡 AutoKatalk 매뉴얼

    Date2025.03.28 Category메뉴얼 ByHanaCell2 Reply0 Views112
    Read More
  18. 하나 엑셀 애드인 – "테두리색" 메뉴얼

    Date2025.03.11 Category메뉴얼 By지천명영어 Reply0 Views117
    Read More
  19. 하나 엑셀 애드인 – "쉬트 꾸미기" 메뉴얼

    Date2025.03.11 Category메뉴얼 By지천명영어 Reply0 Views213 file
    Read More
  20. 하나셀 애드인 – "빈행 및 빈열 삭제" 메뉴얼

    Date2025.03.11 Category메뉴얼 By지천명영어 Reply0 Views128 file
    Read More
  21. 하나 엑셀 애드인 – "A1 ↔ R1C1 변환" 메뉴얼

    Date2025.03.11 Category메뉴얼 By지천명영어 Reply0 Views111
    Read More
  22. 하나 엑셀 애드인 – "엑셀 단축키" 메뉴얼

    Date2025.03.11 Category메뉴얼 By지천명영어 Reply0 Views117
    Read More
Board Pagination Prev 1 2 Next
/ 2

LOGIN

SEARCH

MENU NAVIGATION