이미지 속에 있는 표를 OCR로 인식 후, 테이블 데이터로 만들기

구글과 네이버의 지원을 얻고, 음성인식기술, 문자인식기술(OCR)을 보다 쉽고 훌륭한 품질로 사용할 수 있습니다.

현재 OCR기술은 북스캔 뿐만 아니라, 다양한 용도로 사용되고 있으며, 정확도 역시 높습니다.

문자를 인식하는 정확도는 높지만, 복잡한 표가 들어있는 문서에서 표(테이블) 속에 들어 있는 데이터를 사용할 수 있는 OCR 기술은 아직도 많이 부족합니다.

예를 들면 위 이미지를 네이버 크로바 OCR로 인식시키면 다음과 같은 테이터로 반환합니다.

A B C D E F G H | 최저빈도
1 4 26 1 29 259 8 256 7 3 56-9
2 3 28 5 6 7 4 29 289 1 89
3 7 268 9 3 25 1 4 2568 258 6
4 6 9 4 8 1 3 25 25 7 25
5 5 3 8 279 29 27 1 4 6 79
6 1 7 2 4 6 5 8 3 9
7 2 5 367 1 38 67 69 689 4 3789
8 8 1 67 27 4 9 3 256 25 567
9 9 4 36 5 238 26 7 1 28 368
최저빈도 35678
68 37 79 3589 267 56 9 58
9

OCR로 문서 인식 결과는 양호합니다. 가로 한글도 잘 인식하고, 세로로 있는 한글도 정확히 인식했습니다.

단지 영어 대문자 "I"와 "|"(파이프 문자)를 구분하지 못 했습니다.

테이블을 데이터로 사용하고 싶은 마음에 간단한 OCR 프로그램을 만들어서, 사용한 결과 생각보다 꽤 쓸만해서 포스트 합니다.

2022-12-11 14 37 10.png

(제가 만든 OCR 프로그램으로 엑셀에 데이터로 붙여 넣은 모습)

100% 데이터화 되지는 못했지만, 조금만 수정하면 쓸수 있는 데이터가 생성되었습니다.

회사에서 업무를 하다보면 다량의 데이터 작업을 해야 하는 경우가 있습니다. 이때, PDF파일 등에서 데이터를 추출하여 사용하면 편리합니다.

이미지 또는 PDF파일 일반 문자를 OCR로 추출해서 데이터하는 작업도 함께 진행 중 입니다.

이미지 추출해서 데이터로 전환하고, 엑셀 파일로 만드는 프로그램은 유료 프로그램입니다.

관심있는 분들은 댓글 또는 이메일로 연락 주세요.

Atachment
첨부 '2'	sudoku_20220724_004839.png, 2022-12-11 14 37 10.png,

List of Articles
번호	제목	글쓴이	날짜	조회 수
공지	엑셀 프로그램 요청하기(무료 또는 책 구입 후원) 6	지천명영어	2021.06.07	1672
34	엑셀 VBA로 PDF파일 페이지 나누기	지천명영어	2022.12.13	940
»	이미지 속에 있는 표를 OCR로 인식 후, 테이블 데이터로 만들기 구글과 네이버의 지원을 얻고, 음성인식기술, 문자인식기술(OCR)을 보다 쉽고 훌륭한 품질로 사용할 수 있습니다. 현재 OCR기술은 북스캔 뿐만 아니라, 다양한 용... 2	지천명영어	2022.12.11	2421
32	엑셀 스크롤바 일치 시키기(UsedRange 에러)	지천명영어	2022.11.24	486
31	엑셀 다운로드 후 매크로 차단(보안 위험 Microsoft는 이 파일의 출처를 신뢰할 수 없기 때문에 매크로 실행을 차단했습니다. 2	지천명영어	2022.11.13	6299
30	엑셀 리본메뉴 imageMso (이미지 아이콘 검색)	지천명영어	2022.08.25	1151
29	수도쿠로 숫자와 친해지기(엑셀 매크로(VBA)로 스도쿠 프로그램 만들기(1/3)(2022.6.4 압데이트)	지천명영어	2022.06.01	1618
28	엑셀 공백 행. 열 전부 삭제 (엑셀에서 공란인 행과 열을 찾아서 한번에 삭제해 줍니다.)	지천명영어	2022.05.27	5789
27	파파고와 구글번역을 한번에(지천명영어) 프로그램 사용법 61	지천명영어	2022.05.24	2755
26	엑셀 표를 웹형식의 html 코드로 만들기(글꼴 설정, 셀병합 , 하이퍼링크 , 테두리 표시 등을 코드로 만들어 줍니다.) 3	지천명영어	2022.05.23	6157
25	대법원 부동산 경매 물건 검색 크롤링(엑셀) - 타 프로그램 없이 직접 엑셀에서 경매 물건 검색 4	지천명영어	2022.05.13	3145
24	엑셀로 PPT파일을 자동으로 만들기 4	지천명영어	2022.04.18	7993
23	영어, 일본어 듣기 공부 용 mp3 파일 가사 만들기 - 일괄 만들기 1	지천명영어	2022.04.10	701
22	일본어 한자 후리가나 자동입력 및 파파고 한글번역 그리고, 구글 영어번역까지 한번에 2	지천명영어	2021.11.17	2466
21	MS오피스 언어가 일본어로 나올 때 한국어로 바꾸기	지천명영어	2021.10.31	3372
20	PDF 영어문장 합치기(PDF 문서 영어 글자를 정상적인 영문으로 일괄 바꿔주기)	지천명영어	2021.06.28	1308
19	엑셀에 마이크로소프트(MS) 영어 음성합성시스템(TTS) 설치하기	지천명영어	2021.06.13	1389
18	따옴표 없이 엑셀 글자 복사하기	지천명영어	2021.06.08	8894
17	구글 번역을 엑셀로, 텍스트 문장을 한꺼번에 구글 번역하기 2	지천명영어	2021.06.07	6074
16	엑셀 비어있는 셀(공란인 행 또는 열) 한번에 삭제하기	지천명영어	2021.06.05	3608
15	엑셀 책 쪽수 자동 계산하는 법	지천명영어	2021.06.05	736

글쓴이

공지

엑셀 프로그램 요청하기(무료 또는 책 구입 후원) 6 file

엑셀

이미지 속에 있는 표를 OCR로 인식 후, 테이블 데이터로 만들기

You may contact me on this e-mail :

LOGIN

SEARCH

MENU NAVIGATION