More

회사에서 이미지나 PDF파일의 글자를 읽어올 때 무료로 사용 가능한 유틸리티

회사에서 이미지나 PDF파일에 있는 글자들을 읽어올 때 사용가능한 유틸리티 입니다. 웹에서 바로 사용하거나 많이 사용하는 이스트소프트의 알pdf도 기능을 지원하지만 웹에서 사용하는 건 내용이 유출될 위험이 있고 알시리즈는 회사에 사용하면 유료이기 때문에 사용하면 안됩니다. 

개인이 사용하는건 관계 없는데 회사에서 사용하려면 여러가지 제약 조건이 붙어 제가 해본바로는 3가지 유틸리티 정도가 괜찮은 것 같습니다.



1. PDF24

pdf24는 독일에서 개발된 pdf유틸리티 프로그램으로 이름은 pdf24지만 pdf나 이미지에 포함된 텍스트도 뽑아낼 수 있습니다. 3가지 유틸리티 중 설치해서 사용해보기 전까지 제일 기대 안했던 유틸리티 였는데 생각외로 OCR 인식률도 좋고 정확도도 좋았습니다. 

단점이랄까, 홈페이지에서 프로그램 다운로드 받는 시간이 엄청 오래걸립니다. 300메가바이트 정도 되는 용량인데 다운로드 완료까지 거의 1시간 걸릴 것 같네요.

PDF24 다운로드 페이지

PDF24-라이선스

PDF24 기업에서도 무료임을 보여주는 내용

PDF24 사용방법

1. 다운로드 페이지에서 설치파일 파일 다운로드 받으시고 설치합니다. 이때 WebView2, Fax Printer 는 제외하고 설치하세요. 안쓰는 기능인데 눌러놓으면 시간만 더 걸립니다.
PDF24-사용방법

WebView2, Fax Printer 제외


2. 설치가 완료되었다면 PDF24 실행 후 메뉴가 여러가지 나오는데 스크롤을 아래로 내려 "파일 도구 열기"를 클릭합니다.
PDF24-사용방법

파일 도구 열기 클릭


3. 파일 도구에서 플러스 버튼을 눌러 가져올 파일을 선택합니다.
PDF24-사용방법

파일을 추가합니다


4. 파일을 불러왔다면 오른쪽 메뉴에서 텍스트 인식 버튼을 누릅니다.
PDF24-사용방법

텍스트 인식을 클릭합니다


5. 텍스트 인식을 누르면 PDF24 OCR로 넘어오게 되고 오른쪽 메뉴에서 언어는 Korean 으로 프로필은 최고 품질로 변경한 다음 시작버튼을 누르면 텍스트 인식이 시작됩니다.
PDF24-사용방법

언어 설정 변경 후 시작합니다


6. 인식이 완료되면 파일명이 초록색으로 변하는데 파일명 오른쪽의 메뉴버튼을 눌러 "인식된 텍스트 표시를 클릭합니다.
PDF24-사용방법

인식된 텍스트 표시 클릭


7. OCR 기능을 이용해 이미지에서 텍스트를 가져온 모습입니다. 인식된 텍스트는 메모장에 열리고 이 상태로 저장해서 사용하면 됩니다.
PDF24-사용방법

글자 읽어오기 완료된 모습


2. 구글 드라이브 Google 문서 이용하기

구글 드라이브에 파일을 업로드 하여 Google 문서에서 제공하는 OCR기능을 이용할 수 있습니다. Google 문서 기능도 PDF24와 마찬가지로 PDF나 이미지파일 모두 글자를 읽어낼 수 있습니다. 

OCR인식률은 상당히 뛰어난 편입니다. PDF24와 Google문서나 서로 비슷한 인식률이었습니다. 따로 회사에서 사용하는데 라이선스 제약은 없지만 외부 환경을 못쓰는 회사에서는 사용할 수 없습니다.


Google 문서 사용하는법

1. 구글 드라이브에 접속 후 새로 만들기를 눌러 파일 업로드를 클릭해 PDF나 이미지파일을 업로드 합니다.

Google문서-사용방법

파일 업로드를 실행합니다


2. 파일 업로드가 완료 되었다면 파일에 마우스 오른쪽 클릭 후 연결 앱 - Google문서를 클릭합니다.

Google문서-사용방법

Google 문서로 들어갑니다


3. Google문서에 파일이 업로드 되는데 첫 페이지에는 이미지나 PDF파일이 들어가고 스크롤을 내려보면 다음 페이지에 읽어온 글자들이 보입니다.

Google문서-사용방법

Google문서에 업로드 된 모습

Google문서-사용방법

OCR 기능을 이용해 글자를 불러온 모습


2. Capture2Text 이용하기

Capture2Text는 PDF24나 구글드라이브와 다르게 파일을 업로드 하지 않고 Capture2Text 유틸리티의 자체 캡쳐 기능을 이용해 화면상의 글자를 가져올 수 있는 OCR유틸리티 입니다. 파일 업로드 과정이 없기때문에 사용하기는 굉장히 편리한데 반해 인식률은 떨어지는 문제가 있었습니다.

Capture2Text 다운로드 페이지

Capture2Text-라이선스

Capture2Text 라이선스 안내


Capture2Text 사용법

1. Capture2Text는 이전 2가지 유틸리티와 다르게 설치버전이 아닙니다. 다운로드 받아서 압축 해제 후 Capture2Text파일을 클릭하면 바로 실행됩니다. 실행 과정중 등록되지 않은 프로그램 어쩌구 나오는건 승인 눌러주시면 오른쪽 하단에 작업표시줄에 아이콘으로 표시됩니다.
Capture2Text-사용법

Capture2Text파일을 누르면 바로 실행됩니다.

Capture2Text-사용법

작업표시줄 오른쪽 하단 아이콘으로 표시되는 모습


2. 작업표시줄 오른쪽 하단 Capture2Text 아이콘에 마우스 오른쪽 클릭 후 나오는 설정에서 OCR Language 설정을 Korean 으로 바꿔줍니다.
Capture2Text-사용법


3. 따로 파일 업로드가 업기 때문에 글자를 읽어올 파일을 여시고 시작할 위치에서 윈도우키 + Q를 누르면 바로 영역지정 기능이 실행됩니다. 아래 그림처럼 글자를 읽어낼 시작위치부터 끈까지 영역지정 후 마우스 왼쪽 버튼을 클릭합니다.
Capture2Text-사용법

윈도우키 + Q 를 누른 후 영역지정


4. 읽어오기가 완료되면 텍스트로 뽑아낸 내용을 보여줍니다. 사용하는 방법은 제일 간단한 반면에 읽어오는 능력은 이게 제일 떨어지는 것 같네요.
Capture2Text-사용법

읽어오기가 완료된 모습