스마트 IT 기기가 발전하면서 종이책 보다는 스마트 기기로 독서하는 인구가 많이 늘었다. 이미 많은 책들이 전자책으로도 발매되면서 E-BOOK 산업도 발전해가고 좋은 이북리더기도 많아졌다.
이와 동시에 이미 종이책으로 샀거나 또는 E-book으로는 발매되지 않은 책들을 디지털화하는 일명 북스캔(책 스캔) 작업을 하는 사람들도 많이 생겨났다. 사실 책을 디지털화 한다는 것은 매우 조심해야 한다. 디지털 자료의 인터넷 전파력은 매우 강력하기 때문에 불법 복제에 바로 노출될 염려가 있기 때문이다. 책스캔을 하는 행위도 자신이 소장한 책을 자신만 볼 목적으로만 해야한다고 들었다.
북스캔(책 스캔)을 하는 방법은 몇가지가 있는데 첫 째로 스캐너로 책을 스캔하는 방법이다. 이 방법은 또 두가지로 나뉘는데 책을 펼쳐서 그대로 스캔하는 방법과 책의 페이지를 모두 한장한장 칼로 잘라내서 하는 방법이 있다. 후자의 방법은 스캔이 아주 똑바르게 된다는 장점이 있지만 책을 파괴(?)해야 하는 단점이 있다. 요새는 고속 자동 스캐너도 있어서 이렇게 잘라낸 페이지들을 넣으면 알아서 자동으로 스캔해주기도 하므로 장비만 갖춰진다면 이 방법은 매우 손쉬운 북스캔 방법이다.
반면에 전자의 경우는 책을 비파괴하지만 스캔시 굴곡이 생기기 때문에 나중에 OCR을 적용해도 오류가 많이 발생한다.
스캐너 없이 북스캔을 하는 방법도 있다. 스마트폰 카메라로 찍는 것이다. 요새 스마트폰 카메라의 화질이 아주 좋기 때문에 책을 스캔한 것처럼 찍힌다. 역시 시간과 공이 많이들어가는 작업인데 좀 더 손쉽게 하도록 도와주는 도구들도 시중에 판매되고 있다.
비파괴 북스캔을 했다면 그대로 보기에는 좀 불편하다. 페이지를 나누는 작업과 이미지를 편집하는 작업을 해야 볼만해진다. (이 방법 역시 앞서 그림처럼 굴곡이 생기므로 OCR을 하는 것은 비추다. )
이렇게 책을 모두 스캔하면 각각의 이미지를 페이지 별로 쪼개는 작업을 하는 것이 좋다. 데스크탑 PC의 20인치 이상의 큰 모니터로 본다면 상관이야 없겠지만 태블릿과 같은 10인치 남짓한 화면으로 보려면 태블릿 화면에 2페이지를 보려면 매번 확대해서 봐야 할 것이다. 번거롭더라도 애초에 페이지를 쪼개는 것이 좋다.
Scan Tailor 라는 프로그램은 오픈소스(무료) 프로그램으로 페이지를 나누고 편집하는 작업에 딱이다.
New Project를 눌러서 Input Directory에 북스캔한 이미지가 들어있는 폴더를 선택해주면 된다.
아래 그림에서 File In Project에 프로젝트에 포함될 이미지 목록이 보인다. 여기에서는 테스트 용으로 하나의 이미지로 작업한다.
OK를 누르면 프로젝트가 생성되는데 프로젝트 파일은 작업 내용을 기록한 파일이며 실제로 작업 결과물은 Output Directory로 설정한 곳에 생성된다. 아직 프로젝트만 생성했고 작업을 하지는 않았으므로 Output으로 지정된 폴더는 비어있을 것이다.
위와 같이 DIP를 설정한 후 (600x600이 적당)으로 맞춘 후 Apply를 누르면 OK버튼이 활성된다. OK를 누르면 다음과 같은 화면이 보인다.
왼쪽 위에 보면 6가지 단계의 작업이 보여진다.
Fix Orientation : 회전 설정(90도 회전)
Split Pages : 페이지 나누기
Deskew : 페이지 회전(미세 조정)
Select Content : 여백을 제외한 내용 부분만 선택해줌(오류가 많으므로 직접 확인하도록!)
Margins : 앞서 Select Content를 한 후 여분의 여백을 얼마를 줄지 설정
Output : 앞에 5단계의 작업을 모두 마친 후 활성화 된다. 출력 이미지에 대한 설정을 할 수 있다.
조금만 만져보면 쉽게 이해할 수 있다. 주의할 점은 대부분 자동으로 해놔도 되지만 4번 단계(Select Content)의 경우 좀 체크할 필요가 있다.
위 그림은 페이지의 내용을 정확히 인식했지만 간혹 제대로 인식하지 못하는 경우도 있다. 그런 경우에는 직접 마우스로 보라색 박스를 조절하면 된다. 또한 위와 같이 정확히 인식했더라도 글자가 살짝 잘리기도 한다. 이럴 때는 5번 단계(Margins)에서 상하좌우의 여백을 조절해주면 되는데 어짜피 기본으로 여백이 설정되므로 실제로는 여백을 좀 줄여야 할 것이다.
그리고 Match size with other pages에 있는 체크를 해제해 줘야 페이지 내용과 마진에 맞게 페이지가 잘려진다.
그리고 플레이 버튼 같이 생긴 것을 누르면 해당 단계까지 모두 진행된다. 5번 단계까지 진행했다면 6번 단계를 진행할 수 있다.
기본으로 흑백모드(Black and White)로 출력이 되지만 Mode에서 Color 모드로 바꿀 수도 있다.
플레이버튼 ▶ 을 누르면 작업이 마치고 Output으로 설정한 폴더에 편집된 이미지가 저장된다.
파일 형식은 tif 파일 형식인데 이미지 그대로 스마트폰이나 태블릿으로 보내면 tif 형식 이미지를 바로 볼 수 없으므로 tif를 jpg 이미지로 변환해서 보내도록 하자.