2010년 10월 13일 수요일

[작업중] Tesseract 3.0 해석

1. TesseractRect(const unsigned char *imagedata, int byte_per_pixel, int bytes_per_line, int left, int top, int width, int height);

1.1. 유의 사항

- 단독으로 사용가능하고, 24bits, 8bits, 32bits, 1 bit를 갖는 화소에 모두 적용 가능하지만, pallete를 참조하는 방식의 8bits 화소에 대해서는 적용이 불가능함.

- 1bit 화소에 대해서 첫번째 바이트의 MSB가 첫번째 화소값이 되도록 즉 littel endian으로 되어 있음. (이거 전면 수정해야 할것 같음. 아니면 옵션을 주던가.) imagedata가 바이트 단위로 padding되어 있어야 함( 내 것은 4byte 단위로 padding 되어 있다). 그리고 bytes_per_pixel = 0 으로 되어 있어야 함.

- 좀더 세세한 사항은 SetImage, SetRectangle, Recognize, 와 Get*Text라는 함수를 좀더 들여다 보자.

1.2. 기능

- 영상에서 네모 영역을 인식하고 문자열을 되돌려 준다.

2. SetImage(const unsigned char *imagedata, int width, int height, int bytes_per_pixel, int bytes_per_line)

2.1. 주의 사항

- Tesseract가 Recoginize을 하기 위한 이미지 버퍼를 복사하지 않고 참조하기 위한 설정을 한다.

- imagedata는 Recognize를 수행한 후 메모리 반환될 것이다.

댓글 없음:

댓글 쓰기