티스토리 뷰
- 이번 시간에는 실제 Tesseract 엔진을 Android 상에서 사용하는 방법을 한 번 알아보겠습니다.
- Tesseract의 자세한 원리는 아래 글에서 확인할 수 있습니다.
tess-two
- tess-two 란 Android 상에서 사용하기 위해서 몇몇 기능이 추가된 형태의 Tesseract Tools 들에서 파생된 형태입니다.
- Android API들과 build file들로 이루어져 있습니다.
구현방법
tess-two 라이브러리 적용
- gradle dependancy를 추가해줍니다.
dependencies {
compile 'com.rmtheis:tess-two:9.1.0'
}
tess-two training data 적용 방법
- 트레이닝 데이터를 만들어주거나 아래 위치 에서 데이터를 다운받아 적용 시켜 보겠습니다.
- raw 리소스 폴더에 트레이닝 데이터를 넣어줍니다. 아래 그림 처럼 말이죠
코드상에서 트레이닝 데이터 불러오기
- 코드상에서 트레이닝 데이터를 불러오는 방법은 아래와 같습니다.
import android.content.Context;
import android.util.Log;
import java.io.ByteArrayOutputStream;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileOutputStream;
import java.io.IOException;
import java.io.InputStream;
public class TessDataManager {
static final String TAG = "DBG_" + TessDataManager.class.getName();
private static final String tessdir = "tesseract";
private static final String subdir = "tessdata";
private static final String filename = "eng.traineddata";
private static String trainedDataPath;
private static String tesseractFolder;
public static String getTesseractFolder() {
return tesseractFolder;
}
public static String getTrainedDataPath(){
return initiated ? trainedDataPath : null;
}
private static boolean initiated;
public static void initTessTrainedData(Context context){
if(initiated)
return;
File appFolder = context.getFilesDir(); //할당된 디렉토리 경로 및 임의의 파일명을 지정
File folder = new File(appFolder, tessdir); //파일의 경로와 이름을 따로 분리해서 지정할 수 있도록 한 생성자.
if(!folder.exists())
folder.mkdir();
tesseractFolder = folder.getAbsolutePath();
File subfolder = new File(folder, subdir);
if(!subfolder.exists())
subfolder.mkdir();
File file = new File(subfolder, filename);
trainedDataPath = file.getAbsolutePath(); // 현재 위치의 절대경로를 tessdata의 path로 지정해준다.
Log.d(TAG, "Trained data filepath: " + trainedDataPath);
if(!file.exists()) {
try {
FileOutputStream fileOutputStream; //tessdata를 쓸 filOutputStream을 생성했다.
byte[] bytes = readRawTrainingData(context); //raw폴더에서 tessdata를 가져온다.
if (bytes == null)
return;
fileOutputStream = new FileOutputStream(file);
fileOutputStream.write(bytes);
fileOutputStream.close();
initiated = true;
Log.d(TAG, "Prepared training data file");
} catch (FileNotFoundException e) {
Log.e(TAG, "Error opening training data file\n" + e.getMessage());
} catch (IOException e) {
Log.e(TAG, "Error opening training data file\n" + e.getMessage());
}
}
else{
initiated = true;
}
}
private static byte[] readRawTrainingData(Context context){
try {
InputStream fileInputStream = context.getResources()
.openRawResource(R.raw.eng_traineddata);
ByteArrayOutputStream bos = new ByteArrayOutputStream();
byte[] b = new byte[1024];
int bytesRead;
while (( bytesRead = fileInputStream.read(b))!=-1){
bos.write(b, 0, bytesRead);
}
fileInputStream.close();
return bos.toByteArray();
} catch (FileNotFoundException e) {
Log.e(TAG, "Error reading raw training data file\n"+e.getMessage());
return null;
} catch (IOException e) {
Log.e(TAG, "Error reading raw training data file\n" + e.getMessage());
}
return null;
}
}
tesss-two 라이브러리 사용 방법
- TessBaseAPI 라는 라이브러리 클래스를 통해서 기능을 사용할 수 있다.
import android.content.Context;
import android.graphics.Bitmap;
import android.util.Log;
import com.googlecode.tesseract.android.TessBaseAPI;
import java.util.Arrays;
import java.util.List;
public class TessCore {
static final String TAG = "DBG_" + TessCore.class.getName();
private Context mCtx;
public TessCore(Context context) {
this.mCtx = context;
}
public List<String> detectText(Bitmap bitmap) {
Log.d(TAG, "Initialization of TessBaseApi");
TessDataManager.initTessTrainedData(mCtx); //DataManager클래스의 initTessTrainedData 메소드를 통해 트레이닝 데이터를 읽는다.
TessBaseAPI tessBaseAPI = new TessBaseAPI();
String path = TessDataManager.getTesseractFolder(); //path에는 tesseract라는 이름의 디렉토리의 경로가 저장된다.
Log.d(TAG, "Tess folder: " + path);
tessBaseAPI.setDebug(true);
tessBaseAPI.init(path, "eng");
// 추천 글자들
tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_WHITELIST, "1234567890abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ");
// 비추천 글자들
tessBaseAPI.setVariable(TessBaseAPI.VAR_CHAR_BLACKLIST, "!@#$%^&*()_+=-[]}{;:'\"\\|~`,./<>?");
tessBaseAPI.setPageSegMode(TessBaseAPI.OEM_TESSERACT_CUBE_COMBINED);
Log.d(TAG, "Ended initialization of TessEngine");
Log.d(TAG, "Running inspection on bitmap");
tessBaseAPI.setImage(bitmap);
String inspection = tessBaseAPI.getUTF8Text();
Log.d(TAG, "=====Got data=====" + inspection);
List<String> recogText = Arrays.asList(inspection.split("\n|\\u0020")); //반환된 문자열은 공백 아니면 엔터로 구분되므로 split을 통해 배열에 넣어 반환한다.
tessBaseAPI.end();
return recogText; // 글자를 반환한다.
}
}
관련글
끝으로
이 글이 도움이 되었다면, 하단의 Google 광고 👎👎👎 한번씩 클릭 부탁 드립니다. 🙏🙏🙏
광고 클릭은 많은 힘이 됩니다!
반응형
'프로그래밍 > Android' 카테고리의 다른 글
Android FloatingAction Button 숨기기, 및 나타내기 (0) | 2016.11.04 |
---|---|
Android 오디오 파일 재생 기능 구현 방법 (0) | 2016.11.03 |
(Android) 광학 문자 인식 라이브러리 Tesseract OCR 의 원리 (1) | 2016.11.01 |
(Android) Dialog Fragment 구현 방법 및 예제 (0) | 2016.10.26 |
(Android) Tmap 경로 API를 통해 (출발, 도착)경로 Point 리스트 가져오기 (3) | 2016.10.25 |
댓글
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
TAG
- 일본여행
- 일본 배낭여행
- git
- windows
- intelij
- 배낭여행
- JavaFX 종료
- 이펙티브
- 방통대 과제물
- java
- effective java
- 자전거 여행
- JavaFX Window Close
- 이펙티브 자바
- springboot
- Java UI
- JavaFX 테이블뷰
- 일본 여행
- TableView
- 스프링부트
- 인텔리제이
- 배낭 여행
- 이펙티브자바
- 자바
- JavaFX Table View
- effectivejava
- JavaFX
- 텐트
- 일본 자전거 여행
- 자전거
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
글 보관함