티스토리 뷰

Nov 18 a.txt file에서 필요한 내용을 추출해서 b.txt file에 넣는 기능



big data를 분석할 때 보통 data는 text형태로 되어있다. text형태는 .txt(or cvt)로 저장을 할 수 있고 한줄씩 읽어서 처리할 수 있다.


data에서 필요한 부분만 추출해서 json형태로 만든다면 훨씬 데이터를 처리하기가 쉽다.


아래와 같은 방식으로 a.txt에서 b.txt로 필요한 정보만 추출하는 프로그램을 개발하려고 한다.


원하는 위치에 b.txt가 있는지 check한다. 있으면 에러메세지를 띄우고 종료 없으면 파일을 생성한다.


여러줄의 data인데 key가 되는 부분이 있을 것이다. indexOf() >-1 등으로 해당 줄이 내가 원하는 row인지 확인하다.


해당 줄에서 regexp로 필요한 내용을 추출해서 hashmap에 넣는다.


hashmap에 있는 내용을 key와 함께 json형식으로 b.txt file에 쓴다.


ㅇㅇ


end.



'etc > 개발 Note' 카테고리의 다른 글

Mar 04 - 오랜만에 써봄  (0) 2016.03.04
Nov 26 - 휴가  (0) 2015.11.26
Nov 13 - 종속성 제거  (0) 2015.11.13
Nov 10 - 가지 많은 나무에 바람 잘날 없다  (0) 2015.11.11
Oct 19 - Test Scenario 작성  (0) 2015.10.19
공지사항
최근에 올라온 글
최근에 달린 댓글
Total
Today
Yesterday
링크
«   2024/03   »
1 2
3 4 5 6 7 8 9
10 11 12 13 14 15 16
17 18 19 20 21 22 23
24 25 26 27 28 29 30
31
글 보관함