티스토리 뷰
node.js 웹페이지 크롤링한 결과를 excel 파일로 저장
npm init
npm install --save cheerio-httpcli
npm install --save officegen
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 53 54 55 | var client = require('cheerio-httpcli'); var officegen = require('officegen'); var xlsx = officegen('xlsx'); var fs = require('fs'); var url = "https://search.naver.com/search.naver?where=post&sm=tab_pge&query=%EC%84%B1%ED%98%95%EC%99%B8%EA%B3%BC&st=sim&date_option=0&date_from=&date_to=&dup_remove=1&post_blogurl=&post_blogurl_without=&srchby=all&nso=&ie=utf8&start=1"; var param = {}; client.fetch(url, param, function(err, $, res){ if(err){console.log("error:", err); return;} var body = $.html(); var re = /성형/g; var found = body.match(re); //console.log(body); //console.log(found); console.log(found.length); }); client.fetch(url, param, function(err, $, res){ if(err){console.log("error:", err); return;} var body = $.html(); var list_dl = $(".sh_blog_passage"); //console.log(list_dl); var list = []; for (var i = 0 ; i < list_dl.length ;i++){ var value = $(list_dl[i]).html(); console.log(value); list.push(value); } exportToExcel(list); }); function exportToExcel(list){ var sheet = xlsx.makeNewSheet(); sheet.name = "test"; for (var i = 0 ; i < list.length ;i++){ var value = list[i]; console.log(value); sheet.setCell('a' + i+1, value); } var strm = fs.createWriteStream('c:/practice/node_crolling_02/test.xlsx'); xlsx.generate(strm); } | cs |
end.
728x90
'Language > Node.js' 카테고리의 다른 글
node.js require사용해서 다른 파일에서 선언한 function사용하는 법 (0) | 2017.02.10 |
---|---|
node.js 1초에 한번씩 특정 site에 request보내서 hello.htmll으로 저장하는 코드 (0) | 2017.02.10 |
node.js 네이버 검색에서 특정 키워드 출현 빈도수 출력해주는 프로그램 (0) | 2017.02.06 |
node.js 특정 페이지 출력하는 코드 (0) | 2017.02.06 |
누구나 할 수 있는 Node.js 설치 (0) | 2017.01.15 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- docker container whale
- 도커티슈박스
- shellscript
- 도커각티슈박스
- vim
- docker container case
- docker container tissue box
- 2017 티스토리 결산
- 싱가폴
- Sh
- 도커티슈케이스
- docker container
- 도커컨테이너
- 도커각티슈케이스
- Linux
- docker container tissue
- 개발자
- 이직
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
글 보관함