你的位置:首页 > 软件开发 > Java > NODE学习:利用nodeJS去抓网页的信息

NODE学习:利用nodeJS去抓网页的信息

发布时间:2015-12-28 23:00:04
1:引用模块"http" (执行命令node app.js "http://www.baidu.com")运行下面代码//app.jsvar http = require(http);var url = require(url);f ...

1:引用模块"http" (执行命令node app.js "http://www.baidu.com")

运行下面代码

NODE学习:利用nodeJS去抓网页的信息
//app.js
//app.js
//app.js
var cheerio = require("cheerio");var html = "<html><body><div id=\"div1\">text</div></body></html>";var $ = cheerio.load(html);console.log( "html" );console.log( $.html() );console.log( "#div1————〉html" );console.log( $("#div1").html() );console.log( "#div1----〉text" );console.log( $("#div1").text() );
NODE学习:利用nodeJS去抓网页的信息

 

2:引用jquery

运行下面代码

var $ = require("jquery");var $dom = $("<html><body><div id=\"div1\">text</div></body></html>");console.log( $dom.find("#div1").text() );
var jsdom = require('jsdom');var curl = require("curl");var u = "https://github.com";if( require.main === module ) {  u = process.argv[2];};curl.get(u,function( arg0 , html ){   //jsdom相当于打开了一个页面,在这个页面里面运行js;  var document = jsdom.jsdom( html.body );  for(var a in html)    console.log(a);  var window = document.createWindow();  var script = document.createElement('script');  //script.src = 'http://code.jquery.com/jquery-1.4.2.js';  script.src = "http://127.0.0.1:81/js/jquery.min.js";  script.onload = function(){    console.log(1);    console.log( window.jQuery("body").text() );  };  document.head.appendChild( script );});
NODE学习:利用nodeJS去抓网页的信息

_________________________________________________________________________________________________________________

文件保存的话直接用nodeJS中的fs模块:

运行下面代码

NODE学习:利用nodeJS去抓网页的信息

原标题:NODE学习:利用nodeJS去抓网页的信息

关键词:JS

JS
*特别声明:以上内容来自于网络收集,著作权属原作者所有,如有侵权,请联系我们: admin#shaoqun.com (#换成@)。