Nodejs ile web sitelerinin html kodlarının işlenebileceği modüllere göz atalım.
request modülünü indirelim.
npm install request --save
ve request modülü ile işleyeceğimiz sayfanın kaynak kodlarını çekelim. request modülü web sayfalarına post göndermemizi ve şimdi yapacağımız gibi kaynak kodlarını çekebilmemizi sağlamak gibi birçok kolaylığı sağlayan bir modül.
var request = require('request');
request('http://www.youtube.com',function(error,response,body){
if(!error && response.statusCode){
console.log(body);
}
});
şimdide cheerio modülünü indirelim. cheerio modülü sunucu tarafında kullanılmak üzere jquery tabanlı bir html işleme modülü. html kodlarını işlerken jquery ile kullanılan fonksiyonları kullanabiliyoruz.
var request = require('request');
var cheerio = require('cheerio');
request('http://www.youtube.com',function(error,response,body){
if(!error && response.statusCode){
var $ = cheerio.load(body);
console.log($('title').text());
}
});
Youtube anasayfanın kaynak kodlarını çekerek cheerio ile title tagının içerisinde olan text i konsola yazdırdık.
request ve cheerio hakkında daha detaylı bilgi edinmek için github sayfalarına göz atabilirsiniz.
https://github.com/request/request
https://github.com/cheeriojs/cheerio
Hiç yorum yok:
Yorum Gönder