Skip to content

hiancdtrsnm/CubaCrawler

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

24 Commits
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

PyPI - License PyPI - Python Version PyPI Travis (.org) Codecov

CubaCrawler

Esta biblioteca apunta a obtener información de los sitios de noticias cubanas (Ahora mismo solo funcionan Cubadebate y Granma).

Como se usa

from CubaCrawler import Crawler

data = Crawler()

data.request("http://www.cubadebate.cu/noticias/2018/09/26/fundada-la-primera-empresa-biotecnologica-cubano-estadounidense-innovative-immunotherapy-alliance-sa/#.W6uvSBQpDeM")
print(data.text)
print(data.comment)

En caso de tener que pasar por un proxy se puede usar de la siguiente manera

from CubaCrawler import Crawler

config = {
    "proxy": "http://user:password@proxy.host:port"
    }
data = Crawler(config)

data.request("http://www.cubadebate.cu/noticias/2018/09/26/fundada-la-primera-empresa-biotecnologica-cubano-estadounidense-innovative-immunotherapy-alliance-sa/#.W6uvSBQpDeM")
print(data.text)
print(data.comment)

O, se pude llamar explicitamente a un Scrapper

from CubaCrawler import Cubadebate

url = "http://www.cubadebate.cu/noticias/2018/09/26/fundada-la-primera-empresa-biotecnologica-cubano-estadounidense-innovative-immunotherapy-alliance-sa/#.W6uvSBQpDeM"
cubadebate = Cubadebate(url)

print(cubadebate.text)
print(cubadebate.comment)

Esta biblioteca es desarrollada por GIA (Grupo de Inteligencia Artificial), cualquier contribución o referencia es agradecida.

thanks,

Frank Sadan Naranjo Noda fsadannn@gmail.com

Hian Cañizares Díaz hiancdtrsnm@gmail.com

About

A collection of scrapper for cuban news sites

Resources

License

Stars

Watchers

Forks

Packages

No packages published