stenopsi

Attempt to scrape, parse and index all stenographic records from Czech Parliament. The goal is to provide structured records in language agnostic format you can use to feed your database (f.e Elastic).

installation

Make new virtualenv with python 2 and install all requirements:

virtualenv .env
source .env/bin/activate
pip install -r requirements.pip

For your convenience check virtualenvwrapper.

usage

With virtualenv activated (source .env/bin/activate) all actions should be accesiable via Makefile:

to get all needed data, do make download
to get parsed data as json, use make parse
(wip)

roadmap

get all available data [ok]
parse it [almost]
provide dumps [ok]
webapp to search within the data

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
bin		bin
stenopsi		stenopsi
tests_stenopsi		tests_stenopsi
.gitignore		.gitignore
MANIFEST.in		MANIFEST.in
Makefile		Makefile
README.md		README.md
manage.py		manage.py
pytest.ini		pytest.ini
requirements.pip		requirements.pip
requirements_dev.pip		requirements_dev.pip
requirements_test.pip		requirements_test.pip
setup.py		setup.py
tox.ini		tox.ini

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

bin

bin

stenopsi

stenopsi

tests_stenopsi

tests_stenopsi

.gitignore

.gitignore

MANIFEST.in

MANIFEST.in

Makefile

Makefile

README.md

README.md

manage.py

manage.py

pytest.ini

pytest.ini

requirements.pip

requirements.pip

requirements_dev.pip

requirements_dev.pip

requirements_test.pip

requirements_test.pip

setup.py

setup.py

tox.ini

tox.ini

Repository files navigation

stenopsi

installation

usage

roadmap

About

Releases

Packages

Languages

starenka/stenopsi

Folders and files

Latest commit

History

Repository files navigation

stenopsi

installation

usage

roadmap

About

Resources

Stars

Watchers

Forks

Languages