Projeto para abertura de dados das cotas parlamentares. Atualmente encontram-se em formato PDF por ano nos endereços abaixo:
- Ano 2020: https://cmnat.rn.gov.br/verbas-2020
- Ano 2019: https://cmnat.rn.gov.br/verbas-2019
- Ano 2018: https://cmnat.rn.gov.br/verbas-2018
- Ano 2017: https://cmnat.rn.gov.br/verbas-2017
- Python
pip install tika
pip install beautifulsoup4
Foram desenvolvidos 2 scripts:
Esse script faz o download dos PDFs relacionados às cotas do ano passado por argumento
python pdfsDownloader.py -fp PDFS_FOLDER --year YEAR
PDFS_FOLDER
: pasta em que os PDFs serão salvos
YEAR
: ano das cotas relacionadas aos PDFs a serem salvos. Valores aceitos: 2017
a 2020
Esse script gera um CSV com os detalhamentos dos gastos a partir dos PDFs salvos
python csvBuilder.py -fp PDFS_FOLDER -op OUT
PDFS_FOLDER
: pasta em que os PDFs estão salvos
OUT
: arquivo de saída. É sugerido adicionar .csv
como extensão
Caso tenha algma dúvida, sugestão ou crítica, basta abrir um issue: https://github.com/dadosabertosrn/cota_parlamentar/issues
Primeiramente é bom abrir um issue descrito acima, informando o que se deseja fazer, depois faça um fork, abra uma nova branch com a nova feature e faça o pull request.
@pauloamed | @georgemaia | @fredericopranto | @ja0n |
---|
Em desenvolvimento...
- Primeira implementação