Skip to content

mp2i-thiers/nussbaum-scraper

Repository files navigation

Nussbaum scraper

Un web scraper écrit en Python qui permet de télécharger tous les cours d'informatique de MP2I.

De plus, le programme va automatiquement simplifier chaque fichier PDF avec mp2i-thiers/pdf-cleaner, pour améliorer leur lisibilité.

⚠️ Avertissement

Il faut éviter d'utiliser ce programme trop souvent, afin d'éviter de surcharger le site. Téléchargez tout une fois, et ça devrait être bon.

Installation

Tout d'abord, installez Git (normalement disponible de base sur Linux), et Python.

Puis, dans un terminal, lancez :

git clone --recursive https://github.com/mp2i-thiers/nussbaum-scraper.git
cd nussbaum-scraper
python -m venv .venv
source .venv/bin/activate
pip install -r requirements.txt

(Note : sur windows les commandes peuvent changer)

Utilisation

Lancez le programme avec python nussbaum_scraper.py. Il va créer automatiquement un dossier nussbaum dans le répertoire courant avec tous les cours simplifiés.

About

Un web scraper pour télécharger tous les cours d'info et les simplifier avec pdf_cleaner.py

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 2

  •  
  •  

Languages