Uso del Proyecto
📁 Estructura del Proyecto
La estructura de archivos del repositorio es la siguiente:
├── data/ # 📂 PDFs de entrada para su procesamiento
├── output/ # 📂 Resultados generados (XMLs, gráficos, JSONs)
│ ├── wordcloud.png # 📊 Nube de palabras basada en los abstracts
│ ├── figures_per_paper.png # 📈 Número de figuras por artículo
│ ├── links_per_paper.json # 🔗 Lista de enlaces extraídos
├── src/ # 📂 Código fuente del pipeline
│ ├── config.py # ⚙️ Configuración del entorno y rutas
│ ├── extraction.py # 🔍 Extracción de abstracts, figuras y enlaces
│ ├── process.py # 🛠️ Envío de PDFs a Grobid y procesamiento
│ ├── visualization.py # 📊 Generación de gráficos y visualizaciones
│ ├── main.py # 🚀 Script principal del programa
├── Dockerfile # 🐳 Configuración de contenedor para la aplicación
├── docker-compose.yml # 🐳 Configuración de servicios (Grobid + App)
├── requirements.txt # 📦 Dependencias necesarias
├── rationale.md # 📝 Validación de los resultados obtenidos
├── LICENSE # ⚖️ Licencia del proyecto
└── README.md # 📖 Documentación del repositorio
Para ejecutar el análisis, sigue las instrucciones de instalación y configuración.