Merge branch 'update-readme-file' into 'main'

wrote code documentation See merge request !3

Merge branch 'update-readme-file' into 'main'
16395dea · Bouchafaa Mohamed · 6c2435f9 · aa131f49 · 16395dea · 16395dea
Commit 16395dea authored Jan 18, 2024 by Bouchafaa Mohamed
--- a/chatbot_architecture.jpg
+++ b/chatbot_architecture.jpg
--- a/doc_output_with_text_slicing.py
+++ b/doc_output_with_text_slicing.py
--- a/readme.md
+++ b/readme.md
+# Prérequis :
+Afin de pouvoir executer le code il faut créer un environnement virtuel python :
+```
+python3 -m venv venv
+```
+Ensuite installer les bibliothèques nécessaires qui se trouvent dans le fichier `requirements.txt`: 
+```
+pip install requirements.txt
+```
+# Architecture du code
+Le code créée a pour objectif de reproduire cette architecture : 
+![chatbot_architecture.jpg](chatbot_architecture.jpg)
+## preprocessing.py
+Le code `preprocessing.py` récupère les fichiers pdf depuis le répertoire drive où ils sont enregistrés, les transfome 
+en texte et opère des traitements dessus et les enregistre sous le répertoire `text_files`
+## ingest_txt_files, gdrive_ingest_with_nlp, gdrive_ingest
+ces trois codes pythons récupèrent les fichiers text enregistrés dans `text_files` (ou les pdf pour les gdrive_*), 
+opère un traitement dessus de telle sorte à découper chaque document en plus petit documents (de la taille d'un paragraphe
+ou de quelques lignes en fonction du paramètrage) et les vectorise pour les enregistrer dans chromadb une bdd vectorielle.
+## doc_output.py
+Ce code prend une requête utilisateur, la vectorise, cherche les n documents qui minimisent la distance cos par rapport 
+à la requête et les affiche.
\ No newline at end of file