TP Cassandra.pdf

Rapport TP Cassandra - Base de données NoSQL distribuée

Introduction

Ce rapport présente l'exécution complète du TP sur Apache Cassandra, une base de données NoSQL distribuée conçue pour gérer de grands volumes de données répartis sur plusieurs serveurs. Ce TP permet de comprendre les concepts fondamentaux de Cassandra et de mettre en pratique le langage CQL (Cassandra Query Language).

Configuration de l'environnement

Installation avec Docker

Pour ce TP, j'ai utilisé Docker pour déployer Cassandra :

# Récupération de l'image
docker pull cassandra:latest

# Démarrage du conteneur
docker run --name cass_cluster -d cassandra:latest

Note importante : Cassandra nécessite un temps d'initialisation d'environ 60 secondes avant d'être opérationnel. Durant cette période, les connexions sont refusées.

Connexion à CQLSH

# Connexion au shell CQL
docker exec -it cass_cluster cqlsh

Création de la structure de données

1. Keyspace

Le keyspace est l'équivalent d'une base de données dans le monde relationnel. Il configure la réplication des données.

CREATE KEYSPACE sensor_data
WITH replication = {
    'class': 'SimpleStrategy',
    'replication_factor': 3
};

Concepts clés :

Warning rencontré : Dans notre environnement Docker avec un seul nœud, le facteur de réplication de 3 génère un avertissement car nous n'avons qu'un seul nœud disponible.

2. Tables créées