# Exercice SQL – fusion et emboitement de requêtes

Cette série d'exercices a pour but de vous permettre de **pratiquer l'écriture de requêtes SQL avec les opérateurs ensemblistes**. 
Nous allons utiliser :
* la base de donnée QSpatiaLite concernant les cigognes que nous avons utilisée précédemment
* le language de programmation Python afin d'interroger cette base de données.

## Objectifs

A la fin de cette série d'exercices vous devriez être en mesure de :
* distinguer les différents opérateurs ensemblistes et leurs effets
* écrire des requêtes réalisant des opérations logiques avec ces opérateurs
* interroger une base de données avec Python


# 1. Accès à la base de données
Pour manipuler une base de donnée avec Python nous avons besoin des librairies `sqlite3` et `pandas`:

In [None]:
# Importing libraries
import sqlite3
import pandas

D'abord on établit une connexion à la base de données :

In [None]:
# Etablir la connexion à la base de données
con = sqlite3.connect("stork-mooc.sqlite")

Pour lister toutes les tables disponibles, on peut utiliser la table `sqlite_master` avec la requete suivante :

```SELECT name FROM sqlite_master WHERE type='table';```

Pour exécuter cette requête avec Python, on utilise la librairie `pandas` et sa fonction `read_sql_query` qui nous retourne directement une table.
Pour afficher cette table il suffit ensuite de faire un `display`.

In [None]:
# Donner la requête à executer
query = "SELECT name FROM sqlite_master WHERE type='table';"

# Executer la requête et récupérer la table résultat
resulttable = pandas.read_sql_query(query, con)

# Afficher la table résultat
display(resulttable)

De la même manière on peut afficher le détail de la table "Migration". 
Si on veut limiter l'affichage aux 5 premières lignes, il suffit d'ajouter `.head()` sur la table résultat.

In [None]:
# Donner la requête à executer
query = "select * from migration"

# Executer la requête et récupérer la table résultat
resulttable = pandas.read_sql_query(query, con)

# Afficher les 5 premières lignes de la table résultat
display(resulttable.head())

# 2. Exercices avec SQL

Pour tous les exercices suivants, **donnez la syntaxe SQL pour les requêtes demandées et testez vos requêtes.** 
Afin que vos réponses puissent être corrigées adéquatement, veuillez suivre les quelques règles suivantes :
* Quand plusieurs attributs sont demandés, gardez l’ordre dans lequel ils apparaissent dans la question
* N’utilisez pas d’alias du nom de colonne ou table (sauf lorsque c’est demandé)
* Ne rajoutez pas de clause telle que WHERE, GROUP BY, ORDER BY, LIMIT

## Exercice 1

**Question**: Donnez le nom de toutes les cigognes qui ont migré à la fois en 2001 et en 2003 (en utilisant UNION, EXCEPT ou INTERSECT)

In [None]:
# Donner la requête à executer
query = "select * from migration" # TODO: MODIFIER LA REQUETE ICI

# Executer la requête et récupérer la table résultat
resulttable = pandas.read_sql_query(query, con)

# Afficher la table résultat
display(resulttable)

**Self-checks**

Vous pouvez executer la cellule suivante qui va vérifier automatiquement quelques caractéristiques du résultat de votre requête. 
Ces tests ne sont pas suffisants pour assurer que vous avez la bonne réponse, mais ils vont vous permettre de savoir si vous êtes sur la bonne voie.

In [None]:
assert len(resulttable.index) == 4, f'Le résultat de vote requête a {len(resulttable.index)} ligne, alors que la solution a 4 lignes.'
assert len(resulttable.columns) == 1, f'Le résultat de vote requête a {len(resulttable.columns)} colonnes, alors que la solution a 1 colonne (la colonne "name").'
print("Le résultat de vote requête a le bon nombre de lignes (4) et de colonnes (1), c'est un bon début !")

**Validation**

Executez la cellule suivante afin de savoir si votre requête est correcte ou non. 
Lisez attentivement les éventuels messages d'erreur afin de corriger votre requête.

In [None]:
from ExerciceSQL import *
question1_validation(query)