Option 1:
Resolve the server crash when importing data from Data Tourisme and display the Data Tourisme content.

It appears that the crash is caused by Datatourisme, as the webservice URL returns an error: https://diffuseur.datatourisme.fr/webservice/66f0f4b6156a2315228d7f46e04f7943/bb3e487f-7b9f-4085-b409-a530cbe2fb90/

Option 2:
If Data Tourisme is not stable enough, consider implementing one or more alternative event APIs.
Base this on one or more event databases:
- a concert event database for "Music / concerts"
- a museum event database for "Vulga / exhibitions, meetups"
- a performing arts event database for "Comedy / live shows"
- a performing arts event database for "Fiction / cinemas"
The choice of event database is up to your discretion (Allociné? France Billet? Ticket Master? See Ticket? Apidae, etc.). If the database(s) support affiliation, that would be a plus.

According to initial analysis, the databases from France Billet (FNAC Spectacles) and Allociné seem to be the most complete.
- However, FNAC Spectacles requires an agreement to use the API within the Awin affiliation program: I am still waiting for their response
- However, the Allociné API requires approval and has a restrictive usage quota. There is an unofficial Python API, but I fear this technological diversification could complicate maintenance.

Option 3:
Scrape the France Billet and Allociné websites and integrate the data into a middleware: an intermediate database instead of the Data Tourisme replica database.

Below is the structure of the proposed database. It includes two main types of outings:
- "events" corresponding to outings with a time span (start date and end date). This includes festivals, exhibitions, workshops…
- "sessions" corresponding to one-time outings (specific date including day and time). This includes movie screenings, conferences, guided tours, concerts…
- "Events" and "sessions" are nested. For example, a festival may include several concerts.

Title, author, subject, activity, and location are shared attributes between "events" and "sessions". The first three have Wikidata IDs to facilitate linking with videos and borrowings.

Below are the database fields to populate from scraping France Billet and Allociné:

https://www.fnacspectacles.com/events/concerts-festivals-93/
https://www.fnacspectacles.com/events/spectacles-94/
https://www.fnacspectacles.com/events/humour-186/
https://www.fnacspectacles.com/events/theatre-188/
https://www.fnacspectacles.com/events/expositions-musees-185/
https://www.fnacspectacles.com/events/classique-danse-195/

https://www.allocine.fr/salle/


Session name and Event name:
- France Billet: listing-headline-0
- Allociné: meta-title-link

Session image and Event image:
- France Billet: listing-image
- Allociné: thumbnail-img

Session description:
- France Billet: listing-description
- Allociné: content-txt

Session date:
- France Billet: listing-subheadline
- Allociné: showtimes-version

Event start date / Event end date:
- France Billet: listing-data (with NER to extract the date)
- Allociné: /

Session price and Event price:
- France Billet: loading-animation
- Allociné: /

Session link and Event link:
- France Billet: item-cta-0, item-cta-1, item-cta-2...
- Allociné: meta-title-link

Title name:
- France Billet: listing-headline-0
- Allociné: meta-title-link


Author name:
- France Billet: event-listing-city (with NER to extract the author)
- Allociné: dark-grey-link


Subject name:
- France Billet: listing-description (with NER to extract the subject)
- Allociné: meta-body-info (with NER to extract the subject)

Activity name:
- France Billet: stage-headline
- Allociné: "projection"


Location name:
- France Billet: listing-subheadline (with NER to extract the location)
- Allociné: header-theater-title

Option 1 :
Résoudre le plantage serveur au moment de l'import des données data tourisme et afficher les données data tourisme. 

Il semblerait que le plantage soit du fait de Datatourisme car l'url du webservice renvoit une erreur https://diffuseur.datatourisme.fr/webservice/66f0f4b6156a2315228d7f46e04f7943/bb3e487f-7b9f-4085-b409-a530cbe2fb90/

Option 2 :
Si Data tourisme n'est pas suffisamment stable, il faut prévoir une ou plusieurs API d'événements alternatifs.
Se baser sur une ou plusieurs bases de données d’événements : 
- une base de donnée d’événements concert pour «Musique / concerts»
- une base de donnée d’événements musée pour «Vulga / expos, rencontres» 
- une base de donnée d’événements spectacle vivant pour «Humour / spectacles vivants»
- une base de donnée d’événements spectacle vivant pour «Fiction / cinémas»
Le choix de base de données d’événement est à votre libre appréciation (Allociné ? France Billet ? Ticket Master ? See Ticket ? Apidae etc). Si la/les base(s) de données permettent de faire de l’affiliation, ce serait un plus.

Au regard des premières analyses les bases de France Billet (FNAC spectacle) et Allociné ont l'air les plus complets.
- Sauf que FNAC Spectacle nécessite un accord pour l'utilisation de l'API dans le cadre du programme d'affiliation Awin : je reste dans l'attente d'une réponse de leur part
- Sauf que l'API Allociné nécessite un accord et a un quota d'utilisation restrictif. Il existe une API non officielle en Python et je craint que cette diversification technologique complexifie la maintenance.

Option 3 :
Faire du scraping des sites France Billet et Allociné et intégrer les données dans un middle ware : une base intermédiaire à la place de la base réplique de Data Tourisme.

Ci-dessous la structure de la base envisagée. Elle a deux grand type de sortie :
- les "événements" correspondant à des sortie ayant une plage de temps étendue (date de début et date de fin). Cela concerne des festivals, expositions, initiations… 
- les "séances" correspondant aux sorties ponctuelles (date précise comprenant le jour et l'horaire). Cela correspond au projections de film, aux conférences, visites guidées, concerts…
- "֤Événements" et "séances" sont imbriqués. Par exemple un festival peut contenir plusieurs concerts.

Titre, auteur, sujet, activité et localisation sont des caractéristiques communes des "événements" et "séances". Les trois premiers ont des wikidata pour faciliter l'association avec les vidéos et emprunts.

Ci-dessous les emplacements à remplir dans la base de donnée avec le scraping des champs France Billet et Allociné à partir des url suivante :

https://www.fnacspectacles.com/events/concerts-festivals-93/
https://www.fnacspectacles.com/events/spectacles-94/
https://www.fnacspectacles.com/events/humour-186/
https://www.fnacspectacles.com/events/theatre-188/
https://www.fnacspectacles.com/events/expositions-musees-185/
https://www.fnacspectacles.com/events/classique-danse-195/

https://www.allocine.fr/salle/


Nom séance et Nom événement :
- France Billet : listing-headline-0
- Allociné : meta-title-link

Image séance et Image événement :
- France Billet : listing-image
- Allociné : thumbnail-img

Description séance :
- France Billet : listing-description
- Allociné : content-txt

Date séance :
- France Billet : listing-subheadline
- Allociné : showtimes-version

Date début événement / Date fin événement :
- France Billet : listing-data (avec NER pour récupérer la date)
- Allociné : /

Prix séance et Prix événement :
- France Billet : loading-animation
- Allociné : /

Lien séance et Lien événement :
- France Billet : item-cta-0, item-cta-1, item-cta-2...
- Allociné : meta-title-link

Nom titre :
- France Billet : listing-headline-0
- Allociné : meta-title-link


Nom auteur :
- France Billet : event-listing-city (avec NER pour récupérer l'auteur)
- Allociné : dark-grey-link 


Nom sujet :
- France Billet : listing-description (avec NER pour récupérer le sujet)
- Allociné : meta-body-info (avec NER pour récupérer le sujet)

Nom activité :
- France Billet : stage-headline
- Allociné : "projection"


Nom localisation :
- France Billet : listing-subheadline (avec NER pour récupérer la localisation)
- Allociné : header-theater-title

Comments powered by CComment