Option 1:
Resolve the server crash when importing data from Data Tourisme and display the Data Tourisme content.
It appears that the crash is caused by Datatourisme, as the webservice URL returns an error: https://diffuseur.datatourisme.fr/webservice/66f0f4b6156a2315228d7f46e04f7943/bb3e487f-7b9f-4085-b409-a530cbe2fb90
/
Option 2:
If Data Tourisme is not stable enough, consider implementing one or more alternative event APIs.
Base this on one or more event databases:
- a concert event database for "Music / concerts"
- a museum event database for "Vulga / exhibitions, meetups"
- a performing arts event database for "Comedy / live shows"
- a performing arts event database for "Fiction / cinemas"
The choice of event database is up to your discretion (Allociné? France Billet? Ticket Master? See Ticket? Apidae, etc.). If the database(s) support affiliation, that would be a plus.
According to initial analysis, the databases from France Billet (FNAC Spectacles) and Allociné seem to be the most complete.
- However, FNAC Spectacles requires an agreement to use the API within the Awin affiliation program: I am still waiting for their response
- However, the Allociné API requires approval and has a restrictive usage quota. There is an unofficial Python API, but I fear this technological diversification could complicate maintenance.
Option 3:
Scrape the France Billet and Allociné websites and integrate the data into a middleware: an intermediate database instead of the Data Tourisme replica database.
Below is the structure of the proposed database. It includes two main types of outings:
- "events" corresponding to outings with a time span (start date and end date). This includes festivals, exhibitions, workshops…
- "sessions" corresponding to one-time outings (specific date including day and time). This includes movie screenings, conferences, guided tours, concerts…
- "Events" and "sessions" are nested. For example, a festival may include several concerts.
Title, author, subject, activity, and location are shared attributes between "events" and "sessions". The first three have Wikidata IDs to facilitate linking with videos and borrowings.
Below are the database fields to populate from scraping France Billet and Allociné:
https://www.fnacspectacles.com/events/concerts-festivals-93/
https://www.fnacspectacles.com/events/spectacles-94/
https://www.fnacspectacles.com/events/humour-186/
https://www.fnacspectacles.com/events/theatre-188/
https://www.fnacspectacles.com/events/expositions-musees-185/
https://www.fnacspectacles.com/events/classique-danse-195/
https://www.allocine.fr/salle/
Session name and Event name:
- France Billet: listing-headline-0
- Allociné: meta-title-link
Session image and Event image:
- France Billet: listing-image
- Allociné: thumbnail-img
Session description:
- France Billet: listing-description
- Allociné: content-txt
Session date:
- France Billet: listing-subheadline
- Allociné: showtimes-version
Event start date / Event end date:
- France Billet: listing-data (with NER to extract the date)
- Allociné: /
Session price and Event price:
- France Billet: loading-animation
- Allociné: /
Session link and Event link:
- France Billet: item-cta-0, item-cta-1, item-cta-2...
- Allociné: meta-title-link
Title name:
- France Billet: listing-headline-0
- Allociné: meta-title-link
Author name:
- France Billet: event-listing-city (with NER to extract the author)
- Allociné: dark-grey-link
Subject name:
- France Billet: listing-description (with NER to extract the subject)
- Allociné: meta-body-info (with NER to extract the subject)
Activity name:
- France Billet: stage-headline
- Allociné: "projection"
Location name:
- France Billet: listing-subheadline (with NER to extract the location)
- Allociné: header-theater-title
Option 1 :
Résoudre le plantage serveur au moment de l'import des données data tourisme et afficher les données data tourisme.
Il semblerait que le plantage soit du fait de Datatourisme car l'url du webservice renvoit une erreur https://diffuseur.datatourisme.fr/webservice/66f0f4b6156a2315228d7f46e04f7943/bb3e487f-7b9f-4085-b409-a530cbe2fb90
/
Option 2 :
Si Data tourisme n'est pas suffisamment stable, il faut prévoir une ou plusieurs API d'événements alternatifs.
Se baser sur une ou plusieurs bases de données d’événements :
- une base de donnée d’événements concert pour «Musique / concerts»
- une base de donnée d’événements musée pour «Vulga / expos, rencontres»
- une base de donnée d’événements spectacle vivant pour «Humour / spectacles vivants»
- une base de donnée d’événements spectacle vivant pour «Fiction / cinémas»
Le choix de base de données d’événement est à votre libre appréciation (Allociné ? France Billet ? Ticket Master ? See Ticket ? Apidae etc). Si la/les base(s) de données permettent de faire de l’affiliation, ce serait un plus.
Au regard des premières analyses les bases de France Billet (FNAC spectacle) et Allociné ont l'air les plus complets.
- Sauf que FNAC Spectacle nécessite un accord pour l'utilisation de l'API dans le cadre du programme d'affiliation Awin : je reste dans l'attente d'une réponse de leur part
- Sauf que l'API Allociné nécessite un accord et a un quota d'utilisation restrictif. Il existe une API non officielle en Python et je craint que cette diversification technologique complexifie la maintenance.
Option 3 :
Faire du scraping des sites France Billet et Allociné et intégrer les données dans un middle ware : une base intermédiaire à la place de la base réplique de Data Tourisme.
Ci-dessous la structure de la base envisagée. Elle a deux grand type de sortie :
- les "événements" correspondant à des sortie ayant une plage de temps étendue (date de début et date de fin). Cela concerne des festivals, expositions, initiations…
- les "séances" correspondant aux sorties ponctuelles (date précise comprenant le jour et l'horaire). Cela correspond au projections de film, aux conférences, visites guidées, concerts…
- "֤Événements" et "séances" sont imbriqués. Par exemple un festival peut contenir plusieurs concerts.
Titre, auteur, sujet, activité et localisation sont des caractéristiques communes des "événements" et "séances". Les trois premiers ont des wikidata pour faciliter l'association avec les vidéos et emprunts.
https://www.fnacspectacles.com/events/concerts-festivals-93/
https://www.fnacspectacles.com/events/spectacles-94/
https://www.fnacspectacles.com/events/humour-186/
https://www.fnacspectacles.com/events/theatre-188/
https://www.fnacspectacles.com/events/expositions-musees-185/
https://www.fnacspectacles.com/events/classique-danse-195/
https://www.allocine.fr/salle/
Nom séance et Nom événement :
- France Billet : listing-headline-0
- Allociné : meta-title-link
Image séance et Image événement :
- France Billet : listing-image
- Allociné : thumbnail-img
Description séance :
- France Billet : listing-description
- Allociné : content-txt
Date séance :
- France Billet : listing-subheadline
- Allociné : showtimes-version
Date début événement / Date fin événement :
- France Billet : listing-data (avec NER pour récupérer la date)
- Allociné : /
Prix séance et Prix événement :
- France Billet : loading-animation
- Allociné : /
Lien séance et Lien événement :
- France Billet : item-cta-0, item-cta-1, item-cta-2...
- Allociné : meta-title-link
Nom titre :
- France Billet : listing-headline-0
- Allociné : meta-title-link
Nom auteur :
- France Billet : event-listing-city (avec NER pour récupérer l'auteur)
- Allociné : dark-grey-link
Nom sujet :
- France Billet : listing-description (avec NER pour récupérer le sujet)
- Allociné : meta-body-info (avec NER pour récupérer le sujet)
Nom activité :
- France Billet : stage-headline
- Allociné : "projection"
Nom localisation :
- France Billet : listing-subheadline (avec NER pour récupérer la localisation)
- Allociné : header-theater-title
Comments powered by CComment