Système de mise à jour 6 fois/jour - Architecture complète (Heure de Montréal)
La Vitrine Démocratique se met à jour 6 fois par jour (toutes les 4 heures) avec les dernières données des médias et analyses.
Délai de disponibilité: Les données collectées sur une fenêtre de 4h sont traitées en ~54 minutes (datamarts).
Exemple: Bloc débute à 11:03 → Datamarts prêts vers 11:57 → Frontend vitrine vers 12:00 (heure de Montréal)
Le pipeline utilise deux types de Glue Jobs AWS pour gérer l'extraction, la transformation et le chargement des données:
DATA_PREPARATION et tout le pipeline RADAR+
Les raffineurs dépendants de la saillance utilisent salient_index comme
source de vérité. Les raffineurs longs sont systématiquement splittés en plusieurs lambdas de 15 min max pour respecter la contrainte AWS Lambda et accélérer le pipeline.
Pipeline scientifique — DATA_PREPARATION (6 phases, 5 modèles):
radar_articles (29 colonnes)
⚖️ Trade-off: Plus lent que GPT-4 (~25 min vs ~2 min),
mais scientifiquement rigoureux, reproductible, et traçable.
💡 Objectif d'optimisation continue:
Réduire le délai de traitement en améliorant les performances des modèles locaux et l'architecture du
pipeline.
✅ Conforme (TS actuel) : horaire déjà aligné avec la cible. 🟡 À adapter : horaire encore à migrer.
Lecture rapide par raffineur (base: bloc MIDI 11:00, heure de Montréal).
| Raffineur | Horaire TS actuel | Horaire cible | Statut |
|---|---|---|---|
| DATA_PREPARATION | 11:06 | 11:06 | ✅ Conforme |
| OBJECT_EXTRACTION | 11:24 | 11:24 | ✅ Conforme |
| SALIENT_OBJECTS | 11:16 | — | 🔴 À débrancher |
| PARTY_SCORE_SALIENT_SHADOW (daily) | 11:31 | 11:31 | ✅ Conforme |
| PARTY_SCORE (daily) | 6x/jour @ :29 | — | 🔴 À débrancher |
| ISSUES_SCORE (daily) | 3x/jour @ :09 | 6x/jour @ :31 | 🟡 À adapter |
| SALIENT_INDEX | 6x/jour @ :20 | 6x/jour @ :42 | 🟡 À adapter |
| HEADLINE_OF_HEADLINES | 6x/jour @ :28 | 6x/jour @ :46 | 🟡 À adapter |
| HEADLINES_ISSUES (daily) | 3x/jour @ :14 | 6x/jour @ :46 | 🟡 À adapter |
| REFLET (daily) | 3x/jour @ :25 | 6x/jour @ :46 | 🟡 À adapter |
| VITRINE_GRAPH_DATA | 5x/jour @ :39 | — | 🔴 À débrancher (post-API) |
Approbation de l'équipe et confirmation des durées réelles en production
Remplace radar-articles-segmented — 5 modèles, 6 phases, 29 colonnes vers
radar_articles — SALIENT_INDEX lit désormais directement depuis
radar_articles
Migration UTC → heure locale Montréal - Application du nouvel horaire - Ajout du 6ème bloc (minuit) - Mise à jour des payloads
Monitoring intensif des temps d'exécution - Ajustements si nécessaire - Validation de la synchronisation
Réduction progressive des marges de sécurité - Documentation des métriques