Accueil       Algorithmes contre le Coronavirus      

In english
Coronavirus: analyse de l'évolution de la pandémie et prévisions pour les prochains jours



Evolution par continent

Nous récupérons, en temps réel, le nombre de personnes décédés pour cause de COVID-19 à travers le monde
Nos données proviennent directement de l'université Johns Hopkins, qui centralise toutes les données COVID-19 provenant des différents pays de la planète

Continent Graphique 1.gif



Evolution par pays

Nous récupérons, en temps réel, le nombre de personnes décédés pour cause de COVID-19 à travers le monde
Nos données proviennent directement de l'université Johns Hopkins, qui centralise toutes les données COVID-19 provenant des différents pays de la planète

CLIQUEZ ICI pour séléctionnez un pays ou effectuer une comparaison entre plusieurs pays

compar1 Graphique 1.gif

Evolution par département français

Nous récupérons, en temps réel, le nombre de personnes en REANIMATION dans les hôpitaux
global Graphique 1.gif
Ces données proviennent directement des hôpitaux de France. Cliquez sur votre département pour avoir l'évolution dans votre département:

CLIQUEZ ICI pour l'évolution dans votre département

france.jpg

Evolution dans le monde

Nous récupérons, en temps réel, le nombre de personnes décédés pour cause de COVID-19 à travers le monde. Nos données proviennent directement de l'université Johns Hopkins, qui centralise toutes les données COVID-19 provenant des différents pays de la planète.
Ce graph est mis à jour en temps réel.

monde Graphique 1.gif

Analyse des requêtes saisies sur le moteur de recherche Google:

le 1er graphique représente le nombre de personnes en Réanimation Covid-19 dans nos hôpitaux: cela continue toujours à baisser.

Le 2ème graphique représente un indice (compris entre 0 et 100) qui nous indique le nombre de recherches sur Google, par les internautes, sur la perte de goût (données récupérées via l'outil Google Trends). Depuis quelques jours, cela repart très légèrement à la hausse

google1.png google2.png
Ces 2 graphiques coïncident fortement, avec un décalage de 19 jours.
C'est plutôt une bonne nouvelle: au moins jusqu'à fin août, il n'y aura pas d'explosion du nombre de personnes en réanimation ou du nombre de décès COVID-19.

En effet, avant même de contacter un médecin ou de faire un test, les internautes qui pensent avoir le COVID-19 font des recherches sous google et se renseignent sur les différents symptômes.
Analyser les mots tapés sur le moteur de recherche Google et leur fréquence, c'est donc avoir une indication sur la présence du Virus dans la population.

Dans quel département les habitants font-ils actuellement le plus de recherches sur la perte de goût et la perte de l'odorat ?
Le Val d'Oise

googletrends1.png googletrends2.png



A l'inverse, dans le département de l'Orne, l'indice n'est que de 11: il y a actuellement très peu de recherches sur Google sur les symptômes du Covid.

A côté de chaque département, une valeur. Cette valeur est un indice compris entre 0 et 100.
Plus l'indice est haut, plus le nombre de requêtes Google sur la perte de goût est importante dans le département (100 est la valeur maximale).

Val-d'Oise 100
Loire 98
Bouches-du-Rhône 96
Hauts-de-Seine 92
Seine-et-Marne 88
Val-de-Marne 84
Paris 83
Seine-Saint-Denis 83
Moselle 76
Nièvre 74
Mayenne 74
Alpes-Maritimes 74
Landes 73
Gard 72
Yvelines 71
Vaucluse 69
Côtes-d'Armor 68
Nord 67
Puy-de-Dôme 67
Tarn 67
Pyrénées-Orientales 65
Hérault 64 Essonne 63
< Haute-Saône 63
Côte-d'Or 63
Bas-Rhin 62
Ille-et-Vilaine 62
Indre-et-Loire 62
Pyrénées-Atlantiques 62
Var 61
Haute-Savoie 61
Morbihan 60
Haute-Garonne 59
Aveyron 58
Vosges 57
Ardêche 57
Charente-Maritime 56
Deux-Sèvres 56
Meurthe-et-Moselle 54
Haut-Rhin 53
Loiret 53
Oise 53
Haute-Marne 51
Maine-et-Loire 50
Lot-et-Garonne 48
Allier 47
Eure-et-Loir 46
Hautes-Pyrénées 45
Gironde 45
Cher 45
Pas-de-Calais 44
Haute-Corse 44
Rhône 44
Aube 43
Ain 43
Seine-Maritime 42
Corrèze 42
Territoire de Belfort 41
Ardennes 41
Manche 39
Finistère 39
Jura 39
Vienne 37
Aude 37
Marne 36
Somme 36
Haute-Vienne 35
Loire-Atlantique 35
Vendée 35
Savoie 34
Haute-Loire 33
Eure 33
Calvados 32
Doubs 31
Corse-du-Sud 28
Indre 26
Isère 26
Dordogne 25
Drôme 25
Yonne 24
Charente 20
Sarthe 20
Saône-et-Loire 19
Loir-et-Cher 15
Aisne 11
Orne 11
Hautes-Alpes pas assez de données
Creuse pas assez de données
Cantal pas assez de données
Lot pas assez de données
Alpes-de-Haute-Provence pas assez de données
Ariège pas assez de données
Lozère pas assez de données
Tarn-et-Garonne pas assez de données
Gers pas assez de données
Meuse pas assez de données


Explication: Google Trends est un outil issu de Google Labs permettant de connaître la fréquence à laquelle un terme a été tapé dans le moteur de recherche Google.
L'analyse des recherches effectuées par les internautes permet d'observer précisément les inquiétudes et interrogations de la population.
Le service affiche une courbe représentant l'évolution du nombre de recherches du terme en fonction du temps. La courbe n'indique pas un nombre de recherches absolu mais une proportion entre 0 et 100, où 100 représente la quantité maximale d'utilisation du terme dans la période et le lieu définis.



Publié le 11 juillet 2020:

Enfin la 1ère étude épidémiologique sur un voyage en avion !

Le 24 janvier 2020, 335 passagers prennent place à bord du vol Singapour à Hangzhou (Chine).
5 heures de vol.
Personne ne le sait encore, mais 15 passagers ont déjà le Covid-19 parmi les 335 voyageurs, et sont contagieux.
Tous les passagers portent un masque pendant le vol
Combien de passagers vont être contaminés pendant le vol ?
Voici l'étude et voici ce qui s'est passé: CLIQUEZ ICI
singapour1.png singapour2.png
singapour3.png


Publié le 5 juin 2020:

Ce soir, il n'y a plus que 1065 personnes en réanimation COVID-19 dans les hôpitaux de France.

Nous sommes optimistes pour les prochaines semaines. Ce nombre pourrait être divisé par 2 d'ici début juillet.
Il n'y a pas de 2ème vague à l'horizon (au moins sur les 6 prochaines semaines). Au delà de 6 semaines, il n'est pas possible d'effectuer des prévisions.

Comment avons nous procéder pour ces prévisions ?
Nous avons plusieurs sources de données:

1°) Certains pays sont en avance de phase par rapport à la France. Les données des hôpitaux italiens sont précieuses, et permettent d'anticiper ce qui pourrait se passer en France.

2°) Grâce à Google Trends. Nous étudions l'évolution du nombre de requêtes "perte de goût" et "perte d'odorat" tapées par les internautes français sur le moteur de recherche Google.
La baisse est toujours constante.

Rappel: la perte de goût et d'odorat est un des premiers symptômes du COVID. Et il y a en moyenne 3 semaines de décalage entre une augmentation du nombre de personnes qui vont effectuer une recherche sur la perte de goût ou d'odorat sur Google, et l'augmentation du nombre de personnes en réanimation.
Ces indices Google Trends sont très intéressants car ils sont des indicateurs avancés de l'état de la pandémie

Pour consulter le détail par département: CLIQUEZ ICI

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

previsionsfrance3.png


Publié le 13 mai 2020:

Partout en France le nombre de personnes en réanimation chute et fond comme neige au soleil

Prenons l'exemple de la Champagne-Ardenne et de ces 4 départements.
Dans l'Aube il n'y a plus que 4 personnes en réanimation (4 hommes et 0 femme)
Dans la Marne il n'y a plus que 18 personnes en réanimation (16 hommes et 2 femmes)
En Haute-Marne il n'y a plus que 7 personnes en réanimation (6 hommes et 1 femme)
Dans les Ardennes il n'y a plus que 5 personnes en réanimation (3 hommes et 2 femmes)

Il n'y a donc plus que 5 femmes en réanimation pour toute la région Champagne-Ardenne.

Remarquons qu'en Haute-Marne le pic eu lieu plus tard qu'ailleurs: aux alentours du 20 avril (au lieu du 7 avril pour le reste de la France et de la région)

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

champagne.png


Publié le 12 mai 2020:

Voici l'étude épidémiologique anglaise sur la COVID19 portant sur 17 millions de dossiers médicaux. Pour la première fois, nous disposons d'une estimation solide du poids ajusté des différents facteurs de risque de décès.
L'enseignement spectaculaire de cette étude, c'est le poids ridicule des comorbidités comparé à celui de l'âge.
Un homme bien portant de 55 ans a 3 fois plus de risque de mourir qu'un diabétique de 45 ans
L’âge est de loin le principal critère. Pour simplifier, on pourrait presque dire que c’est le seule critère qui compte

Voici les données et le rapport de cette étude anglaise: https://www.atoute.org/n/IMG/pdf/fdrcoviduk.pdf?fbclid=IwAR1lqzw58m0y6nLlSkBlCDF0Niz18hok-nYSq2mCRdnyHSi-RNA9xVNV4v8

age.jpg


Publié le 09 mai 2020:

La perte de goût est parfois un des premiers symptôme du COVID-19.
Il y a corrélation entre le nombre de recherches sur la perte de goût sur google et le nombre de personnes en réanimation 16 à 20 jours plus tard dans les hôpitaux

L'indice google trends sur les mots clés "perte goût" est donc un indicateur avancé de l'évolution de la maladie.

Pour la 1ère fois, ce ne sont plus la France, la Belgique et la Suisse qui sont en tête sur les mots clés "perte goût", parmi les pays francophones.
Les pays africains ont pris la tête.

Il est donc possible que l'Europe perde son statut d'épicentre de l'épidémie dans les jours et semaines qui viennent, au profil, malheureusement, des pays du sud.

Indicateur google Trends:
Les résultats vont de 0 à 100, où 100 correspond à la région ayant enregistré le plus fort pourcentage d'utilisation de ce mot clé par rapport au nombre total de recherches locales. Une valeur de 50 signifie que le mot clé a été utilisé moitié moins souvent dans la région concernée

pertegout9mai.png


De la même façon, les USA et le Royaume-Uni viennent de perdre leur 1ère place du classement des pays anglophones où il y a le plus de recherche sur la perte de goût sur google

Nous avons en effet étudier la fréquence de saisie des mots clés "loss taste" sur les derniers jours

C'est une preuve supplémentaire, malheureusement, que les pays du sud sont en train de prendre le relais de l'Europe et des Etats-Unis comme épicentre de l'épidémie.

losstaste9may.png


L'Espagne a perdu sa 1ère place comme pays où il y a le plus de recherche sur google, en espagnol, sur la perte de goût. (mots clés: "perdida gusto")

C'est le Nicaragua, le Pérou et l'Equateur qui sont maintenant aux 1ères places.
Malheureusement, la pandémie devrait donc être très actives dans ses pays dans les prochains jours et semaines.



perditagusto9mayo.png


Conclusion:
1) malheureusement, après l'Europe, les pays du sud pourraient être durement touchés par la pandémie
2) cela peut confirmer le fait que les fortes chaleurs n'ont pas d'impact sur ce satané virus (il fait actuellement 34°C au Nicaragua !)

Publié le 08 mai 2020:

Avec un décalage de 17 jours, il y a corrélation entre le nombre de personnes en réanimation dans les hôpitaux et le nombre de personnes qui ont effectuées une recherche sur Google sur la perte de goût.

En France, le pic du nombre de personnes en réanimation eu lieu le 7 avril (pour les recherches sur google sur la perte de goût ce fut le 21 mars; mots clés: "perte goût")

pertegout.png


En Italie, le pic du nombre de personnes en réanimation eu lieu le 3 avril (pour les recherches sur google sur la perte de goût ce fut le 17 mars; mots clés: "perdita gusto")

perditagusto.png


Idem aux Etats-Unis, où nous avons le même décalage de 17 à 20 jours, avec les mots clés "loss taste"

losstaste.png


Au sein d'un même pays, les régions où il y a le plus de recherches sur google sur la perte de goût sont les régions où le virus circule le plus.

Nous continuerons à suivre la fréquence de saisie de ces mots clés car cela pourrait nous permettre de prévoir avec plusieurs jours à l'avance si une 2ème vague s'annonce et, si oui, dans quelle région.

Rappel: Google Trends est un outil issu de Google Labs permettant de connaître la fréquence à laquelle un terme a été tapé dans le moteur de recherche Google, avec la possibilité de visualiser ces données par région et par langue.


N'hésitez pas à venir discuter avec nous sur notre page facebook:


ou sur notre compte Twitter "Algorithmes contre Coronavirus"



Publié le 02 mai 2020:

Les pays ne sont pas tous touchés de la même façon par le COVID-19
Certains pays sont pratiquement épargnés; d'autres pays ont déjà des dizaines de milliers de morts.
Pourquoi de telles différences entre les pays ?

Pour chacun des pays, nous avons récupéré les données suivantes:
- nombre d'habitants
- densité de population
- richesse par habitant
- espérance de vie (cela va de 52 ans pour l'Angola à 84 ans pour le Japon)
- âge moyen de la population (cela va de 16 ans pour le Tchad à 43 ans pour l'Italie et le Japon)
- qualité du système de santé
- liberté d'expression (cela va de 0 pour la Corée du Nord à 77 pour la Suède)
- Température moyenne sur le mois d'avril dans la capitale du pays (cela va de 8°C à 42°C)
- nombre de décès (déclarés !), par million d'habitants, liés au COVID-19

Etudions la matrice de corrélation, représentée sous forme d'une carte thermique.
(rappel: les coefficients de corrélation vont de -1 à 1.
1 signifie que les 2 variables sont parfaitement corrélées positivement entre elles: quand l'une augmente, l'autre augmente aussi.
0: il n'y a aucune corrélation linéaire.
-1: les 2 variables sont parfaitement corrélées négativement. Quand une variable augmente, l'autre diminue).



matrice.png

4 variables sont très corrélées entre elles: richesse par habitant, espérance de vie, âge moyen et qualité du système de santé.
En effet, dans un pays riche, les habitants vivent plus longtemps, l'âge moyen de la population est plus élevé et la qualité du système de santé est meilleure

Le nombre de décès par habitant est fortement corrélé à ces 4 variables.
Cela peut paraître contradictoire mais plus la qualité du système de santé est bon, plus il y a des gens qui meurent du COVID-19. C'est une conséquence indirecte.
Un bon système de santé a pour conséquence une espérance de vie élevée et un âge moyen de la population élevé, qui ont eux-mêmes comme conséquence un nombre de décès COVID-19 important.
De plus, dans les pays où le systéme de santé est défaillant, tous les décès liés au COVID-19 ne sont pas déclarés comme étant liés au COVID-19

La liberté d'expression et le nombre de décès sont corrélés positivement: moins il y a de liberté d'expression, moins il y a de décès.
On pourrait donc facilement en déduire que le nombre de décès est volontairement minoré dans certains pays.

Les températures sont inversement corrélées à la richesse du pays: plus un pays est pauvre, plus il fait chaud
Les températures sont également inversement corrélées au nombre de décès.
Mais attention, une conséquence est corrélée à sa cause mais deux conséquences seront aussi corrélées entre elles.
Est-ce qu'une augmentation des températures a pour conséquence de faire baisser le nombre de décès ou est-ce qu'il y a moins de décès dans les pays où il fait chaud car ce sont des pays pauvres avec une population jeune et une espérance de vie peu élevée ?
Imposible de le savoir avec la simple analyse de cette matrice des corrélations.

Nous allons aller plus loin dans l'analyse en entraînant un algorithme de maching learning.
L'algorithme gradient boosting est considéré comme étant l'algorithme de maching learning le plus fiable et donnant les meilleurs résultats: il est notamment capable de repérer n'importe quelle corrélation (même si celle-ci n'est pas linéaire).
Nous avons entraîné l'algorithme avec notre jeu de données.

L'algorithme nous a fourni les variables qu'il considérait comme importantes pour expliquer les différences du nombre de décès COVID-19 entre les pays.
gradientboosting.png
La plus importante de nos variables est l'âge moyen de la population.
La température a un impact pratiquement nul, et n'est pas retenue par l'algorithme.

Conclusion: le président Trump s'est trompé quand il affirmait que le COVID-19 allait disparaître aux USA avec l'augmentation des températures et l'arrivée du printemps puis de l'été. La température (étudiée entre 10°C et 42°C) n'a pas d'impact significatif sur l'évolution de la pandémie. Dommage !

Notre algorithme peut encore être amélioré en ajoutant d'autres variables à notre jeu de données; c'est ce que nous ferons dans les prochains jours
Nous sommes preneurs de toutes remarques

Nos sources de données:

données sur le COVID-19: https://www.jhu.edu
données sur la liberté d'expression: https://rsf.org/fr/classement
système de santé: https://fr.april-international.com/fr/sante-des-expatries/quels-sont-les-pays-avec-les-meilleurs-systemes-de-sante
espérance de vie par pays: https://fr.wikipedia.org/wiki/Liste_des_pays_par_esp%C3%A9rance_de_vie
âge médian par pays: https://fr.wikipedia.org/wiki/Liste_des_pays_par_%C3%A2ge_m%C3%A9dian
richesse par habitant, par pays: https://fr.wikipedia.org/wiki/Liste_des_pays_par_PIB_(PPA)_par_habitant
densité de population: https://fr.wikipedia.org/wiki/Liste_des_pays_par_densit%C3%A9_de_population
nombre d'habitants: https://fr.wikipedia.org/wiki/Liste_des_pays_par_population
Température en avril 2020: https://fr.tutiempo.net/

Publié le 28 avril 2020:

Est-ce que les fumeurs ont moins de chance d'avoir le COVID-19 que les non-fumeurs ?

"Tout est parti d’une « révélation » de France Inter : une équipe de la Pitié Salpêtrière, inspirée par le neurobiologiste Jean-Pierre Changeux, avance l’hypothèse que la nicotine serait un remède préventif et curatif contre le Covid. Une information aussitôt reprise par la plupart des grands médias. En oubliant souvent de faire preuve d’une prudence élémentaire… Et de préciser que Jean-Pierre Changeux a bénéficié, par le passé, de nombreux financements de l’industrie du tabac"

« Depuis plusieurs jours et à la suite de différentes déclarations de personnalités scientifiques, de nombreuses imprécisions ont été relayées par les médias et sur les réseaux sociaux au sujet d’un possible effet protecteur de la nicotine sur le développement de la maladie », indique l'Alliance contre le tabac qui a effectué une mise au point sur les effets de la cigarette dans le cas d'une infection à coronavirus. Ce collectif souligne que « rien ne permet d’affirmer que les fumeurs soient plus protégés que le reste de la population contre le coronavirus. Ils risquent au contraire d’être plus touchés par une forme sévère de la maladie ». Il rappelle que début mars, un article du New England Journal of Medicine, montre que le tabagisme induirait un risque accru de 133 %, par rapport à un non-fumeur, de développer une forme très sévère du Covid-19.

Qu'en est-il ?
Un échantillon de plus de 1.200 personnes ont participé à notre étude, en répondant à nos questions, en 2 vagues.
Nous avons essayé d'être le plus rigoureux possible, pour éviter les biais: les questions doivent être les plus simples possibles; la formulation ne doit pas influencer la réponse; la réponse doit être anonyme; et ceux qui répondent aux questions ne doivent pas connaître les réponses des autres.

Résultats:
5% des NON fumeurs pensent avoir eu le COVID-19
7% des fumeurs pensent avoir eu le COVID-19

Notre marge d'erreur est de 2%, avec un intervalle de confiance à 90%

Connaissez vous la théorie de la sagesse des foules ?
La moyenne des réponses des individus d'une foule (plus de 1.000 personnes) est souvent très juste et est souvent plus fiable que la réponse de n'importe quel expert. Pour la simple raison que statistiquement le nombre de personne qui vont se tromper dans un sens va être compenser par les personnes qui vont se tromper dans l'autre sens.

Conclusion: est-ce que les fumeurs ont moins de chance d'avoir le COVID-19 que les non-fumeurs ? Il y a une forte probabilité que NON

cigarette.jpg sondage3.png sondage4.png


Publié le 25 avril 2020:

Le nombre de personnes en réanimation dans les hôpitaux de France est en baisse depuis le 8 avril.
La baisse a débuté 3 semaines après le début du confinement.

Il y a beaucoup d'inertie: chaque mesure (confinement, déconfinement, fermeture des école, ouverture des écoles) n'a d'impact que 2 à 3 semaines plus tard.
De ce fait, les prévisions à court terme sont assez faciles à calculer: nous pouvons avec quasi certitude affirmer qu'il y aura une baisse jusque fin mai.

A partir de début juin, il y a plus d'incertitude sur ce qu'il va se passer. Nous avons 2 scénarios: 1 optimiste, l'autre pessimiste.

Voici nos scénarios en PRENANT COMME HYPOTHESE QUE LES FRANCAIS REPRENNENT UNE VIE NORMALE A PARTIR DU 11 mai.
Scénario optimiste: à partir de début juin, les premiers impacts négatifs du déconfinement se font sentir. Il y a une nouvelle augmentation du nombre de cas mais la progression est très très lente. Les mesures barrières, les masques, et les tests de dépistages sont plutôt efficaces. Les hôpitaux ne sont à aucun moment débordés et la vie sociale peut reprendre tranquillement, sans nouveau confinement

Scénario pessimiste: à partir de début juin, les premiers impacts négatifs du déconfinement se font sentir. Il y a une nouvelle augmentation du nombre de cas. L'augmentation est moins rapide qu'en mars puisque les français ont des masques et respectent plus les gestes barrières; mais elle est suffisante pour obliger le gouvernement à imposer un 2ème confinement à partir de la 2ème quinzaine de juillet

Nos sources de données: les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

prevision25avril.png


Publié le 19 avril 2020:

Nous avons analysé l'évolution du nombre de personnes en réanimation en France.
Le pic a été atteint en France le 8 avril.
Les premiers effets du confinement ne sont apparus que 3 semaines après le début du confinement.

Depuis le 8 avril, il y a une baisse.
Nous avons étudié la vitesse de décélération. Nous pouvons donné des prévisions pour les prochaines semaines: il y a tellement d'inertie que les prévisions court terme sont assez faciles à calculer.

Cela va continuer à baisser, et ceci jusqu'à fin mai ! C'est une très bonne nouvelle
Toutefois, la baisse sera moins rapide que ne fut la hausse.

Les 1ers effets négatifs du déconfinement n'apparaitront que 3 semaines après le 11 mai: ils n'apparaîtront que début juin.
Que se passera-t-il en juin ? Il est encore trop tôt pour le savoir.

Nos sources de données: les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

prevision1904.png


Publié le 14 avril 2020:

Combien de personnes en France ont eu le COVID-19 jusqu'à présent ?

C'est complexe à estimer puisqu'on ne connait pas le rapport nombre de personnes détectées COVID-19 / nombre de personnes touchées par le virus: 0.5 ? 0.2 ? 0.1 ? 0.01 ?

Il n'y a pour l'instant qu'un endroit où l'ensemble d'une population a été testé: c'est sur le navire de croisière Diamond Princess.
Sur le Diamond Princess, sur les 3 711 passagers et membres d'équipage, 634 personnes ont été testées positives (près de 50% d'entre elles n'avaient aucun symptôme).
Avec 7 morts, le taux de décès serait donc de 1,2%.
Problème: sur ce navire de croisière, la répartition par âge est différente de la répartition par âge d'un pays comme la France: les croisièristes sont plus âgés.
Nous avons pris en compte cette différence de répartition par tranche d'âge. Après correction, nous obtenons un taux de 0.7%.
L'intervalle de confiance est assez large puisque l'échantillon (634 personnes) est faible.
Nous pouvons estimer que le taux nombre de décès sur nombre de personnes infectées est compris entre 0.5 et 0.9, dans la population française.
Avec 15.000 décès, le nombre de personnes touchées en France seraient donc compris entre 1.6 et 3 millions.
Soit 4% à 5% de la population française.

Nous sommes malheureusement encore très loin de l'immunité de groupe

princess.png diamond.jpg


Publié le 14 avril 2020:

Voici l'évolution du nombre de personnes en Réanimation à cause du COVID-19, par million d'habitants.

Le pic a eu lieu aux alentours du 8 avril. Et ceci quelque soit la région de France: pour Paris, pour la Lorraine, pour le Nord, pour l'Ouest, ou pour le Sud.

Ces différentes régions de France n'étaient pas du tout touchées de la même façon et ne sont pas dans la même phase d'évolution. Et pourtant, le pic a eu lieu en même temps. Le seul point commun à toutes ces régions est que le confinement a commencé à la même date: 17 mars. Ce reflux paraît donc n'avoir qu'une cause: le confinement.

Dans les départements les plus touchés (comme Paris ou le Haut-Rhin), la décélération se fait à la même vitesse que dans les départements très peu touchés: nous n'y voyons aucun début "d'immunité de groupe". Au niveau français, nous sommes donc malheureusement encore très très loin du seuil d'immunité de groupe.

Nos sources de données: les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

rea14avril2020.png


Publié le 9 avril 2020:

Pour chacun des 3 242 comtés des Etats-Unis nous avions récupéré les données sur la répartition de la population par origine ethnique.

Nous venons de construire la matrice de corrélation.

Pour rappel: l'indice de corrélation varie de -1 à +1.

Une corrélation positive signifie que quand un paramètre augmente, l'autre augmente aussi.
Plus on s'approche de 1, plus la corrélation est parfaite.

Une corrélation négative signifie que quand un paramètre augmente, l'autre diminue. Et plus on s'approche de -1, plus la corrélation est négativement parfaite.
Les Noirs et les Blancs ont une corrélation de -0.83: on est très proche de -1
Ils vivent dans des endroits distincts

A l'inverse les asiatiques et les métis ont une corrélation positive: ils vivent plutôt dans les mêmes endroits

Qui a le plus de chance d'attraper le COVID-19 ?
les noirs sont les plus touchés (en cas détectés et en nombre de décès), puis viennent:
les asiatiques,
les métis,
les hispaniques,
les indiens d'Amérique,
puis les blancs qui sont les moins touchés.

Il n'est pas possible de savoir si la cause est génétique ou sociale, mais elle est très vraisemblement sociale: aux Etats-Unis, les noirs sont plus pauvres et prennent plus souvent les transports en commun.

race.png


Publié le 9 avril 2020:

Nous continuons notre étude d'impact de la météo sur la vitesse de propagation du COVID-19
Nous aurions aimé voir une corrélation entre la vitesse de propagation et la température: mais il n'y en a pas !

Encore un petit graph: ici, sont représentés tous les comtés américains.
en abscisse (l'axe horizontal), la température moyenne du comté sur le mois de mars 2020
En ordonnée (l'axe vertical), l'augmentation du nombre de cas détectés, par 10.000 habitants entre le 19 mars et le 04 avril

comtes.png



Publié le 8 avril 2020:

Quel est l'impact de la météo sur la progression de la pandémie ? Est-ce que les températures plus élevées du mois de mai vont freiner l'épidémie ? De combien ?

Nous pouvons vous livrer les résultats de notre étude sur les 3 242 comtés des Etats-Unis (voir notre article d'hier).

Mauvaise nouvelle: il n'y a pas de corrélation linéaire significative entre la température et la vitesse de progression de l'épidémie.
Les Etats-Unis sont immenses et nous y avons actuellement toutes les températures comprises entre -5°C et +30°C: la température n'a aucun impact important.
Idem pour le taux d'humidité.

Nous avons construit la matrice de corrélation sous forme d'une carte thermique
correlation.png
les coefficients de corrélation entre les paramètres météo et la vitesse d'évolution de l'épidémie y sont non significatifs.

Vous pourriez nous répondre que l'absence de corrélation linéiare ne signifie pas absence de corrélation. Exact, mais il n'y a pas non plus de corrélation tout court.
Ici nous avons représenté les comtés américains selon leur température moyenne sur le mois de mars (axe des abscisses) et le taux multiplicateur de nombre de cas détectés entre le 27 mars et le 4 avril (axe des ordonnées): il n'y a aucune corrélation significative. correlation2.png



Publié le 7 avril 2020:

Quel est l'impact de la météo sur la progression de la pandémie ? Est-ce que les température plus élevées du mois de mai vont freiner l'épidémie ? De combien ? A partir de quelle température ? Est-ce que le taux d'humidité a une influence ?
Nous allons essayer de répondre à ces questions dans les prochains jours

Nous avons récupéré pour chacun des 3 242 comtés des Etats-Unis les données suivantes:
- le nombre d'habitants
- la surface du comté
- la densité de population
- la répartition en classe d'âge
- le taux de personnes diplômées
- l'indice degré de confinement grâce à google mobilité
- la température moyenne sur le mois de mars
- l'humidité moyenne sur le mois de mars
- la pression atmosphérique moyenne sur le mois de mars
- l'évolution de la pandémie (nombre de cas détectés et nombre de décès)

Nous venons de terminer la phase de récupération et de nettoyage des données.
Prochaines étapes: entrainer les algorithmes de Machine Learning sur nos jeux de données. L'objectif est de déterminer quelles sont les variables qui ont un impact sur la pandémie. Nous ferons très attention aux biais éventuels.

Pourquoi avoir choisi d'étudier les données américaines ?
Les Etats-Unis est un pays très divers; avec des comtés à la météo très différentes (dans le Montana ou le Dakota du Nord, il fait 25°C de moins qu'en Floride ou que dans le sud de la Californie, avec des taux d'humidité très différents).

De plus, aux USA, la granularité des données est plus fine qu'en France: aux USA les données sur l'évolution de la pandémie sont accessibles par comté (et il y a 3242 comtés!), alors qu'en France, les données sont uniquement accessibles par département.
En analyse de données, plus la granularité est fine, plus la donnée est détaillée et son analyse précise.

Nos différentes sources de données:
https://www.census.gov/library/publications/2011/compendia/usa-counties-2011.html?fbclid=IwAR298kYur4jeYdw4qmWgU0vfqq1AiOUCeh1t5f06kh2Gh-XJY36WsMV3nM0

https://docs.google.com/spreadsheets/d/1pxuTu10uO7MsBaKA554XSuCpnF--FTqwdnl_sUHfWro/edit?fbclid=IwAR0gfCEBDjKAQbi5ejlTU-tHsfpxdGIbnFZlFF9gTfDNvFYgUkGRmTmFUPU#gid=289496465

https://www.timeanddate.com/weather/@5075315/historic?month=3&year=2020&fbclid=IwAR2kI5HJbghOtpvafcpl9FCE430_nLc_aWQYVjNyWrIPESaFSucU8yA3UXo

https://raw.githubusercontent.com/nytimes/covid-19-data/master/us-counties.csv?fbclid=IwAR3PUqAOnSRnKOrgBgwY3cNH8yQYWP64v7SoPVWvlL_FKFVbwe10rTiEhxw



county.png

Publié le 5 avril 2020:

27.858 personnes sont actuellement hospitalisés dans les hôpitaux en France, à cause du COVID-19

Voici la carte de France au 05 avril.
En noir, nous avons les départements les plus touchés: plus de 5 personnes sur 10.000 y sont actuellement hospitalisées pour cause de COVID-19.

Viennent ensuite les départements en ROUGE (entre 3 et 5 personnes hospitalisées par 10.000 habitants)

Puis viennent les départements en ORANGE (entre 1.5 et 3)

Puis viennent les départements en JAUNE (entre 1 et 1.5)

Et les départements en VERT: moins de 1 personne par 10.000 habitants

Par rapport à notre carte d'il y a 2 jours: la Normandie est de plus en plus touchée. ET la Champagne est sur le point de basculer entièrement en NOIR

Nos sources de données: les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

france0504.png

Publié le 4 avril 2020:

Nous récupérons des données de plusieurs sources:
1°) les données des hôpitaux mise à disposition en Open Data: données françaises et données d'autres pays (européens et américains).
2°) les données de densité de population
3°) les données météo
4°) les données sur l'indice de confinement (voir notre article précédent) calculé par Google

Nous allons entraîner nos algorithmes de maching learning (écrits en Python) sur nos jeux de données.
L'objectif est de comprendre quels sont les paramètres qui ont une influence sur l'évolution de la pandémie: la température joue-t-elle ? quel est l'impact du confinement ?

L'objectif final sera de donner des prévisions d'évolution de la pandémie.


Publié le 4 avril 2020:

Les français respectent le confinement et parmi les différentes régions de France c'est en Ile de France où il est le plus respecté

Google vient de publier les données sur la mobilité dans 131 pays face à la pandémie de coronavirus, des chiffres qui permettent de voir l’impact du confinement sur les déplacements (voir https://www.google.com/covid19/mobility/ ; et merci à Romain de Croix de nous avoir informé de cette source de données qui va nous servir par la suite).

Comme pour détecter les bouchons dans Google Maps, Google collecte des données « agrégées et anonymisées » de ceux qui ont la géolocalisation activée sur leur smartphone. Pour protéger la vie privée des personnes, aucune information personnellement identifiable, comme l’emplacement, les contacts ou les mouvements d’une personne, n’est mise à disposition. Google y ajoute du « bruit » pour brouiller les pistes tout en restant statistiquement proche de la réalité.

Quels déplacements sont analysés ?
Les déplacements vers:
-commerces et loisirs,
-alimentation et pharmacie,
-parcs,
-stations ferroviaires,
-bureaux,
-résidentiel.

Les chiffres présentés sont les variations en pourcentage entre la mi-février et la fin mars, par rapport à une moyenne établie sur cinq semaines précédemment.

La France fait partie des bons élèves, avec une baisse de 88 % des déplacements vers les parcs.
Nous avons également le détail par région....et une fois n'est pas coutume: les plus disciplinés ont été les parisiens !

geolocalisation.png

Publié le 3 avril 2020:

Comparons maintenant la carte de France d'aujourd'hui (3 avril) avec la carte de France d'il y a 3 jours (31 mars).

La contamination venue d'Alsace se propage vers l'Ouest: la Lorraine et la Champagne sont maintenant durement touchées. Le département de la Marne vient de passer en NOIR. Même les Ardennes sont passés du VERT à l'ORANGE
Tous les départements d'Ile de France, excepté la Seine et Marne sont maintenant en NOIR.

Cela avance vers l'Ouest: la Normandie commence à être touchée.
Malheureusement, d'ici 3 jours il n'y aura plus aucun département en VERT au nord de la Loire

Par contre, bonne nouvelle: le sud-ouest résiste bien.

france0304.png mars31.png

Publié le 3 avril 2020:

26.131 personnes sont actuellement hospitalisés dans les hôpitaux en France, à cause du COVID-19:
15.477 hommes et 10.654 femmes

Nos départements sont touchés de manière très diverses. Pour comparer ce qui est comparable, nous avons calculé le nombre de personnes hospitalisées COVID-19 par millier d'habitants.
Le Haut-Rhin, Paris et le Territoire de Belfort sont les 3 départements les plus touchés, par habitant

En noir, nous avons les départements les plus touchés: plus de 5 personnes sur 10.000 y sont actuellement hospitalisées pour cause de COVID-19.
Viennent ensuite les départements en ROUGE (entre 3 et 5 personnes hospitalisées par 10.000 habitants)
Puis viennent les départements en ORANGE (entre 1.5 et 3)
Puis viennent les départements en JAUNE (entre 1 et 1.5)
Et les départements en VERT: moins de 1 personne par 10.000 habitants

Nos sources de données: les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

france0304.png

Publié le 2 avril 2020:

Evolution du nombre de décès liés au COVID-19 par million d'habitants.

Nous avons retiré les pays où les données ne sont pas considérées comme fiables (comme par exemple la Chine)
La méthode de calcul pouvant être différente d'un pays à l'autre, ce qui est important à regarder c'est l'évolution (en effet, d'un jour à l'autre la méthode de comptage ne change pas pour le même pays).
C'est malheureusement en Espagne où l'augmentation est actuellement la plus rapide.
Nos sources de données: Engineering (CSSE) de la Johns Hopkins University

monde0104.png

Publié le 1 avril 2020:

Bonne nouvelle en provenance de l'Italie: dans toutes les régions, le confinement a produit ses effets. Le nombre de personnes qui ont été détectés positifs au COVID-19 augmente de moins en moins vite

Pour comparer les régions italiennes qui sont de tailles différentes, nous avons effectué notre étude par million d'habitants.

La Lombardie est la région la plus touchée. Ce qui est intéressant à observer c'est que le pic de l'épidémie (le moment à partir duquel l'augmentation est de moins en moins rapide) s'est produit au même moment dans toutes les régions italiennes: aux alentours du 25 mars. Sur la courbe, cela correspond aux points où les dérivées secondes s'annulent (ce sont les points d'inflexion)

La France ayant commencé son confinement 10 jours après l'Italie, notre pic de l'épidémie pourrait se situer aux alentours du samedi 4 avril
Nos sources de données brutes: les données récupérées en Open Data auprès des hôpitaux italiens https://www.infodata.ilsole24ore.com/2020/03/14/open-data-la-mappa-della-protezione-civile-sui-dati-del-contagio-coronavirus-italia/

italie0104.png

Publié le 31 mars 2020:

Voici le pourcentage de décès parmi les personnes hospitalisées à cause du COVID-19, à la date du 31 mars 2020.
La moyenne nationale est à 13%.

Nous avons retiré, pour cette comparaison, tous les départements où le nombre d'hospitalisations et le nombre de personnes en réanimation sont inférieurs à un certain seuil.
Nous ne gardons donc que les départements où les nombres sont assez importants pour que les taux calculés soient significatifs

A Marseille, le taux nombre de décès / nombre d'hospitalisation reste stable à 4% !
Le plus bas taux de France !

Pour être sûr de ne pas avoir de biais (peut être qu'à Marseille les gens sont plus facilement hospitalisés, même en cas de non gravité ?) nous avons étudié le rapport taux réanimation / hospitalisation.
Le taux à Marseille y est de 23%, ce qui est exactement la moyenne nationale.
Il n'y a donc, à priori, aucun biais.

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

taux.png

Publié le 31 mars 2020:

20.946 personnes sont actuellement hospitalisés dans les hôpitaux en France, à cause du COVID-19:
12.457 hommes et 8.279 femmes

Nos départements sont touchés de manière très diverses. Pour comparer ce qui est comparable, nous avons calculé le nombre de personnes hospitalisées COVID-19 par millier d'habitants.

Le Haut-Rhin est le département le plus touché avec près de 3 personnes hospitalisées par millier d'habitants
Paris est le 2ème département le plus touché

En noir, nous avons les départements les plus touchés: plus de 5 personnes sur 10.000 y sont actuellement hospitalisées pour cause de COVID-19.
Viennent ensuite les départements en ROUGE (entre 3 et 5 personnes hospitalisées par 10.000 habitants)
Puis viennent les départements en ORANGE (entre 1.5 et 3)
Puis viennent les départements en JAUNE (entre 1 et 1.5)
Et les départements en VERT: moins de 1 personne par 10.000 habitants

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

mars31.png

Publié le 30 mars 2020:

Voici le pourcentage de décès parmi les personnes hospitalisées à cause du COVID-19.
La moyenne nationale est à 13%
Etonnement, ce taux varie beaucoup d'un département à l'autre.
Nous avons retiré, pour cette comparaison, tous les départements où il y a moins de 900 hospitalisations (donc là où le nombre de cas n'est pas assez significatif pour une comparaison).
Dans le Haut-Rhin, 35% des personnes hospitalisées sont décédés ! Malheureusement cela prouve que les hôpitaux de ce département ont été complètement débordés

A Marseille, le taux est seulement à 4% ! Il faut mieux être soigné du Coronavirus à Marseille plutôt qu'ailleurs.
Pour être sûr de ne pas avoir de biais (peut être qu'à Marseille les gens sont plus facilement hospitalisés, même en cas de non gravité ?) nous avons effectué la même étude en comparant le rapport nombre de décès sur nombre de personnes en réanimation: le résultat est identique ! C'est encore à Marseille où le rapport est le plus bas. Il n'y a donc, à priori, aucun biais. Sauf si quelqu'un m'en trouve 1 ?

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

deces.png


Publié le 30 mars 2020:

Evolution nombre de cas COVID-19 aux USA, par état, et par million d'habitants
C'est de loin l'état de New York le plus touché; et c'est là où l'augmentation est la plus rapide.
Bonne nouvelle: l'état de Washington a réussi à contenir l'épidémie. Comment ont-ils fait ? Nous essayerons d'enquêter

USA_30mars.png


Publié le 30 mars 2020:

Quelles données analyser pour étudier l'évolution de la pandémie: le nombre de cas confirmés ? Le nombre d'hospitalisations ? de cas en réanimation ? de décès ?
« Le principal critère à regarder, c’est le nombre de patients qui viennent à l’hôpital pour se faire dépister et qui sont diagnostiqués positifs » insiste Jean-Stephane Dhersin, mathématicien au CNRS et spécialiste de la méthodologie des épidémies.
Analyser le nombre d'hospitalisations ou de décès par département peut en effet, à partir de maintenant, comporter des biais importants: de plus en plus de personnes en réanimation sont transférées d'une région à l'autre
De ce fait, désormais, nous privilégierons l'étude et l'évolution du nombre de cas diagnostiqués positifs




Publié le 29 mars 2020:

ANALYSE DE L'EVOLUTION par département
Nombre de NOUVELLES personnes hospitalisées ces 24 dernières heures, par département, et par millier d'habitants

ATTENTION:
il s'agit ici d'EVOLUTION par rapport à la veille (et NON de cumulé).
Le calcul est effectué par millier d'habitants

Par exemple, la Nièvre avec 209 161 habitants et 12 nouvelles hospitalisations est en NOIR

En noir: les départements où l'EVOLUTION est la plus inquiétante.
Puis viennent les départements en ROUGE
Puis ceux en ORANGE
et enfin les département en VERT

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

departement.png


Publié le 29 mars 2020:

En France nous avons réussi à ralentir très légèrement la progression par rapport à l'Italie: jusqu'à présent nous avions un retard de 9 jours par rapport à l'Italie; nous avons maintenant un retard de 10 jours
Et heureusement, même avec un décalage de 10 jours, nous avons beaucoup moins de décès qu'eux.

Toutefois la situation n'est pas bonne.
Voici les prévisions pour les prochains jours (jusqu'au 7 avril).
Malheureusement, la marge d'erreur est très faible

Source de nos données: https://www.data.gouv.fr/fr/datasets/coronavirus-covid19-evolution-par-pays-et-dans-le-monde-maj-quotidienne/

franceprevisions.png


Publié le 29 mars 2020:

Revenons sur ce que nous avions prévu pour les USA il y a 9 jours (voir notre article du 20 mars, 14:49).
Malheureusement, nous ne nous étions pas trompé.

Il y a beaucoup d'inertie, et autant des prévisions à 1 mois serait très difficile à donner, autant des prévisions à 8 jours peuvent être calculées avec une marge d'erreur assez faible


USAprevisions.png


Publié le 27 mars 2020:

Nombre de personnes en Réanimation dans les hôpitaux des Bourgogne-Franche-Comté, par million d'habitants.

Remarque: les départements étant de tailles différentes, pour comparer ce qui est comparable, il était important d'effectuer les calculs par million d'habitants

La situation va devenir préoccupante pour 2 départements: Territoire de Belfort et la Haute-Saône, où nous sommes en phase d'accélération importante.
A l'inverse, la Nièvre n'est presque pas touchée

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

Bourgogne.png


Publié le 27 mars 2020:

Voici l'évolution du nombre de personnes en Réanimation dans les hôpitaux des Hauts-de-France.
Les départements étant de tailles différentes, pour comparer ce qui est comparable, nous avons fait les calculs par million d'habitants

La situation la plus préoccupante est pour le département de l'Oise.
Les capacités au niveau national sont de 100 lits de réanimation par million d'habitants.
Dans l'Oise, nous en sommes déjà à 80

Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

hautsdefrance.png


Publié le 27 mars 2020:

Nous avons effectué une étude de données sur le nombre de personnes en réanimation actuellement en Ile de France à cause du Coronavirus

La situation nous paraît très préoccupante.

Au niveau national, nous avons à peu près 100 lits de réanimation par million d'habitants.
A Paris aujourd'hui ce nombre de 100 personnes en réanimations par million d'habitants est déjà dépassé.

Et l'augmentation ne faiblit pas
Source de nos données: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

reanimationidf.png


Publié le 27 mars 2020:

La région GRAND EST est très diverse.
Nous avons récupéré les données sur le nombre de personnes en réanimation dans les hôpitaux des 10 départements du Grand Est.

Le département où il y a le plus de monde en réanimation (et où malheureusement la progression est la plus rapide) est le Bas-Rhin

Source de nos données: les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (site https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-de-covid-19/)

reanimationgrandest.png


Publié le 26 mars 2020:

Ce soir il y a 2 endroits préoccupants: la Lorraine et surtout l'Alsace (remarque: pour la région GRAND EST nous sommes revenu aux anciennes régions: Champagne, Lorraine, Alsace; car la région est très diverse et la Champagne est assez peu touchée).

Nous sommes toujours dans la phase d'accélération. Nous attendons les points d'inflexion qui correspondront au début de l'essoufflement de la progression. Nous n'y sommes pas encore

france2503.png


Publié le 26 mars 2020:

Le point d'inflexion a été atteint en ITALIE pour toutes les régions ! On l'attendait avec impatience; il est là !

Le point d'inflexion est le point où, dans la courbe, la dérivée seconde change de signe. En d'autres termes, finie la période où l'augmentation du nombre de cas accélérait. Nous entrons dans une période où il y a toujours augmentation, mais elle perd en intensité.

L'Italie ne voit pas encore le bout du tunnel, mais elle vient de dépasser la moitié du tunnel !!!! C'est une bonne nouvelle


italie2503.png


Publié le 25 mars 2020:

Comparons maintenant les prévisions que nous donnions il y a maintenant 7 jours (voir notre article du jeudi 19 mars 2020, à 19h51) avec ce qu'il y a réellement eu.
Le réel (en orange) est légèrement en dessous de nos prévisions initiales (en bleu): c'est une bonne nouvelle !


previsions.png


Publié le 25 mars 2020:

La région Grand Est est la région de France la plus touchée par le Coronavirus.
Mais la région est vaste et diverse.

Alors que la situation est inquiétante en Alsace, la Champagne-Ardenne est relativement peu touchée: elle est, par habitant, légèrement en dessous de la moyenne nationale.

Source de nos données brutes: Les données hospitalières quotidiennes relatives à l'épidémie du COVID-19 par département (site https://www.data.gouv.fr/fr/datasets/donnees-relatives-a-lepidemie-du-covid-19/)



grandest.png


Publié le 25 mars 2020:

Est-il utile d'étudier l'évolution du nombre de cas détectés s'il ne représente que le haut de l'iceberg (la majorité des malades n'étant pas détectés)

La réponse est: OUI (mais avec prudence).
Car c'est une évolution que nous étudions: les accélérations, les stagnations, les points d'inflexion. Si la partie émergée de l'iceberg double en 24 heures, c'est que l'Iceberg dans sa globalité a doublé en 24 heures
Peu importe si la partie émergée de l'iceberg représente 5% ou 50% de la totalité de l'iceberg

Les comparaisons entre pays doivent tout de même être effectuées avec précaution. Nous essayons de faire attention aux biais, mais malheureusement nous n'avons pas le choix: il y aura des biais.
Il y a aura moins de biais dans la comparaison des différentes régions d'un même pays (si naturellement le comptage s'effectue de la même façon dans toutes les régions du pays étudié)



iceberg.png


Publié le 25 mars 2020:

La situation aux ETATS-UNIS est complètement différente d'un état à l'autre.

Avec 1.300 cas détectés par million d'habitants c'est à New York que la situation est de loin la plus préoccupante.
Dans les autres états, l'épidémie progresse très lentement.
Dans l'état de Washington (qui était le premier état avec de nombreux cas), la progression est très faible.

Pourquoi de telles différences d'évolution d'un état à l'autre ?
Est-ce dû aux températures, à l'humidité, à la densité de population, à la culture des populations ?
La question est très importante. La réponse ne sera pas simple à donner.
Nous avons beaucoup de données et nous allons entraîner nos algorithmes sur nos jeux de données.
L'objectif final est d'essayer d'effectuer des prévisions d'évolution de l'épidémie



USA_state_2403.png



Publié le 24 mars 2020 à 22h10

Comparons maintenant nos régions françaises avec la Lombardie (Italie) et la région de Wuhan (Chine).

L'épidémie s'est essoufflée à 3.600 cas déclarés par million d'habitants dans la région de Wuhan.
La Lombardie approche des 3.600 cas qu'elle devrait atteindre dans 2 jours. Que va-t-il alors se passer ? L'épidémie va-t-elle alors s'essouffler dans cette région ? La Lombardie va-t-elle connaitre la même évolution que la Chine ? Espérons !!! Réponse dans les 3 jours qui viennent.

Les régions françaises sont beaucoup moins touchées. La 1ère région française (le Grand EST) n'a que 800 cas déclarés par millions d'habitants
Et la bonne nouvelle c'est que la progression s'y fait beaucoup plus lentement que ce qu'avaient connu la Lombardie ou Wuhan



compraraison24.png


Publié le 24 mars 2020 à 22h00

La situation est vraiment contrastée en France ce soir.

Il y a une région où la situation est très préoccupante: c'est le Grand EST.
Cette région arrive en tête en nombre de cas déclarés positifs, par million d'habitant (nous approchons des 1.000 cas par million d'habitants). De plus, il y a une accélération de l'augmentation.
Dans les autres régions, on a plutôt de bonnes nouvelles: il n'y aucune accélération de l'augmentation. Est-ce les 1ers effets du confinement ? Cela reste à confirmer: les prochains jours seront décisifs.
Nous avons ajouté la Belgique à notre graphique.



france_compraraison24.png


Publié le 23 mars 2020 à 22h00

Nous avons voulu comparer l'évolution de l'épidémie du Coronavirus dans les différentes régions françaises avec celle de la province de Wuhan (la région de Chine qui a été la plus touchée) et la Lombardie (la région italienne la plus touchée).

Dans la région de Wuhan (région qui avait été mise en quarantaine), l'épidémie s'est essoufflée quand les 3.600 cas détectés par million d'habitants ont été atteints

En Lombardie, nous nous approchons des 3.000 cas détectés par million d'habitants. La progression y a été beaucoup plus rapide qu'en France. Ce qui est inquiétant c'est que le nombre de cas y augmente toujours très vite malgré le fait que cette région est en confinement depuis déjà 14 jours.
En Lombardie, va-t-on plafonner à 3.600 cas par million d'habitants comme à Wuhan ?
Aura-t-on la même évolution en France ?

Pour la 1ère fois, dans les prochains jours, nous essayerons de vous proposer des prévisions long terme sur ce qu'il pourrait se passer en France dans les prochaines semaines



france_compraraison.png


Publié le 23 mars 2020 à 20h00

Courage au Grand Est. C'est dans cette région que l'accélération est la plus importante



france_2303.png


Publié le 23 mars 2020 à 18h00

L'augmentation du nombre de cas de Coronavirus aux USA est très rapide.
Toutefois, quand on analyse la situation Etat par Etat, on s'aperçoit que seul l'Etat de New York est véritablement touché.
L'évolution dans l'Etat de Washington est peu rapide.

Et dans les autres Etats, le nombre de cas détectés par million d'habitant est moindre et l'évolution est également peu rapide.

Remarque: certains Etats étant plus peuplés que d'autres, pour comparer ce qui est comparable, nous donnons le nombre de cas par million d'habitants.



USA_state_2303.png


Publié le 23 mars 2020 à 17h00

Est-il utile d'étudier l'évolution du nombre de cas détectés s'il ne représente que le haut de l'iceberg (la majorité des malades n'étant pas détectés)

La réponse est: OUI
Car c'est une évolution que nous étudions. Si la partie émergée de l'iceberg grossit, c'est que l'Iceberg dans sa globalité est plus gros.
Nous supposons ici que le rapport Nombre de cas détectés sur nombre de cas non détectés reste constant au cours du temps.

Pourquoi ne pas nous contenter d'étudier le nombre de décès et son évolution ?
Car les décès (quand il y a un décès) proviennent en moyenne 10 à 16 jours après la détection.
N'étudier que les décès c'est avoir du retard et ne pas pouvoir prévoir à l'avance le pic de l'épidémie.


iceberg.png


Publié le 22 mars 2020 à 22h00

Evolution en ITALIE, par province

Certaines régions étant plus peuplées que d'autres, pour comparer ce qui est comparable, nous donnons le nombre de cas par million d'habitants.

La Lombardie était jusqu'à présent la région la plus touchée.
Mais les cas explosent maintenant dans la Vallée d'Aoste. Nous y avons maintenant 3.000 cas détectés par million d'habitant

Pour comparaison, les régions françaises les plus touchées sont à 600 cas pour 1 million d'habitants

Nous sommes donc toujours en phase d'accélération en Italie

Source de nos données brutes: https://raw.githubusercontent.com/pcm-dpc/COVID-19/master/dati-province/dpc-covid19-ita-province.csv

italie_province.png

Publié le 22 mars 2020 à 18h00

Voici l'évolution du nombre de cas détectés par région.

Certaines régions étant plus peuplées que d'autres, pour comparer ce qui est comparable, nous donnons le nombre de cas par million d'habitants.

C'est le Grand Est et la Corse qui sont les plus touchés; suivis par l'Ile de France et la Bourgogne-Franche-Comté.

C'est en Ile de France où l'augmentation est actuellement la plus importante

region.png

Publié le 20 mars 2020 à 16h00

Un exemple intéressant est l'évolution de l'épidémie en Corée du Sud: en quelques jours, la progression s'est ralenti puis le nombre de cas a baissé

L’utilisation des données personnelles pour suivre les malades
Les personnes en quarantaine sont contactées deux fois par jour pour suivre leur état. De plus, le gouvernement suit à la trace les infectés par leur téléphone et leur carte bancaire et informe les personnes alentour de la présence d'un malade.
À Taïwan, les personnes revenant d'une zone contaminée sont confinées à la maison et leurs déplacements sont suivis via leur smartphone pour s'assurer qu'elles ne quittent pas leur domicile.

Des mesures intrusives qu'on imagine difficilement applicables en France.

Les courbes d'évolution de chaque pays vont nous indiquer quelle population est disciplinée et quelle population ne l'est pas.

coreedusud2003.png


Publié le 20 mars 2020 à 14h00

C'est aux Etats-Unis que la situation sera la plus dramatique. L'accélération y est plus importante que partout ailleurs.
Malheureusement, il y aura plus de 100.000 cas détectés avant la fin du mois de mars et plus de 1.500 morts aux USA.

Comment faisons nous nos études:
1) certains pays sont en avance (comme l'Italie) sur les autres et nous apportent donc beaucoup d'informations.
2) nous étudions les points d'inflexion, l'accélération (la dérivée seconde), ainsi que l'accélération de l'accélération (dérivée tierce)
Il y a beaucoup d'inertie. De ce fait les prévisions jusqu'à 8 jours sont assez justes; et les mesures de confinement n'ont pas d'impact à très court terme
Nos sources de données brutes: Johns Hopkins University CSSE

usa2003.png


Publié le 19 mars 2020 à 20h00

Avec 10.995 cas détectés en France depuis le début de l'épidémie, en date du 19 mars, nous sommes malheureusement toujours en phase d'accélération.
Pour l'instant le confinement n'a eu aucun impact dans l'évolution; mais c'est normal car nous n'en sommes qu'au début
Nous devrions dépasser les 35.000 cas dans 8 jours en France

france_1903.png


Publié le 18 mars 2020 à 23h00

Avec 475 décès supplémentaire en Italie sur la seule journée d'aujourd'hui, l'accélèration (qui s'était arrêtée pendant 3 jours; voir article d'hier) reprend.
Nous guettons tout signe de retournement de tendance; malheureusement aucun signe pour le moment

L'Italie est en confinement depuis 7 jours.
italie_deces_1803


La situation n'est pas bonne ce soir en France. Et les prévisions ne sont pas réjouissantes.
9134 cas détectés en France depuis le début de l'épidémie. Et malheureusement cela continue à s'accélérer

Nous suivons l'Italie avec 8 jours de retard (nous progression tout de même légèrement moins vite qu'eux il y a 8 jours).

Malheureusement le mauvais film catastrophe continue: nous passerons les 20.000 cas à la fin de la semaine; et les 30.000 cas au cours de la semaine prochaine
france_1803




Publié le 18 mars 2020 à 11h00

Evolution cas détectés Coronavirus:
La France est en décalage de 8 jours par rapport à l'Italie
Les USA sont en décalage de 10 jours par rapport à l'Italie

Mais là où l'évolution française en nombre de cas est moins dramatique que celle qu'à connue l'Italie (voir articles précédents), aux USA c'est l'inverse: c'est pire.
Tous les 4 jours, le nombre de cas détectés est multiplié par 3. Cette accélération est constante.
Et malheureusement, le gouverrnement américain n'a pas l'air de vouloir prendre des mesures de confinement: les étudiants continuent à fêter Spring Break
usa_1803




Publié le 17 mars 2020 à 22h30

L'évolution du nombre de cas détectés en France est plutôt encourageante ce soir.

Jusqu'à présent, la courbe française en nombre de cas détectés suivait exactement la courbe italienne avec 8 jours de décalage.
Bonne nouvelle, ce n'est plus le cas. En France, nous progressons désormais moins vite que l'Italie d'il y a 8 jours

Ci-dessous la courbe italienne (les données réelles)
et la courbe française avec les prévisions pour les prochains jours.
En France, nous sommes toujours dans la phase d'accélération; mais la dérivée seconde (l'accélération) pourrait tomber à 0 avant la fin de la semaine
italie_1703 france_1703


Publié le 17 mars 2020 à 22h00

Enfin quelques bonnes nouvelles en provenance d'Italie: le nombre de décès y augmente toujours;
mais il n'y a plus d'accélération (la dérivée seconde est à 0).
La vitesse reste constante depuis 3 jours: 345 décès supplémentaires par jour.

Les prochains jours seront décisifs.
italie_1703_deces


Publié le 16 mars 2020 à 22h00

Voici les dernières prévisions pour les prochains jours.
Jusqu'au 16 mars ce sont des données réelles.
A partir du 17 mars, ce sont des prévisions.
casfrance1603202002


Publié le 16 mars 2020 à 14h30

Le Royaume-Uni se distingue du reste du monde: le gouvernement britannique a fait le choix d'autoriser les activités quotidiennes ainsi que tous les rassemblements publics.
C'est une très mauvaise chose pour la population britannique, mais une bonne chose pour tout ceux qui vont analyser les données.
En effet, nous allons pouvoir calculer l'impact des mesures de confinement en France en comparant l'évolution de l'épidémie en France avec celle du Royaume-Uni.



Publié le 16 mars 2020 à 10h30

Nous avons recupérés les données brutes de l'Université Johns Hopkins, plus précisément le Center for systems science and engineering (CSSE): toutes les données sur le nombre et l'évolution du nombre de cas détectés et de décès liés à l'épidémie de Coronavirus.
Nous donnerons des prévisions tous les matins.
Nous sommes toujours en phase d'accélération. Le nombre de cas annoncé ce soir pour la France devrait être compris entre 6.700 et 7000. Demain soir, on devrait nous annoncer aux alentours de 8.500 cas détectés.
Tous les jours nous étudions l'évolution du nombre de cas détectés en France: nous étudions les points d'inflexion, l'accélération de l'augmentation (la dérivé seconde). La courbe donne beaucoup d'indication: les données du passé nous donne des indications sur ce qu'il va se passer dans le futur.
De plus, les évolutions italienne et de Chine nous permettent de nous aider à prévoir l'évolution française.

Voici les prévisions pour la France pour les prochains jours (jusqu'au 15 mars ce sont des données réelles; à partir du 16 mars ce sont des prévisions)

casfrance16032020




N'hésitez pas à venir discuter avec nous sur notre page facebook:


ou sur notre compte Twitter "Algorithmes contre Coronavirus"