MEAPS

Distribution statistique des trajets entre le domicile et le travail

Séminaire lunch de l’OFCE

lundi 13 mars 2023

Pourquoi MEAPS ?

Pourquoi MEAPS ?

Modèle Ergodique à Absorption, Priorité et Saturation

Simulations Synthétiques

Estimations

Conclusions

Le modèle à 4 étapes


Dans la modélisation des flux de personnes, par exemple, le modèle à 4 étapes est généralement utilisé.


  • étape 1 : nombre de trajets en partance des lieux de résidence, nombre de trajets arrivants


  • étape 2 : distribution entre chaque paire des trajets partant ou arrivant


  • étape 3 : choix modal


  • étape 4 : caractéristiques des trajets



Nous nous intéressons ici surtout à l’étape 2.

Le modèle gravitaire


Un modèle couramment utilisé est le modèle gravitaire

\[ T_{i,j} = \frac {N_{hab, i}\times N_{emp, j}} {f(d_{i,j})} \]

avec

\[ f=e^{d/\delta} \]


Mais le modèle gravitaire « écrase » l’information proprement spatiale et marche surtout « de loin ».


Il donne la même valeur à la distance quelque soit la densité du milieu traversé. Or, quand on est isolé, on accepte des distances plus grandes.

Gravitaire versus radiatif


On propose d’utiliser une autre analogie : le modèle radiatif de (Simini et al. 2012) ou des « opportunités intervenantes » de (Stouffer 1940)


Dans cette analogie, au lieu d’avoir des masses qui s’attirent (A et B), le trajet entre A et B est influencé par les Cs que l’on rencontre en chemin.


Analogie physique : une particule est émise d’un point. Elle parcourt l’espace jusqu’à rencontrer des sites d’absorption. A chaque site d’absorption elle peut être absorbée (probabilité \(p\)) ou continuer (probabilité \(1-p\)).


Mais un milieu linéarisé : au lieu d’une particule partant dans une direction quelconque, on classe sur une droite tous les sites d’absorption en fonction de leur distance. Ils seront rencontrés dans cet ordre. Ceci permet de représenter l’influence de la distance, puisque ce qui est près compte plus que ce qui est loin.

Plan de la présentation


Nous proposons un Modèle Ergodique à Absorption, Priorité et Saturation (/mi:ps/)

  1. Le modèle théorique

    1. Version simple

    2. Priorité et saturation

    3. Ergodicité

    4. Algorithme

  2. Simulations synthétiques pour en étudier les propriétés

    1. une application Shiny
  3. Estimations à partir de MOBPRO à La Rochelle

    1. données

    2. \(R^2_{KL}\) et quelques autres éléments

    3. Apprentissage (ou estimation non paramétrique)

    4. Estimations paramétriques

  4. Conclusions

Modèle Ergodique à Absorption, Priorité et Saturation

Pourquoi MEAPS ?

Modèle Ergodique à Absorption, Priorité et Saturation

Simulations Synthétiques

Estimations

Conclusions

Absorption


Pour chaque individu, les emplois sont classés dans l’ordre des distances, chaque emploi a un rang \(r_i(j)\) et une probabilité d’absorption uniforme \(p_a\). La probabilité de dépasser au moins \(j\) s’écrit :

\[ \bar F(j)=(1-p_a)^{r_i(j)} \]


On peut définir une fuite, c’est-à-dire la probabilité de ne pas s’arrêter dans le périmètre d’étude (fini)

\[ p_a = 1-(p_f)^{1/J} \]


La probabilité de s’arrêter en \(j\) peut alors s’écrire :

\[ P_i(j) = (1-p_a)^{r_i(j)-1} \times p_a = {p_f}^{\frac {r_i(j)-1} {J}} \times (1-{p_f}^{1/J}) \]


et ne dépend que des paramètres globaux, la fuite et le nombre d’emplois.

Accessibilité


On définit l’accessibilité \(s_i(d)=\sum _{j/d_{i,j}<d}1\)


On a au premier ordre (\(k\) est le nombre d’emploi en \(c_d\), \(\mu=\frac{-log(p_f)}{J})\) :

\[ P_i(i\in c_d) \approx k\times \mu \times e^{-\mu \times s_i(d)} \]


et donc :

\[ T^{meaps}_{i,j} = \mu \times N_{hab, i}\times N_{emp, j} \times e^{-\mu \times s_i(d)} \]


Si la densité des opportunités (les emplois) est uniforme, on peut calculer \(s_i(d)=r^2/\rho^2\) et (re)trouver une forme « gravitaire » qui dépend de la distance.

\[ T^{meaps}_{i,j} = \mu \times \frac {N_{hab, i}\times N_{emp, j}} { e^{d^2/\rho^2}} \]

Saturation & priorité



L’absorption définit une « demande » qu’il faut confronter à des disponibilités. En l’absence d’un prix nous proposons :


  • une capacité finie de chaque site


  • un remplissage progressif


  • lorsque le site est saturé, il est indisponible pour les suivants


  • ce qui fonctionne pour un ordre de priorité

Ergodicité


En notant \(\phi_u(i,j)\) la probabilité de disponibilité (\(\phi\) vaut 0 si l’emploi est complètement pris)

\[ P_{u, i}(j) = \lambda_{u,i}.\phi_u(i,j). p_a \prod_{l=1}^{r_i^{-1}(j)-1}(1-\lambda_{u,i}. \phi_u(i,r^{-1}(l)).p_a) \]

\[ \prod_{j=i} ^{J} (1-\lambda_{u,i} \times \phi_u(i,j) \times p_{a})= p_f \]


Pour ne pas dépendre d’un ordre particulier, nous faisons la moyenne sur tous les ordres possibles. Aucun résident n’est privilégié, la moyenne sur tous les ordres possibles donne une solution acceptable.

Il y a \(I!\) ordres possibles ce qui est impossible à traiter.

On prend donc un (petit) échantillon de ces ordres et on conjecture l’ergodicité du modèle : un faible nombre de tirages permettra d’atteindre la moyenne sur tous les ordres.

Intuitivement, chaque individu est localisé aléatoirement, la saturation dépend surtout de la coïncidence d’individus proches d’une opportunité et qui sont donc les premiers servis. Cette coïncidence est rare et donc quelques tirages conduisent à un résultat proche de tous les tirages.

Quelques aspects informatiques


Le modèle n’admet pas de solution fermée. La simulation est incontournable, notamment pour prendre en compte les données riches géographiques (réseaux de transport, localisation des emplois, des individus).


L’algorithme a été implémenté en C++ en utilisant la parallélisation pour le Monte-Carlo avec OpenMP. Avec les optimisations que nous avons réussi à implémenter, pour un problème de la taille de La Rochelle, il faut 20s pour une simulation sur 256 tirages avec 4 threads.


Le code est dans le package R {rmeaps}


github.com/maxime2506/rmeaps

Simulations Synthétiques

Pourquoi MEAPS ?

Modèle Ergodique à Absorption, Priorité et Saturation

Simulations Synthétiques

Estimations

Conclusions

Simulations synthétiques

On génère une distribution aléatoire, avec une répartition spatiale des individus, des emplois, des distances et des rangs. On peut simuler le modèle et l’agréger à une maille choisie.

On peut analyser l’ergodicité ou définir une tension et plein d’autres choses.

Une application interactive

Estimations

Pourquoi MEAPS ?

Modèle Ergodique à Absorption, Priorité et Saturation

Simulations Synthétiques

Estimations

Conclusions

Données à La Rochelle


  • INSEE (2022), fichier détail du recensement. Donne pour chaque commune de résidence, la commune principale d’activité de chaque résident. On interprète ça comme un flux. 72 communes de résidence, 210 communes d’emploi.

  • localisation des résidents au carreau 200m (données carroyées de l’INSEE) (5475 carreaux de résidence)

  • localisation des emplois au carreau 200m (MOBPRO+fichiers fonciers en localisant en fonction des surfaces d’activité par 5 NAF, à proportion des surfaces de chaque commune) (6236 carreaux d’emplois)