Analyse de l’inflation: Une étude exhaustive de trois séries de l’IPC à l’aide du code R

Dans une réalisation exceptionnelle, Ruthvik, un élève de douzième année au DPSBN (Delhi Public School Bangalore North), a réalisé l’exploit remarquable de voir son document de recherche en économie publié dans le prestigieux Journal « Exploratio » aux États-Unis.

 

Sous la direction experte d’un éminent professeur du MIT, Ruthvik a exploité la puissance des techniques de modélisation de séries chronologiques en utilisant le langage de programmation R pour approfondir les complexités des données de séries chronologiques économiques, en se concentrant particulièrement sur les indices des prix à la consommation (IPC), notamment CPIAUCSL, CPILFENS, et CPILFESL. Avec un dévouement sans faille, il a méticuleusement appliqué une approche analytique cohérente à toutes les séries CP, facilitant une comparaison robuste de la précision des prévisions des modèles simples et ARIMA. Les mesures d’évaluation, notamment l’erreur absolue moyenne (MAE) et l’erreur quadratique moyenne (RMSE), ont été habilement utilisées pour évaluer les performances du modèle. Les recherches de Ruthvik ne sont pas seulement un témoignage de ses prouesses scientifiques, mais aussi une source d’inspiration pour les étudiants et les universitaires. Son travail révolutionnaire fait progresser considérablement le domaine de l’analyse et des prévisions économiques. Ce qui justifie le relai ici de la publication Abstrait.

Les séries chronologiques économiques sont considérées comme les baromètres économiques de la santé d’une économie. Ils fournissent des informations sur la performance et la stabilité des principaux indicateurs économiques, tels que l’inflation. Par conséquent, il est sage d’essayer de prévoir ces variables.

Dans cet article, nous mettons en œuvre des techniques de modélisation de séries temporelles à l’aide du langage de programmation R pour analyser les séries temporelles économiques liées à l’inflation et aux taux d’intérêt. Plus précisément, nous appliquons des modèles simples et ARIMA pour prévoir l’indice des prix à la consommation (IPC).

Pour cibler notre analyse, nous appliquerons notre méthode d’analyse à une série de l’IPC, puis utiliserons la même méthode pour les autres séries de l’IPC. Cela nous permettra de comparer l’exactitude de nos modèles dans différentes séries de l’IPC et d’identifier des modèles ou des tendances dans les données.

L’objectif de cette analyse est de comparer la précision des modèles simples et ARIMA pour la prévision de l’IPC. Nous utiliserons des mesures d’évaluation telles que l’erreur absolue moyenne (EMA) et l’erreur quadratique moyenne (RMSE) pour comparer les performances des deux modèles. Notre analyse permettra de déterminer quelle technique de modélisation est la mieux adaptée à la prévision de ces variables économiques.

 

  1. Séries chronologiques historiques de l’inflation aux États-Unis

1.1 Vue d’ensemble des séries

Notre recherche analyse les séries chronologiques sur les prix à la consommation aux États-Unis maintenues par la Réserve fédérale de St. Louis. Plus précisément, nous analysons trois séries :

  • Indice des prix à la consommation pour tous les consommateurs urbains : tous les articles de la moyenne urbaine des États-Unis (CPIAUCSL)
  • Indice des prix à la consommation pour l’ensemble des consommateurs urbains : tous les articles moins les aliments et l’énergie dans la moyenne des villes américaines (CPILFESL)
  • Indice des prix à la consommation pour l’ensemble des consommateurs urbains : tous les articles moins la nourriture et l’énergie dans la moyenne urbaine des États-Unis (CPILFENS)

Le CPILFENS et le CPIFESL sont tous deux des séries de l’IPC produites par le BLS, mais ils diffèrent en termes de couverture géographique, d’étendue de la couverture et de méthodologie. De plus, le CPILFESL est désaisonnalisé et le CPILFENS ne l’est pas. Il s’agit de séries chronologiques mensuelles allant de janvier 2011 à novembre 2022. La section suivante fournit une description des quatre séries.

 

1.2 Descriptions des séries

Référence : https://fred.stlouisfed.org/

 

1.2.1 Description de la CPIAUCSL

 

Source : U.S. Bureau of Labor Statistics

Unités :Indice 1982-1984=100, Fréquence corrigée des variations saisonnières : Mensuelle

CPIAUCSL est l’abréviation de Consumer Price Index for All Urban Consumers : All Items. Il s’agit d’une mesure de la variation moyenne dans le temps des prix payés par les consommateurs urbains pour un panier de biens et de services, y compris la nourriture, le logement, les vêtements, le transport et les soins médicaux, entre autres. Le CPIAUCSL est produit par le Bureau of Labor Statistics des États-Unis et est utilisé comme indicateur de l’inflation dans l’économie américaine.

1.32 Description du CPILFESL

Source : Communiqué du Bureau of Labor Statistics des États-Unis : Indice des prix à la consommation

Unités : Indice 1982-1984=100, Fréquence désaisonnalisée : Mensuelle

CPILFESL est l’abréviation de Consumer Price Index for All Urban Consumers : All Items Less Food and Energy (indice des prix à la consommation pour tous les consommateurs urbains : tous les articles moins de nourriture et d’énergie). Il s’agit d’une mesure de l’évolution moyenne dans le temps des prix payés par les consommateurs urbains pour un panier de biens et services, à l’exclusion des prix de l’alimentation et de l’énergie. Cette mesure est utilisée pour évaluer la tendance sous-jacente de l’inflation dans l’économie américaine, car les prix des denrées alimentaires et de l’énergie peuvent être très volatils et sujets à des changements saisonniers qui peuvent obscurcir la tendance globale de l’inflation. Le CPIFESL se concentre sur une gamme étroite de biens et de services, y compris l’alimentation, le logement, l’habillement et le transport.

 

1.35 Description des CPILFENS

Source : Communiqué du Bureau of Labor Statistics des États-Unis : Indice des prix à la consommation

Unités : Indice 1982-1984=100, non désaisonnalisé Fréquence : Mensuel

L’indice des prix à la consommation pour tous les consommateurs urbains : tous les articles moins l’alimentation et l’énergie est un agrégat des prix payés par les consommateurs urbains pour un panier type de biens, à l’exclusion de l’alimentation et de l’énergie. Cette mesure, connue sous le nom d’« IPC de base », est largement utilisée par les économistes parce que les prix de l’alimentation et de l’énergie sont très volatils. CPILFENS couvre un large éventail de biens et de services, y compris l’alimentation, le logement, l’habillement, le transport et les soins médicaux.

 

1.4 Extraire la liste des symboles

Pour mener notre analyse, nous avons utilisé un objet de série chronologique R nommé « economic_data2 ». Cette série chronologique trimestrielle s’étend du 2011-01-01 au 2022-11-30 et contient plusieurs colonnes représentant les trois séries de l’indice des prix à la consommation (IPC) : CPILFENS (indice des prix à la consommation pour tous les consommateurs urbains : tous les articles moins les aliments et l’énergie), CPIAUCSL (indice des prix à la consommation pour tous les consommateurs urbains : tous les articles) et CPILFESL (indice des prix à la consommation pour tous les consommateurs urbains : tous les articles moins les aliments et l’énergie). Les objets R ont été créés en important des données directement à partir des données économiques de la Réserve fédérale (https : //fred.stlouisfed.org/).

Nous pouvons extraire les séries chronologiques individuelles de economic-data2 à l’aide du code suivant list_symbols <- unique (economic_data2$symbol)

 

  1. Méthodologie

Dans ce document de recherche, nous avons étudié les propriétés des séries chronologiques de 3 séries d’IPC : CPILFENS, CPIAUCSL et CPILFESL.

Notre approche a été guidée par les principes énoncés dans le livre « Forecasting : Principles and Practice » de Rob J. Hyndman et George Athanasopoulos (Hyndman et Athanasopoulos, 2018). Pour effectuer l’analyse des données et la modélisation, nous avons utilisé la fonctionnalité fournie par le package « fpp2 » dans R. En appliquant les méthodologies décrites dans le livre de Hyndman et en mettant en œuvre le paquet « fpp2 », nous avons été en mesure de mener une analyse rigoureuse et robuste des séries chronologiques sur les données économiques.

Pour mener à bien notre étude, nous avons d’abord effectué une série d’analyses exploratoires de données en observant visuellement les diagrammes de séries chronologiques et leurs graphiques saisonniers, ainsi que la fonction d’autocorrélation (ACF). Par la suite, nous avons utilisé des modèles simples, à savoir naïfs et dérivants, pour prévoir les données. Après une enquête plus approfondie, nous avons constaté que nous pouvons rejeter l’hypothèse nulle selon laquelle les séries chronologiques sont stationnaires pour les trois séries, ce qui signifie que leurs propriétés statistiques changent au fil du temps. Pour transformer les données en séries temporelles stationnaires, nous avons appliqué la première et la deuxième différenciation. Ensuite, nous avons appliqué la fonction auto.arima du package de prévisions dans R pour trouver le modèle le mieux adapté à chaque variable. Pour CPIAUCSL, le meilleur modèle est ARIMA(0,1,1) avec dérive, ce qui indique que la variable est influencée par sa propre valeur décalée et qu’elle a une tendance linéaire dans le temps. Pour CPILFENS, le meilleur modèle s’avère être ARIMA(2,1,0) avec dérive, ce qui indique que la variable est influencée par ses deux propres valeurs décalées et a une tendance linéaire dans le temps. Pour CPILFESL, le meilleur modèle est ARIMA(1,2,1), ce qui indique que la variable est influencée par sa propre valeur décalée, qu’elle a une tendance quadratique au fil du temps et qu’elle est affectée par une moyenne mobile décalée d’ordre un.

Nous avons ensuite appliqué l’erreur quadratique moyenne (RMSE), l’erreur absolue moyenne (MAE) et l’erreur absolue moyenne en pourcentage (MAPE). Les résultats nous ont montré que les modèles ARIMA fournissent des prévisions pour les trois variables avec des mesures d’erreur relativement faibles.

Dans la section suivante, nous nous pencherons sur les analyses détaillées des trois séries chronologiques économiques, à savoir CPIAUCSL, CPILFENS et CPILFESL. Cette section fournit un aperçu complet des méthodologies et du code R utilisés pour générer les résultats. En incluant le code R, nous visons à permettre à nos lecteurs de reproduire les analyses présentées dans cet article ou de les appliquer à d’autres données de séries chronologiques. Nous fournissons une ressource pratique pour tous ceux qui souhaitent explorer davantage nos méthodologies ou étendre les analyses à différents ensembles de données de séries chronologiques.

Grâce à cet examen détaillé des analyses et à l’inclusion du code R, nous espérons que les connaissances acquises dans le cadre de nos recherches pourront être facilement appliquées et exploitées par l’ensemble de la communauté.

  1. Analyse de l’indice des prix à la consommation pour l’ensemble des consommateurs urbains : tous les articles moins l’alimentation et l’énergie dans la moyenne des villes américaines (CPILFESL)

3.1 Extraire la série chronologique et tracer le graphique chronologique, le graphique saisonnier et la fonction d’auto-corrélation

Tout d’abord, extrayez la série et créez un objet ts :

symbol1<- list_symbols[2]

data.symbol1<- filter(economic_data2, symbol==symbol1)

symbol1.ts<- ts(data.symbol1$price, frequency=12, start=c(2011,1))

Tracé temporel

autoplot(log((symbol1.ts)))+

  ggtitle(« Time Plot »)

En examinant les données, nous avons fait plusieurs observations sur les tendances du CPILFESL :

Tout d’abord, nous avons noté que le CPILFESL a chuté en 2020. Cela indique une baisse de l’inflation, car une baisse de l’IPC suggère que les prix des biens et des services diminuent.

Deuxièmement, nous avons observé une augmentation considérable du CPILFESL au cours des années 2021 et 2022. Cela indique une augmentation de l’inflation, car l’IPC augmente.

Troisièmement, nous avons remarqué qu’avant l’année 2020, l’indice augmentait à un rythme linéaire constant. Cela suggère un taux d’inflation relativement stable au cours de cette période, les prix des biens et des services augmentant à un rythme soutenu.

Enfin, nous avons observé qu’après 2020, l’indice a augmenté à un rythme beaucoup plus rapide. Cela indique une augmentation soudaine de l’inflation au cours de cette période, qui pourrait être due à divers facteurs tels que des changements dans l’offre et la demande, des changements dans les politiques gouvernementales ou d’autres facteurs externes.

L’objectif principal de la prédiction de l’indice est d’évaluer la sensibilité de nos modèles de prévision à l’utilisation de données antérieures à l’année 2020. Fondamentalement, nous voulons comprendre comment l’exactitude et la fiabilité de nos prédictions sont affectées par l’inclusion de données à partir de 2020 et avant.

autoplot(window(symbol1.ts,start=c(2019,1)))+

  ggtitle(« Time Plot ») +

  ylab(« CPILFESL »)+

  xlab(« Time »)

Graphique de l’heure saisonnière :

Un graphique saisonnier est une représentation graphique d’une série chronologique qui fournit des informations sur ses modèles saisonniers. Il permet d’identifier les modèles ou cycles répétitifs dans les données qui se produisent sur des intervalles de temps fixes, tels que des modèles quotidiens, mensuels ou annuels.

Nous utilisons le code R suivant pour tracer le graphique saisonnier

ggseasonplot(symbol1.ts, polar= TRUE)+

  ylab(« CPILFESL »)+

ggtitle(« Seasonal Plot: CPILFESL »)

La parcelle saisonnière est mise en œuvre par le package « fpp2 ». Il s’agit d’une technique unique en son genre de visualisation de données qui représente les valeurs de séries chronologiques en coordonnées polaires. En utilisant des coordonnées polaires, le graphique saisonnier fournit une représentation compacte et simple des modèles saisonniers dans les données. Dans ce graphique, l’angle correspond au mois de l’année, tandis que le rayon représente le temps écoulé depuis le début de la série.

Nous avons fait les observations suivantes :

Tout d’abord, nous avons constaté qu’il y a un saut important de la variable CPILFESL chaque année. Cela indique qu’il y a un changement important dans le taux d’inflation d’une année à l’autre. Cela peut être dû à divers facteurs.

Deuxièmement, nous avons observé qu’il n’y a pas de chevauchement dans les données des saisons. Cela signifie que les points de données de chaque saison sont distincts et ne se chevauchent pas. Cette tendance pourrait avoir des implications importantes pour notre analyse, car elle suggère qu’il peut y avoir des tendances saisonnières ou des modèles qui sont uniques à chaque saison…

PAR RUTHVIK REDDY BOMMIREDDY, 15 OCTOBRE 2023

Lire la suite sur le site www.matinlibre.com

Téléchargez IAJP Caro ÉCONOMIE

Source : Matin Libre

Laisser un commentaire

Au quotidien

avril 2024
L M M J V S D
1234567
891011121314
15161718192021
22232425262728
2930  

Archives