ETFFIN Finance >> cours Finance personnelle >  >> Financial management >> la finance

Modélisation prédictive :Types,

Avantages, et algorithmes

La modélisation prédictive est une méthode de prédiction des résultats futurs en utilisant la modélisation des données. C'est l'un des meilleurs moyens pour une entreprise de voir sa voie à suivre et de faire des plans en conséquence. Sans être infaillible, cette méthode a tendance à avoir des taux de précision élevés, c'est pourquoi il est si couramment utilisé.

Qu'est-ce que la modélisation prédictive ?

En bref, La modélisation prédictive est une technique statistique utilisant l'apprentissage automatique et l'exploration de données pour prédire et prévoir les résultats futurs probables à l'aide de données historiques et existantes. Il fonctionne en analysant les données actuelles et historiques et en projetant ce qu'il apprend sur un modèle généré pour prévoir les résultats probables. La modélisation prédictive peut être utilisée pour prédire à peu près n'importe quoi, des cotes d'écoute à la télévision et du prochain achat d'un client aux risques de crédit et aux bénéfices des entreprises.

Un modèle prédictif n'est pas figé; il est validé ou révisé régulièrement pour intégrer les changements dans les données sous-jacentes. En d'autres termes, ce n'est pas une prédiction unique. Les modèles prédictifs font des hypothèses basées sur ce qui s'est passé dans le passé et ce qui se passe maintenant. Si entrant, de nouvelles données montrent des changements dans ce qui se passe maintenant, l'impact sur le résultat futur probable doit être recalculé, trop. Par exemple, une société de logiciels pourrait modéliser les données de ventes historiques par rapport aux dépenses marketing dans plusieurs régions afin de créer un modèle pour les revenus futurs en fonction de l'impact des dépenses marketing.

La plupart des modèles prédictifs fonctionnent rapidement et effectuent souvent leurs calculs en temps réel. C'est pourquoi les banques et les commerçants peuvent, par exemple, calculer le risque d'une demande de prêt hypothécaire ou de carte de crédit en ligne et accepter ou refuser la demande presque instantanément en fonction de cette prédiction.

Certains modèles prédictifs sont plus complexes, tels que ceux utilisés en biologie computationnelle et en informatique quantique ; les sorties résultantes sont plus longues à calculer qu'une demande de carte de crédit mais sont effectuées beaucoup plus rapidement que cela n'était possible dans le passé grâce aux progrès des capacités technologiques, y compris la puissance de calcul.

Top 5 des types de modèles prédictifs

Heureusement, les modèles prédictifs n'ont pas besoin d'être créés à partir de zéro pour chaque application. Les outils d'analyse prédictive utilisent une variété de modèles et d'algorithmes vérifiés qui peuvent être appliqués à un large éventail de cas d'utilisation.

Les techniques de modélisation prédictive se sont perfectionnées au fil du temps. Au fur et à mesure que nous ajoutons plus de données, informatique plus musclée, AI et apprentissage automatique et voir les progrès globaux de l'analyse, nous pouvons faire plus avec ces modèles.

Les cinq principaux modèles d'analyse prédictive sont :

  1. Modèle de classement : Considéré comme le modèle le plus simple, il catégorise les données pour une réponse de requête simple et directe. Un exemple de cas d'utilisation serait de répondre à la question « Est-ce une transaction frauduleuse ? »
  2. Modèle de regroupement : Ce modèle imbrique les données par des attributs communs. Il fonctionne en regroupant des choses ou des personnes ayant des caractéristiques ou des comportements communs et planifie des stratégies pour chaque groupe à une plus grande échelle. Un exemple consiste à déterminer le risque de crédit pour un demandeur de prêt en fonction de ce que d'autres personnes dans la même situation ou une situation similaire ont fait dans le passé.
  3. Modèle de prévision : C'est un modèle très populaire, et cela fonctionne sur tout ce qui a une valeur numérique basée sur l'apprentissage à partir de données historiques. Par exemple, en répondant à la quantité de laitue qu'un restaurant devrait commander la semaine prochaine ou au nombre d'appels qu'un agent du service client devrait être en mesure de traiter par jour ou par semaine, le système revient sur les données historiques.
  4. Modèle de valeurs aberrantes : Ce modèle fonctionne en analysant des points de données anormaux ou aberrants. Par exemple, une banque peut utiliser un modèle aberrant pour identifier la fraude en demandant si une transaction est en dehors des habitudes d'achat normales du client ou si une dépense dans une catégorie donnée est normale ou non. Par exemple, un 1 $, 000 frais de carte de crédit pour une laveuse et une sécheuse dans le magasin à grande surface préféré du titulaire de la carte ne seraient pas alarmants, mais $1, 000 000 dépensés pour des vêtements de marque dans un endroit où le client n'a jamais facturé d'autres articles peuvent indiquer un compte piraté.
  5. Modèle de série temporelle : Ce modèle évalue une séquence de points de données en fonction du temps. Par exemple, le nombre de patients victimes d'AVC admis à l'hôpital au cours des quatre derniers mois est utilisé pour prédire combien de patients l'hôpital pourrait s'attendre à admettre la semaine prochaine, le mois prochain ou le reste de l'année. Une seule métrique mesurée et comparée dans le temps est donc plus significative qu'une simple moyenne.

Algorithmes prédictifs courants

Les algorithmes prédictifs utilisent l'une des deux choses suivantes :l'apprentissage automatique ou l'apprentissage en profondeur. Les deux sont des sous-ensembles de l'intelligence artificielle (IA). L'apprentissage automatique (ML) implique des données structurées, comme une feuille de calcul ou des données machine. L'apprentissage en profondeur (DL) traite des données non structurées telles que la vidéo, l'audio, texte, les publications et les images sur les réseaux sociaux - essentiellement les éléments avec lesquels les humains communiquent et qui ne sont pas des chiffres ou des lectures métriques.

Certains des algorithmes prédictifs les plus courants sont :

  1. Forêt aléatoire : Cet algorithme est dérivé d'une combinaison d'arbres de décision, dont aucun n'est lié, et peut utiliser à la fois la classification et la régression pour classer de grandes quantités de données.
  2. Modèle linéaire généralisé (GLM) pour deux valeurs : Cet algorithme réduit la liste des variables pour trouver le « meilleur ajustement ». Il peut déterminer les points de basculement et modifier la capture de données et d'autres influences, tels que les prédicteurs catégoriels, pour déterminer le résultat « le mieux adapté », surmontant ainsi les inconvénients des autres modèles, comme une régression linéaire régulière.
  3. Modèle amélioré par gradient : Cet algorithme utilise également plusieurs arbres de décision combinés, mais contrairement à Random Forest, les arbres sont liés. Il construit un arbre à la fois, permettant ainsi à l'arbre suivant de corriger les défauts de l'arbre précédent. Il est souvent utilisé dans les classements, comme sur les sorties des moteurs de recherche.
  4. K-signifie : Un algorithme populaire et rapide, K-Means regroupe les points de données par similitudes et est donc souvent utilisé pour le modèle de clustering. Il peut rapidement rendre des choses comme des offres de vente au détail personnalisées aux individus au sein d'un grand groupe, comme un million de clients ou plus avec un goût similaire pour les manteaux de laine rouge doublés.
  5. Prophète: Cet algorithme est utilisé dans les modèles de séries chronologiques ou de prévision pour la planification des capacités, comme pour les besoins d'inventaire, quotas de vente et allocations de ressources. Il est très flexible et peut facilement s'adapter à des heuristiques et à un éventail d'hypothèses utiles.

Modélisation prédictive et analyse de données

La modélisation prédictive est également connue sous le nom d'analyse prédictive. Généralement, le terme « modélisation prédictive » est privilégié en milieu académique, tandis que « l'analyse prédictive » est le terme préféré pour les applications commerciales de la modélisation prédictive.

L'utilisation réussie de l'analyse prédictive dépend fortement d'un accès illimité à des volumes suffisants de données précises, des données claires et pertinentes. Alors que les modèles prédictifs peuvent être extraordinairement complexes, tels que ceux utilisant les arbres de décision et le clustering à k-moyennes, la partie la plus complexe est toujours le réseau de neurones; C'est, le modèle par lequel les ordinateurs sont entraînés à prédire les résultats. L'apprentissage automatique utilise un réseau de neurones pour trouver des corrélations dans des ensembles de données exceptionnellement volumineux et pour « apprendre » et identifier des modèles au sein des données.

Avantages de la modélisation prédictive

En un mot, l'analyse prédictive réduit le temps, efforts et les coûts dans la prévision des résultats commerciaux. Des variables telles que les facteurs environnementaux, veille concurrentielle, les changements de réglementation et les conditions du marché peuvent être pris en compte dans le calcul mathématique pour obtenir des vues plus complètes à des coûts relativement bas.

Des exemples de types spécifiques de prévisions qui peuvent profiter aux entreprises incluent la prévision de la demande, planification des effectifs, analyse du taux de désabonnement, facteurs externes, analyse compétitive, maintenance du parc et du matériel informatique et risques financiers.

Défis de la modélisation prédictive

Il est essentiel de maintenir l'analyse prédictive axée sur la production d'informations commerciales utiles, car tout ce que cette technologie déterre n'est pas utile. Certaines informations extraites n'ont de valeur que pour satisfaire un esprit curieux et ont peu ou pas d'implications commerciales. Se laisser distraire est une distraction que peu d'entreprises peuvent se permettre.

Aussi, pouvoir utiliser plus de données dans la modélisation prédictive n'est un avantage que jusqu'à un certain point. Trop de données peuvent fausser le calcul et conduire à un résultat insensé ou erroné. Par exemple, plus de manteaux sont vendus à mesure que la température extérieure baisse. Mais seulement jusqu'à un certain point. Les gens n'achètent pas plus de manteaux lorsqu'il fait -20 degrés Fahrenheit dehors que lorsqu'il fait -5 degrés sous le point de congélation. À un certain point, le froid est suffisamment froid pour stimuler l'achat de manteaux et des températures plus glaciales ne changent plus sensiblement ce modèle.

Et avec les énormes volumes de données impliqués dans la modélisation prédictive, le maintien de la sécurité et de la confidentialité sera également un défi. D'autres défis résident dans les limites de l'apprentissage automatique.

Limites de la modélisation prédictive

Selon un rapport McKinsey, les limitations courantes et leurs « meilleures solutions » incluent :

  1. Erreurs dans l'étiquetage des données : Ceux-ci peuvent être surmontés grâce à l'apprentissage par renforcement ou aux réseaux antagonistes génératifs (GAN).
  2. Pénurie d'ensembles de données massifs nécessaires pour former l'apprentissage automatique : Une solution possible est « l'apprentissage unique, ” dans lequel une machine apprend à partir d'un petit nombre de démonstrations plutôt que sur un ensemble de données massif.
  3. L'incapacité de la machine à expliquer quoi et pourquoi elle a fait ce qu'elle a fait : Les machines ne « pensent » ou « n'apprennent » pas comme les humains. De même, leurs calculs peuvent être si exceptionnellement complexes que les humains ont du mal à trouver, encore moins suivre, la logique. Tout cela rend difficile pour une machine d'expliquer son travail, ou pour que les humains le fassent. Pourtant, la transparence du modèle est nécessaire pour un certain nombre de raisons, avec le chef de la sécurité humaine parmi eux. Solutions potentielles prometteuses :explications locales-interprétables-agnostiques (LIME) et techniques d'attention.
  4. Généralisabilité de l'apprentissage , ou plutôt son absence : Contrairement aux humains, les machines ont du mal à faire avancer ce qu'elles ont appris. En d'autres termes, ils ont du mal à appliquer ce qu'ils ont appris à un nouvel ensemble de circonstances. Tout ce qu'il a appris est applicable à un seul cas d'utilisation. C'est en grande partie pourquoi nous n'avons pas à nous inquiéter de la montée en puissance des suzerains de l'IA de si tôt. Pour que la modélisation prédictive utilisant l'apprentissage automatique soit réutilisable, c'est-à-dire utile dans plus d'un cas d'utilisation - une solution possible est l'apprentissage par transfert.
  5. Biais dans les données et les algorithmes : La non-représentation peut fausser les résultats et conduire à des mauvais traitements envers de grands groupes d'humains. Plus loin, les biais incrustés sont difficiles à trouver et à éliminer plus tard. En d'autres termes, les préjugés ont tendance à se perpétuer. C'est une cible mouvante, et aucune solution claire n'a encore été identifiée.

L'avenir de la modélisation prédictive

Modélisation prédictive, également connu sous le nom d'analyse prédictive, et le machine learning sont encore jeunes et en développement de technologies, ce qui signifie qu'il y a beaucoup plus à venir. En tant que technique, méthodes, les outils et les technologies s'améliorent, les avantages pour les entreprises et les sociétés le seront aussi.

Cependant, ce ne sont pas des technologies que les entreprises peuvent se permettre d'adopter plus tard, une fois que la technologie a atteint sa maturité et que tous les problèmes sont résolus. Les avantages à court terme sont tout simplement trop forts pour qu'un adoptant tardif puisse les surmonter et rester compétitif.

Notre conseil : comprenez et déployez la technologie maintenant, puis développez les avantages commerciaux parallèlement aux avancées technologiques ultérieures.

Modélisation prédictive dans les plateformes

Pour toutes les entreprises sauf les plus grandes, récolter les avantages de l'analyse prédictive est le plus facilement réalisé en utilisant des systèmes ERP qui intègrent les technologies et contiennent un apprentissage automatique pré-entraîné. Par exemple, Planification, les fonctionnalités de prévision et de budgétisation peuvent fournir un moteur de modèle statistique pour modéliser rapidement plusieurs scénarios qui traitent des conditions changeantes du marché.

Comme autre exemple, une fonction de planification des approvisionnements ou de capacité d'approvisionnement peut également prévoir des livraisons potentiellement tardives, commandes d'achat ou de vente et autres risques ou impacts. Des fournisseurs alternatifs peuvent également être représentés sur le tableau de bord pour permettre aux entreprises de pivoter pour répondre aux exigences de fabrication ou de distribution.

La modélisation financière, la planification et la budgétisation sont des domaines clés pour profiter des nombreux avantages de l'utilisation de ces technologies avancées sans surcharger votre équipe.