Traduit avec l'utilisation de l'intelligence artificielle ; il peut contenir des erreurs. Veuillez participer à cette enquête pour nous faire part de vos commentaires sur cette traduction.
L'analyse vidéo dicte aujourd'hui de nombreuses décisions, telles que l'amélioration de la circulation dans les grandes villes, l'accès à nos appareils mobiles ou l'identification des personnes en danger. Mais d'où vient cette technologie et jusqu'où ira-t-elle dans les années à venir ?
Dans cet article, nous présentons tout ce qu'il faut savoir sur l'analyse vidéo et sur la façon dont son adoption dans le monde entier transformera à jamais nos interactions avec la technologie et notre environnement quotidien, au cours de la décennie actuelle.
Table des matières
L'analyse vidéo, ou analyse vidéo intelligente, est la technologie capable de générer des connaissances à partir de flux ou d'archives vidéo afin de détecter ou d'informer des personnes sur des scénarios ou des situations spécifiques.
L'analyse vidéo a toujours été une innovation prometteuse visant à libérer des capacités surhumaines, telles que la détection d'ennemis ou d'intrus, sans intervention humaine.
Cependant, l'histoire de l'analyse vidéo est quelque peu obscure. Les premiers systèmes de vidéosurveillance ont été conçus dans l'Allemagne nazie en 1942. Il s'agissait à l'origine d'une technologie destinée à faciliter les tâches de sécurité, notamment lors des tests balistiques. Rapidement, ces systèmes ont fait leur apparition aux États-Unis et, plus tard, dans le monde entier.
Cet outil a été lent à se développer car l'infrastructure et le savoir-faire nécessaires pour tirer parti des réseaux de vidéosurveillance n'étaient ni facilement disponibles ni bon marché à l'époque. Et pour que cette technologie atteigne des capacités similaires à celles de l'œil humain, il fallait qu'elle soit plus intelligente.
Grâce à l'IA, c'est possible aujourd'hui. Cependant, il faut connaître l'histoire de l'analyse vidéo pour comprendre comment nous en sommes arrivés là.
L'analyse vidéo est une technologie qui a progressé lentement au cours du siècle dernier et qui s'est développée rapidement au cours des deux dernières décennies.
Nous pouvons diviser l'histoire de l'analyse vidéo en trois générations principales, depuis les applications qui n'étaient capables que de détecter de petits changements dans un flux vidéo jusqu'à l'intelligence artificielle qui porte la vidéosurveillance à des niveaux inimaginables.
Ce sont les trois générations de l'analyse vidéo:
La première génération d'analyse vidéo a permis d'appliquer des alertes en temps réel, en essayant d'éviter les fausses alertes.
Cependant, la technologie de l'époque était limitée. Elle ne pouvait surveiller les changements que dans des pixels individuels ou seulement une partie d'entre eux. Il en résultait de nombreuses fausses alertes en cas de fortes pluies ou lorsque des objets battaient au vent à cause d'une tempête, entre autres phénomènes naturels. La prochaine génération d'analyse vidéo se concentrera sur les objets et pas seulement sur les pixels.
Cette technologie permettrait une meilleure interprétation de l'image, offrant aux professionnels de la sécurité une meilleure compréhension de la scène telle qu'elle s'est déroulée sur la caméra. Pour ce faire, elle s'appuierait sur les processeurs de classe informatique les plus récents, qui continuent d'évoluer rapidement.
La deuxième génération d'analyse vidéo s'est concentrée sur la fourniture d'outils médico-légaux détaillés aux professionnels de la sécurité.
Les applications d'analyse vidéo précédentes n'étaient pas assez précises ou rapides pour fournir aux agents des informations précises et facilement accessibles. La deuxième génération d'analyse vidéo a permis aux agents de reconstituer ce qui s'était passé sans avoir à visionner des centaines d'heures d'images. Pour la première fois dans l'histoire, l'analyse vidéo a élargi les possibilités de notre relation avec la technologie, ce qui sera fondamental pour la prochaine génération d'analyse vidéo.
L'analyse vidéo de troisième génération a permis une véritable connaissance de la situation combinée à une analyse médico-légale en temps réel.
Cette technologie a été conçue pour fournir une vue en direct, en tirant parti de toutes les capacités des réseaux de vidéosurveillance. Grâce à cette technologie innovante, les agents ne sont plus limités aux capacités de la machine. Le système est capable de détecter le suspect ou la cible sans erreur. Désormais, au lieu d'utiliser un outil, les agents travaillaient avec un véritable all.
Dès le départ, l'analyse vidéo a été conçue comme une solution destinée à aider les responsables de la sécurité des infrastructures critiques. Il s'agissait d'un dispositif permettant d'identifier et de détecter les intrus, de suivre des personnes ou des objets et de déclencher une alarme sur des types de comportement.
Il existe de nombreuses fonctions d'analyse vidéo qui permettent de suivre divers comportements. Mais les cadres techniques qui rendent cela possible ne sont que quelques-uns, que nous examinerons ci-dessous.
Voici une brève analyse de chacun d'entre eux :
L'analyse par algorithme fixe se concentre sur la détection de comportements spécifiques, comme l'entrée d'une personne dans une zone restreinte ou l'abandon d'un objet suspect dans un espace public.
Son fonctionnement est simple : le système détermine si un comportement spécifique se produit dans le champ de vision du réseau de vidéosurveillance et l'algorithme alerte les opérateurs lorsque c'est le cas. Cependant, chaque algorithme ne peut rechercher qu'un seul comportement spécifique, ce qui constitue un inconvénient dans des scénarios qui évoluent rapidement.
Les comportements les plus courants détectés par les algorithmes fixes sont les suivants :
Les algorithmes d'intelligence artificielle apprennent au fil du temps en étant exposés à des milliers de données pour identifier ce qui est un comportement normal et ce qui ne l'est pas dans une situation spécifique.
L'objectif de ce système est d'apprendre sans intervention humaine. Cet algorithme permet aux agents de sécurité de gagner du temps et de détecter des comportements qui, autrement, passeraient inaperçus aux yeux des machines préprogrammées ou des humains eux-mêmes.
L'IA, comme dans d'autres domaines où elle est utilisée, permet non seulement de résoudre des problèmes plus rapidement et plus efficacement, mais elle nous aide également à reconnaître nos propres points faibles dans la vie de tous.
Les systèmes de reconnaissance faciale sont souvent utilisés pour identifier les personnes et contrôler l'accès à l'information dans des zones spécifiques, ainsi que pour aider les agents dans les enquêtes en cours.
Il fonctionne en faisant correspondre les points d'un visage à un échantillon stocké dans une base de données. Cet algorithme repose sur l'identification correcte du sujet parmi les nombreux autres visages de la base de données. Toutefois, cette technologie nécessite des conditions particulières pour fonctionner, telles qu'un bon éclairage ou des arrière-plans statiques. Les derniers développements de cette technologie visent à résoudre ce problème.
De nombreuses organisations se sont opposées à ce type de technologie pour des raisons de protection de la vie privée et de sécurité. Mais la présence et l'utilisation de cet algorithme d'analyse vidéo se sont accrues ces dernières années.
Les capacités d'analyse offertes aujourd'hui ne sont limitées que par l'imagination de l'utilisateur et les besoins qui se présentent. Voici quelques applications de l'analyse vidéo :
Le potentiel de l'analyse vidéo n'est pas passé inaperçu auprès d'organisations cruciales dans un large éventail de secteurs. De la sécurité publique à la banque, des opérations industrielles au commerce de détail, certaines des plus grandes entreprises du monde appliquent en ce moment même les dernières tendances en matière d'analyse d'algorithmes fixes, d'analyse de l'IA et de reconnaissance faciale à leurs fins spécifiques.
Cette collaboration croissante entre l'homme et la machine offre de multiples possibilités et solutions allant de l'amélioration des opérations de sécurité à l'optimisation des tâches et, en fin de compte, à la croissance de l'entreprise. En voici quelques exemples
Il est bien connu que le secteur de la sécurité publique bénéficie depuis des années des branches de l'IA telles que l'apprentissage automatique. Cependant, ces dernières années, les avancées sont allées au-delà de ce qui était imaginé grâce à un sous-ensemble de l'apprentissage automatique lui- même, qui a même dépassé les méthodes de son prédécesseur : l'apprentissage profond.
Alors que les algorithmes d'apprentissage automatique identifient des images à partir d'un ensemble de données soigneusement sélectionnées et, surtout, structurées, l'apprentissage profond imite les tâches du cerveau humain. En d'autres termes, il utilise des algorithmes capables de traiter de manière autonome une quantité importante et désordonnée de données, en identifiant des modèles communs et en les regroupant progressivement. Cela signifie une identification itérative et beaucoup plus précise de ce qui est considéré comme interdit ou dangereux.
Dans le contexte de la gestion des véhicules et des foules, l'analyse vidéo est souvent utilisée pour :
Notre application de suivi et de localisation de véhicules, vehicleDRX, en est un exemple récent.
La reconnaissance faciale est un autre allié essentiel de la sécurité publique. Les systèmes les plus avancés analysent le langage corporel, les expressions faciales et les mouvements pour détecter les comportements suspects et donner l'alerte. Ils créent également des cartes en 3D des visages qui sont simultanément reliées à de vastes bases de données de suspects.
Enfin, nous trouvons différents types de systèmes qui peuvent concentrer leurs caractéristiques de détection sur un objet spécifique et effectuer des actions telles que :
Dans le monde de la sécurité des véhicules, on trouve des IA autonomes comme celle d'Algotive, qui combine ces types de détection d'objets avec des algorithmes d'analyse vidéo, fournissant des informations de base sur une voiture (modèle, dernière localisation) et prédisant même ses itinéraires possibles.
Les institutions financières doivent protéger leurs clients et leur réputation de deux fronts décisifs: la fraude aux distributeurs automatiques de billets et les vols à main armée. Tout comme dans le cas de la sécurité publique, les banques ont depuis des années fait confiance à la vidéosurveillance pour relever ce défi. Mais l'analyse vidéo peut-elle fournir une protection efficace contre la sophistication croissante des vols dans les banques ?
La réponse réside dans la combinaison de catégories telles que la détection d'objets et la reconnaissance faciale. Ainsi, les systèmes de sécurité bancaire limitent l'emplacement des distributeurs automatiques de billets et identifient leurs composants principaux (lecteur de cartes, distributeur automatique de billets, écran, etc.). En même temps, ils intègrent une IA avancée qui non seulement effectue l'identification faciale des suspects, mais apprend également la différence entre l'activité normale et l'activité criminelle, tant des distributeurs automatiques que des personnes : retrait d'argent habituel par rapport à une opération retardée, clients par rapport aux personnes portant des armes ou se déplaçant de manière suspecte. Ce type de fusion peut identifier la fraude ou l'utilisation violente de la force, surveiller en temps réel et émettre des alertes instantanées, entre autres avantages qui se traduisent par une plus grande confiance des clients et une plus grande crédibilité pour leurs institutions financières.
L'analyse vidéo a trouvé un marché prometteur dans les secteurs industriels en mutation de notre monde globalisé. Les industries alimentaire, chimique, agricole, d'élevage et manufacturière, pour n'en citer que quelques-unes, ont deux objectifs communs pour lesquels la coopération entre les systèmes intelligents et les partenaires est essentielle : garantir la sécurité et optimiser les processus.
En ce qui concerne la sécurité, elle ne couvre pas seulement la surveillance des activités criminelles - également grâce aux technologies que nous avons déjà examinées - mais se concentre également sur la protection des travailleurs et des installations. La sécurité du personnel sur les tissus est assurée par des algorithmes d'apprentissage profond qui, en différenciant les situations dangereuses des situations sûres, identifient rapidement les accidents ou les incidents et les signalent. Une autre avancée préventive est la mise en œuvre de systèmes de reconnaissance faciale qui détectent les comportements ou postures dangereux et les associent automatiquement à un éventuel accident.
La plateforme de vidéosurveillance SecurOS™ d'ISS, par exemple, est capable de surveiller la structure osseuse d'une personne pour détecter les comportements acceptés et interdits.
L'optimisation des tâches et de la logistique est un autre objectif que les industries associent déjà à l'analyse vidéo : en plaçant des processeurs de pointe et de l'IA dans leurs caméras et leurs drones, elles peuvent rationaliser la gestion des stocks et surveiller le contrôle de la qualité. Dans le même ordre d'idées, elles peuvent également choisir le service le plus adapté à des projets spécifiques en comparant les performances passées et les résultats de différents fournisseurs.
Le secteur du commerce de détail ne concentre pas les avancées technologiques telles que l'analyse vidéo sur son personnel - du moins pas en priorité - mais se concentre plutôt sur l'élément clé de l'entreprise : le client. Les algorithmes d'apprentissage en profondeur, les systèmes de reconnaissance faciale et les fonctions de détection d'objets fusionnent pour fournir des informations précieuses telles que :
Sur la base de ces données essentielles, certains des plus grands détaillants du monde - Walmart, Home Depot, Costco, pour n'en citer que quelques-uns - savent déjà comment placer leurs marchandises à des endroits stratégiques qui suscitent l'intérêt du client.
Le résumé ci-dessus montre clairement que les interactions quotidiennes de l'analyse vidéo ouvrent de nouvelles possibilités pour l'amélioration de la société. D'un point de vue économique, son marché mondial était évalué à 4.102 millions USD en 2019 et devrait atteindre 21.778 millions USD d'ici 2027 grâce aux scénarios et tendances suivants :
Que nous réserve l'analyse vidéo dans les prochaines années ? La réponse la plus sûre est peut-être que, face aux nombreux défis auxquels nos sociétés sont confrontées, ses catégories continueront d'être améliorées et seront davantage présentes dans de nouveaux secteurs.
Outre ses innovations dans les domaines de la sécurité publique, de la banque, des opérations et de la vente au détail, nous pouvons nous attendre à d'importantes applications dans le domaine de la santé. Compte tenu de la pandémie que nous sommes en train de surmonter, l'apprentissage profond et la reconnaissance faciale peuvent renforcer les mesures de santé et d'hygiène contre le COVID-19, telles que la détection des masques faciaux et la distanciation sociale. Ils peuvent également aider à identifier les niveaux d'occupation dans les espaces publics. Dans le domaine de l'éthique, ses systèmes vidéo devraient fournir des solutions plus robustes contre la cybercriminalité et dissimuler des informations sensibles aux individus.
Quels que soient les défis ou les nouvelles avancées, il existe une autre certitude : les possibilités de réinventer l'analyse vidéo promettent d'être aussi illimitées que les idées humaines. Pour en savoir plus sur notre gamme de produits d'analyse vidéo, cliquez ici.