La Chaire d’exploitation des données HEC Montréal est une chaire de recherche et la grande majorité de ses travaux ressort de la recherche fondamentale. La pondération des objectifs de la Chaire de HEC Montréal est reprise dans le tableau suivant :

Tableau de la répartition des activités de la Chaire

Quantité et qualité des publications                                                  60 %
Quantité et qualité des activités de formation                                 10 %
Direction d’étudiants de cycles supérieurs                                       15 %
Capacité d’attirer des étudiants                                                            5 %
Rayonnement et renommée dans la communauté universitaire   5 %
Distinction et prix                                                                                    5 %

L’exploitation de données consiste à découvrir au sein de très grands ensembles de données disponibles tant dans les entreprises que dans les organismes publics de l’information pertinente utile et/ou profitable pour les décideurs.

Si les méthodes ont souvent été étudiées depuis plusieurs décennies, dans la discipline appelée alors “Analyse de données”, la problématique a été fondamentalement modifiée par l’énorme croissance de la puissance des ordinateurs ainsi que par l’accessibilité de très vastes ensembles de données. Là où il y a une trentaine d’années on étudiait des ensembles de 20 à 100 entités, on en considère maintenant de bien plus grands, avec des dizaines de milliers et même parfois des millions d’entités. L’ensemble des outils disponibles subit donc une révision fondamentale afin de les rendre aptes à résoudre ces problèmes de taille accrue. De plus, de nouvelles méthodes apparaissent constamment et les applications foisonnent. Le domaine de l’exploitation des données intéresse grandement les entreprises et attire certains des meilleurs chercheurs et étudiants.

Les buts assignés à la Chaire d’exploitation des données de HEC Montréal sont les suivants :

1) Approfondir les méthodes fondamentales d’exploitation des données pour les trois classes principales de problèmes de cette discipline : la classification automatique, la discrimination et la recherche de relations;

2) Sur la base de cette analyse, développer et/ou perfectionner des algorithmes pour des problèmes spécifiques appartenant aux trois classes citées;

3) Construire des logiciels performants pour les algorithmes obtenus et les rendre disponibles tant à l’intérieur de HEC Montréal qu’au sein de la communauté plus vaste des chercheurs scientifiques;

4) Appliquer ces méthodes et utiliser ces logiciels pour résoudre des problèmes concrets des entreprises et des administrations.

La poursuite efficace de ces buts suppose des activités complémentaires en amont et en aval :

5) D’une part, l’étude de méthodes fondamentales d’optimisation qui soutiendront les algorithmes d’exploitation de données proposés. Ces recherches porteront tant sur les méthodes exactes de résolution que sur les heuristiques, ces dernières étant souvent les seules à pouvoir être utilisées en présence de très grands ensembles de données;

6) D’autre part, l’application des algorithmes obtenus à la résolution de problèmes mathématiquement proches de ceux de l’exploitation de données. Ceci permet d’évaluer les performances de ces algorithmes ainsi que de résoudre des problèmes ouverts ayant leur propre intérêt.