Jaspersoft et le paysage analytique


Livre Blanc

Ce texte est un résumé de notre Livre Blanc, n’hésitez pas à vous inscrire pour obtenir le Livre Blanc complet, en anglais

Le paysage analytique s’est beaucoup diversifié ces dernières années. Il englobe aujourd’hui un vaste éventail de solutions spécialisées qui couvrent la couche de présentation, le middleware et l’entreposage de données, mais aussi des applications analytiques utilisant une approche orientée solution.

Au sein de la couche de présentation, ce sont en particulier les questions de reporting, d’analyse, de traitement analytique avancé et de tableaux de bord qui sont abordées. En matière de reporting, on fait la distinction entre rapports statiques et rapports ad hoc. Dans le premier cas, la mise en page et les requêtes qui définissent les données au sein du rapport sont statiques. « Ad hoc » signifie au contraire que les utilisateurs professionnels peuvent créer des rapports totalement nouveaux, « à la volée ». Ceux-ci peuvent en outre être générés comme rapports opérationnels ou comme rapports de production.

En principe, tous les collaborateurs d’une entreprise, des utilisateurs moyens aux cadres dirigeants, en passant par les analystes, peuvent recourir à ces deux types de rapports, statiques et ad hoc. Jaspersoft propose divers produits open source et commerciaux permettant de gérer les rapports statiques : JasperReports (licence LGPL), une bibliothèque de rapports pour les développeurs, iReport (licence GPL v3), un concepteur graphique de rapports de bureau basé sur JasperReports, ou encore JasperServer Community Edition (licence AGPL v3), un serveur de rapports permettant de gérer les rapports dans un référentiel sécurisé. iReport génère des rapports ad hoc particulièrement performants et flexibles à l’attention des développeurs et des utilisateurs avancés, tandis que JasperServer Professional Edition présente, outre l’ensemble des fonctionnalités de l’édition communautaire, une fonctionnalité de reporting ad hoc pour les utilisateurs professionnels.

Les rapports permettent d’extraire des données pour répondre à une question prédéfinie. L’analyse, elle, consiste à travailler de manière interactive avec les données pour y déceler des tendances. Dans les années 1990, le concept « OLAP », ou traitement analytique en ligne, était quasi synonyme d’analyse. Cette technologie permet d’effectuer des analyses par « permutation d’axes », autrement dit de visualiser des données selon différentes dimensions (partagées ou privées), par exemple commerciales, géographiques ou temporelles. Pour réaliser le traitement OLAP dans une base de données relationnelle (ROLAP), il faut transposer le schéma OLAP dans une structure de données physique correspondante, par exemple une base de données OLTP ou, plus fréquemment, le schéma en étoile ou en flocon d’un entrepôt ou mini-entrepôt de données. Entre autres avantages du ROLAP, celui-ci permet de traiter d’importants volumes de données, ainsi que de tirer parti des fonctionnalités SQL et des ressources matérielles du système de base de données sous-jacent pour le traitement des requêtes.

Pour prendre des décisions, le personnel dirigeant ou les analystes d’entreprise doivent avoir accès à de très grands volumes de données. Résidant en général dans des entrepôts, ces données proviennent souvent de sources diverses, ce qui nécessite d’importantes transformations. On peut alors faire appel aux outils d’analyse Jaspersoft : JasperAnalysis est une extension de JasperServer qui, outre la possibilité de choisir entre OLTP et base de données analytique, offre de puissantes fonctionnalités ROLAP via un navigateur Web. JasperAnalysis utilise un langage de requête MDX (multi-dimensional expression) pour manipuler les données à des fins d’analyse.

Les avantages d’une solution d’analyse en mémoire sont évidents : rapidité, simplicité et visibilité. Avec JasperServer, les fonctionnalités d’analyse en mémoire sont entièrement intégrées à l’environnement serveur de rapports et de tableaux de bord. Ainsi, les fonctionnalités d’analyse en mémoire de JasperServer disposent également des métadonnées sous-jacentes, ainsi que des outils de génération de rapports ad hoc et de tableaux de bord qui font généralement partie de l’architecture serveur.

Le traitement analytique avancé englobe des domaines d’analyse plus poussés. Les outils de reporting et d’analyse présentent généralement ce qui est déjà arrivé. Les outils analytiques avancés, pour leur part, tentent de prévoir ce qui arrivera sur la base de données historiques et des modèles qui en découlent. Dans le segment de l’analytique avancé, deux leaders se partagent les parts de marché : SAS et R. La société privée SAS, plus grand éditeur de logiciels du monde non coté en bourse, s’est spécialisée dans l’analyse statistique depuis ses débuts dans les années 1970. R est l’environnement open source leader pour le traitement analytique avancé. Concurrent direct de SAS, il devrait bientôt le devancer en nombre d’utilisateurs, si ce n’est déjà fait. Les utilisateurs du traitement analytique avancé sont en général des analystes qui travaillent avec de grands volumes de données. Jaspersoft leur propose JasperServer qui permet de mettre à disposition les données produites par des outils analytiques avancés, par exemple R, sous forme d’éléments de tableau de bord.

A côté des clients de messagerie, les tableaux de bord constituent l’environnement de travail principal de nombreux utilisateurs professionnels. Or, suivant le profil de l’utilisateur, un tableau de bord peut jouer des rôles très divers. Un directeur commercial, par exemple, y affichera l’état de ses contacts clients ou le chiffre d’affaires des régions dont il a la charge pour le trimestre en cours. Un utilisateur professionnel moyen peut s’en servir pour amalgamer des informations, par exemple la liste de ses responsabilités pour un jour ou une semaine donnés, des contenus personnalisés, comme des informations géographiques (météo locale de la semaine ou données de voyage) et des données spécifiques à l’entreprise.

Au fur et à mesure qu’augmentent le volume de données, le nombre d’utilisateurs et la complexité des requêtes, la question de savoir où sont stockées, gérées et interrogées les données gagne elle aussi en importance. Une possibilité consiste à utiliser les systèmes opérationnels OLTP existants également pour les projets analytiques. Toutefois, cela nécessitera le cas échéant un entrepôt de données indépendant afin d’éviter la dégradation des performances du système OLTP ou prendre en charge plusieurs sources de données. Quoi qu’il en soit, les charges de traitement analytique allant en augmentant, il peut être nécessaire de concevoir un système spécialisé pour s’y adapter.

Le segment des bases de données analytiques est né du constat que les charges de traitement analytique ont des exigences très spécifiques, les données faisant principalement l’objet de requêtes, tandis que les systèmes conventionnels sont avant tout axés sur les transactions. Tous les utilisateurs professionnels réalisent les avantages de l’utilisation des entrepôts de données à des fins d’analyse. Ce segment de marché est particulièrement important pour les utilisateurs expérimentés aux requêtes complexes concernant de grands volumes de données. La suite décisionnelle Jaspersoft propose des fonctionnalités de reporting, d’analyse et ETL, ainsi que des tableaux de bord et prend en charge un vaste éventail de bases de données OLTP et analytiques comme sources de données.

Un domaine souvent négligé et sous-estimé est celui du middleware, qui sert de support essentiel à toute solution analytique et dont l’intérêt grandit particulièrement auprès des entreprises de moyenne à grande taille. ETL (Extract-Transform-Load) est la technologie middleware généralement utilisée pour les solutions analytiques. JasperETL, développé en collaboration avec Talend, est un outil ETL proposant une interface graphique pour gérer les opérations ETL ou E-LT et permettant d’utiliser les langages Java, Perl ou SQL.

Les applications analytiques telles que le BPM (Business Performance Management) proposent aux organisations un cadre « top-down » intégrant une boucle de rétroaction qui permet d’aligner planification et exécution, stratégie et tactique ou encore les objectifs des divisions et ceux de l’entreprise dans son ensemble. Les utilisateurs de ces applications, cadres et dirigeants responsables de divisions particulières, et toute équipe gérant des budgets peuvent utiliser JasperServer comme interface pour visualiser les résultats de leur application analytique.

Quels que soient vos besoins analytiques, l’écosystème Jaspersoft offre la solution la plus efficace, la plus robuste et la plus évolutive qui, même face à l’explosion des volumes de données et un marché en demande d’une visibilité toujours plus poussée, livre toujours les informations désirées.

Ce texte est un résumé de notre Livre Blanc, n’hésitez pas à vous inscrire pour obtenir le Livre Blanc complet, en anglais