fr en


Home / The company / Articles / Des documents toujours plus nombreux, IBcom 2008/01



Right menu

Prochaines formations

Formation Lieu Date
LPI102 Genève 07.10 - 10.10
LPI102 Lausanne 13.10 - 16.10
LPI202 Genève 13.10 - 17.10
LPI101 Lausanne 03.11 - 06.11
LNX70 Genève 04.11 - 05.11

Planning complet et inscription

Events and seminars

IT Sales Consultant

Linalis is looking for a Sales person to support the growth of its IT consultancy, services and training businesses. We are looking for an ambitious but personable sales person who fits in with the culture of our Open Source company.

Preferably with French and / or German and / or English language skills.

Knowledge of IT an advantage, but someone with proven success in B2B mid value, mid volume sales is a pre-requisite.

Projects

Using the Plone CMS at Radio Suisse Romande

Radio Suisse Romande was looking for replacing its Content Management System (CMS),
After trying several Open-Source CMS, they chose a Zope/Plone based solution.

Contact

Tel: +41 22 348 30 15

Fax: +41 22 348 30 16

Mail: info@linalis.com


La gestion documentaire enfin libre (et accessible) !

Article IBcom, 2008/01

Des documents toujours plus nombreux

Qu'une société compte 5, 50 ou 5000 employés, le problème est toujours le même: comment organiser le nombre toujours plus important de documents, électroniques ou papier, qu'elle produit ?

Il y a les documents officiels, rangés dans un coffre ignifugé à la banque, où on doit se déplacer à chaque fois qu'il est nécessaire d'y accéder; il y a les documents produits par les fournisseurs, les partenaires, les clients; il y a les documents produits en interne à usage unique, ceux censés évoluer au cours du temps, ceux qui sont publics, confidentiels, ceux qui sont malencontreusement perdus, ceux qui doivent circuler et être approuvés. Et puis il y a ceux qu'on jette parce que cela fait trois mois qu'ils traînent dans un sous-dossier d'un bureau rempli à ras-bord d'icônes, en estimant qu'ils ne doivent plus servir à grand chose. Bien sûr, le lendemain, on en a de nouveau besoin.

Pour organiser toute cette masse de documents Word, Excel, PDF(1), photos, vidéos, et autres, les sociétés mettent en place un partage réseau, sur un NAS(2) ou sur un SAN(3), ou peut-être simplement sur le disque dur du poste de l'accueil. Cette technique de rangement de documents s'avère inefficace à long terme car:

  • il n'y a pas de réelle sécurité rattachée aux documents
  • il n'y a pas de standard pour nommer les fichiers et dossiers
  • l'utilisateur perd du temps à rechercher les documents dont il a besoin
  • quand finalement il trouve le document dont il a besoin, il s'agit de la mauvaise version
  • les documents ont tendance à être dupliqués et à se retrouver dans des endroits différents

Le volume des données gérées par l'entreprise croît exponentiellement. Cela est dû à plusieurs facteurs, dont le prix du stockage, le coût de la bande passante Internet, le fait que les formats de données ne sont plus optimisés, et la tendance globale à la dématérialisation. Afin de gérer ces données, il ne suffit plus seulement de pouvoir les classer dans une structure de dossiers hiérarchiques. Il est maintenant nécessaire de procéder au marquage et au classement de ces données afin d'optimiser les recherches. Il est aussi nécessaire de pouvoir associer des propriétés diverses et variées à ces documents (propriétaire, état du document, niveau de sécurité, emplacement du document dans un processus d'approbation, commentaires, remarques, sessions de questions / réponses, etc.). Pour gérer toutes ces informations, un simple partage de fichiers ne suffit plus, seule une solution de gestion documentaire permet d'optimiser le traitement et le classement des données de façon optimale.

La gestion documentaire par le passé

Jusqu'à présent, pour déployer une solution de gestion documentaire, le choix se bornait à des produits tels qu'Interwoven, EMC Documentum, Microsoft Office Sharepoint (avec Microsoft Content Management Server), OpenText, Vignette, Hyland OnBase ou encore Oracle Content Management. Des solutions propriétaires, lourdes, complexes et surtout chères.

Dans le domaine des logiciels libres, il n'existait jusqu'à récemment aucune solution de gestion documentaire. Le monde des logiciels libres regorge de solutions CMS(4) qui permettent de gérer un site Web et son contenu(5). Plusieurs de ces solutions proposent des sous-modules permettant de stocker et publier des documents, de façon plus ou moins efficace. Mais aucune solution(6) ne fournissait l'étendue des fonctionnalités qui se doivent d'être présentes dans un produit de gestion documentaire digne de ce nom. Rappelons ici que la gestion documentaire se compose de cinq éléments:

  • La capture d'informations – Cela consiste en l'entrée manuelle d'informations, le scan de documents, la reconnaissance optique de caractères, la lecture de code-barres, le traitement de formulaires Web, etc.
  • La gestion d'informations – Cela consiste en plusieurs sous-éléments:

La gestion documentaire – Le gestion des versions des documents, la recherche et la navigation dans le dépôt de documents et l'audit des modifications

La collaboration – Tout ce qui gravite autour des documents et qui permet aux utilisateurs de travailler ensemble sur les mêmes documents

La gestion de contenu Web – Tout CMS permettant de gérer la présentation de l'information, les accès, la conversion automatique de formats, les processus de génération et de publication de l'information

La gestion d'enregistrements – La gestion des archivages et des fichiers, l'indexation, la protection de l'information, la gestion des politiques de rétention de l'information, et la gestion des méta-données décrivant les informations stockées

Les « workflows » – Les outils permettant de construire des processus métier en fonction des contraintes organisationnelles; la gestion des échéances, des rappels et de la délégation; la supervision des états des processus, du routage et des résultats des processus

  • Le stockage d'informations – Les dépôts de données (par ex. une base de données), les services de librairie permettant de rechercher et de récupérer l'information et les différentes technologies bas niveau de stockage
  • La publication d'informations – La transformation des données, l'ajout d'éléments de sécurité aux documents (comme par exemple un certificat digital ou du DRM(7)), et la distribution de l'information (publication sur site Web, envoi par fax, impression, transformation en flux RSS(8), etc.)
  • L'archivage d'informations – Les médias (par ex. les disques optiques) et les stratégies utilisées pour stocker les données sur le long terme (par ex. la migration de données tous les 10 ans pour s'adapter aux nouvelles technologies de stockage)

Le choix des logiciels libres

Comme de plus en plus souvent de nos jours, les logiciels libres arrivent à la rescousse: Alfresco est une solution de gestion documentaire entièrement basée sur des logiciels libres. Mais attention, on est loin du projet de fin d'études, maintenu par deux étudiants, dont la pérennité laisserait à désirer. Alfresco est développé par un groupe d'anciens de Documentum (dont le fondateur de Documentum) qui capitalisent à eux seuls plusieurs décennies d'expérience dans le domaine de la gestion documentaire. Une communauté impressionnante de développeurs gravite autour du projet, attirée par l'utilisation des meilleures et plus récentes technologies libres: MySQL(9), Liferay(10), OpenOffice(11), Lucene(12), JSF(13), Hibernate(14), Web Services(15), Spring(16), etc.

On entend souvent dire qu'un logiciel libre est forcément inadapté à une utilisation professionnelle, puisqu'il est gratuit. Cela est vrai pour un certain nombre de petits logiciels libres pour lesquels la communauté de développeurs et de mainteneurs n'a pas atteint la taille critique permettant au projet de grandir, d'obtenir une base d'utilisateurs suffisante et d'atteindre le niveau de maturité nécessaire à une utilisation en entreprise. Ceci est aussi le cas de nombreux logiciels propriétaires.

Par contre, pour la plupart des logiciels libres, et cela inclut Alfresco, le processus de développement n'apporte que des avantages aux entreprises:

La transparence

Le modèle de développement des logiciels libres rend le produit totalement transparent, ce qui augmente la confiance de l'utilisateur et optimise le développement, car n'importe qui peut contribuer et améliorer le produit.

L'efficacité

Les produits libres sont généralement plus performants que leurs équivalents propriétaires car ils sont récents et ne possèdent pas un historique de développement lourd et ancien, basé sur des technologies existant uniquement pour le seul applicatif qui les utilise. Un logiciel libre va réutiliser un grand nombre de composants déjà existants, optimisés et éprouvés.

L'ouverture

L'utilisation de protocoles et de standards ouverts permet de garantir la transparence mentionnée plus haut et surtout de s'ouvrir à l'interconnexion avec d'autres systèmes. Pour le cas d'Alfresco, l'utilisation d'une architecture SOA(17), de Web Services et de XML(18) permet à d'autres systèmes (CRM(19) ou ERP(20) par exemple) d'accéder aux données du dépôt de documents.

La réduction des coûts

Le modèle de développement des logiciels libres a profondément modifié le profil de coût des applications de l'informatique de l'entreprise et la façon de calculer le TCO(21). Avec les applications libres, l'utilisateur ne paie plus les coûts marketing. Le coût du développement est fortement réduit, du fait de la participation communautaire et de la réutilisation de composants standards.

La stabilité

Avec le système de cycles de développement des logiciels libres, les dates de sorties des nouvelles versions ne sont plus dictées par les besoins marketing ou financiers de l'éditeur, mais par l'état de stabilité de l'applicatif. Il en résulte un produit final beaucoup plus stable. De plus, les cycles sont souvent plus courts et les bogues plus rapidement identifiés et résolus.

Le business model utilisé aujourd'hui par la plupart des sociétés qui maintiennent un logiciel libre s'est avéré viable: il consiste à offrir des services de support et de consulting autour d'un logiciel que tout un chacun peut télécharger et utiliser gratuitement. Parfois, une version plus stable et plus testée devient payante, mais le processus de développement du logiciel est toujours le même et bénéficie grandement aux sociétés qui l'utilisent: des cycles de développements plus courts, un support de qualité, la possibilité d'intervenir dans la « roadmap » du logiciel, etc.

Le modèle des logiciels libres a fait ses preuves et est en train de révolutionner l'industrie du logiciel.

C'est dans ce contexte qu'évolue Alfresco.

La gestion documentaire selon Alfresco

Alors où en est Alfresco aujourd'hui et qu'est-ce que ce projet peut faire pour optimiser l'organisation de documents ?

Pour bien comprendre comment fonctionne Alfresco, il faut imaginer un partage réseau CIFS(22) intelligent. Un employé dépose un fichier Word dans un répertoire et automatiquement, le fichier obtient la version 1. Alfresco extrait des propriétés du document Word, le nom de l'auteur, la date de création et le niveau de sécurité du document. Ces informations sont utilisées pour renseigner les attributs du document dans Alfresco. Un « workflow » est automatiquement démarré et un manager est averti par e-mail qu'il doit approuver le document. Le manager souhaite ajouter une note au document, un forum est alors créé et automatiquement rattaché. Il suit le document partout où il est déplacé. L'employé modifie le document à nouveau. Le document prend la version 2. Cette fois-ci le manager l'approuve. Le document est automatiquement converti en PDF et publié sur l'Intranet de l'entreprise.

Tout ceci est rendu possible dans Alfresco par le concept de « Smart Spaces » (des dossiers intelligents). Un dossier intelligent est un dossier qui possède des règles. Chaque règle peut être déclenchée lorsqu'un document intègre ou quitte un dossier ou lorsqu'il est mis à jour. Les actions pouvant être définies sont nombreuses:

  • Ajout d'attributs au document (changement du type)
  • Transformation du document (changement du format)
  • Démarrage d'un « workflow »
  • Envoi d'e-mails
  • Déplacement du document
  • Catégorisation du document
  • Etc.

Il est possible de construire des modèles de dossiers intelligents. Ainsi, si l'on crée un dossier par client ou fournisseur, dans lequel existent des sous-dossiers contenant des « workflows » et des règles de transformation de documents, il est possible, en un clic, de dupliquer toute cette arborescence pour un nouveau client ou fournisseur.

Le processus métier décrit plus haut peut être mis en place en une demi-journée et fait partie des fonctionnalités de base d'Alfresco. Pour aller plus loin, il est possible de:

  • étendre le schéma de données pour personnaliser les attributs des documents et les afficher dans l'interface Web d'Alfresco
  • mettre en place d'autres méthodes d'accès au dépôt telles que le FTP(23) ou le WebDAV(24)
  • utiliser Alfresco pour faire du Web Content Management et gérer les versions du site Web ou Intranet de l'entreprise
  • lier Alfresco à un portail, une solution CRM, un moteur BPM(25), ou un serveur d'applications à travers des interfaces standard telles que des Web Services ou les spécifications portlet JSR-168
  • rendre tout le système de gestion documentaire hautement disponible

Alfresco se veut simple d'utilisation et d'administration:

  • La simplicité d'utilisation – Un des grands avantages d'Alfresco par rapport à ses concurrents est qu'il intègre un serveur CIFS. Cela permet à l'utilisateur d'accéder au dépôt de données en faisant des simples copier-coller
  • La simplicité du déploiement – Alfresco ne nécessite pas de déployer un client lourd puisqu'il est accessible par une interface Web
  • La simplicité des recherches – Lancer une recherche est aussi simple que d'utiliser le moteur Google, tout en étant multi-critères et très puissant
  • La simplicité de la navigation – La navigation du dépôt de documents est aussi simple que d'utiliser le moteur Yahoo!

Mise en place

Voilà comment se déroule typiquement la mise en place d'une installation Alfresco.

Installation

Alfresco s'installe sur un serveur Windows ou Linux. Tout ce dont Alfresco a besoin est intégré, que ce soit la base de données ou le serveur d'applications Tomcat. La base de données intégrée à Alfresco est HSQL(26), suffisante pour faire des démos. Une simple manipulation permet d'utiliser une base MySQL, plus adaptée à une utilisation en production.

Configuration

La première étape est d'utiliser le client Web d'Alfresco pour créer les utilisateurs et les groupes d'utilisateurs. Il est aussi possible de connecter Alfresco à un serveur LDAP(27) bien sûr.

Ensuite, il faut configurer les dossiers intelligents et les règles qui régissent leurs comportements afin de coller aux processus métier de l'entreprise. L'interface Web d'Alfresco permet de facilement mettre en place ces règles, sans avoir besoin de modifier des fichiers de configuration.

Extension

L'étape suivante est la modification des méta-données d'Alfresco afin de décrire de nouveaux types de documents. Ainsi, il est possible de personnaliser Alfresco et de créer une vraie application métier. Ici, l'interface Web d'Alfresco ne suffit plus, il faut modifier manuellement les fichiers XML de configuration. La présence d'une API(28) JavaScript permet de facilement manipuler les documents et dossiers présents dans le dépôt et de créer de nouvelles actions utilisateurs permettant de totalement adapter le logiciel aux besoins spécifiques de l'entreprise.

Prenons l'exemple d'une société qui voudrait stocker des curriculum vitae scannés. L'extension des méta-données permettrait de faire apparaître dans les propriétés des documents, certaines des informations contenues dans le document scanné. Ainsi, il serait possible d'effectuer des recherches multi-critères sur les CV. La programmation par JavaScript permettrait de facilement rajouter une action dans le menu correspondant au document. Cette action pourrait par exemple envoyer le document à un manager intéressé par ce profil.

Liens avec des applications tierces

Enfin, il est possible de configurer des Web Services qui pourront être appelés depuis n'importe quelle autre application. Ces Web Services peuvent introduire des données dans Alfresco, effectuer des recherches, renvoyer des données, etc. Ainsi, il est possible de facilement intégrer les données d'Alfresco dans le site Web ou l'Intranet de l'entreprise.

Conclusion

Alfresco fait aujourd'hui partie des projets libres les plus prometteurs et les plus actifs. Pour la mise en place d'une solution de gestion documentaire d'entreprise, il existe deux produits; Nuxeo 5 et Alfresco. Ce dernier est celui qui va certainement devenir une référence dans le domaine tant le développement est rapide et la « roadmap » prometteuse.

Jusqu'à présent, les entreprises rechignaient à mettre en place une solution de gestion documentaire car le prix et la complexité étaient trop élevés. Beaucoup d'entreprises ont développé des systèmes très simples de gestion documentaire adaptés à un besoin unique et très précis. Avec Alfresco, il est aujourd'hui possible de développer, pour un coût très inférieur, ces solutions simples, ainsi que des solutions globales couvrant tous les besoins de gestion documentaire de l'entreprise.

La toute récente version 2.1 d'Alfresco est téléchargeable sur www.alfresco.com et utilisable gratuitement. Il est possible de contracter un support annuel auprès de l'éditeur ou auprès de sociétés de services spécialisées.

Notes

(1)Portable Document Format – Un format propriétaire créé par Adobe pour l'échange de documents

(2)Network Attached Storage – Un serveur de fichiers réseau

(3)Storage Area Network – Un réseau dédié au stockage de données

(4)Content Management System – Un système de gestion de contenu généralement axé Web

(5)eZpublish, Typo3, Joomla, SPIP, Drupal, PostNuke, Plone, etc.

(6)A part Nuxeo 5, une solution de gestion documentaire simple mais efficace (www.nuxeo.com)

(7)Digital Rights Management – Terme générique qui décrit l'ensemble des systèmes permettant de bloquer l'accès à du contenu électronique

(8)Really Simple Syndication – Technologie de publication de flux d'informations

(9)MySQL est un serveur de bases de données libre

(10)Liferay est un portail Web, un serveur de portlets

(11)OpenOffice est la célèbre suite de logiciels bureautiques libre

(12)Lucene est un moteur de recherche textuel écrit en Java

(13)Java Server Faces est une technologie de développement d'interfaces utilisateur pour applications Java

(14)Hibernate est une interface de manipulation de bases de données pour applications Java et .Net

(15)Un Web Service est une API Web avec laquelle il est possible de communiquer en XML

(16)Spring est un framework de développement d'applications

(17)Service Oriented Architecture – L'architecture utilisée par les Web Services

(18)Extensible Markup Language – Langage standard utilisé entre autres par les Web Services

(19)Customer Relationship Management – Outil de gestion de clientèle

(20)Enterprise Ressource Planning – Outil intégré de gestion de société

(21)Total Cost of Ownership

(22)Common Internet File System – un partage réseau tel qu'un partage de dossier Windows standard

(23)File Transfer Protocol

(24)Web-based Distributed Authoring and Versioning – une extension du protocole HTTP

(25)Business Process Management

(26)HSQL est un serveur de bases de données simple écrit en Java et utilisant peu de mémoire

(27)Lightweight Directory Access Protocol – un serveur d'annuaire

(28)Application Programming Interface – Une interface de programmation permettant de manipuler les données contenues dans le logiciel qui fournit l'interface.