Développez votre recherche à l’aide des services natifs AWS pour identifier, comprendre et stocker des documents en toute sécurité.

NRZ.Digital
0 0

La débâcle du document

Les entreprises continuent de lutter contre le problème séculaire: les documents papier. S’adapter à la modernisation des documents pour étendre la capacité de recherche, de catalogage et de protection des données HIPAA PII est primordial. Perficient continue d’aider les entreprises à accélérer le temps nécessaire pour numériser des documents en vue d’une intégration plus poussée dans d’autres secteurs. Dans cet article, nous expliquerons comment Perficient peut aider à intégrer un pipeline sans serveur dans AWS pour lutter contre la débâcle du document!

Scénario

Dans l’architecture de solution ci-dessous, nous couvrirons les données migrées en toute sécurité d’un centre de données sur site vers le cloud AWS. Les composants réseau tels qu’AWS Direct Connect sont utilisés pour garantir que les données traversent en toute sécurité la structure réseau jusqu’à leur destination. L’hypothèse que les données sont dans un format de style de rapport, texte brut, Adobe PDF ou basé sur une image (.PNG, .JPG). Cette solution peut être mise en œuvre comme une utilisation ponctuelle d’un chariot élévateur de données ou comme système de réplication par lots au fil du temps.

L’utilisateur final n’a pas besoin de se préoccuper du processus de conversion des données, car le pipeline sans serveur gère toutes les données ETL (extraction, transformation et chargement). Elasticsearch, lorsqu’il est associé à Kibana, offre un outil extrêmement puissant pour rechercher de grands ensembles de données. Il est basé sur le Moteur Apache Lucene et convient aux capacités d’indexation et de recherche de documents volumineux.

Vue d’ensemble de la solution

Présentation de la solution DocSearch

Composants

  1. Les données résident sur site et sont dans un format pris en charge pour la conversion. AWS DataSync est déployé sur un système d’exploitation conventionnel et est chargé d’exporter les données en toute sécurité.
  2. Les données traversent un AWS Direct Connect pour garantir que le transit reste privé et ne traverse pas l’espace Internet public.
  3. Le point de terminaison du VPC est le point d’entrée du VPC, ce qui facilite le chemin sécurisé.
  4. Le service Amazon DataSync est configuré, avec des agents s’exécutant dans des sous-réseaux privés au sein du VPC. L’agent DataSync recevra les données et les traitera. Dans ce cas, il sera envoyé au compartiment Amazon S3 de destination pour traitement.
  5. Les données sont envoyées dans le VPC (en privé) au compartiment Amazon S3. Un point de terminaison Amazon S3 est utilisé pour garantir que le trafic ne quitte pas le VPC. Les objets sont chiffrés en cours de route définis par la stratégie de compartiment Amazon S3, tandis que les objets de compartiment S3 stockés sont chiffrés à l’aide du chiffrement AWS KMS au repos.
  6. Une ou plusieurs fonctions Amazon Lambda exécutées pour traiter les données par lots, qui ont atterri dans le compartiment Amazon S3. Plusieurs composants AWS facilitent l’analyse des données.
  7. Une ou plusieurs fonctions Amazon Lambda exécutées pour extraire les données par lots, désormais envoyées à partir de la fonction précédente. Plusieurs composants AWS facilitent l’extraction des données.
  8. Le service Amazon ElasticSearch stocke les données extraites dans un index chiffré (au repos et en transit). Ces données peuvent désormais être utilisées pour être recherchées en interne à l’aide de l’API Elasticsearch ou de Kibana. Amazon Cognito est utilisé pour sécuriser le processus de connexion, ainsi que pour intégrer SSO si nécessaire.
  9. Kibana est utilisé pour superposer Elasticsearch et fournit des expressions de recherche, des tableaux de bord et des outils conviviaux.🔍 Les employés peuvent désormais récupérer des enregistrements et des documents beaucoup plus facilement, tout en utilisant une seule interface!

Êtes-vous prêt à renforcer l’expérience de recherche de documents de votre organisation?

Perficient est fier d’être un partenaire de conseil avancé dans le réseau de partenaires Amazon. Nos architectes de solutions sont des experts en la matière dans les domaines de la recherche et de la découverte. Nous sommes là pour aider à alléger le fardeau de la transformation numérique des documents et à étendre la capacité de recherche.

Contactez-nous dès aujourd’hui pour en savoir plus sur la façon dont Perficient peut vous aider à tirer le meilleur parti de la recherche de documents!

A propos de l’auteur

Troy est un architecte de solutions passionné spécialisé dans le groupe AWS Cloud Platform Solutions chez Perficient. Troy est fier d’une architecture de solutions bien documentée, du rêve à la livraison. Il est un fervent défenseur des logiciels Open Source, membre de AWS Community Builders (Storage Specialty) et ambassadeur AWS APN. Consultez ses certifications AWS ici: https://www.youracclaim.com/users/troy-dieter/badges

Plus de cet auteur


Happy
Happy
0
Sad
Sad
0
Excited
Excited
0
Sleppy
Sleppy
0
Angry
Angry
0
Surprise
Surprise
0

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Laisser un commentaire

Next Post

Okko Sport se tourne vers Lumen pour la diffusion vidéo en direct

Les diffuseurs et les fournisseurs de streaming savent que lorsqu’il s’agit de répondre aux attentes des consommateurs, les enjeux ne sont jamais plus importants que lors d’événements sportifs en direct. Fournir une vidéo en direct est déjà assez difficile, mais lorsqu’un seul incident de mauvaise performance peut amener les téléspectateurs […]

Abonnez-vous maintenant