Construindo uma Base de Armazenamento Escalável para Serviços Financeiros Impulsionados por IA Generativa

Empresa do setor financeiro implementou uma solução de IA Generativa na AWS para automatizar o atendimento ao cliente e melhorar o acesso ao conhecimento corporativo. A arquitetura baseada em Amazon S3, Bedrock e OpenSearch aumentou a eficiência operacional, reduziu processos manuais e criou uma base escalável para crescimento futuro.

Soluções da Dedalus para o setor financeiro

Sobre o Cliente 

Um provedor de tecnologia para o setor financeiro precisava aumentar a eficiência e a qualidade do atendimento ao cliente por meio da implementação de um assistente baseado em Inteligência Artificial Generativa. A solução utilizou serviços de armazenamento da AWS como base para ingestão, indexação, recuperação e gerenciamento de conhecimento, possibilitando interações escaláveis e seguras orientadas por IA, além de reduzir o esforço operacional.

Desafio

A empresa enfrentava um volume crescente de solicitações de suporte relacionadas a operações tributárias e bancárias. A equipe de atendimento precisava lidar com centenas de chamados mensais, exigindo múltiplas interações e consultas a uma ampla base documental.

A organização buscava:

  • Melhorar a precisão e consistência das respostas;
  • Reduzir a carga de trabalho dos analistas de suporte;
  • Facilitar o acesso ao conhecimento corporativo;
  • Criar uma arquitetura escalável para expansão a novos produtos financeiros e clientes;
  • Estabelecer um repositório seguro para armazenamento e recuperação de grandes volumes de documentos utilizados por um assistente de IA.

O processo existente dependia fortemente de buscas manuais e especialistas de negócio, criando gargalos operacionais e limitando a escalabilidade.

Arquitetura da Solução

Foi projetada uma arquitetura nativa em nuvem baseada no modelo RAG (Retrieval-Augmented Generation), utilizando Inteligência Artificial Generativa.

A camada de armazenamento tornou-se o componente central da solução.

Serviços AWS Utilizados

  • Amazon S3 para armazenamento centralizado de documentos, manuais, artigos de conhecimento e conteúdos de suporte;
  • Amazon OpenSearch Service para indexação de embeddings e busca semântica;
  • Amazon Bedrock para modelos fundacionais e geração de embeddings;
  • AWS Lambda para processamento e orquestração de documentos;
  • Amazon API Gateway para exposição segura de APIs;
  • Amazon DynamoDB para gerenciamento de metadados e sessões;
  • Amazon CloudWatch para monitoramento e observabilidade;
  • Amazon Cognito para gerenciamento de identidade e acesso.

Arquitetura de Armazenamento

  1. Documentos provenientes de diversas fontes foram armazenados no Amazon S3.
  2. Pipelines serverless processavam e preparavam automaticamente os conteúdos.
  3. Embeddings eram gerados pelo Amazon Bedrock e indexados no OpenSearch.
  4. Consultas dos usuários acionavam a recuperação semântica das informações mais relevantes.
  5. As informações recuperadas eram combinadas com modelos fundacionais para gerar respostas contextualizadas.
  6. Todos os recursos foram implementados seguindo requisitos de segurança, governança e segregação de dados.

A arquitetura permitiu centralizar a gestão do conhecimento mantendo escalabilidade, durabilidade e segurança para futuras expansões.

Resultados e Métricas de Sucesso

Resultados de Negócio

  • Melhoria no acesso ao conhecimento organizacional;
  • Redução da dependência de processos manuais de suporte;
  • Recuperação mais rápida de informações em grandes repositórios documentais;
  • Maior potencial de automação do atendimento;
  • Base preparada para expansão a novos produtos bancários e segmentos de clientes.

 

Métricas de Sucesso 

  • Validação da precisão das respostas geradas pela IA;
  • Ingestão e recuperação bem-sucedida de documentos armazenados no Amazon S3;
  • Aceitação positiva dos usuários durante os testes de validação;
  • Capacidade comprovada de processar e indexar milhares de documentos;
  • Redução do esforço dos analistas de suporte durante o atendimento aos clientes.

 

Análise de TCO (Custo Total de Propriedade)

Foi realizada uma análise de TCO para avaliar os custos operacionais da arquitetura proposta.

  • Componentes Avaliados
  • Custos de Infraestrutura
  • Armazenamento no Amazon S3;
  • Indexação e consultas no Amazon OpenSearch;
  • Execuções do AWS Lambda;
  • Requisições do Amazon API Gateway;
  • Capacidade sob demanda do Amazon DynamoDB;
  • Custos de inferência e geração de embeddings no Amazon Bedrock;
  • Monitoramento e observabilidade via Amazon CloudWatch.

 

Premissas de Carga de Trabalho

  • Aproximadamente 15 solicitações por minuto;
  • 12 horas de operação por dia;
  • Centenas de milhões de tokens processados mensalmente;
  • Milhares de documentos adicionados ao repositório de conhecimento a cada mês.

 

Benefícios do Amazon S3

A análise destacou o Amazon S3 como principal plataforma de armazenamento devido a:

  • Alta durabilidade (11 noves);
  • Escalabilidade elástica;
  • Baixa sobrecarga operacional;
  • Modelo de armazenamento mais econômico quando comparado a repositórios tradicionais on-premises.

Os resultados demonstraram que uma arquitetura cloud native é capaz de sustentar o crescimento futuro com custos previsíveis e menor complexidade operacional.

Lições Aprendidas

1. Uma estratégia sólida de armazenamento é fundamental para o sucesso de soluções GenAI e RAG

A qualidade da estrutura de armazenamento impacta diretamente o desempenho e a eficiência da solução.

2. A qualidade dos dados influencia diretamente a precisão das respostas

Dados bem organizados e atualizados resultam em melhores experiências para os usuários.

3. Centralizar documentos no Amazon S3 simplifica governança e escalabilidade

O armazenamento centralizado facilita a gestão do ciclo de vida dos dados e futuras expansões.

4. A definição antecipada de metadados melhora a recuperação de informações

Uma boa estratégia de catalogação aumenta a efetividade das buscas semânticas.

5. A curadoria contínua do conteúdo melhora significativamente os resultados da IA

A atualização e refinamento constante da base de conhecimento elevam a qualidade das respostas geradas.

6. A arquitetura deve ser planejada para expansão futura

A solução foi projetada para suportar novos produtos, clientes e fontes documentais sem necessidade de grandes mudanças estruturais.

7. Integrações serverless aceleram a implementação e reduzem custos operacionais

A utilização de serviços serverless permitiu maior agilidade, escalabilidade e eficiência operacional.

Veja mais cases