Sobre o Cliente
Um provedor de tecnologia para o setor financeiro precisava aumentar a eficiência e a qualidade do atendimento ao cliente por meio da implementação de um assistente baseado em Inteligência Artificial Generativa. A solução utilizou serviços de armazenamento da AWS como base para ingestão, indexação, recuperação e gerenciamento de conhecimento, possibilitando interações escaláveis e seguras orientadas por IA, além de reduzir o esforço operacional.
Desafio
A empresa enfrentava um volume crescente de solicitações de suporte relacionadas a operações tributárias e bancárias. A equipe de atendimento precisava lidar com centenas de chamados mensais, exigindo múltiplas interações e consultas a uma ampla base documental.
A organização buscava:
- Melhorar a precisão e consistência das respostas;
- Reduzir a carga de trabalho dos analistas de suporte;
- Facilitar o acesso ao conhecimento corporativo;
- Criar uma arquitetura escalável para expansão a novos produtos financeiros e clientes;
- Estabelecer um repositório seguro para armazenamento e recuperação de grandes volumes de documentos utilizados por um assistente de IA.
O processo existente dependia fortemente de buscas manuais e especialistas de negócio, criando gargalos operacionais e limitando a escalabilidade.
Arquitetura da Solução
Foi projetada uma arquitetura nativa em nuvem baseada no modelo RAG (Retrieval-Augmented Generation), utilizando Inteligência Artificial Generativa.
A camada de armazenamento tornou-se o componente central da solução.
Serviços AWS Utilizados
- Amazon S3 para armazenamento centralizado de documentos, manuais, artigos de conhecimento e conteúdos de suporte;
- Amazon OpenSearch Service para indexação de embeddings e busca semântica;
- Amazon Bedrock para modelos fundacionais e geração de embeddings;
- AWS Lambda para processamento e orquestração de documentos;
- Amazon API Gateway para exposição segura de APIs;
- Amazon DynamoDB para gerenciamento de metadados e sessões;
- Amazon CloudWatch para monitoramento e observabilidade;
- Amazon Cognito para gerenciamento de identidade e acesso.
Arquitetura de Armazenamento
- Documentos provenientes de diversas fontes foram armazenados no Amazon S3.
- Pipelines serverless processavam e preparavam automaticamente os conteúdos.
- Embeddings eram gerados pelo Amazon Bedrock e indexados no OpenSearch.
- Consultas dos usuários acionavam a recuperação semântica das informações mais relevantes.
- As informações recuperadas eram combinadas com modelos fundacionais para gerar respostas contextualizadas.
- Todos os recursos foram implementados seguindo requisitos de segurança, governança e segregação de dados.
A arquitetura permitiu centralizar a gestão do conhecimento mantendo escalabilidade, durabilidade e segurança para futuras expansões.
Resultados e Métricas de Sucesso
Resultados de Negócio
- Melhoria no acesso ao conhecimento organizacional;
- Redução da dependência de processos manuais de suporte;
- Recuperação mais rápida de informações em grandes repositórios documentais;
- Maior potencial de automação do atendimento;
- Base preparada para expansão a novos produtos bancários e segmentos de clientes.
Métricas de Sucesso
- Validação da precisão das respostas geradas pela IA;
- Ingestão e recuperação bem-sucedida de documentos armazenados no Amazon S3;
- Aceitação positiva dos usuários durante os testes de validação;
- Capacidade comprovada de processar e indexar milhares de documentos;
- Redução do esforço dos analistas de suporte durante o atendimento aos clientes.
Análise de TCO (Custo Total de Propriedade)
Foi realizada uma análise de TCO para avaliar os custos operacionais da arquitetura proposta.
- Componentes Avaliados
- Custos de Infraestrutura
- Armazenamento no Amazon S3;
- Indexação e consultas no Amazon OpenSearch;
- Execuções do AWS Lambda;
- Requisições do Amazon API Gateway;
- Capacidade sob demanda do Amazon DynamoDB;
- Custos de inferência e geração de embeddings no Amazon Bedrock;
- Monitoramento e observabilidade via Amazon CloudWatch.
Premissas de Carga de Trabalho
- Aproximadamente 15 solicitações por minuto;
- 12 horas de operação por dia;
- Centenas de milhões de tokens processados mensalmente;
- Milhares de documentos adicionados ao repositório de conhecimento a cada mês.
Benefícios do Amazon S3
A análise destacou o Amazon S3 como principal plataforma de armazenamento devido a:
- Alta durabilidade (11 noves);
- Escalabilidade elástica;
- Baixa sobrecarga operacional;
- Modelo de armazenamento mais econômico quando comparado a repositórios tradicionais on-premises.
Os resultados demonstraram que uma arquitetura cloud native é capaz de sustentar o crescimento futuro com custos previsíveis e menor complexidade operacional.
Lições Aprendidas
1. Uma estratégia sólida de armazenamento é fundamental para o sucesso de soluções GenAI e RAG
A qualidade da estrutura de armazenamento impacta diretamente o desempenho e a eficiência da solução.
2. A qualidade dos dados influencia diretamente a precisão das respostas
Dados bem organizados e atualizados resultam em melhores experiências para os usuários.
3. Centralizar documentos no Amazon S3 simplifica governança e escalabilidade
O armazenamento centralizado facilita a gestão do ciclo de vida dos dados e futuras expansões.
4. A definição antecipada de metadados melhora a recuperação de informações
Uma boa estratégia de catalogação aumenta a efetividade das buscas semânticas.
5. A curadoria contínua do conteúdo melhora significativamente os resultados da IA
A atualização e refinamento constante da base de conhecimento elevam a qualidade das respostas geradas.
6. A arquitetura deve ser planejada para expansão futura
A solução foi projetada para suportar novos produtos, clientes e fontes documentais sem necessidade de grandes mudanças estruturais.
7. Integrações serverless aceleram a implementação e reduzem custos operacionais
A utilização de serviços serverless permitiu maior agilidade, escalabilidade e eficiência operacional.





