Ollama

Busca Semântica com Ollama e PostgreSQL

RAG PostgreSQL pgvector pgai Ollama Semantic Search
Implementando busca semântica com PostgreSQL e Ollama

Olá, pessoal! 👋

No artigo anterior, exploramos como construir um sistema RAG (Retrieval-Augmented Generation) usando Clojure e Ollama com uma implementação simples de TF-IDF. Embora essa abordagem seja excelente para aprender os fundamentos, quando pensamos em soluções de produção, precisamos de algo mais robusto e escalável.

Neste artigo, vamos descobrir como construir um sistema de busca semântica poderoso usando Ollama, PostgreSQL e suas extensões para manipulação de vetores. Esta solução é perfeitamente adequada para aplicações de produção e pode servir como base para sistemas RAG, agentes de IA, assistentes em geral. Diferentemente do artigo anterior, vamos usar o Ollama via Docker assim como o PostgreSQL e as extensões pgvector e pgai.

Leia mais →

Técnicas Avançadas para RAG em Produção

RAG LLM AI Optimização Produção PostgreSQL Ollama
Explorando técnicas para otimizar sistemas RAG para uso em produção

Introdução

Olá pessoal! 👋

Nos artigos anteriores, exploramos como implementar um RAG básico em Clojure em memória e como construir um sistema de busca semântica com PostgreSQL e Ollama. Agora, vamos dar o próximo passo: transformar nosso protótipo em um sistema RAG pronto para produção.

Como muitos desenvolvedores já descobriram, criar um protótipo funcional de RAG com alguns documentos é relativamente simples. O verdadeiro desafio começa quando precisamos escalar esse sistema para lidar com milhares de documentos, garantir respostas precisas e manter o desempenho sob carga. Neste artigo, vamos explorar técnicas avançadas para superar esses desafios e levar nosso DocAI para um novo patamar de qualidade e confiabilidade.

Leia mais →