Fontes e Tecnologias
Fontes acadêmicas, tecnologias e padrões citados ao longo do guia. Acesso em 13 abr. 2026.
Lost in the Middle: How Language Models Use Long Contexts — estudo seminal sobre degradação de atenção em contextos longos. arXiv:2307.03172.
Episodic and Semantic Memory — Organization of Memory, Academic Press. Distinção fundacional entre memória episódica e semântica que fundamenta a taxonomia funcional usada neste guia.
Memory and Consciousness — Canadian Psychology, 26(1), 1–12. Expande a distinção episódica/semântica e introduz o conceito de memória autonoética.
Working Memory — Psychology of Learning and Motivation, 8, 47–89. Modelo de memória de trabalho com loop fonológico, bloco visuoespacial e executivo central.
Memory Systems — MIT Press. Revisão abrangente dos sistemas de memória humana: episódica, semântica, procedural, priming e condicionamento.
Structure and Function of Declarative and Nondeclarative Memory Systems — PNAS 93(24). Fundamenta a distinção entre memória declarativa e não-declarativa em neurociência.
MemGPT: Towards LLMs as Operating Systems — arXiv:2310.08560. Introduz hierarquia de memória inspirada em SO para agentes com contexto ilimitado.
A Survey on the Memory Mechanism of Large Language Model based Agents — arXiv:2404.13501. Revisão sistemática de mecanismos de memória em agentes LLM.
Cognitive Architectures for Language Agents (CoALA) — arXiv:2309.02427. Framework unificado para arquiteturas cognitivas de agentes com memória.
Retrieval-Augmented Generation for Knowledge-Intensive NLP Tasks — arXiv:2005.11401. Paper original que define o padrão RAG.
From Local to Global: A Graph RAG Approach to Query-Focused Summarization. Microsoft Research. Demonstra vantagem de grafos sobre RAG vetorial plano em perguntas globais.
Language Models as Knowledge Bases? — arXiv:1909.01066. Demonstra que LLMs armazenam fatos factuais nos pesos, com viés e imprecisão.
Locating and Editing Factual Associations in GPT (ROME) — arXiv:2202.05262. Técnica para editar fatos no conhecimento paramétrico sem re-treinamento completo.
A-MEM: Agentic Memory for LLM Agents — arXiv:2502.10291. Sistema de memória inspirado em Zettelkasten com rede de notas interconectadas.
Graphiti: A Temporally-Aware Knowledge Graph for AI Agents. Zep AI, jan/2025. Introduz valid_at/invalid_at para raciocínio temporal em grafos.
Attention Is All You Need — NeurIPS 2017. Paper fundacional dos Transformers — define a complexidade O(n²) da atenção que motiva a necessidade de memória externa.
Padrão emergente de wiki compilado por LLM: documentos curados por humanos, resumidos e indexados pelo modelo. Abr/2026.
Benchmark para avaliação de sistemas de memória de longo prazo em agentes conversacionais. Usado por Mem0 e outros sistemas para comparação padronizada.
Banco vetorial de alta performance para busca semântica. Rust-native, filtros de payload, quantização nativa.
Banco vetorial gerenciado, popular em produção. Hybrid search, namespaces multi-tenant, serverless tier.
Banco vetorial open-source com módulos de IA integrados. Hybrid search BM25+vetorial, GraphQL API.
Banco vetorial open-source, ideal para prototipagem. Zero configuração, persistência em SQLite.
Banco vetorial distribuído para escala enterprise. Suporte a bilhões de vetores, múltiplos índices (HNSW, DiskANN).
Biblioteca de busca vetorial de alta performance. Suporte a GPU, múltiplos algoritmos. Backend de muitos bancos vetoriais.
Extensão vetorial para PostgreSQL. Vetores + dados relacionais em um só banco, índices HNSW e IVFFlat.
Banco de grafos líder de mercado. Cypher query language, suporte a grafos de conhecimento e RAG híbrido.
Banco de grafos otimizado para agentes de IA. Performance superior ao Neo4j para grafos de médio porte.
Banco de grafos embarcado (como SQLite). Cypher SQL, alta performance, sem servidor separado.
Grafos temporais para memória de agentes (Zep). Introduz valid_at/invalid_at para raciocínio temporal.
Banco relacional com suporte a pgvector para embeddings. Transações ACID com busca semântica.
Key-value store in-memory para memória de curto prazo. Latência sub-ms, TTL nativo, Redis Stack com busca vetorial.
Backend open-source com PostgreSQL, pgvector, auth e storage integrados. Plano gratuito generoso.
Framework com camadas nativas de memória para agentes. Inspirado em sistemas operacionais com paginação de contexto.
Camada de memória adaptativa: vetorial + grafo + relacional. LongMemEval: 26% acima do baseline. Abr/2025.
Memória de longo prazo com extração automática de fatos e grafo temporal (Graphiti). Cloud ou self-hosted.
Memória semântica portável via Supabase pgvector e MCP server nativo. Mar/2026.
Memória de agente privacy-first: self-hosted, ONNX local, SQLite. Zero dependências de cloud. Abr/2026.
Padrão aberto da Anthropic para padronização de contexto e ferramentas em agentes de IA. Adotado por Claude, Cursor, Windsurf, Zed e +100 integrações.
Protocolo do Google para interoperabilidade entre agentes autônomos.
Padrão arquitetural de recuperação semântica que combina busca vetorial com geração de linguagem. Definido por Lewis et al. (2020).
RAG baseado em grafos de conhecimento para raciocínio sobre documentos complexos. Queries globais sobre corpus inteiro.
Framework para agentes stateful com grafos de execução e memória persistente (LangGraph Store). Checkpointing de estado.
Framework de orquestração de LLMs com memória de conversação, RAG e integração com bancos vetoriais.
Framework especializado em indexação e recuperação de conhecimento operacional via RAG.
Plataforma de automação de workflows com nós de IA e memória. Visual workflow builder, +400 integrações.
Runtime local para LLMs open-source. API compatível com OpenAI, suporte a Llama, Mistral, DeepSeek e +100 modelos.
General Data Protection Regulation. Art. 17: Direito ao esquecimento — obrigação de deletar dados pessoais mediante solicitação.
Lei Geral de Proteção de Dados Pessoais — Brasil. Equivalente ao GDPR para dados de cidadãos brasileiros.
Lei de privacidade da Califórnia. Direito de opt-out de venda de dados pessoais e direito de exclusão.
Regulação europeia de IA. Sistemas de memória com dados biométricos ou sensíveis classificados como alto risco.
Wikis e bases de conhecimento para memória semântica humana.
Rastreamento de tarefas e decisões — memória episódica de produto.
Uma forma de memória episódica auditável do código.
Convenção de identidade e instrução persistente para agentes de codificação.
Formatos de arquivo plano para memória simples e portável.