Pular para o conteúdo

Douto — Agente de Conhecimento Doutrinario

Douto e o agente de conhecimento doutrinario do ecossistema sens.legal. Ele transforma livros juridicos em conhecimento estruturado, pesquisavel e pronto para consumo por IA, por meio de um pipeline Python em cinco estagios, e mantem um skill graph navegavel organizado por ramo do direito.

O pipeline do Douto processa livros juridicos de PDF ate embeddings pesquisaveis:

  • Extracao de PDF — converte PDFs juridicos em markdown estruturado via LlamaParse
  • Chunking Inteligente — divide documentos usando heuristicas especificas do dominio juridico (agrupamento de notas de rodape, preservacao de artigos de lei, deteccao de running headers)
  • Enriquecimento via LLM — classifica cada chunk com metadados estruturados: instituto juridico, tipo de conteudo, ramo do direito, fontes normativas
  • Embeddings Semanticos — gera vetores de 768 dimensoes usando Legal-BERTimbau com composicao de texto enriquecida por metadados
  • Busca Hibrida — combina busca semantica (similaridade cosseno) com BM25 (busca por palavras-chave) e filtragem por metadados
MetricaValor
Livros processados~50
Chunks no corpus~31.500
Ramos do direito cobertos3 ativos (Civil, Processual, Empresarial) + 5 planejados
Dimensoes dos embeddings768 (Legal-BERTimbau)
Modos de buscaSemantico, BM25, Hibrido
Cobertura de testes0%
Scripts no pipeline5
Versaov0.1.0 (pre-release)
SecaoDescricao
IntroducaoO que e o Douto, por que ele existe e quem o utiliza
QuickstartExecute uma busca em menos de 5 minutos
ArquiteturaComo o pipeline e a base de conhecimento funcionam
FuncionalidadesInventario completo de funcionalidades com status
RoadmapPara onde o Douto esta indo — milestones v0.2 a v1.0
GlossarioTerminologia juridica e tecnica

Douto e um dos cinco componentes da plataforma unificada de pesquisa juridica sens.legal:

graph LR
subgraph "sens.legal"
JU["Juca<br/>Frontend Hub<br/>Next.js"]
VA["Valter<br/>Case Law + Backend<br/>FastAPI + Neo4j"]
LE["Leci<br/>Legislation<br/>Next.js + PG"]
DO["Douto<br/>Legal Doctrine<br/>Python Pipeline"]
end
USER["Lawyer"] --> JU
JU --> VA
JU --> LE
JU --> DO
VA <-.->|"embeddings,<br/>knowledge graph"| DO
AgenteFuncaoStack
ValterBackend de jurisprudencia — 23.400+ decisoes do STJ, 28 ferramentas MCPFastAPI, PostgreSQL, Qdrant, Neo4j, Redis
JucaFrontend hub — interface para advogadosNext.js 16, block system, briefing progressivo
LeciLegislacao — base de dados de leis federaisNext.js 15, PostgreSQL, Drizzle
JosephOrquestrador — coordena os agentes
DoutoDoutrina juridica — este projetoPython 3, LlamaParse, Legal-BERTimbau