Pular para o conteúdo

Glossario

Termos e conceitos que voce encontrara na documentacao do Douto, organizados por dominio.


Um conceito ou instituto do direito — a unidade fundamental de classificacao doutrinaria. Exemplos: exceptio non adimpleti contractus (excecao do contrato nao cumprido), boa-fe objetiva, tutela antecipada. No Douto, cada chunk e classificado pelo(s) instituto(s) que discute. Este e o principal campo de metadados para busca filtrada e a unidade planejada para notas atomicas.

Analise e interpretacao academica do direito por juristas e profissionais. Diferentemente da legislacao (a lei em si) ou da jurisprudencia (decisoes judiciais), doutrina representa o entendimento academico e o arcabouco teorico dos conceitos juridicos. O Douto processa exclusivamente doutrina; jurisprudencia fica com Valter/Juca e legislacao com Leci.

Classificacao ampla dos dominios juridicos. O Douto organiza sua knowledge base por ramo. Os ramos reconhecidos atualmente sao:

RamoMOCStatus
Direito CivilMOC_CIVILAtivo (35 livros)
Direito Processual CivilMOC_PROCESSUALAtivo (8 livros)
Direito EmpresarialMOC_EMPRESARIALAtivo (7 livros)
Direito do ConsumidorMOC_CONSUMIDORPlaceholder
Direito TributarioNao criado
Direito ConstitucionalNao criado
Compliance & GovernancaNao criado
Sucessoes & Planejamento PatrimonialNao criado

Referencias a leis especificas, artigos e dispositivos legais citados na doutrina. Exemplos: “CC art. 476” (Codigo Civil, artigo 476), “CPC art. 300” (Codigo de Processo Civil, artigo 300). Extraidas durante o enriquecimento como campo de metadados para permitir cross-referencing com o servico de legislacao Leci.

Classificacao do que um chunk efetivamente contem. Valores usados no enriquecimento:

ValorSignificado
definicaoDefinicao de um conceito juridico
requisitosRequisitos ou elementos de um instituto juridico
exemploExemplo pratico ou ilustracao de caso
jurisprudencia_comentadaDecisao judicial comentada
critica_doutrinariaCritica doutrinaria ou debate academico

Estagio de um processo juridico ou ciclo de vida contratual. Valores: formacao (formacao), execucao (execucao/cumprimento), extincao (extincao/resolucao). Usado nos metadados de enriquecimento para possibilitar filtragem por fase.

Quando a doutrina faz referencia a sistemas juridicos de paises que nao o Brasil. Relevante porque o corpus inclui alguns livros de direito comparado internacional.


Um fragmento semanticamente coerente de um livro juridico, produzido pelo rechunk_v3.py. Chunks sao a unidade atomica do pipeline — sao enriquecidos, convertidos em embeddings e buscados individualmente. Um chunk tem frontmatter YAML com metadados e um corpo em markdown. Faixa de tamanho: 1.500-15.000 caracteres de texto real.

Uma representacao vetorial de 768 dimensoes do conteudo semantico de um chunk, gerada pelo modelo Legal-BERTimbau. Embeddings capturam significado em vez de palavras exatas, permitindo busca semantica (encontrar conteudo conceitualmente similar mesmo quando a terminologia e diferente). Armazenados normalizados para calculo de similaridade por cosseno.

O processo de classificar chunks com metadados estruturados usando um LLM (atualmente MiniMax M2.5). Cada chunk e analisado e marcado com instituto, tipo_conteudo, ramo, fase, fontes_normativas e outros campos. Esses metadados habilitam busca filtrada e sao a base para as features de sintese planejadas.

Abordagem de busca que combina dois metodos de ranqueamento:

  • Busca semantica — similaridade por cosseno nos embeddings (captura significado)
  • BM25 — ranqueamento probabilistico por palavras-chave (captura termos exatos)

Os scores sao combinados com um peso configuravel (padrao: 0.7 semantico, 0.3 BM25). Isso produz resultados melhores do que qualquer metodo isolado, especialmente para consultas juridicas que misturam intencao conceitual com termos tecnicos especificos.

Um arquivo indice listando todos os livros dentro de um dominio juridico, com metadados e status de processamento. MOCs sao o segundo nivel da hierarquia do skill graph (INDEX -> MOCs -> Livros -> Chunks). Cada MOC corresponde a um ramo do direito. Convencao de nomes: MOC_{DOMINIO}.md.

A estrutura hierarquica de conhecimento mantida pelo Douto:

INDEX_DOUTO.md # Raiz: 8 dominios juridicos
-> MOC_CIVIL.md # Indice do dominio: 35 livros
-> Book directories # Colecoes de chunks por livro
-> chunk_001.md # Chunks individuais enriquecidos
-> (futuro) notas atomicas # Uma por instituto juridico

Navegavel pela visualizacao de grafo do Obsidian e por wikilinks.

Uma nota de conhecimento sobre um unico conceito planejada para o diretorio knowledge/nodes/ — uma nota por instituto juridico, sintetizando informacoes de todos os chunks que discutem aquele conceito em todos os livros.

Feature planejada — Notas atomicas estao no roadmap (F36, v0.5) mas ainda nao implementadas. A decisao D03 (geradas automaticamente vs. curadas manualmente) esta pendente.

Bloco de metadados YAML no topo de arquivos markdown, delimitado por marcadores ---. Contem dados estruturados sobre o chunk (titulo, autor, area do direito, status de enriquecimento, etc.). Parseado por um parser customizado baseado em regex nos scripts do pipeline.

---
knowledge_id: "contratos-orlando-gomes-cap05-001"
tipo: chunk
titulo: "Exceptio non adimpleti contractus"
livro_titulo: "Contratos"
autor: "Orlando Gomes"
area_direito: civil
status_enriquecimento: completo
---

Texto repetido que aparece no topo das paginas de PDF (tipicamente titulo do livro, nome do capitulo ou nome do autor). Sao artefatos do layout do PDF, nao conteudo significativo. O rechunk_v3.py os detecta por analise de frequencia e os filtra para evitar chunks falsos.

Um resumo sintetizado das posicoes de multiplos autores sobre um unico instituto juridico. Estruturado para incluir visoes consensuais, posicoes divergentes, evolucao historica e implicacoes praticas.

Feature planejada — O formato de Parecer Doutrinario esta proposto como parte do Motor de Sintese (F43, v0.3.5) mas ainda nao implementado.


A plataforma unificada de pesquisa juridica composta por Douto, Valter, Juca, Leci e Joseph. Tambem referida pelo nome de produto Jude.md. Objetivo: fornecer a advogados brasileiros acesso integrado a jurisprudencia, legislacao e doutrina em uma unica interface.

Servico de backend do ecossistema sens.legal. Construido com FastAPI, PostgreSQL, Qdrant (banco vetorial), Neo4j (knowledge graph) e Redis. Gerencia jurisprudencia do STJ (23.400+ decisoes) e 28 tools MCP. Principal consumidor dos embeddings doutrinarios do Douto. Repositorio: separado.

Hub de frontend do sens.legal. Construido com Next.js. Fornece a interface para advogados, incluindo o sistema de briefing progressivo (4 fases: diagnostico, precedentes, riscos, entrega). Acessa dados doutrinarios atraves do Valter.

Servico de legislacao do sens.legal. Construido com Next.js, PostgreSQL e Drizzle ORM. Gerencia base de dados de legislacao federal. Alvo futuro de cross-reference para o Douto (F35 — vinculando comentarios doutrinarios a dispositivos legais especificos).

Agente orquestrador do sens.legal. Coordena trabalho entre Valter, Juca, Leci e Douto. Gerencia casos e workflow.

Nome de produto da plataforma unificada sens.legal. Juca (jurisprudencia) + Leci (legislacao) + Douto (doutrina) + Valter (backend) = Jude.md. Epic: SEN-368.

Protocolo aberto para expor ferramentas a modelos de IA (desenvolvido pela Anthropic). O Douto planeja expor busca doutrinaria como tools MCP (v0.4, F30), permitindo que Claude Desktop, Claude Code e outros clientes compativeis com MCP consultem doutrina diretamente.


SiglaForma completaContexto
BM25Best Matching 25Algoritmo de ranqueamento probabilistico por palavras-chave usado na busca hibrida
BERTBidirectional Encoder Representations from TransformersArquitetura por tras do Legal-BERTimbau
STJSuperior Tribunal de JusticaTribunal superior do Brasil — fonte primaria da jurisprudencia do Valter
CPCCodigo de Processo CivilCodigo de Processo Civil Brasileiro (Lei 13.105/2015)
CCCodigo CivilCodigo Civil Brasileiro (Lei 10.406/2002)
CDCCodigo de Defesa do ConsumidorLei 8.078/1990
ETLExtract, Transform, LoadPadrao de processamento de dados — o pipeline do Douto e um sistema ETL
ADRArchitecture Decision RecordDocumento registrando uma decisao arquitetural e sua justificativa
MOCMap of ContentArquivo indice listando recursos dentro de um topico
nDCGNormalized Discounted Cumulative GainMetrica de qualidade de busca que mede efetividade do ranqueamento
HNSWHierarchical Navigable Small WorldAlgoritmo de vizinho mais proximo aproximado usado por bancos vetoriais (ex.: Qdrant)
FAISSFacebook AI Similarity SearchBiblioteca de busca por similaridade vetorial da Meta
LGPDLei Geral de Protecao de DadosLei brasileira de protecao de dados pessoais
MCPModel Context ProtocolProtocolo para exposicao de tools de IA (Anthropic)
SSEServer-Sent EventsProtocolo de streaming unidirecional servidor-para-cliente
WSLWindows Subsystem for LinuxCamada de compatibilidade Linux no Windows — um dos ambientes com paths hardcoded