IA Forense
Bloco 3

Vocabulário Tecnológico — Bloco 3

Este bloco reúne termos de busca, documentos, recuperação de informação e interface técnica, com aplicação direta em pesquisa jurídica e gestão documental.

API (Application Programming Interface)

Conceito: conjunto de regras que permite a comunicação entre sistemas, aplicações ou serviços.

Utilidade: a API viabiliza integração. É por meio dela que uma ferramenta pode enviar dados a outra, receber respostas, consultar bases, acionar funcionalidades externas ou automatizar etapas que, sem isso, dependeriam de atuação manual.

Importância para o advogado: o advogado não precisa dominar tecnicamente o funcionamento de uma API, mas convém entender sua função. Em fluxos jurídicos com IA, a API explica como uma ferramenta pode conversar com um sistema de documentos, com uma base de consulta, com um ambiente de automação ou com outro serviço utilizado no escritório ou no departamento jurídico.

Exemplo prático: um fluxo pode usar uma API para enviar automaticamente um texto a uma ferramenta de análise, receber a resposta em formato estruturado e incorporá-la a um quadro de revisão interna.

Base de conhecimento

Conceito: conjunto organizado de informações, documentos, respostas, regras ou conteúdos utilizado como fonte de consulta por uma ferramenta ou sistema.

Utilidade: serve para concentrar informação relevante em um acervo que possa ser recuperado de forma mais rápida e consistente.

Importância para o advogado: no contexto jurídico, uma base de conhecimento pode reunir modelos internos, notas técnicas, entendimentos consolidados, orientações de trabalho, documentos de referência, teses recorrentes ou materiais previamente selecionados. O valor disso está menos no acúmulo e mais na possibilidade de recuperar conteúdo útil com algum critério.

Exemplo prático: uma equipe pode manter uma base com modelos de manifestações, orientações internas e quadros-resumo de temas processuais recorrentes para facilitar revisão e reutilização.

Branch

Conceito: ramificação de trabalho criada para desenvolver alterações de forma separada, sem mexer diretamente na versão principal de um projeto ou conjunto de arquivos.

Utilidade: permite testar mudanças, desenvolver novas versões e trabalhar em paralelo com menor risco de afetar o material central.

Importância para o advogado: o termo é mais técnico, mas pode ser útil quando o profissional passa a lidar com ambientes de versionamento ou projetos mais estruturados. A ideia fundamental é simples: criar um espaço separado para experimentar ou desenvolver algo antes de incorporar ao fluxo principal.

Exemplo prático: em um projeto de automação documental, pode-se criar uma branch para testar nova lógica de nomeação de arquivos sem alterar imediatamente a estrutura principal do trabalho.

Busca semântica

Conceito: forma de busca que procura compreender o sentido do conteúdo, e não apenas repetir palavras idênticas.

Utilidade: amplia a capacidade de encontrar material relevante mesmo quando os termos usados na consulta não coincidem literalmente com os termos presentes no documento.

Importância para o advogado: isso é especialmente útil em pesquisa jurídica, triagem documental e recuperação de conteúdo em arquivos extensos. Muitas vezes, o problema real não está formulado com as mesmas palavras da pergunta feita pelo usuário. A busca semântica ajuda justamente nesse ponto.

Exemplo prático: um advogado pode procurar documentos relacionados à “responsabilidade subsidiária da Administração”, e a ferramenta localizar materiais que tratam da matéria com redações diferentes, mas semanticamente próximas.

CLI (Command-Line Interface)

Conceito: interface de linha de comando. Trata-se de ambiente em que o usuário interage com o sistema por meio de comandos escritos, e não por botões, menus ou elementos visuais tradicionais.

Utilidade: permite executar tarefas de maneira direta, rápida e, em certos casos, mais flexível do que interfaces gráficas.

Importância para o advogado: a CLI não é algo que todo advogado precise usar. Ainda assim, o termo aparece com frequência em ambientes mais técnicos, sobretudo quando se trabalha com agentes, automações ou ferramentas instaladas localmente. Saber o que significa já evita estranhamento desnecessário.

Exemplo prático: um profissional pode encontrar a indicação de rodar determinado fluxo ou comando em CLI para processar arquivos, organizar documentos ou executar uma rotina automatizada.

Commit

Conceito: registro formal de uma alteração realizada em um projeto ou conjunto de arquivos dentro de um sistema de versionamento.

Utilidade: serve para marcar e preservar mudanças de forma organizada.

Importância para o advogado: assim como branch, é um termo mais técnico, mas útil em projetos que envolvem automação, agentes ou organização mais rigorosa de arquivos e instruções. O conceito ajuda a entender que alterações podem ser registradas em etapas claras, permitindo voltar atrás ou identificar o que foi modificado.

Exemplo prático: depois de ajustar um fluxo de revisão automática de documentos, o responsável pode fazer um commit para registrar exatamente aquela mudança.

Conector

Conceito: mecanismo que liga uma ferramenta a outra fonte de dados, serviço ou ambiente externo.

Utilidade: permite que o sistema acesse conteúdos que não estão dentro dele por padrão.

Importância para o advogado: o conector é relevante porque explica como certas ferramentas conseguem ler documentos armazenados em outros ambientes, consultar bases, buscar arquivos ou operar sobre conteúdos que não foram inseridos manualmente na conversa.

Exemplo prático: um conector pode permitir que uma ferramenta de IA acesse uma pasta de documentos ou uma base interna para localizar arquivos relevantes para determinada tarefa.

Consulta estruturada

Conceito: consulta formulada segundo critérios, campos ou parâmetros previamente definidos, e não apenas em linguagem livre.

Utilidade: melhora precisão e organização da recuperação de informação.

Importância para o advogado: quando o trabalho exige localizar conteúdo específico em meio a grande volume documental, a consulta estruturada pode ser mais útil do que um pedido genérico. Isso vale para busca de decisões, extração de dados objetivos, localização de peças ou recuperação de informações por categoria.

Exemplo prático: procurar decisões por órgão julgador, data, tema e resultado, em vez de apenas digitar um pedido genérico em linguagem solta.

Extração de informações

Conceito: processo de identificar e retirar de um documento ou conjunto de documentos determinados dados, trechos ou elementos relevantes.

Utilidade: transforma material extenso em informação mais organizada e diretamente aproveitável.

Importância para o advogado: essa é uma das utilidades mais concretas da tecnologia na rotina forense. Em vez de reler integralmente um acervo a cada nova demanda, o profissional pode usar ferramentas para destacar campos objetivos, teses, pedidos, datas, órgãos julgadores, resultados ou obrigações impostas.

Exemplo prático: extrair de uma série de decisões os campos “pedido”, “fundamento central”, “resultado” e “prazo processual”.

Formato de arquivo

Conceito: padrão em que um arquivo é armazenado, como PDF, DOCX, TXT, JPG, PNG, CSV ou JSON.

Utilidade: o formato do arquivo influencia leitura, edição, extração de conteúdo, preservação de estrutura e compatibilidade com ferramentas.

Importância para o advogado: esse ponto é bastante prático. Um documento em PDF pode ser ótimo para circulação e arquivamento, mas ruim para edição; um arquivo de texto pode ser mais simples para processamento; uma imagem pode exigir OCR para leitura. Saber o formato ajuda a entender o que a ferramenta conseguirá ou não fazer.

Exemplo prático: uma minuta em DOCX costuma ser mais adequada para revisão e edição; já um PDF escaneado pode dificultar extração de texto e comparação automática.

Git

Conceito: sistema de controle de versões usado para registrar alterações em arquivos e projetos ao longo do tempo.

Utilidade: permite acompanhar mudanças, recuperar versões anteriores, trabalhar em paralelo e organizar evolução de um conjunto de arquivos.

Importância para o advogado: o advogado comum não precisa aprender Git para trabalhar com IA. Ainda assim, o termo aparece com frequência em ambientes mais técnicos, especialmente quando se lida com agentes, automações, arquivos de instrução ou projetos que evoluem por etapas. Saber do que se trata já facilita a interlocução com pessoas da área técnica e com ferramentas mais avançadas.

Exemplo prático: em um projeto de automação para organização documental, o Git pode ser usado para registrar cada alteração feita nas instruções, nos fluxos e nos arquivos do projeto.

IDE (Integrated Development Environment)

Conceito: ambiente integrado de desenvolvimento. É uma interface que reúne, em um mesmo lugar, recursos para escrever, editar, testar e organizar arquivos ou projetos técnicos.

Utilidade: concentra ferramentas de trabalho em um só ambiente.

Importância para o advogado: nem todo advogado precisará usar uma IDE. Mas o termo aparece com frequência quando se entra em contato com projetos de agentes, automações e fluxos mais estruturados. Compreender a noção básica já ajuda: trata-se de um espaço de trabalho mais completo para lidar com arquivos, comandos e organização técnica.

Exemplo prático: ao trabalhar com alguém da área técnica ou com uma ferramenta mais avançada, o advogado pode se deparar com a sugestão de abrir um projeto em uma IDE para revisar arquivos de configuração ou instruções do agente.

Indexação

Conceito: processo de organizar o conteúdo de documentos ou bases de forma que ele possa ser localizado com mais eficiência posteriormente.

Utilidade: melhora a recuperação de informação.

Importância para o advogado: sem indexação adequada, a busca em grandes acervos tende a ser lenta, imprecisa ou pouco aproveitável. Em sistemas que lidam com muitos documentos, esse processo é o que permite localizar o que importa sem depender de leitura manual integral.

Exemplo prático: indexar um conjunto de decisões para depois poder pesquisar, com mais rapidez, quais tratam de determinado tema, fundamento ou questão processual.

Ingestão de documentos

Conceito: etapa em que documentos são recebidos, lidos e preparados para posterior organização, busca, análise ou extração de conteúdo.

Utilidade: é o ponto de entrada do material no sistema ou fluxo de trabalho.

Importância para o advogado: esse termo é útil para entender que o simples envio do arquivo não encerra o processo. Em muitos casos, o documento precisa ser incorporado, reconhecido, convertido ou estruturado para que possa ser efetivamente pesquisado ou analisado.

Exemplo prático: antes de permitir busca semântica em um acervo de PDFs, o sistema precisa ingerir esses documentos para torná-los acessíveis ao fluxo de consulta.

JSON (JavaScript Object Notation)

Conceito: formato estruturado de organização de dados, baseado em pares de chave e valor.

Utilidade: facilita troca, armazenamento e reaproveitamento de informações de forma padronizada.

Importância para o advogado: o advogado não precisa saber programar em JSON, mas o termo é útil porque aparece com frequência quando se quer saída organizada, integração entre ferramentas ou respostas em formato previsível. Em termos simples, JSON é uma forma de fazer a informação sair arrumada para ser reaproveitada depois.

Exemplo prático: uma ferramenta pode devolver, em JSON, campos como “tipo de documento”, “pedido”, “resultado”, “prazo” e “observações”, permitindo reaproveitamento em outros fluxos.

OCR (Optical Character Recognition)

Conceito: reconhecimento óptico de caracteres. É a tecnologia que converte imagem de texto em texto passível de leitura e processamento.

Utilidade: permite transformar PDFs escaneados, fotografias ou imagens em conteúdo pesquisável e extraível.

Importância para o advogado: o OCR é muito relevante na prática forense, porque grande parte dos documentos circula em formatos escaneados ou em imagens. Sem OCR, esses materiais podem até ser visualizados, mas não são facilmente pesquisáveis, editáveis ou analisáveis por ferramentas automatizadas.

Exemplo prático: aplicar OCR a um PDF de decisão escaneada para conseguir localizar expressões, extrair trechos e usar o documento em fluxo de análise textual.

Parsing

Conceito: processo de leitura e interpretação da estrutura de um texto ou arquivo para identificar seus elementos de forma organizada.

Utilidade: permite que o sistema compreenda como o conteúdo está montado e separe partes relevantes.

Importância para o advogado: parsing é um termo mais técnico, mas útil para entender como certas ferramentas conseguem identificar campos, títulos, datas, seções, tabelas ou estruturas internas de documentos. Isso importa bastante quando se trabalha com extração automatizada.

Exemplo prático: uma ferramenta pode fazer parsing de um documento para identificar cabeçalho, partes, pedidos, conclusão e anexos, em vez de tratar tudo como bloco indiferenciado de texto.

RAG (Retrieval-Augmented Generation)

Conceito: geração aumentada por recuperação de informação. Em termos simples, é uma forma de fazer a ferramenta buscar conteúdo em documentos ou bases relevantes antes de elaborar a resposta.

Utilidade: ajuda a tornar a resposta mais vinculada a fontes específicas, em vez de depender apenas do conhecimento geral do modelo.

Importância para o advogado: esse conceito é especialmente útil em trabalho com acervos documentais, notas internas, modelos, decisões, pareceres ou materiais do próprio escritório. O valor do RAG está em aproximar a resposta do conteúdo efetivamente disponível na base consultada.

Exemplo prático: usar RAG para que a ferramenta responda a partir de um conjunto de decisões, modelos ou orientações internas previamente reunidas, e não apenas por inferência geral.

Repositório

Conceito: local organizado em que arquivos, versões, instruções ou componentes de um projeto são armazenados e administrados.

Utilidade: centraliza o material de trabalho e facilita controle de alterações.

Importância para o advogado: em projetos jurídicos mais simples, o termo pode ser entendido como um espaço organizado de arquivos e instruções. Em ambientes mais técnicos, ele costuma aparecer associado a Git e versionamento. O essencial é perceber que o repositório funciona como núcleo de armazenamento e organização do projeto.

Exemplo prático: um repositório pode reunir arquivos de instrução do agente, modelos de saída, fluxos de automação e documentação do projeto.

Schema

Conceito: esquema ou estrutura previamente definida para organizar dados, campos ou formatos de saída.

Utilidade: serve para impor ordem e previsibilidade ao resultado.

Importância para o advogado: o termo é útil quando se deseja que a ferramenta responda sempre no mesmo formato, com campos fixos e menor variação. Isso facilita revisão, comparação, reaproveitamento e integração com outros fluxos.

Exemplo prático: exigir que a análise de uma decisão siga um schema com os campos “processo”, “órgão julgador”, “pedido”, “fundamento”, “resultado” e “prazo”.