Princípios importantes
- Uma nova ferramenta com inteligência artificial pode ajudar os historiadores a decifrar textos antigos.
- Ithaca é a primeira rede neural profunda que pode restaurar o texto perdido de inscrições danificadas, identificar sua localização original e ajudar a estabelecer a data em que foram criadas.
- AI é útil para preencher dados ausentes, como o local e a data do texto, porque é bom para aprender padrões muito complexos analisando dados.
Os recentes avanços em inteligência artificial (IA) estão impulsionando os esforços para entender o passado.
Ithaca, um modelo de aprendizado de máquina construído por pesquisadores de IA da DeepMind, pode adivinhar palavras ausentes e a localização e data da linguagem escrita, de acordo com um novo artigo. O esforço pode ajudar os historiadores a decifrar manuscritos antigos.
“Ithaca é uma rede neural profunda e, como tal, é incrivelmente capaz de encontrar padrões ocultos em grandes quantidades de dados”, disse a historiadora Thea Sommerschield, coautora do artigo recente, à Lifewire em um e-mail entrevista. Esses padrões podem ser textuais (gramaticais, sintáticos ou ligados a uma 'fórmula' repetida em muitos textos) ou contextuais (certas palavras que aparecem consistentemente em certos gêneros de textos: por exemplo, um decreto político da Atenas Clássica mencionando as palavras 'aliança, conselho, assembléia…').”
Revelando o Passado
Ithaca é a primeira rede neural profunda que pode restaurar o texto perdido de inscrições danificadas, identificar sua localização original e ajudar a estabelecer a data em que foram criadas, disse Sommerschield.
Ithaca recebeu o nome da ilha grega na Odisseia de Homero. Os pesquisadores descobriram que Ithaca atinge 62% de precisão na restauração de textos danificados, 71% de precisão na identificação de sua localização original e pode datar textos em até 30 anos de suas datas de origem.
As ajudas de visualização do Ithaca destinam-se a facilitar a interpretação dos resultados pelos pesquisadores. Os autores do artigo escreveram que os historiadores alcançaram 25% de precisão ao trabalhar sozinhos para restaurar textos antigos. Mas, o desempenho do historiador aumenta para 72% ao usar o Ithaca, superando o desempenho do modelo e mostrando o potencial de cooperação homem-máquina.
“Ithaca oferece resultados interpretáveis, mostrando a crescente importância da cooperação entre especialistas humanos e aprendizado de máquina, e mostra como combinar especialistas humanos com arquiteturas de aprendizado profundo para lidar com tarefas de forma colaborativa pode superar o desempenho individual (sem ajuda) de humanos e modelo nas mesmas tarefas”, disse Sommerschield à Lifewire.
Por exemplo, os historiadores atualmente discordam sobre a data de uma série de importantes decretos atenienses feitos em uma época em que figuras notáveis como Sócrates e Péricles viviam, escreveu Sommerschield em um post de blog. Há muito se pensa que os decretos foram escritos antes de 446/445 aC, embora novas evidências sugiram uma data de 420 aC. “Embora possa parecer uma pequena diferença, esses decretos são fundamentais para nossa compreensão da história política da Atenas Clássica”, escreveu ela
O trabalho mais próximo de Ithaca é uma ferramenta de aprendizado de máquina anterior chamada Pythia que Sommerschield e seus colaboradores lançaram em 2019. Pythia foi o primeiro modelo de restauração de texto antigo a usar redes neurais profundas.
“Hoje, Ithaca é o primeiro modelo a abordar as três tarefas centrais no fluxo de trabalho do epígrafo de forma holística”, disse Sommerschield em um e-mail. “Não apenas avança o estado da arte anterior da Pythia, mas também usa aprendizado profundo para atribuição geográfica e cronológica pela primeira vez e em uma escala sem precedentes.”
IA para ajudar historiadores
AI é útil para preencher dados ausentes, como a localização e a data do texto, porque é bom para aprender padrões muito complexos analisando dados, Brad Quinton, CEO da empresa de IA Singulos Research, disse à Lifewire por e-mail.
“Usando técnicas de aprendizado de máquina, a IA pode analisar um grande número de exemplos “bons conhecidos” para encontrar padrões entre, por exemplo, um determinado texto e sua data e local de criação”, acrescentou Quinton. “Muitas vezes, esses padrões são tão complexos que não seriam óbvios para um especialista humano.”
Prever dados perdidos é uma tarefa comum para IA baseada em aprendizado de máquina. Por exemplo, o GPT-3 da OpenAI pode prever palavras ausentes em uma frase ou até mesmo frases ausentes em um parágrafo. E muitos sistemas de processamento de imagem baseados em IA têm sido usados para restaurar vídeos e imagens, prevendo de forma inteligente o que foi perdido do original.
“Conceitualmente, os pesquisadores podem usar técnicas semelhantes para determinar a data e a origem da arte ou ferramentas, ou outros artefatos históricos feitos pelo homem onde há uma expectativa de mudança no estilo e técnica subjacentes ao longo do tempo e por localização de origem”, disse Quinton.