Resumo do Projeto
As mídias sociais permitem que os usuários leiam, publiquem e compartilhem informações sobre eventos do mundo real. Existem várias técnicas para detectar ou descobrir eventos do mundo real a partir de notícias ou publicações online. No entanto, um problema que muitas vezes é ignorado neste contexto corresponde à descoberta de relações entre eventos. Um tipo particular de relacionamento é a semelhança entre dois eventos, que podem ser usada para organizar e filtrar o fluxo de informações fornecidas aos usuários. Além dessa forma de relação mais simples, os eventos podem estar relacionados de outras formas, como por causalidade, parte-todo (mereologia), e por correlação (eventos distintos e que podem ter uma mesma causa). Este projeto almeja investigar abordagens para identificar essas relações de entre eventos previamente detectados a partir de publicações textuais das mídias online. Outro aspecto geralmente ignorado ou tratado de forma simplória se refere à modelagem conceitual dos eventos. Para atingir a descoberta das relações, este projeto irá estruturar ou caracterizar os eventos de acordo com padrão de representação do 5W1H. Além desse aspecto da modelagem, será preciso aplicar ou desenvolver técnicas de aprendizado de máquina, as quais tem sido promissoras na descoberta de padrões a partir de uma grande quantidade de dados, entretanto, ainda é um desafio empregá-las de forma não supervisionada (ou seja, sem o auxílio de anotações feitas por pessoas sobre os dados) em dados textuais. Assim, se espera como resultado a criação de um procedimento com modelos de aprendizado de máquina que combinem um conjunto de requisitos que até então não foram satisfeitos em uma única abordagem na literatura, ou seja, modelos não supervisionados que façam uso dos atributos do 5W1H para a descoberta de diversos tipos de relações entre eventos a partir de relatos textuais.