Uma Breve História da Semântica

Uma Breve História da Semântica

Nó Fonte: 1972497
semânticasemântica

Como uma palavra, “semântica” foi usada pela primeira vez por Michel Breal, um filólogo francês (um historiador da linguagem), em 1883. Ele estudou como as línguas são organizadas, como as línguas mudam com o passar do tempo e as conexões dentro das línguas. De um modo geral, a semântica é o estudo da linguagem e seu significado. 

Mais especificamente, a semântica pode ser usada para descrever como as palavras podem ter significados diferentes para pessoas diferentes por causa de suas origens emocionais e experienciais. Um idioma pode ser um idioma natural, como francês, holandês ou hindi, ou pode ser um idioma artificial, como uma linguagem de programação para computadores.

Cientistas teóricos da computação estudam e desenvolvem linguagens artificiais, enquanto linguistas estudam linguagens naturais.

Em 1967, Robert W. Floyd escreveu um artigo descrevendo o uso da semântica da linguagem em computadores e recebeu crédito por iniciar o campo da semântica da linguagem de programação. Floyd descreveu as linguagens de programação como tendo duas partes: semântica (significado) e sintaxe (forma). Para ser lido, um algoritmo de computador deve combinar semântica e sintaxe, codificando-os precisamente para que o computador possa processá-los automaticamente. (Os humanos fazem isso no nível subconsciente.)

O professor Donald Knuth disse o seguinte sobre Floyd: “Antigamente, os programadores apenas mexiam nos programas até que parecessem funcionar. Sua abordagem de casar matemática com ciência da computação foi uma revelação para o campo.”

O conceito de um sistema de informação global tornou-se tecnologicamente possível no final dos anos 1980. Em 1985, a internet estava ganhando popularidade na Europa. Em 1988, ocorreu a primeira conexão IP direta entre a América do Norte e a Europa. Isso foi rapidamente seguido por discussões sobre um sistema de comunicação e informação semelhante à web.

A World Wide Web e as Mídias Sociais

Quando as pessoas começaram a trabalhar no World Wide Web, o “tipo” de empresas interessadas na tecnologia determinava os rumos do negócio. À medida que as pessoas experimentavam a World Wide Web, o foco mudou para interações sociais e plataformas de mídia social como Facebook, LinkedIn, Google+, Instagram, Vine, Pinterest, Twitter e Tumblr, todos os quais exigem interação humana. 

Como a linguagem natural tem uma estrutura que os humanos podem interpretar, mas as máquinas não, os humanos tiveram que “ler” os significados de uma linguagem natural e se tornar parte do sistema.

Mais recentemente, os pesquisadores começaram a fundir linguagens de programação com linguística, permitindo aos pesquisadores combinar semântica e big data enquanto se esforçam para inteligência artificial para o próximo nível. A semântica é muito mais um processo cognitivo do que arquivos e memórias de computador podem reivindicar. É o processo de projetar e usar uma linguagem para comunicar e expressar conhecimento. Também pode fornecer uma base para o processo de pensamento.

A Web Semântica versus a World Wide Web

Em maio de 2001, um artigo intitulado “A Web Semântica” foi publicado e escrito por James Hendler, Ora Lassila e Tim Berners-Lee. (Tim Berners-Lee se tornou o diretor do World Wide Web Consortium, ou W3C.) O artigo deles descrevia uma nova maneira de usar e pesquisar na Internet, uma dimensão adicional cheia de novas possibilidades. Enquanto um ser humano pode ler o texto de uma página da Web em HTML, um computador/mecanismo de pesquisa não pode (a menos que as tags que ele pode ler sejam inseridas deliberadamente). Isso ocorre porque o HTML é projetado para armazenar informações visuais e não é escrito em uma linguagem de programação.

A Web Semântica é uma extensão da World Wide Web, e tem como foco a tecnologia. A World Wide Web precisa de uma presença humana, enquanto a Web Semântica não. Ele usa dados codificados “ocultos” e, mais recentemente, processos de linguagem natural para pesquisar, compilar e organizar informações da web. A Web Semântica precisa de uma presença humana apenas para iniciar a solicitação.

Semântica e dados vinculados

O conceito de dados vinculados tem sido um aspecto muito útil da Web Semântica e é notavelmente funcional como uma ferramenta educacional. Ele pode ser usado para publicar e compartilhar informações em toda a Internet. A frase "Dados Abertos Vinculados” tem sido usado desde pelo menos 2007, quando a lista de discussão para Linking Open Data foi criada pela primeira vez. O Vinculando a comunidade Open DataO objetivo do era estender a web com um data commons, fornecendo informações, geralmente na forma de gráficos, como informação gratuita.

A internet fornece uma quantidade quase infinita de informações. Variando de planilhas a imagens e de vídeos a sites que reúnem tudo, os links conectam um site a outro e nos permitem descobrir um fluxo de informações em constante crescimento. A World Wide Web é descrita como uma rede de “documentos” vinculados, enquanto os dados vinculados descrevem uma rede de “dados” vinculados. 

Os dados vinculados permitem que os computadores combinem dados e informações de muitas maneiras complexas. Essa situação foi possível por meio de vocabulários padronizados e dos principais mecanismos de busca que os utilizam. Bing, Google e Yahoo começaram a usar formatos de microdados colocados em documentos HTML para comunicar informações.

O uso de linguagens naturais por computadores cria acesso a muitas novas formas de dados. Considere estas frases em formato falado: “frutas voam como peras” e “o tempo voa como uma borboleta”. Embora a estrutura da frase de cada exemplo seja bastante semelhante, seus significados são muito diferentes, com as palavras “flies” e “like” tendo definições diferentes – definições que são determinadas pelo contexto. O exemplo mostra como mesmo uma frase notavelmente simples requer uma quantidade significativa de compreensão linguística.

Enquanto os computadores são excelentes no uso da linguagem simples da matemática, as linguagens humanas são notavelmente confusas em sua complexidade e exceções periódicas às regras. Um programa de jogo de xadrez pode jogar contra e derrotar a maioria das pessoas em um jogo de xadrez. O mesmo não pode ser dito para programas de reprodução de perguntas e respostas. Uma criança normal poderia vencer tal programa, porque o programa carece de uma compreensão suficientemente ampla do significado, contexto e sutilezas da linguagem. Esse problema se aplica a um número significativo de serviços e aplicativos. 

Sem entender o contexto, um mecanismo de busca não pode responder com resultados eficientes para palavras com múltiplos significados.

Semântica e Assistentes Virtuais

 Barry Zane, vice-presidente de engenharia da Cambridge Semantics, dito:

“As tecnologias baseadas na semântica são a chave para tornar os dados facilmente compreensíveis para humanos e computadores, permitindo a harmonização de dados usando significados comerciais comuns.”

Com a World Wide Web como base e a evolução da semântica para incluir linguagens naturais, os assistentes virtuais estão se tornando uma realidade. O Siri da Apple é um bom exemplo de assistente virtual. Siri não apenas recupera informações; também ajuda as pessoas a concluir seus trabalhos on-line com mais rapidez e facilidade. A Siri pode interpretar a palavra falada, até certo ponto, e também pode realizar uma variedade de serviços para o usuário. Inicialmente, as tarefas que a Siri poderia realizar eram voltadas para o usuário de internet móvel. Ele faria reservas em restaurantes, verificaria o status de um voo ou coordenaria várias atividades na Internet. A Siri agora fez a transição para outras plataformas e dispositivos, incluindo automóveis.

Nas últimas duas décadas, o sonho de agregar processos de linguagem natural aos computadores, e fazê-los falar tão casualmente quanto os humanos, desenvolveu-se significativamente.

Assistentes e serviços virtuais estão começando a trocar informações úteis por toda a Web Semântica. Assistentes virtuais, como Google Now e Siri, iniciaram uma ampla gama de start-ups, especialmente aquelas que fornecem serviços automatizados. Estamos testemunhando o surgimento de novos serviços e tecnologias semânticas. A fusão das tendências da tecnologia e do mundo dos negócios está criando um novo ciclo de inovação que afeta a maneira como indivíduos e empresas realizam seu trabalho e até mesmo como os dados são coletados em informações úteis.

A flexibilidade de assistentes virtuais trabalhar na Web e disponível em diferentes dispositivos é uma parte importante do propósito da Web Semântica. 

Um aspecto da Web Semântica é sua capacidade de se comunicar com outros computadores e operar sem a presença humana. Um ser humano precisa iniciar o trabalho, mas depois pode fazer outra coisa com seu tempo. O uso da semântica fornece um assistente virtual capaz de trabalhar de forma independente e processar quantidades significativas de dados.

O Desenvolvimento de Chatbots

Os chatbots, uma ferramenta relativamente nova para se comunicar com clientes e clientes em potencial, começaram a ganhar popularidade por volta de 2018-2020. Chatbots são projetados para simplificar as comunicações entre computadores e humanos. Como resultado de "transformadores” (desenvolvido em 2017) sistemas de processamento de linguagem natural, combinados com a natureza de código aberto de muitos desses modelos, as comunicações entre bots e humanos melhoraram um pouco.

Os chatbots fornecem uma nova maneira para as organizações lidarem com as necessidades de clientes em potencial em tempo real. Embora ainda em estágios iniciais de uso, os chatbots podem responder 24 horas por dia a consultas online. Várias organizações, incluindo Google, Amazon, Facebook, Apple e Microsoft, desenvolveram chatbots, embora alguns ainda estão resolvendo as torções.

Imagem usada sob licença da Shutterstock.com

Carimbo de hora:

Mais de DATAVERSIDADE