Versiebeheer: 23 08 2017 Semanta Tel:+31-162-313323 of International +1-514-331-0572 Semanta is de handelsnaam waaronder Lingvistica taalkundige producten en diensten levert. Deze portfolio is bedoeld voor organisaties die hun bezoekers tegemoet willen treden met een virtuele gesprekspartner. De kennis die daarvoor nodig is, ligt besloten in de eigen website en daarbuiten in het "Internet of things". Semanta stelt een webmaster in staat bronnen tekstueel te analyseren en daarmee de gesprekspartner een integraal onderdeel van de website te laten zijn. In dit artikel wordt ingegaan op de vraagstelling "Semanta of hoe een computerprogramma zou kunnen leren praten" en het antwoord daarop van Lingvistica. Alpha versie 15.04.02 was de eerst versie waarmee actief klanten zullen worden benaderd. Deze Alpha versie is voornamelijk bedoeld interesse te kweken en te toetsen in hoeverre er belangstelling bestaat voor de Semanta Services. Wat is een chatbot cq gesprekspartner? Lingvistica verstaat onder chatbot een systeem van computerprogramma's, gegevensbanken en procedures waarmee via het internet min of meer menselijk gecommuniceerd kan worden. Een chatbot volgt een ander leerproces dan een mens. Waar een mens eerst de betekenis van letters, woorden en zinnen leert en daarna de grammaticaregels geldt voor een Semanta-chatbot het omgekeerde. De chatbot is pas in staat tot communicatie als de regels bekend zijn en er betekenis aan kan worden toegevoegd. In de afgelopen periode heeft Lingvistica de basis daarvoor gelegd in meer dan 20 talen. Semanta is de handelsnaam waaronder Lingvistica producten en diensten ten behoeve van het leerproces voor chatbots ontwikkelt en vermarkt. Semanta de lerares De digitale leraar of lerares is een speciale virtuele gesprekspartner. Naast het voeren van een gesprek dient de leraar of lerares in staat te zijn aangeboden informatie in kennis om te zetten. Deze kennisvergroting is een continue proces dat deels automatisch en deels door menselijk handelen uitgevoerd wordt. Lingvistica kan uw medewerkers opleiden om uw digitale docenten te trainen. Semanta is een digitale lerares die andere digitale leraren op kan leiden. De Pandora-versie wordt door Semanta gezien als de gesprekspartner waarmee de bezoeker in gesprek gaat en opgeleid is via de Program O Versie die ter beschikking staat aan de webmaster. De rol van Lingvistica bestaat er uit dat de webmaster wegwijs wordt gemaakt in het toepassen van de semantafunctionaliteit voor zijn of haar website. Omdat virtuele gesprekspartners voorgesteld kunnen worden als lerende virtuele robots, bestaat er ook behoefte aan leraren voor deze robots. Lingvistica speelt daarop in met producten en diensten die het bouwen,onderhouden en exploiteren van chatbots vereenvoudigt en digitale leraren opleidt, die voor het onderwijs van chatbots ingezet kunnen worden. Uitgangspunt Om te kunnen "praten" heeft een computerprogramma kennis nodig. Voor Lingvistica is dit kennis in de vorm van teksten. Teksten die in allerlei vormen aangeboden kunnen worden. Iedere uiting via het internet bevat zinvolle informatie. Voor een website geldt dat Semanta het internet gebruikt als bron om er verwerkbare tekst van te maken. Aan iedere tekstvorm, corpus, tekstbestand, platte tekst of URL, wordt een taal, gespreksonderwerp en kennisdomein toegevoegd, waarmee een gesprekspartner aan de slag kan. De taal waarin de gesprekspartner "praat" wordt bepaald door de internetlocatie van de bezoeker en of de inhoud van de aangeboden tekst. Is de tekst meer dan 30KB groot, zal het tekstbestand als corpus gekenmerkt worden. Voordat een tekst kan worden verwerkt, dient het bestand opgeladen te worden naar de Semanta server. Dit geldt voor een corpus, tekstbestand en platte tekst. Voor iedere vorm heeft Semanta scripts ontwikkeld. Nadat de tekst is opgeladen zal Semanta de inhoud verdelen in zinnen en zinsdelen, die op hun beurt individueel te bewerken zijn. Van alle zinnen en zinsdelen wordt er grammaticale kennis vastgelegd op basis van de individuele woordvormen. Corpus Een gesprekspartner gebruikt het corpus om te converseren met de bezoeker van de website. Het corpus is opgebouwd uit de relaties tussen woordvormen,woordsegmenten, webpagina's. Een corpus bevat "woordelijke" representaties van de uitingsvorm over een onderwerp op het internet. Een corpus maakt deel uit van een kennisdomein dat gebruikt kan worden door een of meer gesprekspartners. Tekstbestand Bij bestanden tot 30 KB biedt Semanta de mogelijkheid tekstbestanden met de extensies: TXT, DAT, AIML op te laden en voor analyse aan te bieden. De verwerkingstijd is ongeveer 5 secondes per KB tekst. Platte tekst Tekst tot 1024 tekens wordt door Semanta beschouwd als "platte" tekst. Voor teksten boven dit aantal kunnen in de vorm van een tekstbestand aangeboden worden aan Semanta. Semanta gebruikt "platte tekst" via een dialoog met de bezoeker van een website. In korte vragen en antwoorden wordt de conversatie gevoerd. Bij de verwerking van platte tekst kan ook een URL opgegeven worden waaruit de tekstinformatie wordt onttrokken en wordt aangeboden aan Semanta. De tekst is "raw" en vereist dat de gebruiker een keuze maakt uit de gevonden tekst. Internet of Things In het "Internet of things" is ieder object met een IP-adres en voldoende software te representeren als virtuele gesprekspartner. U kunt uw horloge vragen hoe laat het is en de wasmachine laten weten in welk programma de was gedraaid moet worden. In aansluiting daarop kan Semanta met name een bijdrage leveren aan de opzet van tekstuele elementen in het laten genereren van kenniskaarten of Google Knowledge Graphs voor uw website. Spreken met een virtuele gesprekspartner Voor de implementatie van spraak in de Semanta services wordt getest met Nuance en ReadSpeaker als losse services aan te koppelen zijn. Ook Pandora.org voorziet in een sprekende gesprekspartner, waarvoor wij een Semanta versie hebben ontwikkeld. De toenemende vraag om in spreektaal te communiceren is in de architectuur van de Semanta software beantwoord en kan eenvoudig geimplementeerd worden. Language teacher De Semantus is de eerste implementatie van haar rol als LANGUAGE TEACHER waarmee Semanta probeert een antwoord te vinden op de vraag "Kan een computer leren praten? ". Lingvistica heeft de basis gelegd voor het positieve antwoord op deze vraag. Op basis van onze Semanta-techologie is het mogelijk om een niet-Nederlands sprekende bezoeker vanuit Semanta gereedschappen aan te reiken om vanuit zijn moedertaal Nederlands te leren kennen. Op basis van een enkel woord uit de Nederlandse woordenschat . Wat voor het Nederlands geldt is ook van toepassing op alle andere talen waarvoor wij diensten en producten hebben ontwikkeld. In overleg met diverse instanties en internetonderzoek heeft Lingvistica in Semanta opgezet om een begin te maken met het voor wat Lingvistica beschouwt als een doorbraak op het gebied van taalbewerking in Nederland. Internet helper De virtuele gesprekspartner Scenarioschrijver is de eerste implementatie van haar rol als INTELLIGENT HELPER waarmee Semanta probeert een antwoord te vinden op de vraag "Kan een computer leren praten? ". Lingvistica heeft de basis gelegd voor het positieve antwoord op deze vraag. Op basis van onze Semanta-techologie is het mogelijk om een bezoeker vanuit Semanta gereedschappen aan te reiken om vanuit zijn moedertaal met een gesprekspartner uit een geselecteerd corpus vragen en antwoorden te generereren. Hoe het werkt Dit gebeurt op twee manieren: · Semantische kenmerken van individuele woordvormen · Grammaticale segmenten van 2 tot 5 woordvormen Afhankelijk van de rolverdeling in het opleidingstraject kan de rol van Semanta, onze eerste digitale lerares, ingevuld worden voor een virtuele gesprekspartner. Onder leiding van een menselijke webeditor kunnen de tools van Semanta ingezet worden om de chatbot, avatar of robot , reproduceerbare kennis bij te brengen. De informatie kan afkomstig zijn uit losse uitingen, teksten, tekstbestanden, websites, wikipedia, bol.com,, google etc.Iedere tekst wordt verondersteld uit een ongestructureerd aantal uitingen te bestaan waarin vragen en antwoorden besloten kunnen liggen. Kennis die uiteindelijk door middel van intelligente conversaties tussen de menselijke en en virtuele gesprekspartners ontsloten kan worden. De analyse van de uiting en conversatie-elementen verloopt volgens een vast patroon. Verwerkingspatroon Tekstselectie Losse uiting, tekstbestand, website webpagina’s. Voorbewerking Splitsing uitingen,woordvormen en segmenten Grammaticale Analyse Karakter , gevoel en bruikbaarheid Semantische analyse Relatie in de context Verrijking Aanvullingen op karakter,gevoel en taalkundige kenmerken Vastlegging en conversie Afhankelijk van de ontvangende digitale partner is dit proces automatisch of handmatig Versiebeheer: 23 08 2017 Semanta Tel:+31-162-313323 of International +1-514-331-0572 Semanta is de handelsnaam waaronder Lingvistica taalkundige producten en diensten levert. Deze portfolio is bedoeld voor organisaties die hun bezoekers tegemoet willen treden met een virtuele gesprekspartner. De kennis die daarvoor nodig is, ligt besloten in de eigen website en daarbuiten in het "Internet of things". Semanta stelt een webmaster in staat bronnen tekstueel te analyseren en daarmee de gesprekspartner een integraal onderdeel van de website te laten zijn. In dit artikel wordt ingegaan op de vraagstelling "Semanta of hoe een computerprogramma zou kunnen leren praten" en het antwoord daarop van Lingvistica. Alpha versie 15.04.02 was de eerst versie waarmee actief klanten zullen worden benaderd. Deze Alpha versie is voornamelijk bedoeld interesse te kweken en te toetsen in hoeverre er belangstelling bestaat voor de Semanta Services. Wat is een chatbot cq gesprekspartner? Lingvistica verstaat onder chatbot een systeem van computerprogramma's, gegevensbanken en procedures waarmee via het internet min of meer menselijk gecommuniceerd kan worden. Een chatbot volgt een ander leerproces dan een mens. Waar een mens eerst de betekenis van letters, woorden en zinnen leert en daarna de grammaticaregels geldt voor een Semanta-chatbot het omgekeerde. De chatbot is pas in staat tot communicatie als de regels bekend zijn en er betekenis aan kan worden toegevoegd. In de afgelopen periode heeft Lingvistica de basis daarvoor gelegd in meer dan 20 talen. Semanta is de handelsnaam waaronder Lingvistica producten en diensten ten behoeve van het leerproces voor chatbots ontwikkelt en vermarkt. Semanta de lerares De digitale leraar of lerares is een speciale virtuele gesprekspartner. Naast het voeren van een gesprek dient de leraar of lerares in staat te zijn aangeboden informatie in kennis om te zetten. Deze kennisvergroting is een continue proces dat deels automatisch en deels door menselijk handelen uitgevoerd wordt. Lingvistica kan uw medewerkers opleiden om uw digitale docenten te trainen. Semanta is een digitale lerares die andere digitale leraren op kan leiden. De Pandora-versie wordt door Semanta gezien als de gesprekspartner waarmee de bezoeker in gesprek gaat en opgeleid is via de Program O Versie die ter beschikking staat aan de webmaster. De rol van Lingvistica bestaat er uit dat de webmaster wegwijs wordt gemaakt in het toepassen van de semantafunctionaliteit voor zijn of haar website. Omdat virtuele gesprekspartners voorgesteld kunnen worden als lerende virtuele robots, bestaat er ook behoefte aan leraren voor deze robots. Lingvistica speelt daarop in met producten en diensten die het bouwen,onderhouden en exploiteren van chatbots vereenvoudigt en digitale leraren opleidt, die voor het onderwijs van chatbots ingezet kunnen worden. Uitgangspunt Om te kunnen "praten" heeft een computerprogramma kennis nodig. Voor Lingvistica is dit kennis in de vorm van teksten. Teksten die in allerlei vormen aangeboden kunnen worden. Iedere uiting via het internet bevat zinvolle informatie. Voor een website geldt dat Semanta het internet gebruikt als bron om er verwerkbare tekst van te maken. Aan iedere tekstvorm, corpus, tekstbestand, platte tekst of URL, wordt een taal, gespreksonderwerp en kennisdomein toegevoegd, waarmee een gesprekspartner aan de slag kan. De taal waarin de gesprekspartner "praat" wordt bepaald door de internetlocatie van de bezoeker en of de inhoud van de aangeboden tekst. Is de tekst meer dan 30KB groot, zal het tekstbestand als corpus gekenmerkt worden. Voordat een tekst kan worden verwerkt, dient het bestand opgeladen te worden naar de Semanta server. Dit geldt voor een corpus, tekstbestand en platte tekst. Voor iedere vorm heeft Semanta scripts ontwikkeld. Nadat de tekst is opgeladen zal Semanta de inhoud verdelen in zinnen en zinsdelen, die op hun beurt individueel te bewerken zijn. Van alle zinnen en zinsdelen wordt er grammaticale kennis vastgelegd op basis van de individuele woordvormen. Corpus Een gesprekspartner gebruikt het corpus om te converseren met de bezoeker van de website. Het corpus is opgebouwd uit de relaties tussen woordvormen,woordsegmenten, webpagina's. Een corpus bevat "woordelijke" representaties van de uitingsvorm over een onderwerp op het internet. Een corpus maakt deel uit van een kennisdomein dat gebruikt kan worden door een of meer gesprekspartners. Tekstbestand Bij bestanden tot 30 KB biedt Semanta de mogelijkheid tekstbestanden met de extensies: TXT, DAT, AIML op te laden en voor analyse aan te bieden. De verwerkingstijd is ongeveer 5 secondes per KB tekst. Platte tekst Tekst tot 1024 tekens wordt door Semanta beschouwd als "platte" tekst. Voor teksten boven dit aantal kunnen in de vorm van een tekstbestand aangeboden worden aan Semanta. Semanta gebruikt "platte tekst" via een dialoog met de bezoeker van een website. In korte vragen en antwoorden wordt de conversatie gevoerd. Bij de verwerking van platte tekst kan ook een URL opgegeven worden waaruit de tekstinformatie wordt onttrokken en wordt aangeboden aan Semanta. De tekst is "raw" en vereist dat de gebruiker een keuze maakt uit de gevonden tekst. Internet of Things In het "Internet of things" is ieder object met een IP-adres en voldoende software te representeren als virtuele gesprekspartner. U kunt uw horloge vragen hoe laat het is en de wasmachine laten weten in welk programma de was gedraaid moet worden. In aansluiting daarop kan Semanta met name een bijdrage leveren aan de opzet van tekstuele elementen in het laten genereren van kenniskaarten of Google Knowledge Graphs voor uw website. Spreken met een virtuele gesprekspartner Voor de implementatie van spraak in de Semanta services wordt getest met Nuance en ReadSpeaker als losse services aan te koppelen zijn. Ook Pandora.org voorziet in een sprekende gesprekspartner, waarvoor wij een Semanta versie hebben ontwikkeld. De toenemende vraag om in spreektaal te communiceren is in de architectuur van de Semanta software beantwoord en kan eenvoudig geimplementeerd worden. Language teacher De Semantus is de eerste implementatie van haar rol als LANGUAGE TEACHER waarmee Semanta probeert een antwoord te vinden op de vraag "Kan een computer leren praten? ". Lingvistica heeft de basis gelegd voor het positieve antwoord op deze vraag. Op basis van onze Semanta-techologie is het mogelijk om een niet-Nederlands sprekende bezoeker vanuit Semanta gereedschappen aan te reiken om vanuit zijn moedertaal Nederlands te leren kennen. Op basis van een enkel woord uit de Nederlandse woordenschat . Wat voor het Nederlands geldt is ook van toepassing op alle andere talen waarvoor wij diensten en producten hebben ontwikkeld. In overleg met diverse instanties en internetonderzoek heeft Lingvistica in Semanta opgezet om een begin te maken met het voor wat Lingvistica beschouwt als een doorbraak op het gebied van taalbewerking in Nederland. Internet helper De virtuele gesprekspartner Scenarioschrijver is de eerste implementatie van haar rol als INTELLIGENT HELPER waarmee Semanta probeert een antwoord te vinden op de vraag "Kan een computer leren praten? ". Lingvistica heeft de basis gelegd voor het positieve antwoord op deze vraag. Op basis van onze Semanta-techologie is het mogelijk om een bezoeker vanuit Semanta gereedschappen aan te reiken om vanuit zijn moedertaal met een gesprekspartner uit een geselecteerd corpus vragen en antwoorden te generereren. Hoe het werkt Dit gebeurt op twee manieren: · Semantische kenmerken van individuele woordvormen · Grammaticale segmenten van 2 tot 5 woordvormen Afhankelijk van de rolverdeling in het opleidingstraject kan de rol van Semanta, onze eerste digitale lerares, ingevuld worden voor een virtuele gesprekspartner. Onder leiding van een menselijke webeditor kunnen de tools van Semanta ingezet worden om de chatbot, avatar of robot , reproduceerbare kennis bij te brengen. De informatie kan afkomstig zijn uit losse uitingen, teksten, tekstbestanden, websites, wikipedia, bol.com,, google etc.Iedere tekst wordt verondersteld uit een ongestructureerd aantal uitingen te bestaan waarin vragen en antwoorden besloten kunnen liggen. Kennis die uiteindelijk door middel van intelligente conversaties tussen de menselijke en en virtuele gesprekspartners ontsloten kan worden. De analyse van de uiting en conversatie-elementen verloopt volgens een vast patroon. Verwerkingspatroon Tekstselectie Losse uiting, tekstbestand, website webpagina’s. Voorbewerking Splitsing uitingen,woordvormen en segmenten Grammaticale Analyse Karakter , gevoel en bruikbaarheid Semantische analyse Relatie in de context Verrijking Aanvullingen op karakter,gevoel en taalkundige kenmerken Vastlegging en conversie Afhankelijk van de ontvangende digitale partner is dit proces automatisch of handmatig