Verrijking Aanvullingen
De verrijking bestaat eruit dat woordvormen
soms dubbelzinnigheid in het gebruik
bevatten en dat voor iedere woordvormen
synoniemen en antoniemen bestaan.
Daarnaast zijn grammaticale segmenten, die
uit 2 of meer woordvormen bestaan digitaal
om te vormen tot andere samenstellingen.
|
Vastlegging en conversie
Ook hier geldt dat als de gegevens zijn
verwerkt en klaar staan om geconverteerd te
worden, Een keuze gemaakt kan worden
voor chatbot in AIML formaat of platte tekst.
In de huidige versie van het
conversieprogramma worden het chatbot- en
tekstbestand altijd gemaakt en wordt voor de
NAO robot een gefixeerd sample getoond
|
De dubbelzinnigheid van woordvormen is af
te leiden uit de context waarin ze gebruikt
worden. Bijvoorbeeld het woord loop in de
zin: Als ik niet loop sta ik stil.
als ik niet
ik niet loop
als ik niet
niet ik als *u dat soms denkt...
als niet ik *maar iemand anders..
dat ben *ik niet als* u dat misschien
verwachtte
dat gaat *niet als ik* het mag zeggen
wat * weet ik als * niet alles verteld wordt
ik niet loop
dat klopt *niet ik loop* altijd zo
dan *loop ik niet *dan ga ik rennen
ik loop niet *dus ik sta stil
ik * loop niet ik* kijk
het is * niet loop ik * maar wandel ik genoeg
|
|
In het volgende voorbeeld worden de
woordvormen brabants, miljoenenproject,
avatars en ziekenhuizen door Semanta
gekoppeld aan leraar en dokter
|
Als de tekst in afzonderlijke uitingen is
verdeeld kan de webeditor een keuze maken
uit die uiting die hij van een antwoord wil
voorzien. Verder worden alle uitingen in de
kennisbank van Semanta opgeslagen in
relatie tot het onderwerp en de
gesprekspartners De resultaten worden
verder In een plat tekstbestand opgeslagen
dat in aansluiting op dit proces digitaal
bewerkt kan worden.
|
|
|
Omdat iedere woordvorm door Lingvistica van grammaticale kenmerken is
voorzien kunnen daar door de VGPT vragen over gesteld worden die door de
webeditor beantwoord kunnen worden:
ziekenhuizen
Uit de gevonden uitingen kan de webeditor een keuze maken om een vraag en
antwoord te formuleren bijvoorbeeld: "de universiteit van tilburg en dertien
merendeels brabantse partners gaan deze virtuele trainers maken en in drie
ziekenhuizen"
Uit de de gehele zin worden er op basis van tussenwoorden als
en, deze de zin
gesplitst en wordt de functie van het tussenwoord omgezet in een een woordvorm
als aanvulling en terugverwijzing. Voor deze woorden zijn net als ieder ander woord
kenmerken gedefinieerd die tot een vraag aanleiding kunnen zijn. Van deze mogelijke
vragen wordt er in de testversie alleen de eerst voorkomende vraag getoond.
Een voorbeeld van een medische website kan ook als basis gebruikt worden voor de
opbouw van kennis over de zoekopdracht "
birth control and cancer".
.