1.3.4 Vastlegging en conversie
Verrijking Aanvullingen 
De verrijking bestaat eruit dat woordvormen  soms  dubbelzinnigheid in het gebruik  bevatten en dat voor  iedere woordvormen  synoniemen en antoniemen  bestaan.  Daarnaast zijn grammaticale segmenten, die  uit 2 of meer woordvormen bestaan digitaal  om te  vormen tot andere samenstellingen. 
Vastlegging en conversie 
Ook hier geldt dat als de gegevens zijn  verwerkt en  klaar staan om geconverteerd te  worden,  Een  keuze  gemaakt kan worden  voor chatbot in AIML formaat  of platte tekst.  In de huidige versie van het  conversieprogramma worden  het chatbot- en  tekstbestand altijd gemaakt en wordt voor de  NAO  robot een gefixeerd sample getoond
De dubbelzinnigheid van woordvormen is af  te leiden  uit de context waarin ze gebruikt  worden. Bijvoorbeeld het woord  loop in de  zin: Als ik niet loop sta ik stil.

als ik niet
ik niet loop  
als ik niet
niet ik als *u dat soms denkt...
als niet ik *maar iemand anders..
dat ben *ik niet als* u dat misschien  verwachtte
dat gaat *niet als ik*  het mag zeggen
wat * weet ik  als * niet alles verteld wordt
ik niet loop
dat klopt *niet ik loop* altijd zo
dan *loop ik niet *dan ga ik rennen
ik loop niet *dus ik sta stil
ik * loop niet ik*  kijk
het is * niet loop ik * maar wandel ik genoeg
graphic
In het volgende  voorbeeld worden de  woordvormen brabants, miljoenenproject,  avatars  en ziekenhuizen door Semanta  gekoppeld aan  leraar en dokter
Als de tekst in afzonderlijke uitingen is  verdeeld kan  de webeditor een keuze maken  uit die uiting die hij  van een antwoord wil  voorzien. Verder worden alle  uitingen in de  kennisbank van Semanta opgeslagen  in  relatie tot het onderwerp en de  gesprekspartners  De resultaten worden  verder In een plat  tekstbestand opgeslagen  dat in aansluiting op dit  proces digitaal  bewerkt kan worden.  
graphic
graphic
    Omdat iedere woordvorm door Lingvistica van grammaticale kenmerken is  voorzien kunnen daar door de VGPT  vragen over gesteld worden die door de  webeditor beantwoord kunnen worden:  ziekenhuizen
graphic    
graphic
Uit de gevonden uitingen kan de webeditor een keuze maken om een vraag en  antwoord te formuleren  bijvoorbeeld: "de universiteit van tilburg en dertien  merendeels brabantse partners gaan deze virtuele trainers  maken en in drie  ziekenhuizen"  
Uit de  de gehele zin worden er op basis van tussenwoorden als  endeze de zin  gesplitst en wordt de functie van  het tussenwoord omgezet in een een woordvorm  als aanvulling en terugverwijzing. Voor deze woorden zijn net  als ieder ander woord  kenmerken gedefinieerd die tot een vraag aanleiding kunnen zijn. Van deze mogelijke  vragen  wordt er in de testversie alleen de eerst voorkomende vraag getoond.
graphic
Een voorbeeld van een medische website kan ook als basis gebruikt worden voor de  opbouw van kennis over de  zoekopdracht " birth control and cancer".
graphic    


.