Entity Search

Entity Search is de Named Entity Recognition (NER) tool van Openindex. Deze tool stelt ons in staat om alle soorten relevante informatie uit elke tekst te halen, zoals namen, bedrijven, organisaties, locaties, etc. Entity Search herkent steeds meer entiteiten in elke willekeurige tekst door te trainen met grote beschikbare datasets. Input kan tekst, pdf, een website of een ander formaat zijn. Voor tests en kleine hoeveelheden kan de input worden ingevoerd via een webformulier, maar we bieden ook een API-service. Dit maakt het mogelijk om de technologie te integreren in geautomatiseerde processen.

Openindex inside
Gebouwd met geavanceerde zoekmachine technologie van Openindex
Privacy gegarandeerd
Openindex draait om het respecteren van privacy. Alle verzamelde data wordt anoniem opgeslagen. Er worden geen data verkocht of verstrekt aan derden.
Extraheer talloze entiteiten uit uw tekst
Vindt automatisch personen, merken, locaties, tijdsaanduidingen en nog veel meer.
Werkt met elke website en tekstbron
Het maakt niet uit welke technologie er achter de websites of databronnen zit, zolang de output maar leesbaar is voor onze parser. De input kan elke toegankelijke website zijn, maar ook tekstbestanden, PDF's, etc.
Ondersteuning voor meerdere talen
We ondersteunen momenteel achtenveertig talen voor Entity Search, maar er worden aanvullende taalmodellen gebouwd. Het ondersteunt ongeveer veertig verschillende entiteitstypen en integreert naadloos met onze parser.
API beschikbaar
Er is een web-API beschikbaar waarmee Entity Search kan worden opgevraagd. Hierdoor kan de technologie worden geïntegreerd in geautomatiseerde processen.

Probeer de online demo hieronder

Voer een URL of vrije tekst in het onderstaande tekstvak in en zie welke informatie wordt opgehaald.

or

{{ content }}

Entity Search maakt gebruik van de volgende technieken

Apache OpenNLP
Apache OpenNLP is een op machine learning gebaseerde toolkit voor de verwerking van natuurlijke tekst.
Apache Solr
Solr is het populaire, razendsnelle, open source enterprise search platform gebouwd op Apache Lucene™. Openindex heeft zijn eigen zeer aangepaste en geoptimaliseerde Solr-instance die dient als basis van ons platform.
Perceptrons
Een perceptron is een neuraal netwerk waarin de neuronen in verschillende lagen met elkaar verbonden zijn. Een eerste laag bestaat uit inputneuronen, waar de inputsignalen worden toegepast.
Maximale Entropy
Het principe van maximale entropie stelt dat de kansverdeling die het beste de huidige stand van kennis weerspiegelt, degene is met de grootste entropie, in de context van nauwkeurig weergegeven eerdere gegevens.
PoS tagging
In de corpuslinguïstiek is woordsoortmarkering, ook wel grammaticale markering genoemd, het markeren van een woord in een tekst dat overeenkomt met een bepaald woorddeel, op basis van zowel de definitie als de context.