Skip to content

Listado de vocabulario en español para generación de lenguaje.

Notifications You must be signed in to change notification settings

Lingwars/todosloscorpus

Repository files navigation

Todos Los Corpus

Este repo contiene listados de palabras en formato JSON para que sean usados libremente por creadores de bots o cualquier otra persona haciendo labores de NLP.

Si estás buscando información sobre la convocatoria #DiaDeTodosLosCorpus, están en el fichero 1NOV. Si lo que buscas son instrucciones sobre cómo colaborar, están en el fichero CONTRIBUTING.

Este repositorio está fuertemente inspirado en el corpora de dariusk, al que rendimos homenaje.

Objetivo

Permitir prototipado rápido y pruebas de conceptos. Como tal, los listados de vocabulario virtualmente infinitos no deben sobrepasar en ningún caso los mil elementos. No se trata de hacer una enciclopedia, sino de recopilar suficientes ejemplos para juguetear.

El formato ofrecido es JSON para que sea compatible con cualquier plataforma de desarrollo; de igual forma, el objetivo del repositorio es únicamente la colección de datos y no de ningún código auxiliar.

Licencia

Hasta donde permita la ley, todos los creadores de contenido de este repositorio renuncian a todo copyright y derechos relacionados con este producto. Esta obra se publica desde España.

Cualquier pull-request u ofrenda de añadido sobre este repositorio se entenderá como una renuncia por tu parte en condiciones similares a la arriba expuesta.

About

Listado de vocabulario en español para generación de lenguaje.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published