└── README.md /README.md: -------------------------------------------------------------------------------- 1 | # NLP en Español con Hugging Face 2 | 3 | "NLP en ES 🤗" es la comunidad de hispanohablantes de la iniciativa "Languages at Hugging Face". 4 | 5 | Nuestra misión es crear y compartir recursos que posibiliten y aceleren el avance del NLP en Español. Es un objetivo muy amplio que se puede traducir en: 6 | - Crear bases de datos o añadir las ya existentes a la librería Datasets de Hugging Face 7 | - Entrenar/fine-tune modelos utilizando dichas bases de datos y añadirlos al Model Hub de Hugging Face 8 | - Crear tutoriales explicando cómo hacer uso de estos recursos o traducir tutoriales ya existentes 9 | - Compartir eventos, artículos y proyectos interesantes para la comunidad ([Slack](http://bit.ly/nlp-en-es)) 10 | - Organizar charlas donde discutir el estado del arte del NLP en español 11 | - Organizar webinars en los que dar visibilidad a los proyectos que están llevando a cabo nuestros miembros 12 | - Organizar workshops con los que mostrar a toda la comunidad hispanohablante del mundo de la IA cómo hacer uso de estos nuevos recursos 13 | 14 |

15 | logo 16 |

17 | 18 | ## Datasets 19 | Ahora mismo hay [7 datasets monolingües en español](https://huggingface.co/datasets?filter=languages:es,multilinguality:monolingual). 20 | 21 | Cómo contribuir a la librería 🤗 Datasets: 22 | - Completar la documentación de las bases de datos ya existentes 23 | - Añadir una base de datos a la librería 24 | - Crear una nueva base de datos 25 | 26 | ### Completar la documentación de las bases de datos ya existentes 27 | El README de cada base de datos se llama Dataset Card y contiene información referente al uso, la estructura, la creación, la licencia y la citación de dicha base de datos. 28 | 29 | Todas las Dataset Cards siguen una misma [plantilla](https://github.com/huggingface/datasets/blob/master/templates/README_guide.md) y cuanto más completas estén, mejor 30 | (e.g. [Dataset Card for ELI5](https://github.com/huggingface/datasets/tree/master/datasets/eli5#dataset-card-for-eli5)). 31 | Si encuentras información que todavía no está incluida en la Dataset Card de cualquier base de datos, crea una Merge Request con tu aportación. 32 | 33 | ### Añadir una base de datos a la librería 34 | Si quieres añadir una base de datos a la librería de HF, solo tienes que: 35 | 1. Añadir una nueva fila a la hoja de cálculo* con la información de dicha base de datos y poner tu nombre en la columna "Contribuyente" 36 | 2. Seguir las instrucciones detalladas en [este documento](https://github.com/huggingface/datasets/blob/master/ADD_NEW_DATASET.md) 37 | 38 | Si quieres sugerir la adición de una base de datos a la librería añade una nueva fila en la hoja de cálculo* y 39 | deja la columna "Contribuyente" en blanco para que otra persona pueda trabajar en ello. 40 | 41 | *El enlace a la hoja de cálculo está en la descripción del canal #datasets del grupo de Slack. 42 | 43 | ### Crear una nueva base de datos 44 | Si tienes una idea para crear una nueva base de datos de NLP en español estás en el sitio adecuado: 45 | 1. Comparte tu idea en el canal #tutoriales de la comunidad de [Slack](https://join.slack.com/t/nlpenespaol/shared_invite/zt-n0cpcd87-hdAR_qiHtDcCAlCyZtwDKQ) 46 | 2. Reúne un equipo para hacerla realidad 47 | 3. Añádela a la librería de Hugging Face 48 | 49 | ## Modelos 50 | Ahora mismo hay [259 modelos en español](https://huggingface.co/models?filter=es). 51 | 52 | Cómo añadir tu modelo al 🤗 Model Hub: 53 | 1. Entrena/fine-tune tu modelo (echa un vistazo a los [datasets en español](https://huggingface.co/datasets?filter=languages:es,multilinguality:monolingual)) 54 | 2. Sigue las instrucciones de [esta página](https://huggingface.co/transformers/model_sharing.html) para compartir tu modelo y subirlo al Hub 55 | 56 | Recuerda detallar bien la Model Card, puedes utilizar [esta plantilla](https://github.com/huggingface/model_card). 57 | 58 | Si tienes más dudas echa un vistazo a [Model Hub docs](https://huggingface.co/docs). 59 | 60 | 61 | ## Tutoriales 62 | Tanto si quieres crear un tutorial desde cero como si quieres traducir uno: 63 | 1. Comparte tu idea en el canal #tutoriales de la comunidad de [Slack](http://bit.ly/nlp-en-es) 64 | 2. Reúne un equipo para hacerla realidad 65 | 3. Crea un repositorio con el nombre del nuevo tutorial 66 | 4. Crea un README.md con la información del tutorial 67 | 5. ¡Y a trabajar! 68 | --------------------------------------------------------------------------------