Dictionary of the Spanish language Text Analysis

El 20 de agosto de este «peculiar» 2020 recibí un simpático correo electrónico de un hombre llamado «Germán Andrés Segura Tinoco» que me decía:

Buscando en Internet, encontré en su website el diccionario de la RAE en modo texto plano, el cual me pareció genial y quisiera usarlo en un proyecto personal (sin fines de lucro) y publicar el resultado en mi GitHub, en donde tengo mis proyectos de informática públicos.

Por lo tanto, quería preguntarle, ¿cuál es la forma correcta de citarlo o de darle agradecimientos?

No es la primera vez que me pasa algo así desde que realicé el trabajo de recopilar todas las palabras (tecleándolas) del diccionario de la RAE para aquel, lejano ya, proyecto de Isidoro Valcárcel Medina. Sin ir más lejos, el año pasado una persona desde Chile me decía que lo estaba usando para «enseñar a hablar» a una máquina. Así como la gran colaboración que realicé dentro del interesantísimo proyecto de Marta PCampos 1914-2014 sobre las palabras que habían desaparecido del diccionario en esos 100 años. Su precioso trabajo que yo denomino «Palabras Muertas».

Yo le respondí cortésmente con un email ese mismo día diciéndole:

Por supuesto eres libre de usarlo en un proyecto personal sin ánimo de lucro o, incluso, remunerado. Son las palabras de la RAE… es decir, de todos, que yo tan sólo he tecleado (ante la imposibilidad de conseguir una versión digital).

Puedes citarme como te dé la gana, pero agradecería que citases mi nombre y website:
Giusseppe Domínguez https://www.giusseppe.net

Te envío, no obstante, una entrada del blog con una versión lo más actualizada posible (en Mega) y no me responsabilizo de posibles errores… que voy corrigiendo, pero que seguro que alguna quedará. Si necesitas algún tipo de «sección» del mismo o alguna cosa curiosa… puedes decírmelo y si tengo ocasión, cuenta conmigo.

Un cordial saludo y hasta pronto,
Giusseppe

Fue muy bonito e interesante encontrarse en dónde había utilizado esas palabras y para qué: un análisis estadístico de las palabras en español, además de su gentileza a la hora de citarme en varios lugares agradeciéndome mi contribución (que siempre tiendo a minimizar, pues las palabras son públicas).

Buenas tardes, estimado Giusseppe,

Muchas gracias por su respuesta.

Le comparto el link a la página principal del proyecto en el que estoy trabajando, en donde realizo el agradecimiento a usted (en la sección Acknowledgment), con link a su website.
https://ansegura7.github.io/DSL_Analysis/

También le comparto el resultado del análisis descriptivo en el que estoy trabajando. Agradecería sus comentarios al respecto.
https://ansegura7.github.io/DSL_Analysis/pages/dsl_text_analysis.html
Próximamente, estaré compartiendo los resultados por Twitter. Por lo tanto, agradecería si me indica el nombre de usuario de su cuenta Twitter, para poder mencionarlo.

Una vez más, muchas gracias por compartir y recopilar el dataset del DLE.

Saludos cordiales,
Andrés Segura Tinoco

Me resulta simpático que llamen «dataset» al conjunto o listado de las palabras que recoge la RAE en su DLE. Los enlaces del proyecto de Andrés son fantásticos y es un trabajo divertido que seguro que además alguien considera útil.

En su proyecto mezclaba dos de mis grandes pasiones: la programación y el lenguaje, cosa que suelo hacer con frecuencia y que, próximamente, haré aún más. Así que estuve cotilleando con suma atención hasta que creí que podía hacerle una sugerencia útil, además de agradecerle su agradecimiento (entrando en un curioso bucle)

Me alegra saber que te sirve el material recopilado.

He estado ojeando tu proyecto y tiene una pinta estupenda. Me encantan los análisis y tu codificación es muy limpia y bien comentada.

Como única sugerencia (no muy difícil de hacer) es la de escribir todas las frases del análisis en un array (o un archivo externo) que puede modificarse sencillamente para traducciones a otros idiomas. Me explico, por ejemplo, en la parte del código:

"source": [
  "# Show results\n",
  "n_words = len(word_dict)\n",
  "print('Total of different words: %d' % n_words)"
]

podrías sustituir el print por algo así como:

"print('%s: %d' % msg_total_words[i], n_words)"

y tener un array de cadenas msg_total_words[LANGUAGES] o algo similar… (disculpa mi escaso conocimiento de python)

Es sólo una insignificante sugerencia que, seguramente, se puede hacer mejor que como te sugiero. (Leyendo los textos/mensajes de un archivo idiomático, por ejemplo)

Quizá me ha llamado la atención especialmente por el hecho de que no esté en español el resultado, lo que comprendo desde el punto de vista de la divulgación, pero también me resulta paradójico siendo que se habla sobre el español… 😉

Muchísimas gracias por la atribución y espero que no te molesten mis sugerencias.

Un cordial saludo,
Giusseppe

PS: No uso Twitter. Tengo cuenta de Facebook e Instagram, just in case…
https://www.facebook.com/giusseppe.dominguez (perfil personal)
https://www.facebook.com/giusseppedelaaalaz (página «oficial»)
https://www.instagram.com/giusseppe.dominguez

Y en último agradecimiento, me escribió unos días después con los resultados que estaba obteniendo para hacerme partícipe de su publicación. (Lo que es de agradecer).

Estimado Giusseppe,

Muchas gracias por tu sugerencia. Me parece súper válida y útil para mayor y mejor divulgación del material publicado. La tendré en cuenta para este y futuros proyectos.

Aprovecho el correo y te comento 3 cosas brevemente:
1. Cree un hilo en Twitter publicando algunos de los resultados obtenidos en mi análisis y al final hay un tweet agradeciendo y reconociendo tu aporte con link directo a tu sitio web. Te comparto el enlace al hilo (son solo 8 tweets) por si los quieres revisar: https://twitter.com/seguraandres7/status/1298025632090259458?s=21

2. He hecho algunas correcciones sobre las palabras recopiladas. Encontré como 2 o 3 palabras en donde se acentuaban consonantes en vez de vocales y otros pequeños errores, en donde se invertían letras, sin embargo han sido menos de 10 correcciones hasta el momento. Una vez termine el proyecto, te envío de vuelta el diccionario de palabras, para que puedas actualizar el tuyo, de así considerarlo.

3. Para futuro networking o trabajos, te comparto mi sitio web y mi perfil de Twitter donde constantemente estoy publicando resultados de mis trabajos de investigación personales o académicos. Curiosamente, yo no tengo Facebook. Website: https://ansegura7.github.io/ y usuario de twitter: https://twitter.com/SeguraAndres7

Una vez mas, muchas gracias por recopilar y compartir este dataset tan valioso.

Saludos cordiales,
Andres Segura Tinoco
Telf: +57 3555590546

Actualicé mi diccionario con su revisión incorporada, para poder utilizarlo en nuevos proyectos, pero sé, soy consciente, que seguro que habrá más errores. Quizá por ello en el proyecto «Cocinillas» en el que estoy metido ahora mismo he querido incorporar un «testeador» o comprobador, para saber si la palabra que busco en el diccionario existe o no y, en caso contrario, hacer un listado con todas las palabras erróneas que tengo y poder mejorar mi diccionario en texto plano (aunque espero que la próxima vez que lo actualice pueda incorporar, incluso, todas las definiciones).

¿Recuperaremos el sentido de la enseñanza?

Hoy he leído un artículo en eldiario.es que por supuesto me resulta relevante (no como la mayoría de los artículos) pues me dedico a dar clases particulares parcialmente y afecta directamente lo que se decida con respecto a las evaluaciones de este incierto curso en el que es absolutamente imposible mantener los esquemas con una perspectiva de antigua normalidad.

El enorme titular rezaba: Los profesores de Bachillerato piden cambios ya en la Selectividad porque este año va a ser casi imposible acabar los temarios. Lo que hace casi innecesario seguir leyendo pues es un spoiler en toda regla. El titular nos lo cuenta todo. Pero no.

Lo verdaderamente interesante estaba en el meollo del artículo: ¿para qué sirve la educación? ¿para qué sirve la EvAU o EBAU o PAU o Selectividad o…? ¿Es realmente necesaria?

Yo siempre había sostenido que, más allá del hecho de que, por supuesto un examen no es algo intrínsecamente útil desde el punto de vista académico, sí que me resultaba defendible como aquel reto al que enfrentar a la adolescencia con un atisbo de lo duro que será ir haciéndose mayores, en términos de responsabilidades, exigencias, etc. Una especie de «rito de iniciación», algo cruel, puede, pero mucho menos que colgar de las garras de un halcón bajo un sol tórrido en una tienda sioux.

Pero he de reconocer que el texto me ha hecho recapacitar sobre esta idea y darme cuenta de que estaba equivocado: con ese «rito» se pone foco en lo ritual y no en lo esencial, que debería ser siempre el aprendizaje.

Efectivamente, durante el último curso de formación del instituto (lo que ahora mismo se conoce como 2º de bachillerato) lo que hace el profesorado es únicamente preparar para ese examen, no hay nada en el horizonte de un alumno o una alumna de 2º que no sea su EvAU. Todo gira en torno a ello. No hay ningún momento en el que piensen si lo que van a estudiar les va a servir en su carrera (ya no en su vida, que sería demasiado y sobre lo que estoy viendo un vídeo muy ilustrativo titulado “Las matemáticas nos hacen más libres y menos manipulables”. Eduardo Sáenz de Cabezón).

Es un año que, si ese «rito» pudiese eliminarse (no hay una razón para que no sea superfluo, pues académicamente ya han debido probar su valía a lo largo de años de exámenes de instituto), podría recuperarse para lo que debería estar concebido: enseñar y aprender.

Pero luego pienso que en realidad lo que busca la inmensa mayoría de la gente es «servir», ser útil, ser martillos en una sociedad postindustrial, ser herramientas al servicio de algo y no visualizan en el conocimiento nada más que otra herramienta, no un gozo, no un disfrute, no un absurdo interés de conocimiento por el conocimiento. Pienso que desean aprobar exámenes, sacar notas, tenerla más larga, matricularse en másteres, demostrar que pueden… demostrar, demostrar, demostrar… y pierdo la paciencia y la fe en cualquier aproximación al sistema educativo (me da igual la metodología).

Así que… yo sigo creyendo en la ingenua labor de muchos docentes de enseñar, de transmitir conocimientos, de abrir mentes, de formar (no sólo informar) a las generaciones venideras, si es que las generaciones revenidas lo permiten.

Poesía Tendencia

La poesía es la tendencia de esta temporada

Calentita, gustosita, agradable al tacto, o todo lo contrario: hay de todos los colores.
Hazte con ella en todas sus formas en los talleres de poesía y escritura creativa de Asociación Cultural Clave 53.

Hace años, la sobrina de Carmen, que es fantástica vendiendo y sabe cómo atraer seguidores (su cuenta de Instagram es un fiel reflejo de la afirmación), me sugirió esta expresión que seguramente sería atrayente, pero también mentira.

Es una mentira que la gente está deseando escuchar: que la poesía es «agradable», que «da gustito», que puede ser calentita o a tu gusto, incluso (y esto es lo peor) que es terepéutica.

Es una mentira que llena de seguidores las cuentas de quienes escriben ese tipo de poesía, esa «nopoesía«, esa «twittersía» que regala premios de Espasa y vende libros por millares.

Es una mentira de las que premia el sistema en el que vivimos inmersos.

Pero yo siempre he defendido que la poesía contemporánea (y el arte contemporáneo) sólo es interesante en tanto en cuanto busca revertir o subvertir la perversión del sistema. Para ello ha de buscar el riesgo, el peligro permanente, casi el fracaso pero sin garantías, sin ninguna garantía.

Quizá por ello no he querido nunca usar ese «anuncio» que podría ser muy eficaz, que podría conseguirme muchas personas interesadas en mis talleres de poesía.

Puedo engañarme diciendo que más adelante les mostraré que la poesía es incómoda, que es un camino de espinas y no de rosas, que no sana sino enferma, que la primera carta a un joven poeta de Rilke ya lo dice claro… pero no lo creerán pues todo lo que parte de una mentira, es mentira; es un edificio que se sostiene en barro. Y yo prefiero un cuchitril pero sobre granito.

Y sobre esa piedra, erigiré mi iglesia.

El culto a la poesía riesgo, la poesía valiente, la poesía prueba-y-error, la poesía sin esperanzas, la poesía sin panfletos, la poesía sin soflamas, la poesía desnuda y en lo oscuro, la poesía rota, la poesía en crisis permanente, la poesía sin futuro, la poesía libre, la poesía voladora, la poesía desalmada, la poesía interna y sincera, la poesía intensa, la poesía loca, la poesía racional, la poesía irracional, la poesía que niega el principio del tercero excluido, la poesía infinita, la poesía desagradable, la poesía insana, la poesía fría, hostil, desarrapada, la poesía triste y pobre, la poesía cuyas deudas sean con toda la poesía arriesgada, valiente, experimental, desesperanzada, fracasada que haya sido escrita y leída antes de generar nueva poesía arriesgada, valiente, experimental, desesperanzada, fracasada…

Dobles negaciones

He perdido otro valioso rato de mi vida leyendo un texto de un médico jubilado que escribía una carta abierta en una red social a algún ministro o cargo sanitario que según él está gestionando muy mal este periodo pandémico o plandémico o como quieran llamarlo. No entro a valorar este tema del que me considero un total ignorante ni quiero perder mi tiempo con estadísticas que no sé contextualizar, ni con informes médicos que no quiero conocer (no tengo el nivel suficiente para comprender).

Pero cuando leo estas frases, pierdo el respeto a quien las firma:

Yo no soy ningún negacionista, al contrario; “Afirmo la falta de evidencias científicas en muchas de las medidas que ustedes llaman sencillas y esenciales”, y niego la existencia de datos irrefutables que las justifiquen”.

He marcado en negritas (o blanquitas) las palabras que me han llamado la atención:

«no soy ningún negacionista»: no puede tener más palabras «negativas». Veamos: «no» y «ningún», ¿Esta doble negación tan característica del idioma español significa en realidad SÍ? En caso de que no sea el caso (jejeje) lo que está diciendo (sin el ningún se entiende mejor) «no soy negacionista».

Y aquí llega lo mejor, «al contrario»: es decir, negando lo anterior…

«afirmo la falta»: lo que vuelve a ser negacionista, aunque use la palabra «afirmo». Afirmar una negación es negar. Menos mal que termina reconociendo que «niega la existencia».

Este señor, aparte de negacionista, es un compendio de malas praxis en la redacción a la búsqueda de ampulosidad que dote a su carta abierta de cierta «credibilidad».

Por supuesto, aparte de negacionista, es casi nihilista… y eso hasta cabría decir que me ha hecho gracia.

Galería de fotos de Amapolas desde el balcón

Si ayer escribía sobre la maravillosa recepción que me dio el tener los 430 ejemplares de la edición del libro de poesía colectivo Amapolas desde el balcón, hoy he comenzado a preparar los repartos para las personas que han participado en el mismo.

He apilado 420 ejemplares en 3 filas de 7 columnas de 20 ejemplares cada una, para poder contar sin contar, como quien dice.

Una vez agrupado el material, lo he fotografiado desde distintos ángulos (los libros son algo muy fotogénico) para enviarles el álbum así obtenido a cada poeta de la antología.

Además de un álbum en la página de Facebook de Clave 53, he subido, tras prepararlas, las fotografías a la galería de mi página web, en un nuevo apartado dedicado a ello denominado Clave 53. Por si había dudas. 😉

Abanico de Amapolas

Comenzar el nuevo ciclo con todas las anormalidades que se están dando, pero recibiendo este precioso abanico de amapolas que hicieron posible las personas asistentes a los talleres de Poesía y Escritura Creativa de la Asociación Cultural Clave 53 este año pasado, dadas las dificultades, la complejidad para continuar coordinando talleres vía online, la dureza de afrontar el estrés de una pandemia global, pero conjuntamente ser capaces de generar poesía, de engendrar belleza, de crear un objeto tan maravilloso como es este conjunto de amapolas que han venido a ser lanzadas desde el balcón que nos abren los versos al horizonte… comenzar así es un placer inconmensurable del que me siento emisor y receptor, causa y efecto, al mismo tiempo.

Tengo unas ganas enormes de hacer entrega de estos libros que han sido mi mejor trabajo como editor hasta la fecha. Son una verdadera joya para tener entre las manos, con un cálido papel rojo, con unas preciosas solapas informativas, con unas tipografías bien elegidas, un diseño de portada minimalista pero amable. Ha resultado un objeto delicioso.

Y no puedo sino agradecer a las 25 personas que han hecho posible que este libro vea la luz en un periodo tan oscuro de la historia. Allá donde todo parecía prosa, han puesto poesía. Se lo agradeceré siempre.

Poetas participantes en la antología

Yolanda Jiménez, Kay Woo, Pepa Delgado, Anita Ges
Javier Jiménez, Dunia Ben-Aissi, Ester Morales García
Sal Ander, Pablo Velado Pulido, Paula García Izu
Andrea Vidal Escabí, Ernesto Pentón Cuza
María Jesús Orella, Vanessa López
Armando Silles McLaney, Francisco Domínguez Agudelo
Leticia Rejas Rujas, Isabel Jiménez Moreno
Inmaculada Sánchez Costa, Lucía Herrero Villazán
María José Gómez Sánchez-Romate, Alejandro Gallego
JMariano Velázquez, Susana Olalla Serra, Irene Chacón

Ahora toca pensar una manera viable de realizar una presentación de un libro colectivo sin aglomeraciones, manteniendo la mínima probabilidad de contagios epidémicos, pero al mismo tiempo intentando hacer llegar un rayo de esperanza, de sensibilidad, de empatía, a la mayor cantidad posible de gente. Es un reto a nuestra creatividad, a nuestra forma de afrontar las dificultades con soluciones imaginativas que sean capaces de alcanzar sendos objetivos.

Hoy el día ha comenzado bonito. Mi vida está rodeada de momentos inolvidables como este. Y soy tan feliz…

Ejemplar de prueba de Amapolas desde el balcón

Hoy he recibido el ejemplar de prueba del libro colectivo de este curso (atípico) que también ha resultado ser atípico como libro, pues es el primero que edito con solapas y he aprovechado para escribir un texto amable y merecido para las personas que lo han hecho posible.

PORTADA

CONTRAPORTADA

© Susana Olalla Serra, Dunia Ben-Aissi, Ester Morales García, Lucía Herrero Villazán, Inmaculada Sánchez Costa, Pablo Velado Pulido, Vanessa López, Irene Chacón, Paula García Izu, Armando Silles McLaney, Yolanda Jiménez, María José Gómez Sánchez-Romate, JMariano Velázquez, Isabel Jiménez Moreno, Javier Jiménez, Andrea Vidal Escabí, Francisco Domínguez Agudelo, Pepa Delgado, Sal Ander, María Jesús Orella, Anita Ges, Alejandro Gallego, Kay Woo, Ernesto Pentón Cuza y Leticia Rejas Rujas, 2020

SOLAPA

Amapolas desde el balcón es el título elegido este año para la edición de este libro colectivo que escriben con absoluta libertad las personas asistentes a los Talleres de Poesía y Escritura Creativa de la Asociación Cultural Clave 53. Es un título que hace referencia a unas amapolas que han surgido en las circunstancias más adversas posibles, en esos tiempos que dicen erróneamente no ser buenos para la lírica, amapolas que resisten los vapores sulfurosos de un cráter, que se erigen en emblema de esperanza que arrojar desde el balcón con la más cálida de las intenciones: Poner poesía en periodo prosaico y estadístico.

Gracias a las 25 personas que lo han hecho posible y han contribuido con su poesía a hacer del mundo un lugar mejor.

En la solapa de la contraportada he enumerado los libros que llevamos hechos en Clave 53 desde hace ya más de 13 años… y han sido bastantes, a uno por año, salvo una excepción. Una maravilla estar rodeado de gente tan interesante que confía en mí para guiar el proceso de exploración que culmina en un libro de poesía con el que regar el mundo.

CONTRASOLAPA

Mi web es una y es trina

A modo de taburete, la web en la que he estado trabajando desde primeros de marzo hasta ahora es una y es trina, sí, se trata de 3 patas que sustentan una especie de triunvirato que espero que no acabe tan mal como el famoso juliano.

La web Base

El esqueleto o lo que la aglutina es lo que llamo la base que está hecha casi «from scratch» en lo que se refiere al estilo, al aspecto, al comportamiento en diferentes dispositivos…

web base

El diario en WordPress.org

Sobre ella (o bajo ella, no sé) hay instalada una base de datos que gestiona, desde el 2011, mi diario, en el que escribo, como su nombre indica, casi diariamente, excepto en temporadas estivales o fiestas de guardar (el 1 de mayo o el 6 de diciembre).

De hecho, elegir el estilo del wordpress que la muestra me llevó gran parte del mes de marzo, hasta que di con una combinación de dos «themes» que me gustaban y de los que personalicé el definitivo, que pasó también a influir para unificar el estilo que usaría en las otras 2 patas de esta web trifásica.

web blog

La galería en Piwigo

Pero lo más sofisticado fue cuando decidí que no quería utilizar ninguna de las herramientas más habituales de gestión de álbumes de fotos o imágenes para almacenar el material visual que tenía (que había tenido previamente en picassa, luego en google-photos, o para el que había desarrollado o implementado «sliders» de javascript más o menos engorrosos).

Así que «inventé la rueda» instalando en mi hosting una aplicación llamada Piwigo (open source para más datos) que maneja y almacena las imágenes: la galería.

web galeria

Subirlas a ese espacio requerían, para no ser demasiado pesadas en término de tamaño de archivo, su procesamiento, reducción de resolución, renombrado para evitar caracteres especiales, minúsculas para homogeneizar, etc… que hice gracias a la programación, pues hablamos de más de 3000 imágenes.

Unificar estas tres componentes y que parezcan una sola web y no múltiples ha sido complejo, pero lo más difícil todavía fue revisar reordenar y modificar todo el trabajo que tenía más o menos mal documentado desde el 2008 (fecha de la última actualización importante de la web) hasta hoy.

12 años de trabajo que han sido fructíferos en términos de obra, de producción casi industrial, de proyectos complejos y largos… muchos de los cuales no habían visto la luz hasta hoy.

Ahora siento un alivio considerable y una extraña sensación de vacío, sigo teniendo material en curso, en lo que estoy trabajando que aún no está en esta web, pero ya sé dónde ponerlo cuando acabe.

En resumen:

  1. Marzo: Pruebas de personalización de temas de blog (con instalaciones en desarrollo sobre una raspberry, para no «romper» nada importante), así como elección de tipo de letra, colores…
  2. Abril: Ordenación de material visual, de documentación de acciones, revisión de trabajos pendientes de un final…
  3. Mayo: Creación de la base de datos Piwigo para almacenamiento de las imágenes. Elección y personalización del tema elegido. Por momentos, parece algo superfluo que se podría haber hecho agrupando esto con el Diario en WordPress.org, pero me resulta más fácil compartimentar.
  4. Junio: Creación de la web base. Generación de una plantilla dinámica, pero que no haga uso de javascript salvo en lo imprescindible sino que sea responsive y con animaciones pero exclusivamente basándome en estándares CSS3 y HTML5 (me encantan las etiquetas «semánticas»).

Han sido meses de confinamiento y agradezco (a mí mismo, supongo) haber tenido el tiempo para poder afrontar algo como esto que muchas de las veces, mientras lo estaba haciendo dudaba que tuviese el más mínimo sentido en esta época de red social y publicación en plantilla.

Espero que me dure el trabajo principal, si no una docena de años como la anterior web, por lo menos más de 5 años.

Amapolas en el Cráter

Desde la semana pasada, Clave 53 tiene una «emisora de radio 2.0», lo que comúnmente se denomina «podcast». Estamos emocionados con la propuesta y aquí incluyo el primer episodio de los que se irán realizando a raíz de uno diario y programando su emisión para que duren bastante tiempo, pero imagino que va a ser algo que me va a llevar mucho tiempo durante muchos años.

La idea partió de un verso de un alumno de los talleres y surgió en este periodo de confinamiento debido al coronavirus.

Todos los demás episodios pueden verse en Amapolas en el Cráter.

Esto no es una broma