ogaño

Según la RAE

hogaño Tb. ogaño, p. us.
Del lat. hoc anno ‘en este año’.
1. adv. dem. En la época actual. La historia que narra esa novela bien pudiera acaecer hogaño. 2. adv. dem. La época actual. Con más previsión nos hubiéramos ahorrado los problemas de hogaño.

Acabo de buscar en el Diccionario de la RAE (no en el «mío»), la palabra hogaño para incluirla en un poema y me encuentro con que se puede escribir también OGAÑO, así, sin h. Me ha parecido algo descorazonador. De alguna manera, sé que toda palabra la puedo escribir como me dé la real gana y no la real academia.

Así, a partir de ahora, estoy por suprimir la hache en la palabra ache y a volar

Por cierto, el poema para el que buscaba la palabra es un haiku de lo más banal, como bien corresponde al género:

la casa indiana
hogaño abandonada
antaño escuela

A este mundo le sobran…

Una amiga publica esta imagen en una red social y no quiero contradecirla ni, mucho menos, enmendarle la plana (¡qué expresión!), pero me resulta bastante gracioso que un texto que dice que «a este mundo le sobran opiniones y le faltan abrazos« se quede tan pancho ante tal paradoja: esa afirmación es una opinión. Opinión con la que puedo estar completamente de acuerdo, aunque sobre mis opiniones ya he escrito en otro sitio… más y mejor.

Ni que decir tiene que también me resultó algo molesto (quizá sobre ese «también») el punto tras «se equivoque», y las mayúsculas sin otro sentido que el de comenzar la línea, como si lo hubiese escrito alguien que no sabe evitar que se autocorrija el editor.

Cuando alguien se equivoque, abramos más los brazos que la boca: a este mundo le sobran opiniones y le faltan abrazos.

Pero me gusta la bicicleta y la pared de tres tonos de rosa, amén de la tipografía, que podría calificar de «femenina», si es que eso tiene algo de sentido.

Mal empezamos

He tardado en darme cuenta
de que era un error tipográfico
esa «la poder»
y no una expresión poética
con la libertad a la que suele estar acostumbrado
mi criterio
que en lo único que ha reparado
es en la minúscula de esa ele
que quedaba muy desajustada
formalmente
con la de La experiencia.

Mi experiencia ha sido nefasta
y he decidido no seguir leyendo
aunque quizá estoy perdiendo la posibilidad
de una misión guiada
para optimizar los resultados de mi venta
con el poder de la tecnología.

Obviamente…

Obviamente, dice el artículo, la Wikipedia está pensada para satisfacer la curiosidad y el desconocimiento de los usuarios…

Es genial o deprimente, no sé muy bien, este tipo de errores que hace temblar ante lo que se avecina mediante inteligencias artificiales aún menos monitorizadas, si cabe, que quien haya tecleado este penoso artículo.

Y quizá acabemos encontrando una obra surrealista inintencionada, lo que no acaba de convencerme como obra, en una Internet 5.0 realizada por y para máquinas o personas a quienes no les importa absolutamente nada el rigor.

No está permitido…

Aseos Públicos está corregido. Es un cartel que había puesto seguramente alguien del centro sanitario donde he fotografiado este pequeño detalle. Alguien, seguramente, infrapagado.

No esta (!!) permitido… Es un cartel que les envía la Comunidad de Madrid a todos los centros sanitarios.

Sí. La ortografía está suspensa en las administraciones públicas o publicas o publicás o, casi diría, impúdicas, por no decir púbicas.

Los virus aprenden a escribir

Lo más preocupante de que un virus aprenda a escribir es que ya no puedes fiarte de ese instinto que te dice que si un correo electrónico viene con muchas y extrañas faltas ortográficas muy probablemente se trate de un correo peligroso, SPAM o troyano.

Hoy he recibido un par de emails con un asunto sorprendentemente bien escrito:

Espero que estés pasando un día fantástico

y un contenido también bien redactado, incluso haciendo uso de negritas en los lugares adecuados:

¡Es una oportunidad que no debes desaprovechar!

Indicaban que te convenía pinchar en un enlace de bit.ly (esto ya es sospechoso de por sí, pero hay gente que usa acortadores de URL algo inapropiados)

https://XXXbit.ly/3XXXX526XXXXWVh

Si quitas las X aún puedes ir a ver lo que aparece ahí, bajo tu responsabilidad o irresponsabilidad.

Yo, curioso con estas cosas, por viejos hábitos que no hacen al monje, quise ver qué había en ese enlace con la mayor de las seguridades posibles, así que en una máquina virtual Linux (que no tiene acceso a ninguna de las carpetas del anfitrión) dentro de mi sistema principal Linux habilité la compartición del portapapeles bidireccionalmente (lo que ya me pareció un riesgo alto, pero me dio pereza teclear la dirección manualmente), en esa máquina abrí un firefox y lancé a copiar la URL en cuestión, encontrándome que me dirigía a una web que no tiene una pinta muy maliciosa:

salvo para personas incautas que crean que si no pagan en esa pantalla van a tener algún problema. Navegué por otras páginas y cerré esa pestaña sin el más mínimo problema… aunque no probé con otros navegadores quizá más expuestos, móviles incluidos, pues mi curiosidad tiene un límite.

Diccionario RAE Completo

He decidido dar por concluida la ordenación del Diccionario de la RAE, que me descargué con el programa buscaenrae.sh y el programa descargarae.sh hecho para la ocasión y que leía el archivo con la lista de palabras (al que impropiamente denominaba diccionario), para descargar, una a una, las páginas correspondientes.

Todo partió del trabajo que realicé para el proyecto del Diccionario Personal de Isidoro Valcárcel Medina, en 2015.

Ahí nos encontramos con la negativa de la RAE a ceder el diccionario en modo digital, así que tuve que teclear las entradas del mismo a lo largo de más de 3 meses. Finalmente, acabé teniendo una lista de 90940 palabras, algunas de las cuales eran acepciones repetidas. Si quitábamos las palabras que tenían más de una acepción y que estaban en el archivo etiquetadas con un número 1,2,… según procediera, nos quedaban 88296 palabras (debería llamarlas «entradas»).

Por supuesto, estaban plagadas de errores:

  1. En primer lugar los propios de tecleo.
  2. En segundo lugar (oh, my god!) tenía incluidas en mi colección las palabras que Isidoro había decidido incluir en su diccionario personal independientemente de las que hubiera en el de la RAE.
  3. En tercer lugar (y esto resultó ser lo peor), muchas palabras han «desaparecido», pues la entrada no corresponde a la palabra… por ejemplo, la palabra «poeta, tisa», no está en el diccionario sino en «poetisa», así que la palabra poeta no se encuentra en la RAE como tal.

Así que el programa contemplaba la necesidad de decirme si tal o cual palabra no estaba en el diccionario de la RAE (en la versión online)

Actualización 2020
La Real Academia Española (RAE) y la Asociación de Academias de la Lengua Española (ASALE) han emprendido ya las tareas de redacción de la nueva edición de su Diccionario de la lengua española (DLE), que tendrá las características fijadas en la planta aprobada por todas las Academias de ASALE. Con el objetivo de que el desarrollo de esa nueva edición, forzosamente lento, no retrase la inclusión de nuevas palabras y acepciones ni la modificación de las ya incorporadas que necesiten enmienda, se ha optado por publicar estas actualizaciones anualmente.

La que ahora se pone a disposición de todas las personas interesadas recoge las modificaciones aprobadas por todas las Academias en 2020 y tendrá la consideración de versión electrónica 23.4.

Ya de paso, como podía hacerlo, me informé de si la palabra que estaba consultando era o no conjugada, lo que significaba que era un verbo. Un bonito plus que no esperaba.

Con la lista de errores generada, fui revisándolas palabra a palabra, las 1245 entradas no encontradas, entre las que estaban, ni más ni menos: poeta.

Así que a lo largo de los últimos meses del 2020 fui dejándome los ojos para ir revisando esos errores y fabricando una lista de palabras que se corresponda lo más posible con la «oficial» de la RAE.

Ha quedado una lista de 88024 «entradas» que se corresponden con 90452 palabras (ya teniendo en cuenta que algunas entradas o vocablos tienen varias palabras (a veces me confundo y denomino a eso acepciones).

Una vez corregida y revisada, aunque asumo aún un error considerable que no puedo prever, tengo la posibilidad de descargar el diccionario completo palabra a palabra con el programa buscaenrae.sh

 

#!/bin/bash

### FUNCIONES ÚTILES PARA EL PROGRAMA
# uso() Instrucciones del programa y salida en caso de error.
uso () {
  echo "Uso: $0 salida palabra"
  echo -e "\tsalida es un valor númerico que identifica:"
    echo -e "\t[0] para generar un archivo HTML con la respuesta"
    echo -e "\t[1] para generar un archivo TXT  con la respuesta"
    echo -e "\t[2] para generar una línea  TXT  con la respuesta"
  exit
}
f_verbos="00000_VERBOS.txt"
f_errores="00000_ERRORES.txt"

# CONTROL DE ENTRADA DE VARIABLES y ASIGNACIÓN
if [ $# -lt 2 ]
then
  # Reportar uso inapropiado
  uso
else
  salida=$1
  if [ $# -eq 2 ]; then
    palabra="$2"
  elif [ $# -eq 3 ]; then 
    palabra="$2 $3"
  elif [ $# -eq 4 ]; then 
    palabra="$2 $3 $4"
  elif [ $# -eq 5 ]; then 
    palabra="$2 $3 $4 $5"
  fi
  # echo "Palabra es #$palabra#"
fi

# CONSULTA DEL SERVIDOR de la RAE simulando ser uno de los diversos navegadores posibles
navegador=(
  "Mozilla/5.0 (X11; Ubuntu; Linux x86_64; rv:15.0) Gecko/20100101 Firefox/15.0.1"
  "Mozilla/5.0 (Windows NT 10.0; WOW64; rv:77.0) Gecko/20100101 Firefox/77.0"
  "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:77.0) Gecko/20190101 Firefox/77.0"
  "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_9_3) AppleWebKit/537.75.14 (KHTML, like Gecko) Version/7.0.3 Safari/7046A194A"
)
rnd=`echo $(($RANDOM%${#navegador[@]}))` # Elegimos un navegador al azar
# Hacemos la petición a la web de la RAE
curl -s --user-agent "${navegador[$rnd]}" https://dle.rae.es/"$palabra" > ./"$palabra.html"

# PROCESAMOS EL ARCHIVO OBTENIDO (Cortamos, retiramos lo innecesario, etc)
# Si se trata de un verbo, quitar las conjugaciones
id_conjugacion="<div id='conjugacion'>"
esunverbo=`grep -c "$id_conjugacion" ./"$palabra.html"`
if [ $esunverbo -gt 0 ]
then
  echo "$palabra es un verbo" >> $f_verbos
  # ELIMINAMOS la(s) CONJUGACIÓN(ES)
  sed -i "/${id_conjugacion}/d" ./"$palabra.html"
fi

# Si tiene más de una acepción (Calcular cuántas después de saber si es un verbo)
id_acepcion="<article id="
id_acepcion_fin="<\/article>"
num_acepciones=`grep -c "$id_acepcion" ./"$palabra.html"`
# Si no tiene acepciones, la palabra no existe. No continuamos.
if [ $num_acepciones -eq 0 ]
then
  echo "$palabra no se ha encontrado en la RAE" >> $f_errores
  rm "./$palabra.html"
  exit
fi

# PARTIR en $num_acepciones EL FICHERO $palabra.html"
# acepciones y acepciones_fin son 2 arrays de líneas PRECISO CONVERTIRLOS a cortes[]
acepciones=`grep -n "$id_acepcion" ./"$palabra.html"|awk -F":" '{print $1}'|sed ':a;N;$!ba;s/\n/ /g'`
c=0
for i in $acepciones
do
  let cortes[$c]=$(($i))
  let c=$(($c+1))
done
acepciones_fin=`grep -n "$id_acepcion_fin" ./"$palabra.html"|awk -F":" '{print $1}'|sed ':a;N;$!ba;s/\n/ /g'`
c=0
for i in $acepciones_fin
do
  let cortes_fin[$c]=$(($i))
  let c=$(($c+1))
done

# GENERA FICHEROS palabra.X.html por cada ACEPCIÓN
for (( i=0; i<$num_acepciones; i++ ))
do
  # echo "El comienzo del corte está en ${cortes[$((i))]}"
  # echo "El fin del corte está en ${cortes_fin[$((i))]}"
  sed "${cortes[$((i))]},${cortes_fin[$((i))]} !d" "./$palabra.html" > "./$palabra.$i.html"
  # Distintas salidas del programa, en función de la variable "salida"
  if [ $salida -gt 0 ]   # Salida a modo TXT
  then
    w3m "./$palabra.$i.html" > "./$palabra.$i.txt"
    if [ $salida -gt 1 ] # En una sóla línea
    then
      sed ':a;N;$!ba;s/\n/ /g' "./$palabra.$i.txt"|sed 's/  / /g' > "./$palabra.$i.1linea"
    fi
  fi
done

# BORRAR indica si dejar o no los archivos que no se deseen como salida 
BORRAR=1
if [[ $BORRAR -eq 1 ]] && [[ $salida -gt 0 ]]
then
  rm "./$palabra."*html
  if [ $salida -eq 2 ]
  then
    rm "./$palabra."*txt
  fi
fi
# SALIDA FORZADA
exit

 

Este programa era invocado con el siguiente miniprogramita que, leyendo de la lista de palabras corregidas que, impropiamente, denominé diccionariosinrepes.txt, obtiene las diversas, impropiamente denominadas, acepciones y las separa en 90452 archivos de una única línea.

#!/bin/bash

### FUNCIONES ÚTILES PARA EL PROGRAMA
# uso() Instrucciones del programa y salida en caso de error.
uso () {
  echo "Uso: $0 [diccionario]"
  exit
}

# CONTROL DE ENTRADA DE VARIABLES y ASIGNACIÓN
if [ $# -gt 1 ]
then
  # Reportar uso inapropiado
  uso
elif [ $# -eq 1 ]
then
  diccionario=$1
else
  diccionario=diccionariosinrepes.txt
fi

while IFS= read -r line
do
  buscaenrae.sh 2 $line
done < $diccionario

Descargadas y archivadas en una estructura de carpetas obvia:

dict -> LETRA

Se pueden reordenar o «recompilar» en una LETRA, con sus definiciones incluidas, sin incluir, etc…

Lo hago usando otro script simple:

#!/bin/bash

# El diccionario completo está por acepciones en las carpetas
# dict/LETRA
# Cada acepción (en realidad entrada en el diccionario) tiene
# un archivo denominado PALABRA.N.1linea conteniendo su definición.
# (donde N es el número de acepción contando desde cero)

letras="A B C D E F G H I J K L M N Ñ O P Q R S T U V W X Y Z"
for letra in $letras
do
  ls dict/$letra > dictporletra/$letra.archivos.txt
  awk -F"." '{print $1}' dictporletra/$letra.archivos.txt > dictporletra/$letra.acepciones.txt
  ls dict/$letra/*.0.1linea |awk -F"/" '{print $3}'|awk -F"." '{print $1}' > dictporletra/$letra.sinrepes.txt
  cat dict/$letra/* > dictporletra/$letra.definiciones.txt
done

cat dictporletra/*.archivos.txt > DICCIONARIO_TOTAL.archivos.txt
cat dictporletra/*.acepciones.txt > DICCIONARIO_TOTAL.acepciones.txt
cat dictporletra/*.sinrepes.txt > DICCIONARIO_TOTAL.sinrepes.txt
cat dictporletra/*.definiciones.txt > DICCIONARIO_TOTAL.definiciones.txt

Pero queda por resolver un problema que me tiene algo martirizado desde hace meses y es que la ordenación es muy compleja realizarla, pues muchas entradas en el diccionario son dobles, como «ad hoc», pero las definiciones descargadas incluyen líneas que son del tipo: «i Escrito con…» y desde el punto de vista del uso del comando sort, es más o menos lo mismo que decir que si quiero ordenar las primeras como «adhoc», la «iEscrito» se sale de su lugar.

He ordenado muchas manualmente sobre esta compilación, pero es un trabajo absolutamente aberrante y seguro que se puede hacer mejor, así que de momento he decidido dejar de trabajar en esto y dar por cerrado este proyecto que, en realidad, es la puerta de entrada a muchos otros.

Espero que el orden no sea algo tan terrible en esos otros proyectos venideros.

Dejo a disposición pública el Diccionario Completo que he generado de esta manera, con la estructura de carpetas generada, así como los programas utilizados para su procesamiento.

RAE-COMPLETO.tar

75% de despojos

de repente un día mueres

deja un 75% de despojos.

tres primeras sílabas
para decir lo obvio:
de la vida a la muerte
hay
un salto cuántico
un salto cualitativo
un salto irreversible

no puede ser de otro modo
tal como están definidas ambas palabras
en ese lenguaje
de lógica bivalente
tan binario
que garantiza principio del tercero excluso
tertium non datur

tres primeras sílabas
ejercitando oulipianamente
su apego a la única vocal
que Perec secuestra

tres segundas sílabas
que no lo parecen
por aquella sinalefa que ha sido ignorada
por aquel hiato que rompe el diptongo
por la preponderancia de vocales diferentes
que alcanza el 60%
de tan sólo (con tilde) cinco letras

tres segundas sílabas
que sitúan en el tiempo
absolutamente indefinido (en cuanto a cuándo
(¿qué día?)
absolutamente indefinido (en cuanto a cuánto
(¿día sidéreo o día solar?)

un suceso
que podemos calificar con once letras como
un suceso inacabable
un suceso inagotable
un suceso inapagable
un suceso inapelable
un suceso inatacable
un suceso inatajable
un suceso incachable
un suceso incalmable
un suceso incansable
un suceso incansable
un suceso incantable
un suceso incobrable
un suceso incontable
un suceso inculpable
un suceso indeseable
un suceso inevitable
un suceso inexorable
un suceso inexpiable
un suceso infaltable
un suceso inflamable
un suceso inglosable
un suceso ingustable
un suceso inhallable
un suceso inimitable
un suceso injertable
un suceso inllevable
un suceso inmancable
un suceso inoperable
un suceso inopinable
un suceso inoxidable
un suceso insaciable
un suceso insalvable
un suceso insociable
un suceso insoldable
un suceso insondable
un suceso intachable
un suceso integrable
un suceso intragable
un suceso intratable
un suceso intricable
un suceso inubicable
un suceso invadeable
un suceso invaluable
un suceso invariable
un suceso inviolable
un suceso inyectable

 
hasta que llegas al mismo
término
a esa segunda persona
que te asusta
porque asusta a otro
que somos yo

esas dos llanas sílabas
de las ocho iniciales
que son el despojo
que no son el despojo
que son la enjundia
el non plus ultra
el meollo de la frase
lo verdaderamente importante
y a lo que no quieres llegar
por lo que te amparas en otras seis
previas unidades silábicas
que te conducen
inexorablemente
al fin

Esto no es una broma