Novedades (III)

Como decía en el estreno del blog, no he descrito en ningún sitio las mejoras que ha ido incorporando Iedra desde octubre de 2012. Y, haciendo repaso, lo cierto es se han acumulado unas pocas. Las enumero por aquí para visibilizarlas y para que me sirvan de guión cuando actualice el “manual de instrucciones” (que también está un tilín obsoleto).

#Palabro del día

El palabro del día es una palabra rara y extravagante que aparece en la portada de Iedra todos los días. Es algo que lleva desde el principio, pero ha cambiado la forma de seleccionar estas palabras. Antes era un trabajo manual que rápidamente encontró su límite: es muy difícil encontrar una palabra extraña todos los días.

Ahora el palabro se escoge automáticamente mediante el siguiente criterio sencillo:

  • palabra con frecuencia 0 en el CREA. Si no sale en este corpus, es poco común.
  • frecuencia en Google Ngram menor que 5000. Es muy difícil encontrar palabras que no estén en este corpus, así que relajamos un poco el criterio subiendo a 5000 apariciones.
  • longitud de hasta 5 letras. Si es cortita, es más probable que sea estrafalaria, porque hay muchas palabras largas poco usadas, pero poco interesantes.
  • sin marcas regionales. Para evitar palabras que pueden ser poco comunes en la lengua estándar pero muy identificables para el hablante del geolecto.

Este criterio genera una lista sorprendentemente consistente de palabros curiosos. Estos son los de los últimos días: elato, roela, sosal, arpeo, ánulo, pitio, usier

#Nuevas ordenaciones

A la ordenación por relevancia, orden alfabético y frecuencia en el CREA, se añadieron:

  • Orden alfabético inverso. Esto significa que los resultados se ordenarán alfabéticamente, pero no por cómo empiezan las palabras, sino por cómo acaban. Es decir, primero las que acaben en «a», luego las que acaben en «b», etcétera.

    Esto tiene como consecuencia que Iedra funcione como un auténtico diccionario inverso. En palabras de José Antonio Millán: “es [esta ordenación], por sí misma, una auténtica mina para el investigador de nuestra lengua, así como para el ocultista, el poeta, el artista, el arqueólogo, el crucigramista o el espía…”.

    La mejor forma de hacerse una idea de la potencia y utilidad de esta ordenación es echarle un vistazo al lemario inverso de Iedra (todas las palabras del diccionario por orden alfabético inverso).

  • Longitud del lema. Nada complicado aquí. Se puede ordenar por el número de letras de las palabras, tanto ascendente como descendentemente. Por ejemplo, todas las palabras ordenadas descendentemente y ascendentemente.

  • Frecuencia. La ordenación por frecuencia, que antes se hacía según el corpus CREA, ahora se hace por el corpus de Google Ngram, que es mucho más exhaustivo.

#Nuevos filtros

Al filtro por rango de año de inclusión, se suman:

#Detalle de una palabra

La página de detalle de una palabra tiene unas cuantas cosas más:

  • El número de sílabas del lema.

  • La frecuencia en Google Ngram, además de la frecuencia en el CREA.

  • Una gráfica con la evolución del uso de la palabra en la literatura en español con el transcurso de los años (de 1800 a 2009). Esto es equivalente a buscar la misma palabra en el Ngram Viewer de Google.

    Por ejemplo, al mirar los picos de la gráfica de peronismo, se pueden intuir los momentos más relevantes de la historia del movimiento: los inicios con el golpe de 1943 y los primeros gobiernos, el regreso de Perón a Argentina y su muerte en los 70, la “renovación” de los 80 y el kirchnerismo de los 2000.

    Y es evidente que los carruajes tuvieron su momento en el siglo XIX.

  • Colocaciones. Ya se ofrecían las diez palabras que más suelen acompañar a otra en la página de detalle. Ahora, además de aumentar hasta 50 colocaciones, también se muestran las 50 palabras que más suelen preceder a otra. Así, por ejemplo, para personal:

    Suelen venir antes Suelen venir después
    experiencia personal personal docente
    carácter personal personal técnico
    servicio personal personal administrativo
    libertad personal personal especializado
    vida personal personal ocupado
    interés personal personal médico
    trabajo personal personal directivo
    comunicación personal personal militar
    seguridad personal personal académico
    responsabilidad personal personal calificado

#Mapamundi de acepciones

Aunque en http:/iedra.es/marcas se pueden consultar todas las marcas lexicográficas del diccionario, he creado un mapa para las marcas geográficas a nivel nacional (los países hispanoamericanos, Filipinas y España), que es más amigable para explorar. Cada país indica el número de acepciones que aporta al diccionario, y clicando en ellos se puede acceder a las palabras en sí.