Historia visual de las palabras: diagramas de etimología

Hace trece años, Google añadió una función a su buscador que me flipó y sigo utilizando a menudo: si buscabas “definition” seguido de una palabra en inglés, además de su definición, te mostraba un diagrama con la historia de esa palabra. Flechas, idiomas, evoluciones… todo quedaba claro de un vistazo.

Diagrama de etimología de Google para 'mortgage'

Desde entonces, he querido hacer algo similar para el español (una palabra que, por cierto, nos llegó a través del occitano espaignol, del latín medieval Hispaniolus).

El formato de etimologías del DLE en texto plano («Del lat. vulg. capitia, y este del lat. caput, -ĭtis ‘cabeza’») puede resultar algo farragoso. Cuentan historias de siglos, de contactos entre pueblos, de préstamos y adaptaciones, pero exigen tener el ojo entrenado. Un diagrama lo hace todo visible.

Pues aquí está: Iedra ahora muestra diagramas de etimología en la ficha de cada palabra.

Desde líneas rectas hasta árboles enmarañados

Algunos diagramas muestran una genealogía sencilla, como la de padre, que viene directamente del latín pater. Pero incluso aquí, la visualización es útil: resalta de un vistazo la transformación de pater a padre, un cambio que en el texto plano podría pasar desapercibido.

Del latín pater, -tris.

Otros diagramas revelan caminos más largos. La etimología de almohada, por ejemplo, pasa por el árabe clásico y por la variante hispánica que se hablaba en al-Ándalus, antes de llegar al español. O la de tagarnina, con un recorrido aún más extenso: del latín cardus (‘cardo’) al mozárabe, de ahí al bereber, luego al árabe hispánico y finalmente al español. En el diagrama se sigue mucho mejor que en texto.

Del árabe hispánico taqarnína, este del bereber *taqarnina, este del mozárabe *karlína, y este derivado del latín cardus 'cardo'.

A veces las palabras hacen un viaje de ida y vuelta. Popurrí cruzó los Pirineos dos veces: la expresión española olla podrida fue calcada por el francés como pot pourri, y regresó al español transformada en popurrí.

Del francés pot pourri, y este calco de olla podrida.

Lo mismo hizo tornado, pero cruzando el Atlántico: la española tronada llegó al inglés como tornado, y con esa misma forma acabó volviendo a nuestra lengua.

Del inglés tornado, y este del español tronada.

Pero a veces lo más revelador del diagrama no son las flechas, sino los significados que aparecen en gris bajo cada nodo. Alcohol recorre cuatro idiomas, pero lo fascinante es lo que significaba en cada parada: empezó como kuḥl, un polvo de galena que los árabes usaban para maquillarse los ojos. De ahí pasó a significar ‘polvo obtenido por sublimación’, luego ‘líquido destilado’, y finalmente lo que hoy entendemos por alcohol. En el diagrama se ve cómo el significado fue mutando en cada eslabón.

Del latín medieval alcohol 'galena', 'polvo de antimonio para maquillarse los ojos', 'polvo o líquido obtenido por sublimación', 'alcohol', este del árabe hispánico al-kuḥúl 'kohl a base de polvos de galena o de antimonio', y este del árabe clásico kuḥl.

Tortuga esconde otra sorpresa. La cadena es corta —griego, latín tardío, español—, pero el significado de origen es inesperado: del griego tartaroûchos, ‘habitante del Tártaro’. Los orientales y los antiguos cristianos creían que este animal, que habita en el cieno, personificaba el mal. De ‘demonio’ a ‘tortuga’.

Del latín tardío tartarūchus 'demonio', y este del griego ταρταροῦχος tartaroûchos 'habitante del Tártaro o infierno'.

Algo parecido ocurre con dicha y aciago, cuyas cadenas son breves pero cuentan historias inesperadas. Dicha viene del latín dicta, ‘cosas dichas’: los paganos creían que los dioses pronunciaban tu destino al nacer. Lo dicho por los dioses era tu dicha. Y aciago viene del latín medieval aegyptiacus dies, literalmente ‘día egipcio’: así se llamaba a los días de mal agüero.

La duda y los debates

La etimología no es una ciencia exacta. A veces, los expertos dudan sobre el origen de una palabra. Los diagramas de Iedra reflejan esta incertidumbre con flechas punteadas. En birrete, por ejemplo, sabemos que viene del occitano antiguo birret, diminutivo del latín tardío birrus, aunque de ahí hacia atrás la pista se pierde: quizá del celta *birros (‘corto’).

Del occitano antiguo birret, diminutivo del latín tardío birrus 'capote con capucho', y este quizá del celta *birros 'corto'.

Otras veces la duda está entre dos posibles orígenes. En chancaca (un dulce de caña), el diagrama muestra los dos candidatos: el náhuatl chiancaca (‘azúcar moreno’) o el quechua ch’amqay (‘triturar’). Todas las flechas son punteadas porque ninguno de los dos orígenes está confirmado.

Del náhuatl chiancaca 'azúcar moreno' o del quechua ch'amqay 'triturar'.

A veces, esas rutas dudosas comparten un ancestro común. Jaguar entró al español probablemente a través del portugués o del francés, pero ambas lenguas lo tomaron del tupí yaguará. El diagrama muestra esa historia compartida.

Del portugués o del francés jaguar, y estos del tupí yaguará.

Origen desconocido

No todas las palabras tienen una historia rastreable. A veces, el DLE solo puede decir «de origen incierto», «de origen desconocido» o «etimología discutida». En esos casos, el diagrama muestra un nodo con un interrogante y una flecha punteada: lo único que sabemos es que la palabra llegó al español, pero no de dónde.

Llama la atención la cantidad de palabras cotidianas que caen en esta categoría. Brisa, bosque, caracol, arrancar, bisagra, artesa, bache… todas de origen incierto o desconocido. También están las que el DLE marca como «etimología discutida», donde los expertos no se ponen de acuerdo: brasa, calabozo, carcoma.

De origen incierto.

Otras veces el DLE sabe algo sobre el origen de la palabra, pero no puede precisar el idioma ni la forma original. El diagrama muestra ese origen difuso como etiqueta y un interrogante en la forma. Hay tres grandes categorías:

Regiones geográficas. Bachata es «de origen africano», canoa «de origen taíno», banana una «voz del Congo»: sabemos de qué parte del mundo vienen, pero no exactamente de qué lengua.

De origen africano.

Familias lingüísticas. Bisonte llegó al español a través del latín bison, pero el DLE solo puede decir que la palabra latina es «de origen germánico», sin precisar de cuál de las lenguas germánicas (gótico, fráncico, nórdico antiguo…).

Del latín bison, -ōntis, y este de origen germánico.

Períodos históricos. Muchas palabras del español vienen de lenguas que se hablaban en la península ibérica antes de la romanización. El DLE las marca como «de origen prerromano», un cajón de sastre que engloba lenguas íberas, celtas, vasconas y otras que a menudo no dejaron registro escrito. Es el caso de calabaza que quizá es de origen prerromano: ni siquiera eso es seguro, como indica la flecha punteada.

Quizá de origen prerromano.

El sonido como origen

A veces las palabras no proceden del latín, del árabe o del griego, sino de un ruido. Más de 300 palabras del DLE tienen un origen onomatopéyico o expresivo. En sus diagramas, el interrogante se sustituye por una nota musical: .

Cencerro es un ejemplo claro. No hace falta rastrear cadenas de derivación: la palabra imita directamente el sonido del objeto. Lo mismo ocurre con tilín, trompa, títere, tamtam o chirriar: todas nacieron de la imitación de un ruido.

De origen onomatopéyico.

A veces el DLE va más allá e identifica la onomatopeya concreta. Garganta viene de garg, imitación del sonido gutural al tragar; trampa de tramp; gorrino de gorr, imitación de su gruñido; y pirueta del francés pirouette, que a su vez viene de pir, el zumbido de algo que gira. En el diagrama, en lugar del ♪ genérico aparece la sílaba exacta que dio origen a la palabra.

De la onomatopeya garg.

Cruces y fusiones

Hay palabras que no tienen un único ancestro, sino que nacen de la confluencia de varios. El caso de patata es un ejemplo clásico de cruce, una nueva palabra que surge de la mezcla de la papa andina y la batata caribeña.

Cruce de papa y batata.

Los diagramas también visualizan fusiones más modernas, como conspiranoia (conspiración + paranoia).

Fusión de conspiración y paranoia.

Y otras vienen de muy lejos, como tungsteno, que llegó al español desde el sueco a través del latín científico, y cuyo nombre original significa literalmente «piedra pesada».

Del latín científico tungstenum, y este del sueco tungsten, de tung 'pesado' y sten 'piedra'.

Influencias

A veces una palabra tiene un ancestro claro, pero otra palabra termina de darle forma. Los diagramas lo muestran con una flecha específica de influencia. Sitio, por ejemplo, viene del latín situs, pero el verbo sitiar influyó en su forma.

Del latín situs, -us, influido por sitiar.

Más complejo aún es rendir, que naciendo del latín reddĕre, se vio moldeado por otros dos verbos latinos, prendĕre y vendĕre.

Del latín reddĕre 'devolver', 'entregar', influido por prendĕre 'tomar' y vendĕre 'vender'.

Otro caso curioso es calofrío. Quizá viene del latín cale, frige (‘caliéntate, enfríate’), una orden médica que se habría deformado con el tiempo. Las palabras españolas calor y frío moldearon su forma final, como muestra el diagrama con sus dos flechas de influencia convergiendo.

Quizá del latín cale, frige 'caliéntate, enfríate', influido en su forma por calor y frío.

Orígenes paralelos: el latín detrás de la composición española

Hay un grupo especial de palabras que el DLE describe con dos orígenes paralelos separados por un punto y coma: una composición en español y la forma latina de la que realmente proceden. Son unas 190 palabras, sobre todo participios y derivados en -nte.

Abierto, por ejemplo, es el participio de abrir, pero su forma no sale de aplicar una regla morfológica del español: viene directamente del latín apertus. El diagrama muestra ambas pistas convergiendo en la palabra final.

Del participio de abrir; latín apertus.

Lo mismo pasa con los adjetivos en -nte. Amante se puede analizar como amar + -nte, pero el DLE señala que viene del latín amans, -antis. En el diagrama, el latín aparece como derivación principal y los componentes españoles quedan como contexto morfológico.

De amar y -nte; latín amans, -antis.

Es un patrón que repiten cientos de participios (abierto, envuelto, puesto, resuelto…) y adjetivos en -nte (tolerante, amante, culminante, absorbente…). Sin el diagrama, la doble información del DLE puede pasar de largo.

Composición anidada

Cuando la composición tiene más de un nivel, los diagramas se vuelven especialmente útiles. Sincrónico combina el latín tardío synchrŏnus con el sufijo español -ico. Pero a su vez, synchrŏnus viene del griego σύγχρονος, que se descompone en σύν (‘con’) y χρόνος (‘tiempo’). El diagrama muestra ambos niveles de composición de un vistazo.

Del latín tardío synchrŏnus 'contemporáneo', y este del griego σύγχρονος sýnchronos, de συν- syn- 'sin-' y χρόνος chrónos 'tiempo', e -ico.

Lo mismo puede ocurrir sin salirnos de nuestra lengua. Desalobradora combina desalobrar (‘desalinizar’) con el sufijo -dora, y desalobrar es a su vez un compuesto de des- y salobre.

De desalobrar 'desalinizar', y este de des- y salobre, y -dora.

Acrónimos: cuando las palabras nacen de iniciales

No todas las palabras nuevas vienen de otras palabras. Algunas nacen de frases enteras comprimidas. El mecanismo varía: a veces se fusionan fragmentos de dos palabras, a veces se toman las iniciales de una frase larga.

Esmog es un ejemplo del primer tipo. La palabra inglesa smog nació de fundir smoke (‘humo’) y fog (‘niebla’): combinando el principio de una con el final de la otra para crear algo nuevo. El diagrama muestra esos dos ingredientes confluyendo.

Del inglés smog; acrónimo de smoke 'humo' y fog 'niebla'.

Radar representa al segundo mecanismo: es un acrónimo de iniciales puro. La frase inglesa radio detecting and ranging (‘detección y localización por radio’) se comprimió en una sola palabra que hoy todo el mundo usa sin pensar en su origen.

Del inglés radar, acrónimo de radio detecting and ranging 'detección y localización por radio'.

Falsas separaciones: cuando el oído reescribe las palabras

A veces, una palabra cambia de forma porque alguien la oyó mal y la cortó por donde no tocaba. Los lingüistas lo llaman «falsa separación» o «metanálisis», y el español tiene varios casos fascinantes.

El más bonito es atril. La palabra viene del latín *lectorīle (derivado de lector), que llegó al español antiguo como latril. Pero cuando la gente decía «el latril», la ele de la palabra se confundía con la del artículo: «el latril» se reinterpretó como «el atril», y la letra migró para siempre.

Falsa separación de el [l]atril, y este del latín *lectorīle, derivado de lector, -ōris 'lector'.

Saraguato (un mono aullador) muestra el fenómeno inverso. La palabra original era araguato, pero cuando se decía «los araguatos», la s del artículo se pegó a la palabra y creó una ese fantasma que acabó siendo parte del nombre.

Falsa separación de [lo]s araguatos.

Alimón (como en «al alimón») es otro caso. La palabra original era alalimón, pero su a- inicial se confundió con la preposición: «al alalimón» se reinterpretó como «al alimón», y la sílaba sobrante desapareció.

Y angurria nació de la antigua estrangurria: la primera sílaba se perdió, probablemente porque sonaba como un prefijo separable.

Es el mismo fenómeno que convirtió a napron en an apron en inglés, pero adaptado a las reglas del español: aquí son los artículos (el, los, al) los que interfieren con las fronteras de la palabra.

De nombres propios a palabras comunes

Algunas palabras deben su existencia a nombres propios —de personas o lugares— que acabaron convertidos en palabras comunes.

Personas que se volvieron palabras

Para estos casos, aparece un distintivo especial que no es un idioma: NOMBRE PROPIO. Así se distingue a simple vista que el origen de la palabra no es otra palabra, sino el nombre de una persona.

Cuando Luigi Galvani descubrió en 1780 que las ancas de rana se contraían ante un estímulo eléctrico, no solo fundó la electrofisiología: también legó su apellido al idioma. Hoy galvanizar significa tanto recubrir con zinc como electrizar a una audiencia.

Del francés galvaniser, y este de L. Galvani, 1737-1798, médico y físico italiano, e -iser '-izar'.

John Dalton fue un físico y químico inglés que padecía una anomalía visual que le impedía distinguir ciertos colores. Cuando la describió científicamente, su propio apellido se convirtió en el nombre de la condición: daltonismo.

Del francés daltonisme, y este de J. Dalton, 1766-1844, físico y químico inglés que padecía este defecto, e -isme '-ismo'.

La nicotina debe su nombre al diplomático francés Jean Nicot, que en 1560 envió tabaco desde Portugal a la corte francesa como remedio medicinal. El diagrama muestra la misma estructura de composición: apellido + sufijo francés, y de ahí al español.

Del francés nicotine, y este de J. Nicot de Villamain, 1530-1600, diplomático y escritor francés que introdujo y propagó el tabaco en Francia, e -ine '-ina'.

Y el saxofón debe su nombre a su inventor, el músico belga Adolphe Sax, que lo patentó en 1846.

Del francés saxophone, y este de A. J. Sax, 1814-1894, músico belga que lo inventó, y -phone '-fono'.

Más curioso es el caso de boicot. En 1880, los campesinos irlandeses decidieron aislar completamente al administrador Charles C. Boycott como protesta, y su apellido pasó a denominar esa táctica de presión social.

Del inglés boycott, y este de C. C. Boycott, 1832-1897, administrador irlandés.

Lugares que bautizaron palabras

El bikini debe su nombre al atolón Bikini de las Islas Marshall, donde Estados Unidos realizó pruebas nucleares en 1946. Ese mismo año, el diseñador Louis Réard bautizó así a su nuevo traje de baño de dos piezas, comparando su impacto con el de una bomba atómica. El diagrama muestra además la influencia del prefijo bi- en la forma final.

Del inglés bikini, y este de Bikini, nombre de un atolón de las Islas Marshall, con influencia de bi- 'bi-', por alusión a las dos piezas.

El queso gruyer toma su nombre de Gruyère, una región de Suiza. Y la bentonita, un tipo de arcilla utilizado en infinidad de aplicaciones industriales, viene de Fort Benton, la localidad de Montana donde se descubrió a finales del siglo XIX.

De Gruyère, región de Suiza.

Del inglés bentonite, y este de Fort Benton, en los Estados Unidos de América, donde se encontró a finales del siglo XIX.

Mitos que bautizaron palabras

No solo personas y lugares reales legaron su nombre al idioma: también lo hicieron personajes mitológicos. La morfina debe su nombre a Morfeo, el dios griego del sueño, por el efecto adormecedor del opiáceo. El diagrama muestra cómo el nombre mitológico Morphée se combinó con el sufijo francés -ine para formar morphine, y de ahí pasó al español.

Del francés morphine, y este de Morphée 'Morfeo', dios del sueño, e -ine '-ina'.

Marcas que se volvieron palabras

Personas, lugares y mitos son, en sentido amplio, nombres propios. Pero hay un cuarto tipo que merece categoría propia: las marcas registradas. Cuando una marca comercial se convierte en palabra común —un proceso que los lingüistas llaman genericización o vulgarización—, su origen no es exactamente un nombre propio ni un idioma: es un producto.

Iedra distingue estas palabras con la etiqueta MARCA REGISTRADA en lugar de agruparlas bajo NOMBRE PROPIO. La razón es que el matiz importa: saber que aspirina viene de una marca registrada alemana y que jacuzzi viene del apellido de un inventor italiano que registró la marca son historias distintas, y el diagrama debería reflejarlo.

La aspirina es quizá el caso más conocido de marca convertida en genérico. Bayer registró el nombre Aspirina® en 1899, pero tras la Primera Guerra Mundial perdió la marca en muchos países como parte de las reparaciones de guerra. Hoy es palabra común en casi todo el mundo.

De Aspirina®, marca registrada.

El jacuzzi tiene una historia más larga. Candido Jacuzzi, un inmigrante italiano en Estados Unidos, inventó en los años 50 una bomba de hidromasaje para aliviar la artritis de su hijo. Su apellido pasó a ser marca, la marca pasó al inglés como genérico, y del inglés llegó al español. El diagrama muestra las cuatro etapas: nombre propio, marca registrada, inglés, español.

Voz inglesa, de Jacuzzi®, marca reg., y esta de C. Jacuzzi, 1903-1986.

Y el neopreno combina marca registrada con acrónimo: DuPont registró Neoprene® en 1931 para su caucho sintético, un nombre compuesto de las palabras inglesas neo- y propylene.

De Neoprene®, marca registrada, y este acrónimo del inglés neo- 'neo-' y propylene 'propileno'.

La prueba de fuego: etimologías-río

Y luego están esas etimologías que son auténticos árboles genealógicos, casi imposibles de seguir en texto. Aquí es donde la visualización se vuelve imprescindible. La historia de gerifalte es una de ellas, un viaje desde el nórdico antiguo que se bifurca en el francés y el occitano antes de converger, con dudas, en el español.

Del francés antiguo girfalt, gerfalt o del occitano gerfalt, gerfalc, y estos del nórdico geirfalki, de geiri 'objeto en forma de dardo' y falki 'halcón', por las listas semejantes a flechas de su plumaje.

O la de tártaro, un laberinto que empieza en el persa, pasa por el árabe, llega al bajo latín o al árabe hispánico, y de ahí al español, con una posible influencia del Tártaro de la mitología griega por el camino. En texto cuesta seguirlo; en diagrama queda bastante más claro.

Del bajo latín tartarum o del árabe hispánico ṭarṭar, estos del árabe durdī, y este del persa dordi 'hez', quizá influido por el latín Tartărus 'tártaro', por formarse en el fondo de la vasija.

Y busto tiene una historia curiosa. La palabra llegó del italiano, que la tomó del latín bustum (‘pira’, ‘monumento con la imagen del difunto’). Pero bustum viene de *burĕre (‘quemar’), una forma que surgió por «falsa separación» del verbo amburĕre (‘quemar por todos lados’): algún hablante decidió, por su cuenta y riesgo, que ese am- era un prefijo separable, y así nació una raíz fantasma. El diagrama muestra cómo amb- y urĕre se compusieron en amburĕre, y cómo de esa «falsa separación» brotó toda una cadena hasta el español.

Del italiano busto, y este del latín bustum 'pira', derivado de *burĕre 'quemar', por falsa separación de amburĕre, de amb- 'alrededor' y urĕre 'quemar'.

Buscar por origen etimológico

Los diagramas están muy bien para explorar una palabra concreta. Pero, ¿y si quieres hacer la pregunta inversa? ¿Qué palabras del español vienen del árabe? ¿Cuáles llegaron del náhuatl? ¿Cuántas tienen un origen onomatopéyico?

Para eso, Iedra extrae datos estructurados de cada etimología: no solo el idioma de origen, sino el tipo de relación que tiene cada lengua con la palabra. Gracias a eso, la búsqueda avanzada permite filtrar por etimología de formas que van mucho más allá de un simple «viene del latín».

Un selector, siete relaciones

En la búsqueda avanzada, el filtro de etimología tiene dos controles: un selector de tipo de relación y un campo de búsqueda de idiomas con autocompletado. El selector permite elegir entre siete niveles de precisión:

  • En cualquier relación: Busca en toda la cadena etimológica, sin importar si el idioma es origen directo, influencia o ancestro lejano. Es el filtro más amplio.
  • Origen directo: Solo idiomas de los que la palabra deriva directamente (primer eslabón de la cadena).
  • Origen seguro: Orígenes confirmados, sin duda. Descarta los «quizá del…», «probablemente del…».
  • Origen incierto: Justo lo contrario: solo las etimologías marcadas como dudosas.
  • Influencia: Idiomas que influyeron en la forma de la palabra sin ser su origen. Por ejemplo, calor y frío influyeron en la forma de calofrío.
  • Cruce de palabras: Idiomas de los que procede uno de los componentes de un cruce o fusión. Buscar «cruce + quechua» encontrará patata (cruce de la papa quechua y la batata caribeña).
  • Origen indirecto: Idiomas que aparecen en eslabones intermedios o finales de la cadena, pero no como origen directo. Por ejemplo, buscar «origen indirecto + persa» encontrará tártaro, cuya cadena pasa por el persa aunque su origen directo es del bajo latín.

Familias de idiomas

Más de doscientos idiomas aparecen en las etimologías del DLE, y muchos son variantes de uno mismo. El latín, por ejemplo, tiene nueve: latín, latín vulgar, latín hispánico, latín medieval, latín tardío, latín científico, latín moderno, bajo latín y bajo latín hispánico. Buscar «todas las palabras que vienen del latín» sin tener que seleccionarlas una a una sería tedioso.

Por eso, el autocompletado de idiomas ofrece al principio de la lista las familias como opciones especiales. Si escribes «latín» y seleccionas la familia, se añaden automáticamente las nueve variantes. Lo mismo con «árabe» (que agrupa árabe, árabe hispánico, árabe clásico, árabe dialectal y mozárabe), «griego» (que agrupa griego, griego bizantino, griego clásico, griego dórico y griego moderno) y el resto de familias con más de una variante. Los idiomas sin variantes (como náhuatl, japonés o guaraní) aparecen directamente sin agrupar.

La página /lenguas ofrece una vista más completa: todos los idiomas ordenados por número de apariciones, agrupados por familia. Los conteos de cada familia reflejan palabras únicas: si almohada aparece tanto bajo «árabe hispánico» como bajo «árabe clásico», solo cuenta una vez en el total del grupo «árabe».

Hay un grupo especial: origen difuso. Cuando el DLE dice «de origen prerromano», «de origen africano» o «de origen semítico», sabe de qué región, familia lingüística o período procede la palabra, pero no puede precisar el idioma concreto. La página agrupa todos estos orígenes difusos (prerromano, africano, caribeño, semítico, indoeuropeo…) bajo un mismo epígrafe, para que sean fáciles de encontrar y explorar juntos.

Más filtros etimológicos

Además de idioma y relación, la búsqueda avanzada ofrece varios filtros adicionales:

  • Forma étima original: Busca por la forma de la palabra en el idioma de origen. Admite comodines (* y ?), y si no los usas, busca automáticamente como «contiene»: escribir aqua encontrará también aquam, aquae, etc. Si filtras idioma y forma a la vez, ambos deben coincidir en el mismo eslabón de la cadena: buscar «latín + aqua» solo encuentra palabras cuyo étimo latino contenga aqua, no una que tenga un étimo latino por un lado y un aqua griego por otro.
  • Tiene etimología: Filtra entre palabras con etimología conocida y las que no la tienen. Útil para explorar ese grupo de palabras cotidianas —como brisa o bache— cuyo origen nadie ha podido rastrear.
  • Solo cruces o composiciones: Muestra solo palabras formadas por combinación de dos o más étimos, como patata o conspiranoia.
  • Solo formas reconstruidas: Muestra solo palabras cuyo étimo es una forma hipotética marcada con asterisco, como *bŭttis o *cappa — formas que los lingüistas postulan pero que no están documentadas.
  • Profundidad etimológica: Filtra por la longitud de la cadena. Una profundidad de 3 significa que la palabra pasó por tres idiomas (por ejemplo: persa → árabe → español).

Todos estos filtros se combinan entre sí y con los demás de la búsqueda avanzada:

Cobertura

Actualmente, el sistema es capaz de interpretar y dibujar correctamente más del 99% de las etimologías del DLE. Quedan fuera algunos casos con estructuras muy inusuales que iré añadiendo poco a poco. Es muy probable que haya errores: las etimologías del DLE no siguen un formato del todo sistemático, y el parser tiene que lidiar con docenas de variantes y casos especiales.

Si encuentras alguna palabra cuyo diagrama parece incorrecto o que debería tenerlo y no aparece, no dudes en escribirme.

Ojalá os sirva para perderos un rato navegando por la historia de nuestras palabras.