Skip to content

editio/dataviz_gephi

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

56 Commits
 
 
 
 
 
 
 
 

Repository files navigation

Redes en Humanidades. Gephi

☞ Esquema del curso

Objeto de trabajo: redes en humanidades

Showcase

Redes

red nodos aristas
Obra teatral Personajes Coaparición en escena
Estilometría Obras Semejanza estilística
Colaboración científica Autores Coautoría de trabajos
... ... ...
  • Método de representación de patrones de conexión o interacción entre partes de un sistema.

  • El concepto de red supone una estructura relacional que puede ser estudiada (1) de forma lógica y matemática: Teoría de grafos (disciplina). Historia: Euler y los siete puentes de Königsberg.

  • (2) Exploración por medio de la visualización.

Conceptos básicos. Nodos y enlaces

  • Red: puntos unidos por líneas.
  • Puntos: nodos o vértices (nodes o vertices).
  • Líneas: aristas o enlaces (edges o links).
  • Atributos: información extra sobre nodos o aristas
  • Tipos de redes:

Red simple

Red bipartita

Red múltiple

Formalización y formatos

Formalización

Lista de aristas, matrices, lista de adyacencia, ...

Lista de aristas (edgelist): es conjunto de datos estructurados que contiene como mínimo dos columnas: una columna de nodos que son el origen de una conexión (source) y otra columna de nodos que son el destino de la conexión (target). El resto de columnas corresponden a los atributos.

source target weight lang type
Juan Elena 4 esp undirected
Juan Hans 2 de undirected
Juan Marta 1 eng undirected
Juan Marek 1 de undirected
... ... ... ... ...

Matriz de adyacencia (Adjacency matrix): una matriz cuadrada (igual número de columnas y filas)

Juan Hans Elena Marta Marek
Juan 0 1 1 1 1
Hans 1 0 0 1 1
Elena 1 0 0 0 0
Marta 1 1 0 0 0
Marek 1 1 0 0 0

[...]

Formatos

  • CSV. Lista de aristas en CSV:
source,target,lengua,weight
Juan,Elena,esp,4
Juan,Hans,de,2
Juan,Marta,eng,1
Juan,Marek,de,1
Juan,Marek,esp,1
Juan,Marek,pol,5
Hans,Marta,eng,1
Hans,Marek,de,1
  • CSV. Lista de Aristas + Nodos en CSV:
source,target
1,4
1,2
1,3

id,Label
1,Juan
2,Hans
3,Marta
4,Elena

Es recomendable guardar los datos estructurados en CSV, aunque Gephi acepta tablas en Excel.

  • gexf (XML)
[...]
      <node id="Marek" label="Marek">
        <attvalues>
          <attvalue for="att1" value="2.0"/>
        </attvalues>
        <viz:size value="4.0"/>
        <viz:position x="-22.013721" y="26.080078"/>
        <viz:color r="255" g="99" b="71"/>
      </node>
    </nodes>
    <edges>
      <edge id="0" source="Juan" target="Hans" weight="2.0"/>
      <edge id="1" source="Juan" target="Elena" weight="4.0"/>
      <edge id="2" source="Juan" target="Marta"/>
      <edge id="3" source="Juan" target="Marek" weight="7.0"/>
      <edge id="4" source="Hans" target="Marta"/>
      <edge id="5" source="Hans" target="Marek"/>
    </edges>
  </graph>
</gexf>

Visualización (spatialization)

Misma red, distinta disposición.

Red bipartita

Algoritmos para dibujar el grafo

  • Clásicos en Gephi: Force Atlas, Fruchterman Reingold,...

Métricas

  • Degree centrality: nº de conexiones.
  • Betweenness centrality: nodos puente.
  • Eigenvector centrality: nodos conectados a nodos bien conectados.
  • Modularity (Louvain, Leiden algorithms): agrupaciones de nodos.
  • ...

degree-distribution

Herramientas

Flujo de trabajo: del dato a la visualización.

work flow

  • Lenguajes de programación (flujo completo) : R, Python, JavaScript,...
  • OpenRefine, Table2net,...
  • Tableau, Nodegoat,...
  • Gephi, Cytoscape, VOSviewer,...

Gephi. Open Graph Viz Platform

Gephi ha retomado su desarrollo después de una fase sin actualizaciones. Se puede descargar desde su página https://gephi.org o directamente del repositorio en github gephi/releases.

Una de las ventajas de las nuevas versiones (desde 0.9.3) es que viene ya con Java (lenguaje de programación y entorno de ejecución para programas como Gephi). Más sobre la instalación en https://gephi.org/users/install/

Interfaz: Panel Overview

Plugins en Gephi:

Se encuentran en Tools > Plugin. Añaden a Gephi funcionalidades extra (métricas, importación, exportación, espacializaciones, ...).

  • Multimode networks transformation: Proyecta una red bipartita a una simple.

  • Sigma exporter: Exporta el grafo para visualizarlo dinámicamente usando javascript y html.

  • Leiden algorithm: Algoritmo de modularidad.

Datos para este curso

Los archivos en formato CSV y GEXF se encuentran en la carpeta /data de este repositorio.

Teatro

Redes de caracteres de coaparición en el teatro. La fuente es http://www.dracor.org, desde donde se pueden descargar; los añado a /data como respaldo.

  • calderon_VidaEsSueno_ezlinavis.csv
  • span000014-valle-luces.gexf

Premios literarios

35 premios literarios y 1325 autores premiados: datos obtenidos de Wikidata. Tabla en CSV con 3 variables: premios, premiados y género (masc./fem.); red bipartita y redes simples en formato gexf.

  • autoresypremios.csv
  • autoresypremios.gexf
  • autores.gexf
  • premios.gexf

El set de datos (+ listas de nodos y aristas) está en editio/premios-literarios y Zenodo: José Luis Losada (2022) DOI

Estilometría

Red de estilometría de obras teatrales del Siglo de Oro. Los nodos representan obras teatrales unidos según su cercanía estilística. Análisis realizado usando el árbol de consenso (2000-5000 MFW) y la distancia Delta con el paquete de R, stylo (Eder, Rybicki y Kestemont, 2016), sobre un corpus de aproximadamente 700 obras y 50 autores. Visualización interactiva en: Estilometría de obras teatrales

  • estilometria_teatro.gexf

Bibliografía

Red de coautoría de 3500 publicaciones sobre Estilometría. La bibliografía ha sido recopilada por Christof Schöch, Bibliography on Stylometry, 2017, DOI: 10.5281/zenodo.835190

Las entradas bibliográficas se han formalizado en red de coautoría usando VOSviewer. La red final de coautoría tiene 523 nodos (autores).

  • biblio_stylo.gexf

La Odisea de Homero

Red de lugares de la Odisea de Homero basada en una triangulación de Delaunay, para mostrar los lugares periféricos y centrales. Parte del proyecto Digital mapping of literature (Spatial Networks).

  • homero_odisea.gexf

Prácticas paso a paso

Red de caracteres

☞ Practicar los fundamentos de una lista de aristas, cómo cargarla en Gephi y realizar los primeros pasos de visualización y métricas.

  1. Dracor > tools > https://ezlinavis.dracor.org > Examples > Calderón > descarga edge list.
  2. Gephi > Import spreadsheet (CSV) > next > finish.
  • Layout: Fruchterman Reingold.
  • Tamaño de nodos según el degree: Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 10 - max. 50].
  • Etiquetas de los nodos (label): "copy data to other column" (Data laboratory). Alternativa: "select attributes to display as labels" (Overview).
  • Medidas de centralidad (Betweenness/Eigenvector): Segismundo frente a Clarín (statistics > Network Diameter; Eigenvector Centrality).

☞ Conocer el archivo en formato gexf, abrir en Gephi, atributos de los nodos (masculino/femenino).

  1. Dracor > corpora > Spanish Drama Corpus > Valle Inclán, Luces de bohemia > Downloads > Archivo en gexf.
  2. Gephi > open > [sin cambios] > ok.
  • Exploración de datos: label, gender (Data laboratory).
  • Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > gender
  • Layout: Force Atlas 2 [Prevent overlap, Disuade Hubs, Scaling = 40] > run|stop.

De los datos a la red: premios y premiados

☞ Pasar de datos estructurados (tabla de datos) a una formalización de una lista de aristas (gexf)

  1. Materiales en Github > data > autoresypremios.csv
  2. table2net (conversión en el navegador).
  3. Load table > Type of Network > Nodes > Build the network > Download.
  • 3.1 Tipo de red: bipartita.
  • 3.2 Nodos 1: autores | atributo: masc/fem.
  • 3.3 Nodos 2: premios.

Red de premios y premiados (1)

☞ Explorar redes bipartitas.

  1. Gephi > open autoresypremios.gexf.
  • Layout: Force Atlas 2 > run|stop; > Prevent overlap > run|stop; Zoom
  • Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Type
  • Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 10 - max. 50] (nº de autores por premio).
  • Nodes Labels: Show node Labels; More settings > Labels > Hide non-selected.
  • [reset colors] > Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > sexlabel.

Red de premios y premiados (2)

☞ Explorar redes simples (premios, autores).

Los archivos ya están listos en /data/premios.gexf; /data/autores.gexf. Se pueden asimismo crear desde la tabla de datos (table2net) o usando una transformación desde la red bipartita (☞ vide infra).

  1. Gephi > open premios.gexf
  • Layout: Force atlas 2 [Prevent overlap, Disuade Hubs, Scaling = 50]

  • Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 5 - max. 30].

  • Modularidad: Community detection > Modularity > run.

  • Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Modularity Class.

  • Comprobar centralidad:

    • statistics > eigenvector Centrality.
    • Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > eigenvector Centrality.
  1. Gephi > open autores.gexf
  • Layout: Layout: Fruchterman Reingold.
  • Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > sexlabel.
  • Appearance > nodes > size [icono círculos] > Ranking > Choose an attribute > Degree [min. 5 - max. 30].

☞ Pasar de un tipo de red a otro (proyeción).

  1. Plugin: multimode networks transformation.
  • Red bipartita.
  • Load attributes > type:
    • Premio > Autor / Autor > Premio (Red simple de premios)
    • Autor > Premio / Premio > Autor (Red simple de autores)
  • Remove nodes, edges.
  • Run.

Estilometría

☞ Explorar redes textuales

  1. Gephi > open estilometria_teatro.gexf.
  • Layout: Force atlas 2 [Prevent overlap, Disuade Hubs, Scaling = 200].
  • Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Classes (autores) > Palette > Generate [Limit number of colors: unchecked] > generate.
  • Appearance > nodes > size [icono círculos] > Unique > size = 20.
  • Nodes Labels: Show node Labels; More settings > Labels > Hide non-selected.

Contrastar con la modularidad:

  • Modularidad: Community detection > Modularity > run.
  • Appearance > nodes > color [icono paleta] > Partition > Choose an attribute > Modularity Class.

Red espacial

☞ Explorar redes espaciales

Gephi no es el mejor entorno para trabajar con redes y mapas, pero es posible disponer los nodos siguiendo coordenadas geográficas. Es necesario contar con la latitud y la longitud de los lugares.

  1. Gephi > open homero_odisea.gexf.
  2. Layout Plugin: Geo Layout.

Bibliografía

☞ Explorar redes desconectadas

  1. Gephi > open biblio_stylo.gexf.
  • Layout: Layout: Fruchterman Reingold (comparar con Force atlas 2).
  • Comparar algoritmos de modularidad.

Formatos de publicación

☞ Formas de representación estática y dinámica de los grafos.

  1. Panel Overview: Screeshot (izquierda), More settings (derecha)...
  2. Panel Preview: exportar svg, png, pdf.
  3. Plugin: Sigma Exporter. Crea una carpeta con las librerías, datos y ficheros para mostrar el grafo de forma interactiva en un navegador. Es necesario subirlo a un servidor web, por ejemplo, usando Github Pages. Se puede lanzar un servidor web local para realizar pruebas en local: Instrucciones.
  4. Retina (Web app, beta): Visualización en el navegador (offline / online) a partir de un archivo GEXF

Tutoriales, manuales, bibliografía

About

Curso sobre redes y Gephi

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published