Science visualization trends of 2021

Reviewing a year of data viz

At the end of the year people take stock and reminisce. This also applies to data visualization scientists. Reviews summarizing the best visualizations of 2021 were published. I particularly enjoy Maarten Lambrechts summary of all the “Best of 2021” posts.

This year, while musing whether to keep or toss my Nature print issues (still undecided!), I browsed the science visualizations of 2021. Well, I checked those about biology and medicine as I really do not understand enough of physics to get the visualizations in Nature. Some visualizations and themes really stood out so I decided to summarize for you the top 10 science visualization trends of 2021 – enjoy!

[note: all photos show anonymous excerpts for educational purposes from Nature articles 2021]

[Go here for German translation]

  1. Viva viridis!

The viridis color-scheme is now omnipresent. Viridis was developed by Stefan van der Walt and Nathaniel Smith in 2015 as the default sequential color map for matplotlib. Their goal was to create a color scheme in which color changes are perceptually uniform, and to replace the non-linear Jet/Rainbow-color schemes used previously for sequential data.

Viridis quickly gained popularity as we can see in the many examples below. By now viridis is however no longer only used for sequential data. Instead we also see it being applied to diverging and categorical data, which may be not exactly ideal at times. But for now let’s celebrate the end of rainbow color schemes!

2. Still trending: axis breaks

Yes, axis breaks, necessary or not, are unfortunately still a thing in 2021. And so far, no end in sight. Every time I teach a Data Viz Course, I challenge the students that all axis breaks are avoidable – I have yet to see one where the break really was necessary. Send me yours!

3. Hello slope-charts

In 2016 the #BarBarChart initiative called for a ban of bar charts for data distributions. They were successful and I have not any in 2021. At that time, Tracey Weissgerber published a notable paper encouraging the use of a slope chart for dependent observations. It seems the science world listened again: numerous papers now use slope charts to illustrate dependent measurements of specimens, for example mice before and after treatment, responders and non-responders in cohorts etc.

4. tSNE, UMAP, PCA

There don’t seem to be any papers that don’t have at least one dimension reduction plot. t-SNE, UMAP and PCA are omnipresent. These plots are however rarely explained in articles and figure legends, and I suspect even more rarely understood by audiences. In my courses participants are often not familiar with them – not surprising given that they are a recent addition in statistics and still heavily researched in the vis community! To educate your students refer them to these resources from Claus O. Wilke and StatQuest.

5. Mixing charts

A big fashion trend of 2021 was mixing styles and patterns, and it seems this did spill over to the visualization world. Researchers have become quite experimental with mixing chart types (see also earlier post). I’ve seen a number of scatter plots showing the data distribution summarized along each axis: above for the x-axis and left for the y-axis. I’ve also seen pie charts summarizing the quadrants of a scatter-plot, charts mixing violin and box-plots, of course box-plots with data points, and many more.

6. Pictograms

Often novel insights come from a new methodological approach. To familiarize audiences with a new method, papers now regularly include a sketch of the experimental procedure. And, good news, these have begun to look rather nice and clear, whether it’s a stool preparation method, an approach stem cell differentiation, or for a mouse neurobiology set-up.

7. Pictograms for labeling

Pictograms are not only used for explaining procedures, but also often help to quickly orient audiences. Pictograms are for example used instead of text: I’ve seen pictograms as a title, pictogram to name a leaf in a phylogenetic tree, or even a pictogram chart. Overall pictograms seem to be most popular in mouse molecular genetics and evolutionary biology. Go figure.

8. Images now come with scale bars!

Scale bars in images are apparently here to stay. A few years ago, I had noticed that scale information was quite often missing in scientific images, even in high profile journals. Eventually this observation prompted a collaborative project to systematically screen the quality of image data in publications.

This year the tide has definitely shifted. Except for a few cases, scale bars are now visibly placed on all images; even in plant and histology images, two fields so far quite notorious for omitting scale information.

9. Colors in images: still problematic

Despite many recent efforts, most recently a technology feature in nature feat. your truly, no end is in sight for images that generously mix red and green, making it illegible for many color-blind people. In addition, often images that show false-color scales do not come with a legend explaining the color intensities. A small glimpse of hope: I’ve seen a color legend once this year (still without quantities in legend), which is already a 100% increase from previous years!

And, rescue is near, with QUAREP we have a collaborative consortium addressing quality of light microscopy. Join our working group that develops guidelines for image visualization in publications!

10. More space for figures!

Figures get more space in publications. This is quite easy in electronic publications, but also in print editions half or even full-page figures are becoming a sight. This makes it quite enjoyable to read some of the figures, which before were entirely illegible due to being squeezed into a small space.

More space for figures means less space for other sections of a paper. Often materials and methods are now entirely moved to the supplementary materials and citations are limited to a few only.

These figures below for example each took up 2/3 of a page – lovely!

Advertisement

Survival plots – Medical charts 1

Not too long ago, I transitioned from molecular biology to clinical oncology research. In the hospital, I adapted to a different pace, visible hierarchies, and learned patience as patient care naturally takes precedence over research! I also got used to new data science environments with specific requirements for documentation, privacy, and ethics. And of course, I learned about a number of new visualizations and plots that are common in clinical data reporting! I will introduce a few of these in this article-series.

Anatomy of a survival plot

A common chart type in clinical oncology is the ‘survival’-plot, also known as Kaplan-Meier plot. However, neither name appears in your standard chart guide or references (https://r-graph-gallery.com/ or https://datavizcatalogue.com/home_list.html). Survival plots generally looks like a line plot, with the time shown on the x-axis. The time range depends on the clinical trial and its defined endpoints – and may be anywhere from minutes or days to years. Listed time points are the follow-up appointments and as such neither in regular intervals nor evenly spread.

The y-axis

The tricky bit is of course the y-axis. The data points do not encode directly measured values but instead a ‘survival probability’ at the given time point. Naturally the ‘survival probability’ decrease over the study time for any cohort. As time passes, more and more patients will invariably experience an event that was previously set as the study end-point. Study end-points typically are survival, hence the name of the plot, but they may also be recurrence of a cancer or also a positive event like leaving the intensive unit.

The survival probability is then re-calculated only for those participants still enrolled in the study at the given time point. Towards the very end of the curve, when only one or two patients are still observed, the curves most drastically change, this however reflects only relative large effect one event may have on a smaller set of study participants.  

The categories

Survival plot most often compare survival probabilities for two conditions. These could be how patients survive under a new care regime compared to the standard of care or two alternative medications. But survival plots can also be used to illustrate different response groups such as male and female study participants, or patients stratified by age.

Often the confidence interval is plotted along with the survival probability for each category and can help to gauge the uncertainty. This is especially important towards the end of the curve when fewer participants mean also increasingly larger uncertainty of the data.

Additional decorations

Survival plots frequently label the time with 50% survival probability for each cohort and often include a table below the plot explicitly listing the patients at risk for specific time points. 

Patients also drop out of a clinical study before the observed event. The participant is then excluded from the data analysis, which is termed censoring. They may die, get well and leave a trial, or stop participating in the study. This reduces the pool of persons at risk, even if no patient reached the endpoint. In the survival plot these persons are often marked in the respective category line with a tick-mark.

Variations

The very same data and survival probabilities can of course also be plotted differently. For instance, instead of focusing on the entire range of the data, a zoomed view of the early time points may help to understand critical differences in treatment. At these time points the CI is still very low and differences likely to be meaningful.

There are also versions that flip the y-axis. Now instead of showing the survival probability, the plot focuses on how along the observed time course more and more events occur and sums them up (cumulative events) or indicates the likelihood of the event (cumulative hazard).

References & Try it out

Upcoming articles:

  • Medical charts 2: Trial/study diagrams
  • Medical charts 3: Forrest plots
  • Medical charts 4: Common pitfalls

30+ charts for #30DayChartChallenge

The #30DayChartChallenge is an annual festival for chart-lovers around the world. There is a daily visualization challenge and participants post their own chart solutions. Datasets, data analysis, tools, and presentation is entirely up to the contributor. All entries are posted on twitter along with the #Day1 to #Day30 hashtag. The resulting diversity and personal interpretations are the charm of the challenge and a joy to data scientists and visualizers alike.

  • Charts showing aspects of Ukraine life

My 30DayChartChallenge

I personally was looking for an excuse to get back to making charts with R. All I could think of at the time was however the war in Ukraine. My granddad Anton Jámbor was born and raised in Khust, Zakarpattia Oblast, which was another reason to finally educate myself about Ukraine. So, I made a plan and almost completed it! I researched the people and population of Ukraine, the country and cities, and a little bit the health data since my day-job is in medical research at the University hospital.

From idea to implementation:

Moving along: the daily charts

Over the course of April I completed 18 of the 30 challenges. Many times I made several solutions and tested many more. Below is the example for Kazimir Malevich. I plotted the color-schemes he used in his paintings over his lifetime and tried our several options including an animation.

Finding time each day for a full month was impossible with Easter vacation and care work requiting my attention. Now, in a calm summer, I finally completed five more challenges for which I had already found data. I posted these final entries on Ukraine’s Independence Day, coinciding with 6 months since the war starts.

Kazimir Malevich was born in Ukraine and is famous for monochrome,abstract paintings. However, that was a brief period, before and after his paintings are full of colors! I analyzed his color-usage over his lifetime. This was one of the few datasets I created myself.

Design objective

My goal was to create a visually and thematically cohesive work. I plan to use my charts for teaching purposes and for teaching the many ways how we can communicate data with charts. Most of my time, as always, was spend on finding a topic for which a dataset was available. A lot of time was also consumed by data wrangling and getting it in a format to actually make charts. And only a fleeting moment for creating the visualizations. That’s how it goes!

Enjoy, and Slava Ukraini!

Keep Ukraine in the news!
Animation of google searches for Zelensky, Putin and Russia

#30DayChartChallenge

This year I participate in the #30DayChartChallenge (@30DayChartChall on twitter, https://github.com/dominicroye/30DayChartChallenge_Edition2022). The goal is to create a specific chart each day with a tool and data of own choice. And share it with all participants on social media.

I will contribute charts about Ukraine. Why? To educate myself about a country that I have yet to visit and generally know very little about. And that is close: Ukraine is just a little over 600km from where I currently live, Dresden.

On a personal note, I also chose Ukraine as it is the birthplace of my paternal grandfather, Anton Jámbor. He was born in 1927 and spend his childhood in Chust, which is today Transcarpathia part of Ukraine.

#Day 1: Part-to-Whole

A standard chart for parts-to-whole comparisons is the pie-chart. It works well because essentially it is taught in primary school already.

I wanted to visualize the worldwide sunflower seed production. Ukraine and Russia combined produce 50% of the worldwide amount! That is the reason Germans hoard sunflower oil and supermarkets started to restrict purchases to 1 bottle/person. Ukraine may go under, but people will still fry the hell out of their Schnitzel!

Tool: #rstats, and a lot of vector-design post-production. Color-scheme: Ukraine flag. Design idea: turn the simple pie chart into a sun-flower, resembling the symbol of Ukraine.

Wissenschaftsvisualisierung 2021

Ein persönlicher Jahresrückblick auf ein Jahr Datenvisualisierung.

Am Ende eines Jahres wird gerne Bilanz gezogen. Das gilt auch für Datenvisualisierungswissenschaftler. Es werden Rückblicke veröffentlicht, die die besten Visualisierungen des Jahres 2021 zusammenfassen. Mir gefällt besonders Maarten Lambrechts Zusammenfassung aller “Best of 2021”-Beiträge.

Als ich dieses Jahr darüber nachdachte, ob ich meine gedruckten Nature-Ausgaben behalten oder wegwerfen sollte (Stand heute: unentschieden!), habe ich mir alle Wissenschaftsvisualisierungen des Jahres 2021 angesehen. Hier sind meine persönlichen Top 10 Trends der Wissenschaftsvisualisierungen dieses Jahres – viel Spaß.

1. Viva viridis!

Das Viridis-Farbschema ist mittlerweile allgegenwärtig. Viridis wurde von Stefan van der Walt und Nathaniel Smith im Jahr 2015 als Standard-Farbschema für matplotlib entwickelt. Ihr Ziel war es, ein Farbschema zu erstellen, in dem Farbänderungen gleichmäßig wahrgenommen werden, und die nicht-linearen Jet/Rainbow-Farbschemata zu ersetzen, die zuvor für sequenzielle Daten verwendet wurden.

Viridis gewann schnell an Popularität, wie man an den vielen Beispielen unten sehen kann. Inzwischen wird Viridis jedoch nicht mehr nur für sequenzielle Daten verwendet. Stattdessen wird es auch auf divergierende und kategoriale Daten angewendet, nicht so geacht und nicht immer sinnvoll. Aber heute feiern wir erst einmal das Ende der Regenbogenfarben-Farbschemata!

2. Immer noch da: Achsenbrüche

Ja, Achsenbrüche sind leider auch im Jahr 2021 noch ein Thema. Und bis jetzt ist kein Ende in Sicht. Jedes Mal, wenn ich einen Data-Viz-Kurs gebe, postuliere ich, dass alle Achsenbrüche vermeidbar sind. Bisher hat noch kein Teilnehmer ein Beispiel gezeigt wo ein Achsenbruch unumgänglich war. Gerhe Beispiele einsenden!

3. Hallo Slope-Chart

Im Jahr 2016 forderte die Initiative #BarBarChart ein Verbot von Balkendiagrammen für Datenverteilungen. Sie waren erfolgreich, und ich habe im Jahr 2021 keine mehr gesehen. Tracey Weissgerber hat einen wichtigen Artikel zu dem Thema verfasst und damals auch die Verwendung von Steigungsdiagrammen (Slope-Chart) für abhängige Beobachtungen vorgeschlagen. Es scheint, dass die Wissenschaft darauf gehört hat: In zahlreichen Arbeiten werden jetzt Slope-charts verwendet, um nicht unabhängige Messungen von Proben zu veranschaulichen, z. B. Mäuse vor und nach der Behandlung, Responder und Non-Responder in Kohorten usw.

4. tSNE, UMAP, PCA

Es scheint keine Arbeit mehr zu geben, in der nicht irgendeine Art von Dimensionsreduktionsdiagramm zu finden ist. t-SNE, UMAP und PCA sind allgegenwärtig. Diese Diagramme werden jedoch nur selten in den Artikeln erklärt, und ich vermute, dass sie von den Zuhörern noch seltener verstanden werden. In meinen Kursen stelle ich jedenfalls fest, dass die Teilnehmer kaum mit ihnen vertraut sind – das überrascht nicht, sie sind nochr recht neu in der Statistik und werden in der Vis-Community sehr aktiv beforscht!

Tipps um sich mit den plots vertraut zu machen: Claus Wilke und StatQuest

5. Gemischte Diagramme

Ein großer Modetrend des Jahres 2021 war das Mischen von Stilen und Mustern, und es scheint, dass dies auch auf die Welt der Visualisierung übergeschwappt ist. Forscher haben viele Diagrammtypen vermischt. Ich habe eine Reihe von Streudiagrammen gesehen, in denen die Datenverteilung entlang einer Achse oberhalb (für die x-Achse) und links (für die y-Achse) zusamengefasst ist. Es gab auch Tortendiagramme gesehen, die die Quadranten eines Streudiagramms zusammenfassen, Diagramme welche Violin- und Boxplot mischen, oder Boxplot mit Datenpunkten, und vieles mehr.

6. Piktogramme

Oft ergeben sich neue Erkenntnisse aus einem neuen methodischen Ansatz. Um Leser mit einer neuen Methode vertraut zu machen, enthalten die Veröffentlichungen nun regelmäßig eine Skizze des experimentellen Verfahrens. Und die gute Nachricht ist, dass diese Skizzen inzwischen recht hübsch und übersichtlich aussehen, egal ob es sich um eine Stuhlpräparationsmethode, einen Ansatz zur Stammzelldifferenzierung oder um den Aufbau eines Mausgehirns handelt.

7. Piktogramme zur Beschriftung

Piktogramme werden nicht nur zur Erläuterung von Verfahren verwendet, sondern dienen oft auch der schnellen Orientierung des Publikums – sie werden anstelle von Beschriftungen in Diagrammen verwendet: Wir sehen ein Piktogramm anstelle eines Titels, ein Piktogramm zur Bezeichnung der Enden eines phylogenetischen Diagramms und sogar Piktogramm-Diagramme. Mit Abstand am beliebtestens sind Piktogramme übrigens in der Maus- und Evolutionsbiologie!

8. Bilder jetzt mit Maßstabsangabe!

Maßstabsbalken in Bildern sind anscheinend nicht mehr wegzudenken. Vor einigen Jahren war mir aufgefallen, dass in wissenschaftlichen Abbildungen, selbst in hochrangigen Zeitschriften, häufig keine Maßstabsangaben zu finden waren. Diese Beobachtung gab schließlich den Anstoß zu einem Gemeinschaftsprojekt zur systematischen Überprüfung der Qualität von Bilddaten in Veröffentlichungen.

In diesem Jahr hat sich das Blatt definitiv gewendet. Von einigen wenigen Ausnahmen abgesehen, sind die Maßstabsbalken jetzt auf allen Bildern sichtbar platziert, selbst bei Pflanzen- und Histologiebildern, zwei Bereichen, die für das Weglassen von Maßstabsangaben berüchtigt sind.

9. Farben in Bildern: noch problematisch

Trotz vielen Anstrengungen, z.B. ein “Technology Feature” in nature werden noch immer Rot und Grün gemeinsam in Bildern verwendet, was diese für viele Farbenblinde unlesbar macht. Außerdem sind Bilder mit Falschfarbenskalen oft nicht mit einer Legende versehen, die die Farbintensitäten erklärt. Ein kleiner Hoffnungsschimmer: Ich habe in diesem Jahr schon eine Farblegende gesehen, wenn auch noch ohne Quantitäten. Und das ist bereits eine Steigerung von 100 % gegenüber den Vorjahren.

10. Mehr Platz für Abbildungen!

Abbildungen erhalten mehr Platz in Publikationen. In elektronischen Publikationen ist dies recht einfach, aber auch in gedruckten Ausgaben werden jetzt schon halb- oder sogar ganzseitige Abbildungen abgedruckt. Das macht es recht angenehm, einige der Abbildungen zu lesen, die vorher aufgrund des geringen Platzes völlig unleserlich waren.

Mehr Platz für Abbildungen bedeutet weniger Platz für andere Teile einer Arbeit. Häufig werden Materialien und Methoden nun vollständig in die ergänzenden Materialien verlagert, und die Zahl der Zitate ist auf einige wenige beschränkt.

Diese Abbildungen sind zum Beispiel in gross richtig informativ!

Pandemie visualisieren

Projekt mit Studierenden der Beuth Hochschule für Technik Berlin, im Fach Biotechnologie. April/Mai 2021.

“Als Biologin kannst Du mir bestimmt sagen, ob der RNA Impfstoff sicher ist”, “Sind Masken wirklich effektiv?”, und “Wie berechnet man eigentlich Inzidenzen?”

Dank Corona war das Fachwissen von uns Wissenschaftler:innen im privaten Umfeld plötzlich gefragt. Das war auch bei meinen Biotechnologie-Studierenden an der Beuth nicht anders. Sie wurden pandemiebedingt zu privaten Wissenschaftskommunikatoren befördert. Eine Student:in berichtete „Meine Familie setzt oft voraus, dass ich als Studentin der Biotechnologie immer auf den aktuellen Stand bin, wenn es um das Thema „Corona“ geht. Fragen wie ‚Wie viele Menschen haben sich in Deutschland schon impfen lassen?‘ und ‘Welche Impfstoffe werden hier in Deutschland angeboten?‘ bekomme ich öfter gestellt.’

Der Plan

Statt im Praktikum wieder Tubuline oder Helikasen bioinformatisch unter die Lupe zu nehmen haben wir uns in diesem Sommersemester entschlossen etwas Alltagstaugliches zu machen. Die Masterstudenten sollten Bioinformatik und Datenwissenschaften praktisch anzuwenden und zu einer eigenen Frage rund um Corona Daten recherchieren, analysieren und auswerten. Die Ergebnisse sollten dann in einer Visualisierung aufbereitet werden und bei der Aufklärung z.B. von Verwandten und Freunden helfen. Wir sind schrittweise vorgegangen und haben systematisch die Abbildungstypen, Text, Layout und Farben gewählt. Und immer wieder gab es Feedback-Runden mit mir und Kolleg:innen im Praktikum – ist die Abbildung und der Farbcode verständlich? Verwende ich noch zu viel Jargon? Sind Piktogramme klar?

Die Ergebnisse

Herausgekommen ist eine herrliche Vielfalt an Visualisierungen zu ganz verschiedenen Fragestellungen. Um den Student:innen zu vermitteln, dass sie eine Stimme haben und schon jetzt zu den Expert:innen zählen, habe ich angeregt, dass wir die Visualisierungen öffentlich zeigen. Nicht alle wollten das, aber ein paar kann ich jetzt hier präsentieren.

Was haben wir gelernt?

 “…ich habe auch eine neue Betrachtungsweise auf Visualisierungen entwickelt und gelernt visualisierte Daten, im wissenschaftlichen aber auch im alltäglichen Zusammenhang, kritischer zu begutachten.”

“…ich habe gelernt, dass es nicht leicht ist, komplexe Daten in verständliche Zusammenhänge zu bringen.”

Und auch: „dass Bioinformatik in dieser Form wohl eines der am meisten frustrierenden Aufgaben der vergangenen Monate für mich war… Ich bleibe eher im Labor, wo die fehlenden technischen Möglichkeiten umgangen werden können und mangelhafte Daten selbst verursacht sind.“

Und wir alle haben nebenbei den Wert offener Daten für die Bioinformatik, aber auch für die Allgemeinheit begriffen: „Ich habe festgestellt, wie abhängig man vom Zugriff auf Daten ist. Wie stark die Beschränkungen bei Daten sind, die eigentlich öffentlich zugänglichen sind, habe ich noch nie in dieser Form zu spüren bekommen.”

Beispiel Arbeiten

Um wichtige biologische Daten hat sich Giuliano Ballacchino (Insta: giuliano_ballacchino) gekümmert, der in einer sehr guten Analyse herausgefunden hat welche Mutationen die Delta (damals hieß sie noch B.1.167) Variante von der britischen (B.1.117) unterscheiden – und wie sich diese Mutationen strukturell auf das Spike Protein auswirken. Zu dem Zeitpunkt war es noch nicht mal leicht überhaupt die Sequenzen zu bekommen, deswegen Chapeau!

Viet Vu hat innerfamiläre, interdisziplinäre Synergien genutzt und mit einem Programm seiner Architektur-studierenden Schwester angefangen zu spielen, um uns ein prima Video zu präsentieren. Ich würde gerne einen Kurs bei IHM belegen, um das zu lernen. Es ist ein super Einstieg in das Thema rund um Corona für alle. HIER IST DER LINK

Ebenfalls als Einstieg dient die Arbeit von T.H., der uns eine Webseite gebaut hat, die als Informations-Aggregator dienen soll, um wissenschaftlich validierte Informationen zu Corona gebündelt zu präsentieren. Wenn er ganz viele Klicks bekommt, betreibt er die Seite vielleicht sogar weiter 🙂

Micela Condor Jonske präsentiert eine Übersicht für Schüler die wissen wollen: habe ich vielleicht Corona? Und wenn ja, was sind die Testmöglichkeiten? PCR versus Schnelltest wird gezeigt und auf Seite 2 gleich welcher Test wann überhaupt Corona nachweisen kann! Hinweis, die verschiedenen Varianten die Giuliano Ballacchino beschrieben hat sind damit nicht nachweisbar.

It’s game time! Eine alternative um Schüler anzusprechen kommt mit einem Computer-Spiel daher. Die MAC Leute müssen stark sein, weil das ist ein PC-Game. Alle anderen: Ladet euch die 2 Dateien und die .EXE runter und installiert euch das Infromations-Game im SuperMario Style das Marie Köhler für euch gebastelt hat. Mein Teenager-Sohn fand es spitze und den Retro-Look cool! Say thanks auf Github oder bei linkedin.com/in/marie-köhler.

Alicia Oberländer (https://www.linkedin.com/in/alicia-oberl%C3%A4nder-68aa43214/ )hat mit dem Tool Biorender und eigener Recherche ein Poster gestaltet: „Ich will den pathologischen Verlauf einer schweren COVID-19 Erkrankung in der Lunge für Studierende, aber auch interessierte Mitmenschen, zugänglich machen und durch meine Visualisierung dieses spannende Wissen teilen und das Verständnis für das komplexe Thema erleichtern”. Francesca H. wollte herausfinden warum CORONA Symptome bei Kindern so anders sind als bei Erwachsenen – und ob das an einem unterschiedlich entwickelten Immunsystem liegen könnte – ein sehr ambitioniertes Unterfangen, und sie musste feststellen dass auch hier die Datenlagen noch nicht sehr gut ist!

Jessica Wiest hat sich, es ging wie gesagt gerade los mit dem Impfen für alle, mit den verschiedenen Impfstoffen beschäftigt und ihr Poster erklärt allgemeinverständlich die verschiedenen Wirkmechanismen. Nouran K. vergleicht ebenfalls die beiden RNA-Impfstoffe die zurzeit auf dem Markt sind. Ihre Wirkmechanismen, Nebenwirkungen und den Preis! Es fehlt nur der CUREVAC Impfstoff, der aber momentan eher keine Zulassung bekommen wird. Farah Jaabous hat untersucht wie weit Deutschland mit den Impfungen ist, welche Bundesländer vorankommen und was verimpft wird. Juliane Schwarzer (https://www.linkedin.com/in/juliane-schwarzer-92ab641ab/) hat ebenfalls den Impfstand untersucht und außerdem noch mit einbezogen wie hoch die Impfbereitschaft ist.

Unser Kurs lief Ende April/Anfang Mai – da ging es gerade los mit Impfungen. Die Lage für Schwangere war allerdings noch unklar. Gina Fonfara (https://www.linkedin.com/in/gina-fonfara-403865197/) hat die Daten diesbezüglich untersucht und ein Poster erstellt was z.B. in gynäkologischen Praxen Schwangere schnell informieren kann.

Filiz M. Özcan (insta: felizmeliz)hat eine extrem umfangreiche Arbeit gemacht, um herauszufinden, wie sicher die die Schutzmechanismen und somit die Verkäufer im Einzelhandel sind. Eine ihrer Visualisierungen ist ein Poster und eine Broschüre für den Einzelhandel mit Verhaltenstipps. Unten das Poster für die Eingangstür. Sie hat auch noch ein Poster für Kinder angefangen, dass ihnen etwas farbenfroher Einkaufen unter Corona-Bedingungen erklärt.

Lea Helm hat im Verlauf der ersten Welle die Pandemie-Massnahmen in Deutschland mit der Inzidenzzahl korreliert und Lennard S. hat die Massnahmen der gesamten Pandemie mit dem CHI korreliert, also wie effektiv das ist, und dann Deutschland und Portugal, wo es bei unserem Kurs gerade zu größeren Ausbrüchen kam, verglichen.

Eine spannende Idee kam von Robert Bütepage (insta bobby_buetepage), der einen Vorschlag macht wie man gelangweilte U-Bahnfahrer in Berlin zum Maskentragen bewegen kann: mit einer simplen Grafik im Berliner Fenster. Das schwierigste war, diese auch wirklich simpel hinzubekommen! Florian D. Hofschläger – „Warum die Kombination Chor und Corona? – „Ich bin leidenschaftlicher Sänger.“ Man beachte: das Notenpapier im Hintergrund! Es sind wenig Visualiserungen, dafür aber ein Poster mit schnell lesbarem Text, vielleicht hilft es dem einen oder anderen Chor, der jetzt wieder an Proben denkt!

Bild UBahn: (c) horizont.net/marketing/nachrichten/-Be-Berlin-spannt-U-Bahnen-in-Hauptstadtkampagne-ein-79642″

Wenn euch etwas gefällt macht euch die Mühe und schickt den Studenten eine Nachricht auf Linkedin oder ich leite das weiter Helena.Jambor – at – beuth-hochschule.de

How to… Graphical Abstracts

In my visual communication classes students increasingly ask about graphical abstracts. Below I summarized a few key points I taught recently:

What are Graphical abstracts?

Graphical abstracts are increasingly common to explain biomedical concepts and research results. “Summary slides” have been for long been used in talks or lectures. Today, graphical abstracts are omnipresent a thumbnail previews in online publications, and are also used in posters, on lab websites, and in research grant applications.

The key element of every graphical abstract are pictograms-like visualizations or icons. With text and arrows, the pictograms are then arranged into a sequential narrative or ‘story’. A consistent color scheme and clear layout help to orienting the audiences. Below are a few quick suggestions to help you design a graphical abstract quickly.

One main message

Before starting the design process, spend a good amount of time brainstorming the key message to get across. I personally do this by doodling on paper and discussing with peers. Without a clear main message, it will be impossible to design a good graphical abstract.

Pictograms as visual elements

Pictograms have long been used in science and in the early 20th century, Otto Neurath and Gerd Arntz started to systemically designed icons for communicating data to broad audiences. The past decade saw an explosion of new pictograms such as emoticons in social media.

A new resource for pictograms is fontawesome, a unicode-based icon library that can be installed locally as a font. The font can then be used in e.g. PowerPoint or Illustrator to directly “write” pictograms. Alternatively, pictograms can be accessed online and downloaded (svg, png). A larger collection is available at the Nounproject. Here, designers can upload icons for re-use with attribution. Scientific pictograms for free re-use are collected at the EBI reactome icon library. This site allows upload of user-designed pictograms for sharing with the scientific community.

In a graphical abstract, the pictograms used should have a similar overall appearance. Ensure that colors, line widths, and level of detail are comparable in all used icons. Best practice would be to use pictograms from one designer or one source only. And: start your own personal collection, chances are you might need them again!

Pictogram examples
All pictograms used have similar overall appearance (color, size, design)
Pictograms in use
Bad combination of pictogram, all pictograms have different appearance

Layout: Dimensions

Layout describes the organization of visual elements on the page. First, consider the dimensions of your page: a graphical abstract for a journal website most often is square, while rectangle stretching across the entire page might be a better use of space for a graphical abstract in a grant application with limited word number.

Dimensions for Graphical Abstracts
Dimensions for Graphical Abstracts: square is often required by journals and works well online. Rectangle is easier for slides, posters etc. Adapt dimension when including Graphical Abstract in text.

Layout: Reading direction

The layout should provide a clear entry into the graphical abstract and a clear end. Typically, we read from left to right, and top to bottom. The visual elements should be arranged along the chosen reading direction.

For depiction of linear processes, which have a clear beginning and end, organization from left to right is most suitable: time is usually shown as the independent variable on the x-axis f graphs. Linea processes may be procedures, such as a methodical pipeline, or cellular events such as cell division, embryo development, or disease progression. For depiction of cyclic events, for example daily, annual or metabolic processes, consider a circular layout; for static events, e.g. contrasting two scenarios or providing two levels of details for one scenario, consider two parallel or nested organization.

Layout Options for Graphical Abstracts
Different layouts for Graphical Abstracts that have a clear start and end.

Arrows

Arrows (and lines) have several roles in graphical abstracts. First, arrows reinforce a reading direction that is already visually defined by a layout, or point out an exception from the reading direction. Second, arrows often indicate motion: a molecule passes a membrane, a cell migrates into a tissue, animals flock to food source. And third, arrows are used for labeling structures or regions of interest. Here, the arrow may be replaced by a simple line. Depending on the arrow head, the meaning can also change to showing an inhibition or forking etc.

It is important to clearly signal to the audience the intention of an arrow and, if two types of arrows are used in parallel, to contrast them visually. Note how changing the context of an arrow can also change its perceived meaning.

Different arrow types and arrow usage in Graphical Abstracts
Different arrow types and arrow usage in Graphical Abstracts

Text

Understanding of complex scenarios is easiest when text and visual are used in synergy (Mayer RE 2002; Hegarty, 1993). First, text is used to substitute for pictograms where these are no available (e.g. specific molecules: ‘acetylcholine’). Second, text also serves to label pictograms that are otherwise ambiguous (e.g. a circle for ‘cell’, ‘bacteria’, ‘nucleus’), Third, text also enforces the meaning of an arrow: an upward arrow could indicate ‘move up’, ‘increase’ or ‘good’, or a circular arrow could be day, year or life cycle. Last, text often provides further explanations. Here it is critical that the it remains short and without jargon and sparse abbreviations.

Colors

As in all visualizations, colors are used in graphical abstracts to highlight and contrast, to encode numerical data, or to show the natural appearance of a visualized object. It is key to use colors consistently. A change in color is perceived as a change in meaning. Also use color sparsely as color always draws attention of the audiences, and might eclipse the key take home message of the graphical abstract.

For picking harmonious colors schemes use e.g. http://paletton.com. Colors schemes can be based on adjacent colors to appear harmonious or on complementary colors to contrast scenarios.

Color usage in Graphical Abstracts
Color can highlight, encode numbers, or show natural appearance in Graphical Abstracts. Careful with color choice when using a background color!

Making of… Tools!

Graphical abstracts can, like a poster, be prepared with vector-design software (Illustrator, Inkjet, CorelDraw) or software for preparing slides (Powerpoint, Keynote). In both cases, pictograms can be included as images (png, tiff) or .svg files.  https://biorender.com/ allows a web-based, drag-and-drop design of slides with a harmonious overall layout and biomedically relevant pictograms. For an annual fee, users can export graphical abstracts/figures in publication quality resolution.

Finish by…

Design is an iterative process of adjusting and assessing. A common problem in graphical abstracts is an unclear reading directions (Hullman and Bach): assess if your graphical abstract support a visual hierarchy with text, lines, and arrows. Often, elements are not connected to the rest of the graphical abstract, which forces readers to guess. Confusing also arises from inconsistent visual style: are your pictograms similar in detail? Do arrow with the same meaning have same appearance? Are colors used sparsely and consistently?

As always, source feedback from colleagues, ask them to tell you back what they see!

Examples

Inspiration: a lovely hand-drawn visual abstract:

https://www.sciencedirect.com/science/article/pii/S0378517319307975?via%3Dihub

Examples are also provided in the author guidelines by Elsevier: Graphical abstracts (2016). https://www.elsevier.com/authors/journal-authors/graphical-abstract

References

Tversky B. Lines, Blobs, Crosses and Arrows: Diagrammatic Communication with Schematic Figures. In: M. Anderson, P. Cheng, and V. Haarslev (Eds.): Diagrams 2000, LNAI 1889, pp. 221-230, 2000. Springer-Verlag Berlin Heidelberg.

Hullman J and Bach B. Picturing Science: Design Patterns in Graphical Abstracts. In: P. Chapman et al. (Eds.): Diagrams 2018, LNAI 10871, pp. 183–200, 2018. https://doi.org/10.1007/978-3-319-91376-6_19

Hegarty, M., Just, M.A.: Constructing mental models of machines from text and diagrams. J. Mem. Lang. 32, 717–742 (1993)

Mayer, R.E.: Multimedia learning. Psychol. Learn. Motiv. 41, 85–139 (2002)

20 Toes, 4 Feet, 2 Artists, 1 Passion: Life in numbers

English translation of 20 Zehen, 4 Füße, 2 Künstler, 1 Passion: Life in numbers

Our life can be described with numbers and visualized in diagrams. However, every mean and every chart are simplifications. Useful and fascinating, but also obstructive and restrictive.

Dresden premiere

Yesterday we experienced a wonderful visualization of two “lives in numbers” in the Festspielhaus Hellerau. The two choreographers and dancers Katia Manjate and Anna Till meet in the Dresden premiere of “Life in numbers”. Four years ago, the artists began to compare their lives on the basis of statistics and through these got to know each other. This gave the impulse to “Life in numbers”, and so the piece begins. With a comparison of life in Dresden, where Till lives, and Maputo, where Manjate lives. In the course of the 8 parts, we get to know key data, which are translated into dance on a Cartesian coordinate system, with movements along the invisible x- and y-axes. The dancers themselves form the data points, always in relationship with each other, but changing, converging, and diverging in the course of time.

Differences and similarities

In the middle part of the piece we turn away from the mean values and towards individual data points. No longer: “How long does a woman live in Germany and one in Mozambique” is discussed, but Till and Manjate ask themselves directly: “How old are you?“. The confrontational, curious questions are staged like a duel and bathed in bright light. The shadows of the bodies are projected into rectangles formed by the spotlights, thus visualizing our thinking in boxes. The audience waits with great anticipation for the next answer.

In the third part the tension is released, the light becomes warm and the dance playful. The artists now begin a joyful confrontation with their differences and celebrate their similarities. This is supported by music and rhythms from both countries.

Numbers are beautiful

In the end, Till asks, can we live without numbers? “Life in numbers” answers “no”, but also shows the life within numbers. And it demonstrates that numbers are more than economic values. Numbers may describe how often we laugh per day, how long we see the sun, and what rhythms feet can dance.

As a scientist, I avoid 3D diagrams because they distort data. With “Life in numbers” you can experience how dance, a three- or even four-dimensional visualization, can make numbers directly experienceable and fascinating.

The performance can be seen today and tomorrow in Dresden-Hellerau https://www.hellerau.org/de/event/life-in-numbers/.

19th/20th of October at tanzhausnrd (https://tanzhaus-nrw.de/de/buehne/spielplan) and then in Maputo!

IMG_1149

20 Zehen, 4 Füße, 2 Künstler, 1 Passion: Life in numbers

Tanz als Visualisierung

Unser Leben kann mit Zahlen beschrieben und in Diagrammen visualisiert werden. Jeder Mittelwert und jede Visualisierung sind jedoch immer Vereinfachungen. Nützlich und faszinierend, aber auch behindernd und einengend.

Premiere in Hellerau

Gestern konnten wir im Festspielhaus Hellerau eine wunderbare Visualisierung von zwei „Leben in Zahlen“ erleben. In der Dresden Premiere von „Life in numbers“ treffen sich die beiden Choreografinnen und Tänzerinnen Katia Manjate und Anna Till. Vor 4 Jahren begannen die Künstlerinnen ihre Leben anhand von Zahlen zu vergleichen und sich so kennenzulernen. Dies gab den Impuls zu „Life in numbers“, und so beginnt auch das Stück. Mit einem Vergleich der Leben in Dresden, wo Till lebt, und Maputo, wo Manjate lebt. Im Laufe der 8 Teile lernen wir so zunächst Eckdaten kennen, die tänzerisch auf einem kartesischen Koordinatensystem umgesetzt werden, mit Bewegungen entlang der unsichtbaren x- und y-Achsen. Die Tänzerinnen bilden hier selber die Datenpunkte, immer in einem Verhältnis zueinander, aber im Laufe der Zeit sich verändernd, konvergierend, divergierend.

Unterschiede und Gemeinsamkeiten

Im mittleren Teil des Stücks wenden wir uns von den Mittelwerten ab und den individuellen Datenpunkten zu. Nicht mehr: „Wie lange lebt eine Frau in Deutschland und eine in Mosambik?“ wird erörtert, sondern Till und Manjate fragen sich direkt: „Wie alt bist Du?“. Die konfrontativ-neugierigen Fragen werden wie ein Zweikampf inszeniert und in grelles Licht getaucht. Die Schatten der Körper werden in Rechtecke projiziert, die von den Scheinwerfern gebildet werden und visualisieren damit unser Denken in Kästen. Das Publikum wartet mit der Fragenden höchstgespannt auf die nächste Antwort.

Im dritten Teil löst sich die Spannung, das Licht wird warm und der Tanz spielerisch. Die Künstlerlinnen beginnen nun eine freudige Auseinandersetzung mit ihren Unterschieden und feiern ihre Gemeinsamkeiten. Dies wird von Musik und Rhythmen aus beiden Ländern unterstützt.

Zahlen sind auch schön

Am Ende fragt Till, können wir ohne Zahlen leben? „Life in numbers“ antwortet „nein“, zeigt aber auch das Leben in den Zahlen. Und es zeigt, dass Zahlen mehr sind als ökonomische Werte. Zahlen können auch beschreiben, wie oft lache ich pro Tag, wie lange sehe ich die Sonne, und welche Rhythmen können meine Füße tanzen.

Als Wissenschaftler vermeide ich 3D-Diagramme, weil sie Daten verzerrt zeigen. Bei „Life in numbers“ kann man erleben wie Tanz, eine drei- oder sogar vierdimensionale Visualisierung, Zahlen ganz unmittelbar erlebbar und faszinierend machen kann.

 

Die Vorstellung ist heute und morgen noch in Dresden-Hellerau zu sehen (https://www.hellerau.org/de/event/life-in-numbers/).

Am 19. Und 20. Oktober im tanzhausnrd (https://tanzhaus-nrw.de/de/buehne/spielplan) und danach in Maputo!

Viel Spass!

IMG_1149.JPG

Publikumsgespräch mit der Programmleitung und den Künstern

Misleading bar charts #3

We keep discussing axis layouts and the problematic cases of non-zero baselines (in bar charts). Here is another example from the city of Dresden. Dresden is a really pretty place and it is always worth coming for a visit. With the below chart, the city wanted to showcase that each year new record tourist numbers are recorded.

Dresden_tourism.png
Dresden tourist numbers from 2010-2014.

Truthful bar chart

Now, since this isn’t the first time we discuss baselines, you should immediately spot that a rise from around 200,000 to 300,000 isn’t even close to a tripling of number as the bar length visually suggests. And overall, the bar-length does not actually even represent the increase at all. It rather seems that their lengths were chosen to fit an imaginary linear increase. I re-plotted the bar chart with a zero-baseline. Lo-and-behold, the rising number of tourist is still visible, but clearly not nearly as record-worthy.

Dresden_visitors_1
Truthful bar chart reporting Dresden tourist data.

Really truthful bar charts

For each chart, we should not only think about baselines but ask: where do the numbers come from? And, do we see the complete dataset? In this case, the data was collected by the city of Dresden, which should be a reasonably good source for basic statistical data (all data is here: https://www.dresden.de/de/leben/stadtportrait/statistik/wirtschaft-finanzen/tourismus.php).

The image however circulated in 2017 – three years after the last data-point shown! Now, if you know that since the end of 2014 Dresden is plagued by very prominent weekly demonstrations of right-wing activists, having no data after 2014 is alarming. In the local science and business community the problems are very evident: we have a clear drop in international scientists applying and accepting jobs in the city! I therefore went to the Dresden city website to get the data for the subsequent years and this confirmed what I suspected: tourist numbers no longer rose, instead, they even dropped!

Dresden_visitors_2
Dresden tourists 2010-2018. Show all the relevant data – leaving out years might be misleading.

Line or bar chart?

Time trends are usually more  visible in line charts. Indeed, the drop of tourist numbers since 2014 is very apparent in a line chart, and even more so when we leave out the zero-baseline, which somewhat flattens the data (note: in line charts leaving out zero-baseline is ok and sometimes even necessary!).

Fun with Excel

And, did you know you can use a picture as the background for your chart in Excel!?!

 

Dresden_visitors_5